• 086实战 项目开发流程,以及什么是数据分析平台,再者为什么要做数据分析平台,数据来源,数据处理流程


    一:项目开发流程

    1.项目调研

      了解项目的初始需求,然后结合市场的技术,看一下能否完成

    2.需求分析

      明确一个项目到底需要做什么?

      最终做出的是什么样子?

      重要性:一个好的需求分析能够明确项目的后续发展主题方向

    3.方案设计

      概要设计:

        项目结构,技术选型

      详细设计:

        按照模块设计

    4.编码实现

      具体实现

    5.测试

      功能测试:功能是否达到了需求

      集成测试:模块之间的兼容性

      压力测试:高并发,多用户下,系统是否可以运行

      用户测试:根据用户的建议进行修改

    6.上线

      试运行阶段:新系统与老系统同时在线上运行,使用分流技术

      正式运行:线上只有新系统运行

    7.后期维护

      开发的再一次迭代

    二:什么是数据分析平台

    1.离线数据分析平台

      mapreduce,hive,sparkcore(spark on yarn)

    2.实时数据分析平台

      sparkcore(spark on standalone),sparkstreaming,strom

    三:为什么要自己做数据分析平台

    1.优点

      不存在数据的泄露

      定制化强,可以自由的开发

      数据在自己的公司,可以进行后续的开发

      有利于公司的人才储备

    2.缺点

      需要人才成本,时间成本

      服务器成本,机器成本大

    四:数据的来源

    1.日志服务器

      nginx日志,apache日志,linux日志

    2.业务日志

      log4j日志

      产品:ELK=>ElasticSearch,Logstash,Kibana

    3.业务数据

      存储在业务数据库中,提供业务支持的数据

    4.用户行为数据

      点击,浏览,选择,收藏,下单,离线

    5.购买的第三方的数据

    6.网络的爬虫爬来的数据

    7.合作者的数据

    五:数据处理流程

    1.数据收集

      收集用户数据,保存到HDFS上

    2.数据处理

      数据的清洗,过滤,补全

      根据业务进行需求开发

      将结果保存到sql,或者nosql

    3.数据可视化

      展示结果,可以使用图表等。

    4.基于结果的其他应用

      用户画像

      推荐

      数据分析师

  • 相关阅读:
    Java工程代码开发规范总结
    MySQL5.7 JSON字段性能测试
    Forest v1.5.12 发布,声明式 HTTP 框架,已超过 1.6k star
    HTTP基础系列之:一文搞懂URL
    近1000 star,Forest 1.5.0 正式版发布
    我的开源项目在五个月内超过了 600 star
    我的开源经历:为了方便处理三方 HTTP 接口而写的 Java 框架
    【约瑟夫环】C语言数组法+java循环链表法
    UNICODE编码 特殊符号
    swift3.0 保存图片到本地,申请权限
  • 原文地址:https://www.cnblogs.com/juncaoit/p/6180844.html
Copyright © 2020-2023  润新知