• 大数据概念


    什么是大数据

    基本概念

    在互联网技术发展到现今阶段,大量日常、工作等事务产生的数据都已经信息化,人类产生的数据量相比以前有了爆炸式的增长,以前的传统的数据处理技术已经无法胜任,需求催生技术,一套用来处理海量数据的软件工具应运而生,这就是大数据!

    换个角度说,大数据是:

    1、有海量的数据

    2、有对海量数据进行挖掘的需求

    3、有对海量数据进行挖掘的软件工具(hadoop、spark、storm、flink、tez、impala......)

     

    大数据在现实生活中的具体应用

    电商推荐系统:基于海量的浏览行为、购物行为数据,进行大量的算法模型的运算,得出各类推荐结论,以供电商网站页面来为用户进行商品推荐

    精准广告推送系统:基于海量的互联网用户的各类数据,统计分析,进行用户画像(得到用户的各种属性标签),然后可以为广告主进行有针对性的精准的广告投放

    .....

    什么是hadoop

    hadoop中有3个核心组件:

    分布式文件系统:HDFS —— 实现将文件分布式存储在很多的服务器上

    分布式运算编程框架:MAPREDUCE —— 实现在很多机器上分布式并行运算

    分布式资源调度平台:YARN —— 帮用户调度大量的mapreduce程序,并合理分配运算资源

  • 相关阅读:
    blob 下载功能和预览功能
    实现大文件上传
    element ui框架之Upload
    常用utils
    vue实现excel表格上传解析与导出
    理解script加载
    js处理10万条数据
    Shadow DOM
    20150625_Andriod_01_ListView1_条目显示
    20150624_Andriod _web_service_匹配
  • 原文地址:https://www.cnblogs.com/renxixao/p/11437831.html
Copyright © 2020-2023  润新知