举例几个典型的大数据平台:
1、世界客流路线图
2、气象云图
3、邮件网络
4、微博传播
5、话单
这里每个平台每3小时的数据都能达到T级数据量
21世纪是信息化爆炸的时代:
搜索引擎 谷歌/百度
社交网络 QQ,facebook
电子商务 淘宝,京东
互联网电视 乐视/小米
游戏
移动互联网 微信/微博
这里每个平台的数据传播速度很快,体量很大
社会化趋势:
UGC 用户生成的信息(用户行为 / 用户关系 / 大量碎片化信息)
综上所属那么什么才算是大数据呢?这里记得4个V
1、体量大 volume
2、多样性 variety
3、价值密度低 value
4、速度 velocity
大数据的挑战:
1、对现有数据库的挑战
2、数据的多样性挑战
3、数据实时性的挑战
4、网络架构 数据中心、运维挑战
5、信息安全的挑战(斯诺登事件)
大数据的机遇:
分析技术 数据预处理 统计和分析 数据挖掘
大数据技术 数据采集 数据存储(关系型/NOSQL)
处理大数据的心得:
大数据的价值正在被挖掘出来
数据再大没有价值也是垃圾
大数据里挖掘有价值的信息才是王道
深度挖掘,精准营销与预测
最后举个例子:
有人说房子太多有很多鬼城出现,有人说房子根本没有的卖,那到底谁在说谎话呢,
管理局相关人员可以不用到现场调查,只需要分别调查下某个大楼的电力,水力
的使用量就可以做个预测,那么这个就是深度挖掘精准预测的方法