作业来源:https://edu.cnblogs.com/campus/gzcc/GZCC-16SE1/homework/2639
1.这些分析所采用数据的来源是什么?
按产生主体
(1)企业(关系型数据库,数据仓库)
(2)人(浏览信息,聊天,电子商务......)
(3)机器(服务器产生日志,视频监控数据)
数据来源的行业划分
(1)BAT三大公司为代表
(2)电信、金融、保险、电力、石化系统
(3)公共安全、医疗、交通领域
(4)气象、地理、政务等领域
(5)制造业和其他产业
按数据存储的形式划分
(1)结构化
(2)非结构化
2.大数据的呈现方式有哪些?
2.大数据的呈现方式有哪些?
就是把分析结果用最美观和最容易理解的方式(图标或者图形)展现出来。
目前,行业大概有几种玩法。
网站(兼容PC端和移动端):提供给付费的B端客户,不对外公开,大致形式如下:
开专栏和做公众号:都是纯免费的,将一些不敏感的数据和分析分享出去,攒人品赚口碑。
提供一个SaaS的公有云平台,方便大家把自己的数据制作成为便于在网上特别是移动端传播的图文报表。产品的逻辑很简单:读数读图的需求越来越强烈,但是却缺乏这样的工具或者平台来制作的内容,即使是Excel,也不能制作出适合于网络传播的图文内容。
3.大数据的特点是什么?结合大数据应用案例,分析大数据对思维方式有何影响?
数据量大
人类社会产生的数据每两年就增加一倍——“大数据摩尔定律”。
数据类型繁多
大数据的数据类型丰富,包括结构化数据和非结构化数据,其中,结构化数据占10%左右,主要是指存储在关系数据库中的数据;后者占90%左右,种类繁多,主要包括邮件、音频、视频、微信、微博、位置信息、链接信息、手机呼叫信息、网络日志等。
处理速度快
数据处理和分析的速度通常要达到秒级响应。
价值密度低
在大数据时代,很多有价值的信息都是分散在海量数据中的。譬如监控视频,平时可能没有什么作用,但当发生盗窃事件时,只有记录了案发时刻的那一段视频是有用的。
设计完成一个Mad Libs游戏:
1).创造一个让人欢乐的有趣的故事;
2).提示伙伴输入相应类别的词;
3).将故事完整地输出。