作业要求来源于:https://edu.cnblogs.com/campus/gzcc/GZCC-16SE2/homework/2620
1.分析所采用数据的来源有哪些?
(1)交易数据。
包括 POS 机数据、信用卡刷卡数据、电子商务数据、互联网点击数据、“企业资源规划”(ERP)系统数据、销售系统数据、客户关系管理 (CRM) 系统数据、公司的生产数据、库存数据、订单数据、供应链数据等。
(2)移动通信数据。
能够上网的智能手机等移动设备越来越普遍。移动通信设备记录的数据量和数据的立体完整度,常常优于各家互联网公司掌握的数据。移动设备上的软件能够追踪和沟通无数事件,从运用软件储存的交易数据 (如搜索产品的记录事件) 到个人信息资料或状态报告事件 (如地点变更即报告一个新的地理编码) 等。
(3)互联网上的“开放数据”来源,如政府机构,非营利组织和企业免费提供的数据。
2.大数据的呈现方式有哪些?
(1)面积&尺寸可视化对同一类图形(例如柱状、圆环和蜘蛛图等)的长度、高度或面积加以区别,来清晰的表达不同指标对应的指标值之间的对比。
(2)颜色可视化,通过颜色的深浅来表达指标值的强弱和大小,是数据可视化设计的常用方法,用户一眼看上去便可整体的看出哪一部分指标的数据值更突出。
(3)图形可视化在我们设计指标及数据时,使用有对应实际含义的图形来结合呈现,会使数据图表更加生动的被展现,更便于用户理解图表要表达的主题。
(4)地域空间可视化当指标数据要表达的主题跟地域有关联时,我们一般会选择用地图为大背景。
(5)概念可视化通过将抽象的指标数据转换成我们熟悉的容易感知的数据时,用户便更容易理解图形要表达的意义。
3.大数据的特点是什么?对思维方式有何影响?
(1)大数据的特点:
1、数据量大
人类社会产生的数据每两年就增加一倍——“大数据摩尔定律”。
2、数据类型繁多
大数据的数据类型丰富,包括结构化数据和非结构化数据,其中,结构化数据占10%左右,主要是指存储在关系数据库中的数据;后者占90%左右,种类繁多,主要包括邮件、音频、视频、微信、微博、位置信息、链接信息、手机呼叫信息、网络日志等。
3、处理速度快
数据处理和分析的速度通常要达到秒级响应。
4、价值密度低
在大数据时代,很多有价值的信息都是分散在数据海量中的。譬如监控视频,平时可能没有什么作用,但当发生盗窃事件时,只有记录了案发时刻的那一段视频是有用的。
(2)大数据对思维方式的影响:
(1)人们处理的数据从单一样本数据变成全量数据(全样本数据);
(2)由于是海量数据和全样本数据,人们不得不接受数据的混杂性,而放弃对精确性的追求;
(3)人类通过对大数据的处理,放弃对因果关系的渴求,转而关注相关性关系(即数据的关联性关系)。
4.准备python编程环境
下载安装
https://www.jetbrains.com/pycharm/download/#section=windows
基础学习
廖雪峰https://www.liaoxuefeng.com/wiki/0014316089557264a6b348958f449949df42a6d3a2e542c000
菜鸟教程http://www.runoob.com/python3/python3-tutorial.html
5.简单的输入输出编程练习
设计完成一个Mad Libs游戏
name1 = input('请输入一个名字:')
name2 = input('请输入一个名字:')
vehicle = input('请输入一种乐器:')
print('在琴房练完钢琴的{}看到了偶然路过的{},拿起手边的{}砸到了他的头上并大笑'.format(name1, name2, vehicle))
input('press any key')