1.试述大数据对思维方式的重要影响。
大数据时代最大的转变就是思维的三种转变:全样而非抽样、效率而非精确、相关而非因果。
1.全样而非抽样
过去,由于数据存储和处理能力,在科学分析中,通常采用抽样的方法,通过样本数据的分析来推断全集数据的总体特征,通常,样本数据规模要比全集数据小很多;现在,我们已经迎来大数据时代,大数据的核心就是海量数据的存储和处理,分布式文件系统和分布式数据库技术提供了理论上近乎无限的数据存储能力。有了大数据技术的支持,科学分析完全可以直接针对全集数据而不是抽样数据,而且可以在很短是时间内迅速得到分析结果。
2.效率而非精确
过去,我们在科学分析中采用抽样方法,因为抽样分析只是针对部分样本分析,如果抽样分析的微小误差如果被放大到全集数据以后,误差就会被放大;现在,大数据时代采用全样分析而不是抽样分析,全样分析结果就不存在误差被放大的问题,追求高精确性已经不是其首要目标。
3.相关而非因果
过去,数据分析的目的,一方面是解释事物背后的发展原理,另一方面是用于预测未来可能发生的事件,更多的是解决“因果”,但是,在大数据时代,因果关系不再那么重要了,人们更多的是追求“相关性”,例如,在淘宝网购物的时候,当我们购买了一个汽车防盗锁以后,淘宝还会自动提示你,与你购买相同物品的其他用户还购买了汽车坐垫,它只告诉你两件物品之间存在的相关性,而不会告诉为什么。
2.详细阐述大数据、云计算、物联网之间的区别与联系。
大数据、云计算、物联网之间的区别:大数据侧重于对海量数据的存储、处理和分析,从海量数据中发现价值,服务于生产和生活;云计算本质上旨在整合和优化各种IT资源,并通过网络以服务的方式廉价地提供给用户;物联网的发展目标是实现物物相连,应用创新是物联网发展的核心。
大数据、云计算、物联网之间的联系:从整体上看,大数据、云计算和物联网这三者是相辅相成的。大数据根植于云计算,大数据分析的很多技术都来自于云计算,云计算的分布式数据存储和管理系统提供了海量数据的存储和管理能力,分布式并行处理框架MapReduce提供了海量数据分析能力,没有这些云计算技术作为支撑,大数据分析就无从谈起。反之,大数据作为云计算提供了“用武之地”,没有大数据这个“练兵场”,云计算技术再先进,也不能发挥它的应用价值。物联网的传感器源源不断产生的大量数据,构成了大数据的重要数据来源,没有物联网的飞速发展,就不会带来数据产生方式发变革,由人工生产阶段转向自动生产阶段,大数据时代也不会这么快就到来。同时,物联网需要借助于云计算和大数据技术,实现物联网大数据的存储、分析和处理。三种彼此相互渗透、相互融合、相互促进、相互影响。
3.简述你对大数据应用与发展的看法,以及你在这次大数据浪潮中想扮演什么角色。
大数据应用与发展:
1.大数据决策成为一种新的决策方式。
大数据决策可以面向类型繁多的、非结构化的海量数据进行决策分析,已经成为受到追捧的全新决策方式。可以通过对论坛、微博、微信社区等多种来源数据进行综合分析,弄清或测验信息中本质性的事实和趋势,揭示信息中含有的隐性情报内容,对事物发展做出情报预测,协助实现政府决策,有效应对各种突发事件。
2.大数据应用促进信息技术与各行业的深度融合。
大数据无处不在,例如制造业、金融行业、汽车行业、互联网行业、餐饮行业、电信行业、能源行业、物流行业、城市管理、生物医学、体育和娱乐、安全领域、个人生活等都已经融入了大数据的印迹。
3.大数据开发推动新技术和新应用的不断涌现。
大数据的应用需求是大数据新技术开发的源泉。在各种应用需求的强烈驱动下,各种突破性大数据技术将不断提出并得到广泛应用,数据的能力也将不断得到释放。在不远的将来,原来那些依靠人类自身判断力的领域应用,,将逐渐被各种基于大数据的应用所取代。
在这次大数据浪潮中想扮演的角色:
大数据的时代悄然来临,带来了信息技术发展的巨大变革,并深刻影响着社会生产和人民生活的方方面面。我们享受着信息爆炸带来的便利与繁杂,因此,在大数据的浪潮中,更多的想扮演分类整理管理数据的角色,让繁杂的信息数据能够更好的为人们带来更多的便利服务,响应科技服务于人类。