• 大数据概述


    1.试述大数据对思维方式的重要影响。
    大数据技术的快速发展,不仅是带来了一场企业及技术革命、国家和地方治理革命,更给人们特别是决策者的认知能力带来升华的新机遇。
      为此,全社会必须牢固树立大数据思维,积极适应大数据带来的整体观念变革。
      一是推动从样本思维向总体思维转变。以往,由于诸多客观条件限制,人类无法获得所研究对象的总体特征和数据信息。因而,在决策时只能通过采样手段来获取数据进行分析或推理,其结论往往是一叶障目,不见泰山;在大数据时代,人们可以更加方便、快捷、动态地获得所研究对象的所有数据,并具备全样本数据分析能力,更能从海量信息中寻求客观真理。这就要求我们对数据的思维方式,也应该从样本思维转向总体思维,从而能够更加全面地把握全局。
      二是推动从局部思维向全局思维转变。过去,人们在决策时,往往只有基于视野范围之内,在极为有限的局部信息中寻求次优决策,不异于是井底之蛙;而依据大数据则可将整个大千世界尽收眼底,更加系统地把握客观对象,从而实现最优决策。
      三是推动从精确思维向容错思维转变。在小数据时代,由于收集的样本信息量少,必须确保记录的数据尽量结构化、精确化。否则,分析得出的结论在推及总体上就会南辕北辙。然而,在拥有海量即时数据时,绝对的精准已不再是主要目标,适当忽略微观层面上的精确度,容许一定程度上的错误与混杂,反而更能在宏观层面拥有更好的洞察力。
      四是推动从因果思维向相关思维转变。过去,人们在对小样本数据进行分析时,往往执着于现象背后的因果分析,试图通过有限样本数据来剖析其中的内在机理。但小数据的一个极大缺陷就是有限的样本数据无法反映事物之间普遍性的相关关系。而在大数据时代,通过相关技术可以挖掘出事物之间隐蔽的相关关系,可以准确地获得更多的认知和洞见,从而帮助人们捕捉现在和更好地预测未来。
      五是推动从自然思维向智能思维转变。大数据时代的到来,为提升机器思维由自然思维向智能思维转变带来了大好契机,特别是随着物联网、云计算、社会计算、可视化技术的突破发展,使得大数据系统也能类似人脑一样,自动搜索所有相关的数据信息,进而主动、立体、逻辑地分析数据、做出判断、提供洞见,从而具有类似人类的智能思维能力和预测未来的能力。

    2.详细阐述大数据、云计算、物联网之间的区别与联系。

    1).物联网产生大数据,大数据助力物联网。目前,物联网正在支撑起社会活动和人们生活方式的变革,被称为继计算机、互联网之后冲击现代社会的第三次信息化发展浪潮。物联网在将物品和互联网连接起来,进行信息交换和通信,以实现智能化识别、定位、跟踪、监控和管理的过程中,产生的大量数据也在影响着电力、医疗、交通、安防、物流、环保等领域商业模式的重新形成。物联网握手大数据,正在逐步显示出巨大的商业价值。
    2).大数据是高速跑车,云计算是高速公路。在大数据时代,用户的体验与诉求已经远远超过了科研的发展,但是用户的这些需求却依然被不断地实现。在云计算、大数据的时代,那些科幻片中的统计分析能力已初具雏形,而这其中最大的功臣并非工程师和科学家,而是互联网用户,他们的贡献已远远超出科技十年的积淀。

    3.简述你对大数据应用与发展的看法,以及你在这次大数据浪潮中想扮演什么角色。

    1)云技术:大数据常和云计算联系到一起,因为实时的大型数据集分析需要分布式处理框架来向数十、数百或甚至数万的电脑分配工作。可以说,云计算充当了工业革命时期的发动机的角色,而大数据则是电。云计算思想的起源是麦卡锡在上世纪60年代提出的:把计算能力作为一种像水和电一样的公用事业提供给用户。如今,在Google、Amazon、Facebook等一批互联网企业引领下,一种行之有效的模式出现了:云计算提供基础架构平台,大数据应用运行在这个平台上。业内是这么形容两者的关系:没有大数据的信息积淀,则云计算的计算能力再强大,也难以找到用武之地;没有云计算的处理能力,则大数据的信息积淀再丰富,也终究只是镜花水月。那么大数据到底需要哪些云计算技术呢?这里暂且列举一些,比如虚拟化技术,分布式处理技术,海量数据的存储和管理技术,NOSQL、实时流数据处理、智能分析技术(类似模式识别以及自然语言理解等。
    2)分布式技术:分布式处理系统可以将不同地点的或具有不同功能的或拥有不同数据的多台计算机用通信网络连接起来,在控制系统的统一管理控制下,协调地完成信息处理任务—这就是分布式处理系统的定义。
    3)感知技术:大数据的采集和感知技术的发展是紧密联系的。以传感器技术,指纹识别技术,RFID技术,坐标定位技术等为基础的感知能力提升同样是物联网发展的基石。全世界的工业设备、汽车、电表上有着无数的数码传感器,随时测量和传递着有关位置、运动、震动、温度、湿度乃至空气中化学物质的变化,都会产生海量的数据信息。

  • 相关阅读:
    操作系统发展、同步异步阻塞非阻塞、进程
    day27作业
    tcp粘包、解决粘包问题
    基于TCP连接的socket套接字编程
    《python》join、守护进程、锁/信号量/事件、进程队列
    《Python》并发编程
    《Python》网络编程之验证客户端连接的合法性、socketserver模块
    《Python》网络编程之客户端/服务端框架、套接字(socket)初使用
    《Python》网络编程基础
    《Python》re模块补充、异常处理
  • 原文地址:https://www.cnblogs.com/qq157049540/p/8507404.html
Copyright © 2020-2023  润新知