• 云计算和大数据的崛起


    缓解了不少问题,使许多大小企业的大数据处理成为可能。但要从大量数据中提取商业价值仍然具有其复杂性。

    云计算使得大数据更加大众化——任何企业现在都可以处理巨大规模下的非结构化数据。

    咋一看,很难看出为什么新大数据世界的非结构化数据方式如此必要。即便是新方式带来新的商业价值,为什么不停留在网络会议?为什么要纠结于云数据库呢?

    大数据标记

    大数据就像SDN、DevOps和云计算,是崭新而闪耀的新标记。既不容忽视,又很难理解。没有单一的“大数据”类型——它是非结构化数据的集合标记堆栈。

    举个例子,大数据分析的原则是从大量数据中提取商业价值。数据专家处理资源,将数据转变成有用的信息。经典RDBMS(关系数据库管理系统)能够处理很多数据,并且已经持续多年。为什么数据专家不能继续在RDBMS专注于结构化数据呢?RDBMS 和NoSQL哪个更好?

    结构化或非结构化数据

    一个企业选择技术堆栈是由他们需要存储的数据类型所导向的,数据类型则是由业务需求所导向。

    RDBMS对于管理结构化、高度关联数据很有帮助。

    对于由社会媒体、传感网络和联合分析数据所产生的越来越多的非结构化数据,以及对于持续变化的需要复制到其他操作网站的数据,NoSQL更适合这些情况。非结构化数据在大小上可以是兆字节或甚至千兆字节。

    大数据云:新的解决方案

    理论上,管理基于云的大数据是符合成本效益的、可伸缩的并且构建迅速的。

    数据库管理人员则不那么轻松。NoSQL数据库在近几年出现,凭借它们的键值对,文档存储,看起来并不像关系数据更换缓慢,新的数据很难捕捉、存储、处理、做报告以及归档。

    但对于系统管理者来说也不那么坏。如果他们运行一个私有云,硬件和软件的新的非结构化数据技术堆栈看起来就像旧的——IaaS在底部,数据库服务在中间,他们不需要接触到技术堆栈的低层。

    将数据管理于Windows Aure Tables、MongoDB、Navicat for MySQL中只是充分利用大数据所需要的数据科学的开始。还有大量的业务合作、再培训和其它态度调整需要顾及。

  • 相关阅读:
    (树链剖分+线段树)POJ
    (树上莫队)HDU
    (LCA+树上主席树)FZU 2237
    (预处理+莫队算法)HDU
    (莫队算法)两题莫队算法统计数量的入门题
    (莫队算法)CodeForces
    sublime配置C++14
    (dfs序+莫队算法/启发式合并/树分治)Codeforces 375D
    (线段树两个lazy标记需要设定优先级)UVA 11992
    (线段树区间合并)UVA 11235
  • 原文地址:https://www.cnblogs.com/elegant-dancer/p/3371543.html
Copyright © 2020-2023  润新知