• 大数据 入门


    最小的基本单位是bit,按顺序给出所有单位:bitByte、KB、MB、GB、TB、PB、EB、ZB、YB、BB、NB、DB。

     Bit比特) =Binary Digit
    8Bits = 1 Byte(字节
    1,000 Bytes = 1 Kilobyte
    1,000Kilobytes = 1 Megabyte
    1,000 Megabytes = 1 Gigabyte
    1,000 Gigabytes = 1Terabyte
    1,000 Terabytes = 1 Petabyte
    1,000 Petabytes = 1 Exabyte
    1,000Exabytes = 1 Zettabyte
    1,000 Zettabytes = 1 Yottabyte
    1,000 Yottabytes = 1Brontobyte
    1,000 Brontobytes = 1 Geopbyte
    ======
    大数据这个入门。
    快速入门
    看了一些资料,书籍,还是懵逼。
    就是知道了一些大数据名词,但还是不清楚到底是怎么回事。
    是什么,怎么用。云里雾里的,很容易浮躁,看不下去,难以入门。
    一种难以沟通的感觉。
    实践,需要Linux系统。自己没有。 需要有。 
    如果你想要走这条道路,那么就别撤退,不看了不学了不搞了。 
    既然想要搞,就想办法搞,遇到困难不必浮躁,冷静下来去解决。
    ========
     

    High Scalability 高可扩展性
    NoSQL是Not Only SQL的缩写
    Sharding(分片)
    分片是指将数据拆分,将其分散在不同机器上的过程。
    分片就是数据拆分。 名字起得不好,都不知道啥意思。

    什么是分布式?
    分布式 什么意思
    一个业务分拆多个子业务,部署在不同的服务器上。
    集群:同一个业务,部署在多个服务器上
    分布式 就是 拆分业务
    集群 就是 多个机器共同分担一个业务。

    HDFS—Hadoop Distributed File System
    Hadoop分布式文件系统
    Reduce 减少,分解。
    MapReduce实现了Map和Reduce两个功能
    Map把一个函数方法应用于集合中的所有成员,然后返回一个基于这个处理的结果集;
    Reduce对结果集进行分类和归纳;
    Map()和 Reduce() 两个函数可能会并行运行,

    =======

     
  • 相关阅读:
    隐藏QQ全部图标,隐藏QQ全部信息
    发放腾讯微博邀请,先到先得、
    关于“5005: 优化字节代码时发生未知错误。”的处理办法
    端口
    xmldocument
    MasterPage
    asp.net ajax
    mysqladmin 设置用户名初始密码报错you need the SUPER privilege for this operation
    实践SSH通道链接国外服务器访问受限网站
    转载 实践与分享:Windows 7怎么获取TrustedInstaller权限【图文教程】
  • 原文地址:https://www.cnblogs.com/yue31313/p/7838046.html
Copyright © 2020-2023  润新知