• 了解一下大数据


    项目开发针对的主要是企业家的应用,所以数据量算不上大数据,但是最近大数据在互联网行业的使用,作为一名程序员,应该学习新技术吗?但是学习他仅仅是为了借鉴一下大数据的处理思想,实现的过程,针对的场景,以便在我们的项目开发中借鉴一些思想,提高开发水平。

    ======================================

    hadoop生态系统:

    CPU:hadoop的Mad-Reduce------------------------并行编程的模型机制------切分并发之后合并---spliter--Agrator

    内存:HBase-基于列的NoSQL数据库------------------Key-Value的基于HashTable的快速查询机制

    存储:Hadfs的分布式文件系统--------------------------存储大量数据---针对分布式存储而言(数据分割存储,IO并行运行,提高IO速度,麻烦在于查询如何找并组装)

    ======================

    Habse:nosql数据库

    Hive:nosql的数据仓库

    hadfs:分布式文件系统

    sqoop:etl的工具(数据抽取工作-做etl的过程)

    zookeeper:时间同步工具------注意网络之间协调本质就是时间服务。

    ======================

    Storm流处理技术

    Spark:全新的框架,集大成者

     如果学习的话,这就是一个应该学习的技术.

    部分来自:http://blog.csdn.net/woshiwanxin102213/article/details/19688393

  • 相关阅读:
    docker
    opencart
    Why is setTimeout(fn, 0) sometimes useful?
    linux下php环境配置
    xampp for linux
    Where to go from here
    freefcw/hustoj Install Guide
    khan academy js
    SDWebImage
    基于OpenCV 的iOS开发
  • 原文地址:https://www.cnblogs.com/gstsyyb/p/3965588.html
Copyright © 2020-2023  润新知