• 技术栈_人工智能-大数据-云计算


    技术俯瞰

     云 管 端
      A B C-- 数据 算法 算力
    

    端管云-ABC

    终端-Terminal
    	 端侧数据采集
    	 端侧AI模型
    
    边缘--EON-Edge of Network边缘网络
         数据采集和处理以及上传
    	 数据通信
    	 边缘网络和模型
    
    云端 --Cloud
        01.数据
           结构化数据: 
           非结构化数据
        02. BigData大数据技术趋势
          01.存储和计算分离
    	         计算资源与存储资源可以独立伸缩,计算资源可以在计算完成后立即释放
            001.存储-对象存储 - 湖仓一体  
            002.计算-计算引擎 - 批流一体
          02.资源调度-在线离线混部在线离线混部解决方案
        03.AI模型
    

    湖仓一体

     如何利用对象存储提供的无限存储能力,同时又高效地操作文件系统的元数据
    
    			
    对象存储	
    	 Ceph   是对象存储,块存储和文件系统开源平台
         MinIO  是一款开源云存储软件	
    	 OpenIO 是用于管理和保护大量非结构化数据的开源对象存储解决方案
    	 LakeFS 是一个开源数据环境工具,可让您管理基于对象存储的数据湖
    
    数据湖 :ACID 功能,支持实时消费增量数据、离线批量更新数据
      01.开源     
         Apache CarbonData 华为
         Open Delta Lake  Databricks推出的delta  Delta Lake存储一个事务日志,以跟踪对表目录所做的所有提交,以提供ACID事务
         Apache Hudi     Uber的   Hadoop Upserts Deletes and Incrementals,主要支持Upserts、Deletes和增量数据处理
         Apache Iceberg  Netflix
      02.商业 
         华为
             FusionInsight 智能数据湖
    	     存算分离:OBS实现存储计算解耦
         阿里
           阿里云数据湖构建(Data Lake Formation,DLF)
    	     基于对象存储OSS、数据湖构建Data Lake Formation
    	     存储的部分叫 JindoFS。JindoFS 是阿里云针对云上存储定制的自研大数据存储服务
    	     Jindo FS 有两种使用模式,块存储模式和缓存模式
         腾讯:
           数据湖解决方案以 COS 为数据湖底座,支持多种格式数据海量存储;
           通过数据湖加速器 GooseFS 无缝对接各类计算和机器学习平台,打破数据孤岛
    	   
         ByteLake:字节跳动基于Apache Hudi的实时数据湖平台
    	 微软:
    	   Azure Data Lake -- Azure Data Lake Store
    	   基于 Azure Blob 存储构建的高度可缩放的安全 Data Lake 功能
    	 Amazon
    	  Galaxy数据湖基于Amazon的Simple Storage Service或对象存储服务S3构建
     批流一体
        Spark  Flink
     混部
       K8s
    

    A 人工智能 Artificial Intelligence

    常见的机器学习算法
        线性回归
        逻辑回归
        决策树
        SVM
        朴素贝叶斯
        K最近邻算法
        K均值算法
        随机森林算法
        降维算法
        Gradient Boost 和 Adaboost 算法
    深度神经网络
         DNN--- CNN  RNN
        
        计算机视觉  (Computer Vision  CV)又称为机器视觉(Machine Vision)
        自然语言处理(Natural Language Process, NLP)
        语音识别    (Speech Recognition)
    算法应用等级
       开窗即用
       使用框架
       开发和修改框架的
    

    B 大数据 Big Data

    存储 HDFS Hbase  S3  OBS
    传输 Kafka
    计算 Flink  Spark  Hive  Clickhouse
    资源调度: Yarn Kubernetes   资源调度 时间调度 依赖调度 
    服务  可视化  采集
    

    C 云计算 Cloud

    云计算技术- 云原生 Cloud Native
     以资源编排为主体向以应用编排为主体转变
    	认证  计算机节点管理 计算机网络管理 镜像服务管理  UI服务
    开源的云基础架构服务  OpenStack  围绕虚拟机构建的IaaS资源管理体系
    商业的云基础架构服务
    涉及技术: 服务器虚拟化 有Citrix Xen VMware ESX Server 和Microsoft Hype-V
    未来:-存储和网络  虚拟化网络技术  存储的管理
     资源 应用和服务  安全是底线
     Dev(开发人员)+Ops(运维人员)   
    给用户提供三种环境,实验环境、离线任务、在线服务
  • 相关阅读:
    PAT 甲级 1132 Cut Integer (20 分)
    AcWing 7.混合背包问题
    AcWing 9. 分组背包问题
    AcWing 5. 多重背包问题 II
    AcWing 3. 完全背包问题
    AcWing 4. 多重背包问题
    AcWing 2. 01背包问题
    AcWing 875. 快速幂
    AcWing 874. 筛法求欧拉函数
    AcWing 873. 欧拉函数
  • 原文地址:https://www.cnblogs.com/ytwang/p/14638177.html
Copyright © 2020-2023  润新知