摘要:随着边缘设备的广泛使用和性能提升,将机器学习相关的部分任务迁移到边缘,也即边缘AI技术,已成为必然趋势。但仅凭技术是不足够完成落地和产业转化的。近日我们启动了边缘AI研发落地生态挑战调研。我们发现,当前学界业界在落地过程已经遇到各式各样的困难,重点生态挑战包括数据集和配套算法难以获取、通用方案无法满足特定业务需求、缺乏商业成功案例等。
本文分享自华为云社区《华为云 - 边缘AI研发落地生态挑战调研报告》,作者: 边缘云创新实验室。
随着边缘设备的广泛使用和性能提升,将机器学习相关的部分任务迁移到边缘,也即边缘AI技术,已成为必然趋势,甚至能够同时结合云侧算力和边侧数据来完成机器学习任务。机器学习服务将边缘产生的数据转换为知识的过程中,需要在边缘快速响应并处理本地产生的数据。在落地过程中,我们发现,在连接海量边缘节点的边缘云时代,随着AI服务与边缘用户的距离缩短,通用AI原本部分挑战在边缘场景下变得更加尖锐。
基于一些落地经验,华为云边缘云创新实验室(ECIL,Edge Cloud Innovation Lab,Huawei Cloud)系列文章中曾介绍过数据异构等四大技术挑战。针对这些挑战,各个技术方案落地与成果转化到产业的进程正在紧锣密鼓地进行。但仅凭技术是不足够完成落地和产业转化的。当前学界业界很多团队已经遇到各式各样的困难,比如数据集难以获取、通用方案无法满足特定业务、缺乏商业成功案例等。
因此除了技术挑战外,华为云边缘云创新实验室一直密切关注边缘AI的生态挑战*。为了让更多边缘AI领域的朋友多快好省地完成技术研发落地和商业闭环,华为云边缘云创新实验室启动了边缘AI研发落地生态挑战调研。本次调研通过问卷发放的方式,希望进一步了解边缘AI方案落地与产业落地过程中遇到的生态挑战。截至2021年11月29日,已回收有效答卷175份,问卷开放选项采集到49条补充意见和8条补充建议。对答卷中共计20项量表题项进行分析,信度Cronbach. **为0.975。
*比如研发资源难获取、工具链不完备等主要依赖社区分工与共享的非技术挑战,在本文中定义为生态挑战
**信度指同一问卷对同一组对象重复测量时所得结果的一致性程度,用于测量样本回答结果是否可靠。如果在0.8以上,则该测验或量表的信度非常好;如果低于0.6,量表就需要重新设计题项。
根据调研结果,对边缘AI各角色而言,当前阻碍研发落地,首当其冲生态挑战分别是
- 算法开发者:“真实业务数据集及其基线算法、预训练模型难以获取”
- 服务开发者:“通用方案整体性能不一定满足特定业务需求”
- 技术布道者:“缺乏商业成功案例”
具体调研报告结果请见下文。
1、调研对象
调研对象职业主要是工业界从业者(53.45%),其次是在校学生(31.03%)和学术界研究者(25.86%)。
调研对象的技术方向主要是边缘AI及其应用(55.75%)、AI及其应用(49.43%)、边缘计算及其应用(42.53%)。也有约四分之一的方向为云计算及其应用(25.86%),以及少量的其它方向(13.22%)。
2、边缘AI算法开发者
本问卷中,边缘AI算法开发者是指研发联邦学习、协同推理乃至深度学习调度等边缘AI典型算法的角色。有80.46%调研对象填写了边缘AI算法开发者相关问卷调研选项。对每个挑战的负面影响有四种选项,包括“不了解可跳过”“可维持现状”“建议改进”“亟需改进”。
本章先介绍答卷中关于各个算法开发生态挑战的不同维度调研结果,本章末尾将小结各不同维度的结论。
2.1平均分
若选择“不了解跳过”或“可维持现状”记为0分,“建议改进”记为5分,“亟需改进”记为10分,答卷中对边缘AI算法开发者各挑战的平均分值如下图所示。对比认为“还有其他重要挑战”的1.43分,问卷中所罗列的各挑战都超过了5分,可以认为各挑战都有改进的需求。
其中,平均分值最高(6.87分)的挑战是:
- “真实业务数据集及其基线算法、预训练模型难以获取”
在截尾均值* 6.09分以上的其它头部挑战还包括:
- “算法研发迭代中,重复部署整套端边云系统过于沉重”
- “缺乏AI工具,包括资源监控、节点仿真、标注工具等”
- “算法找不到对应业务场景,或很难得知实际业务落地性能”
*截尾均值指是指在一个数列中,去掉两端的极端值后所计算的算术平均数。在本问卷中用于屏蔽最后一个开放选项的影响,下同。
从“边缘AI及其应用”方向细分工业界、学术界和在校学生等不同职业调研对象(三者在调研对象中的比例大致为2:1:1),细化算法开发者各项挑战平均分:
“边缘AI及其应用”方向下各职业平均分值最高的算法开发挑战分别是:
- 工业界:“缺乏AI工具,包括资源监控、节点仿真、标注工具等” (平均分7.5)
- 学术界:“缺乏真实业务及其研究需求的固定来源” (平均分7.14)
- 在校学生:“真实业务数据集及其基线算法、预训练模型难以获取”(平均分7.68)
在截距均值以上的其它头部挑战还包括:
工业界(截距均值6.19):
- “真实业务数据集及其基线算法、预训练模型难以获取”(平均分7.1)
- “算法研发迭代中,重复部署整套端边云系统过于沉重”(平均分7)
- “边缘AI系统部署等起步过程中缺乏指南文档”(平均分6.35)
学术界(截距均值6.30):
- “真实业务数据集及其基线算法、预训练模型难以获取”(平均分6.96)
- “缺乏AI工具,包括资源监控、节点仿真、标注工具等”(平均分6.72)
在校学生(截距均值6.77):
- “缺乏真实业务及其研究需求的固定来源”(平均分7.41)
- “算法找不到对应业务场景,或很难得知实际业务落地性能”(平均分7.59)
2.2亟需改进
对于边缘AI算法开发者,问卷中提及的挑战被选为“亟需改进”的比例通常三分之一左右,高于“还有其他重要挑战”的6.36%,可以认为各个挑战都有相当的迫切需求。
其中被选为“亟需改进”的挑战中比例最高(42.77%)的是:
- “真实业务数据集及其基线算法、预训练模型难以获取”
在截尾均值(33.33%)以上的其它头部挑战还包括:
- “算法研发迭代中,重复部署整套端边云系统过于沉重”
- “缺乏AI工具,包括资源监控、节点仿真、标注工具等”
- “算法找不到对应业务场景,或很难得知实际业务落地性能”
- “边缘AI系统部署等起步过程中缺乏指南文档”
可以看到,除了一个挑战,“亟需改进”和“平均分”头部挑战基本保持一致,这个有区别的挑战是:
- “边缘AI系统部署等起步过程中缺乏指南文档”
但可以观察到,除了“亟需改进”维度,该挑战其实在“平均分”维度也是非常接近头部(距离截尾均值0.02),这说明其重要性。
2.3可改进
问卷中的绝大部分挑战都以较大比例(63.1% - 69.94% )被选为“建议改进”和“亟需改进”(下总称“可改进”),对比认为“有其他重要挑战”需改进的比例仅为13.87%,说明列举在问卷中相关挑战大部分都明显有改进的需求。
其中,被认为“可改进”的挑战中比例最高(69.94%)的是:
- “真实业务数据集及其基线算法、预训练模型难以获取”
在截尾均值(67.06%)以上的其它头部挑战还包括:
- “缺乏真实业务及其研究需求的固定来源”
- “边缘AI系统部署等起步过程中缺乏指南文档”
- “缺乏AI工具,包括资源监控、节点仿真、标注工具等”
- “算法研发迭代中,重复部署整套端边云系统过于沉重”
与“亟需改进”相比,“可改进”维度头部部分选项排名有变化。
1、在“可改进”维度头部选项中,比“亟需改进”排名更高的挑战,可以认为是有一定的重要性,但相对不那么紧急。这些可能看上去更“长远”的“重要不紧急”挑战包括:
- “缺乏真实业务及其研究需求的固定来源”
- “边缘AI系统部署等起步过程中缺乏指南文档”
第二个挑战也与“亟需改进”部分结论一致。
2、在“亟需改进”维度头部选项中,比“可改进”排名更高的挑战,可以认为是一定的重要性,但相对比较紧急,这些看上去更“紧迫”的“重要且紧急”挑战包括:
- “算法研发迭代中,重复部署整套端边云系统过于沉重”
- “缺乏AI工具,包括资源监控、节点仿真、标注工具等”
2.4小结
对边缘AI算法开发者有以下结论:
1.平均分值最高(6.87分)的挑战是:“真实业务数据集及其基线算法、预训练模型难以获取”
2.其它头部重要挑战中
- “重要不紧急”头部重要挑战包括:“缺乏真实业务及其研究需求的固定来源”“边缘AI系统部署等起步过程中缺乏指南文档”
- “重要且紧急”头部重要挑战包括:“算法研发迭代中,重复部署整套端边云系统过于沉重”“缺乏AI工具,包括资源监控、节点仿真、标注工具等”
3.“边缘AI及其应用”方向下算法开发各职业平均分值最高的生态挑战分别是:
- 工业界:“缺乏AI工具,包括资源监控、节点仿真、标注工具等” (平均分7.5)
- 学术界:“缺乏真实业务及其研究需求的固定来源” (平均分7.14)
- 在校学生:“真实业务数据集及其基线算法、预训练模型难以获取”(平均分7.68)
问卷中也尝试调研边缘AI算法开发其余重要挑战,调研结果词云如下所示,包括边缘AI概念与定义、硬件方案、人才协作、工具与文档、场景需求、AI效果等24条意见,由于篇幅限制不一一阐述。
3、边缘AI服务开发者
本问卷中,边缘AI服务开发者是指,在给定算法基础上开发工业、Re-ID、能源、机器人等边缘AI服务的角色。有74.90%的调研对象填写了边缘AI服务开发者相关问卷调研选项。对每个挑战的负面影响有四种选项,包括“不了解可跳过”“可维持现状”“建议改进”“亟需改进”。
本章先介绍答卷中关于各个算法开发生态挑战的不同维度调研结果,本章末尾将小结各不同维度的结论。
3.1平均分
若选择“不了解跳过”或“可维持现状”记为0分,“建议改进”记为5分,“亟需改进”记为10分,答卷中对边缘AI服务开发者各挑战的平均分值如下图所示。对比认为“还有其他重要挑战”的1.24分,问卷中所罗列的各挑战都超过了5分,可以认为各挑战都有改进的需求。
其中,平均分值最高(6.76分)的挑战是:
- “通用方案整体性能不一定满足特定业务需求”
在截尾均值6.09分以上的其它头部挑战还包括:
- “自研业务算法和系统方案周期长成本高”
- “方案效果复现困难或通用方案应用范围存疑”
从“边缘AI及其应用”方向细分工业界、学术界和在校学生等不同职业调研对象(三者在调研对象中的比例大致为2:1:1),细化服务开发者各项挑战平均分:
“边缘AI及其应用”方向下各职业平均分值最高的服务开发挑战完全一致:
- 工业界:“通用方案整体性能不一定满足特定业务需求” (平均分7.1)
- 学术界:“通用方案整体性能不一定满足特定业务需求” (平均分7.8)
- 在校学生:“通用方案整体性能不一定满足特定业务需求”(平均分7.5)
在截距均值以上的其它头部挑战还包括:
工业界(截距均值5.99):
- “自研业务算法和系统方案周期长成本高”(平均分6.63)
- “方案效果复现困难或通用方案应用范围存疑”(平均分6.1)
学术界(截距均值5.75):
- “自研业务算法和系统方案周期长成本高”(平均分7.00)
- “方案效果复现困难或通用方案应用范围存疑”(平均分6.60)
在校学生(截距均值5.84):
- “方案效果复现困难或通用方案应用范围存疑”(平均分6.88)
- “自研业务算法和系统方案周期长成本高”(平均分6.46)
3.2亟需改进
对于边缘AI服务开发者,问卷中提及的挑战被选为“亟需改进”的比例都在20%以上,高于“还有其他重要挑战”的6.36%,可以认为各个挑战都有一定的迫切需求。
其中被选为“亟需改进”的挑战中比例最高(36.78%)的是:
- “通用方案整体性能不一定满足特定业务需求”
在截尾均值(25.57%)以上的其它头部挑战还包括:
- “自研业务算法和系统方案周期长成本高”
- “现场人员只会开关机,希望简化现场安装部署”
与“平均分”维度相比,“亟需改进”维度头部部分选项排名有变化。
1、在“亟需改进”维度才进入头部的挑战有一个,在“平均分”部分其实也是非常接近头部(距离截尾均值0.06),这可能说明该挑战比较重要,而且需求比较迫切,这个挑战是:
“现场人员只会开关机,希望简化现场安装部署”
2、在“平均分”维度有一个头部挑战在“亟需改进”维度排名下降,意味着其有一定的重要性,但相对紧急程度较低,可能是“重要不紧急”的、更为“长远”的需求,这个挑战是:
“方案效果复现困难或通用方案应用范围存疑”
3.3可改进
问卷中的绝大部分挑战都以较大比例(59.77% - 68.96% )被选为“建议改进”和“亟需改进”(下总称“可改进”),对比认为“有其他重要挑战”需改进的比例仅为10.92%,说明列举在问卷中相关挑战大部分都明显有改进的需求。
其中,被认为“可改进”的挑战中比例最高(68.96%)的是:
- “通用方案整体性能不一定满足特定业务需求”
在截尾均值(61.78%)以上的其它头部挑战还包括:
- “自研业务算法和系统方案周期长成本高”
- “方案效果复现困难或通用方案应用范围存疑”
与“亟需改进”相比,“可改进”维度头部部分选项排名有变化。
1、在“可改进”维度头部选项中,比“亟需改进”排名更高的挑战,可以认为是有一定的重要性,但相对不那么紧急,看上去更“长远”的“重要不紧急”挑战包括:
“方案效果复现困难或通用方案应用范围存疑”
这与“亟需改进”章节结论一致。
2、在“亟需改进”维度头部选项中,比“可改进”排名更高的挑战,可以认为是一定的重要性,但相对比较紧急,这些看上去更“紧迫”的“重要且紧急”挑战包括:
“现场人员只会开关机,希望简化现场安装部署”
这与“亟需改进”章节结论一致。
3.4小结
对边缘AI服务开发者有以下结论:
1.平均分值最高(6.76分)的挑战是:“通用方案整体性能不一定满足特定业务需求”
2.头部重要挑战中
- “重要不紧急”头部重要挑战包括:“方案效果复现困难或通用方案应用范围存疑”
- “重要且紧急”头部重要挑战包括:“现场人员只会开关机,希望简化现场安装部署”
- 头部重要挑战还包括:“自研业务算法和系统方案周期长成本高”
3.“边缘AI及其应用”方向下服务开发各职业平均分值最高的生态挑战完全一致:
- 工业界:“通用方案整体性能不一定满足特定业务需求” (平均分7.1)
- 学术界:“通用方案整体性能不一定满足特定业务需求” (平均分7.8)
- 在校学生:“通用方案整体性能不一定满足特定业务需求”(平均分7.5)
问卷中也尝试调研边缘AI服务开发其余重要挑战,调研结果词云如下所示。包括场景定制化、培训与指南、部署安装、硬件资源、技术方案等18条挑战,由于篇幅原因不一一阐述。
4、边缘AI技术布道者
本问卷中,边缘AI技术布道者是指开展边缘AI技术演讲布道,推广甚至销售现有边缘AI技术与服务的角色。有69.94%调研对象填写了边缘AI技术布道者相关问卷调研选项。对每个挑战的负面影响有四种选项,包括“不了解可跳过”“可维持现状”“建议改进”“亟需改进”。
本章先介绍答卷中关于各个算法开发生态挑战的不同维度调研结果,本章末尾将小结各不同维度的结论。
4.1平均分
若选择“不了解跳过”或“可维持现状”记为0分,“建议改进”记为5分,“亟需改进”记为10分,答卷中对边缘AI技术布道者各挑战的平均分值如下图所示。对比认为“还有其他重要挑战”的0.73分,问卷中所罗列的各挑战都超过了5分,可以认为各挑战都有改进的需求。
其中,平均分值最高(6.61分)的挑战是:
- “缺乏商业成功案例”
在截尾均值5.77分以上的其它头部挑战还包括:
- “缺乏与现有方案系统对比,包括成本、部署要求”
- “受众对边缘AI不了解”
从“边缘AI及其应用”方向细分工业界、学术界和在校学生等不同职业调研对象(三者在调研对象中的比例大致为2:1:1),细化技术布道者各项挑战平均分:
“边缘AI及其应用”方向下各职业平均分值最高的技术布道挑战分别是:
- 工业界:“缺乏与现有方案系统对比,包括成本、部署要求” (平均分6.63)
- 学术界:“缺乏商业成功案例” (平均分6.59)
- 在校学生:“受众对边缘AI不了解”(平均分6.25)
在截距均值以上的其它头部挑战还包括:
工业界(截距均值5.98):
- “受众对边缘AI不了解”(平均分6.15)
- “缺乏商业成功案例”(平均分6.43)
学术界(截距均值5.40):
- “受众对边缘AI不了解”(平均分5.91)
- “缺乏与现有方案系统对比,包括成本、部署要求”(平均分5.68)
在校学生(截距均值5.46):
- “缺乏商业成功案例”(平均分6.05)
- “缺乏直观的UI界面和Demo”(平均分6.05)
- “缺乏与现有方案系统对比,包括成本、部署要求”(平均分5.53)
4.2亟需改进
对于边缘AI技术布道者,问卷中提及的挑战被选为“亟需改进”的比例都在20%以上,高于“还有其他重要挑战”的1.72%,可以认为各个挑战都有一定的迫切需求。
其中被选为“亟需改进”的挑战中比例最高(32.18%)的是:
- “缺乏商业成功案例”
在截尾均值(25.00%)以上的其它头部挑战还包括:
- “缺乏与现有方案系统对比,包括成本、部署要求”
- “缺乏直观的UI界面和DEMO”
与“平均分”维度相比,“亟需改进”维度头部部分选项排名有变化。
1、在“亟需改进”维度才进入头部的挑战有一个,在“平均分”部分其实也是非常接近头部(距离截尾均值0.06),这可能说明该挑战比较重要,而且需求比较迫切。这个“重要且紧急”挑战是:
“缺乏直观的UI界面和DEMO”
2、在“平均分”维度有一个头部挑战在“亟需改进”维度排名下降,意味着其有一定的重要性,但相对紧急程度较低,更为“长远”的需求。这个“重要不紧急”挑战是:
“受众对边缘AI不了解”
4.3可改进
问卷中的绝大部分挑战都以较大比例(54.02% - 62.07%) 被选为“建议改进”和“亟需改进”(下总称“可改进”),对比认为“有其他重要挑战”需改进的比例仅为6.89%,说明列举在问卷中相关挑战大部分都明显有改进的需求。
其中,被认为“可改进”的挑战中比例最高(62.07%)的是:
- “缺乏商业成功案例”
在截尾均值(57.61%)以上的其它头部挑战还包括:
- “缺乏与现有方案系统对比,包括成本、部署要求”
- “受众对边缘AI不了解”
与“亟需改进”相比,“可改进”维度头部部分选项排名有变化。
1、在“可改进”维度头部选项中,比“亟需改进”排名更高的挑战,可以认为是有一定的重要性,但相对不那么紧急,看上去更“长远”的挑战包括:
“受众对边缘AI不了解”
这与“亟需改进”章节结论一致。
2、在“亟需改进”维度头部选项中,比“可改进”排名更高的挑战,可以认为是一定的重要性,但相对比较紧急,这些看上去更“紧迫”的“重要且紧急”挑战包括:
“缺乏直观的UI界面和DEMO”
这与“亟需改进”章节结论一致。
4.4小结
对边缘AI技术布道者有以下结论:
1.平均分值最高(6.61分)的挑战是: “缺乏商业成功案例”
2.其它头部重要挑战中
- “重要不紧急”头部重要挑战包括: “受众对边缘AI不了解”
- “重要且紧急”头部重要挑战包括: “缺乏直观的UI界面和DEMO”
- 头部重要挑战还包括:“缺乏与现有方案系统对比,包括成本、部署要求”
3.“边缘AI及其应用”方向下技术布道各职业平均分值最高的生态挑战分别是:
- 工业界:“缺乏与现有方案系统对比,包括成本、部署要求” (平均分6.63)
- 学术界:“缺乏商业成功案例” (平均分6.59)
- 在校学生:“受众对边缘AI不了解”(平均分6.25)
问卷中也尝试调研边缘AI技术布道其余重要挑战,调研结果词云如下所示。包括边缘AI价值和方案配套等7条意见,由于篇幅原因不一一阐述。
5、未来工作
作为KubeEdge社区SIG AI重要成员,华为云边缘云创新实验室将依据调研结果有针对性地向KubeEdge社区SIG AI持续贡献。KubeEdge是业界首个云原生边缘计算框架、当前云原生计算基金会内部唯一孵化级边缘计算开源项目。KubeEdge在全球已拥有800+贡献者和60+贡献组织,在Github获得4.6k+Stars和1.3k+Forks。作为KubeEdge中唯一的AI特别兴趣小组(Special Interest Group),KubeEdge社区SIG AI致力于使能AI应用在边缘更好地运行,聚焦边缘AI技术讨论、API定义、参考架构、开源实现等。为全球开发者提供相关研发支持并孵化繁荣生态,当前已开源边缘AI平台Sedna,包括其跨边云的协同推理、联邦学习、增量学习和终身学习特性。
作为信奉开源文化的社区,KubeEdge始终都强调“Best ideas win”,领域发展自然也不例外。为了交出一个更有竞争力和创意的提案,本次调研了解每位关注开源与边缘AI的朋友对相关方案落地过程遇到的困难,然后选取Best idea,对社区内容进行优化,以便为大家呈现一个体现开源开放精神的资源分享社区生态。
除了之前章节提及的内容,问卷中还包括调研对象的建议。其中“提供公开数据集、预处理和基线代码,构建Benchmark”的建议无论在总览、还是在边缘AI方向的工业界、学术界和在校学生中票数均排名第一,比例分别为82.18%、92.98%、87.10%、86.67%,并且显著高于其它建议,相信此建议需要重点关注。社区也可以根据上面的阐述细分相关职业需求,进一步优化边缘AI生态。
问卷也尝试调研其余重要建议。包括场景演示和研发支撑等8条建议:
场景演示
- 增加demo展示
- 深入了解行业落地痛点
- 找准一个典型领域或场景进行全方案的落地测试,包括训练和推理结合实际业务形成一套端到端的解决方案
- 光调研开发者不足够,并非方案用户,要落地还得调研边缘AI的最终客户需求
研发支撑
- 最重要还是数据公开
- 希望能提供更多的例子,示例怎么完成一个任务的训练和部署。联邦学习目前了解的人比较少,希望对它的优势和使用方法做更多介绍,降低系统使用门槛。
- 需要对相关开源平台的了解,也可以搞合作
- 提供更多的开发者使用模式,不局限于现在example
路遥共相伴,勠力同向前。特别感谢参与答卷的专家、学者和同学,本次调研的四大“意见领袖”与十佳“优秀意见”等各项评选正在有序进行,并将陆续发放报告和纪念品。结合行业关注的最新技术趋势,KubeEdge将集结当前SIG AI中30+单位的各供应商和开发者为边缘AI算法开发者、服务开发者、技术布道者三种角色提供资源和平台帮助。这将包括数据集开源、预处理与范式算法开源、以及AI工具等行业内迫切需要的资源,为大家带来一场开源饕餮盛宴。相关内容将陆续到来!欢迎关注KubeEdge 社区https://github.com/kubeedge/ 、KubeEdge SIG AI及其项目Sedna https://github.com/kubeedge/sedna。