Gartner 2019年数据科学和机器学习平台魔力象限(截至2018年11月)
2019年的报告评估了17家供应商(比往年多了一家),基于前瞻性(简称前瞻)和执行能力(简称能力),与往常一样将它们列在四个象限中。
请注意,Gartner仅包括拥有商业许可产品的供应商。尽管像Python和R这些纯粹的开源平台在数据科学家和机器学习专业人士当中大受欢迎,但并未包括在内。
Gartner数据科学和机器学习平台魔力象限,2019年与2018年比较。2018年魔力象限(灰色背景图)和2019年魔力象限(前景图)的结果,箭头连接代表同一家公司的圆圈。如果公司位置大幅改善(远离原位置),箭头标以绿色,如果公司位置下降,箭头标以红色。绿色圆圈表示2家新公司(谷歌和DataRobot),红色X标志着今年跌出象限的供应商(Teradata)。
开源的数据科学分析平台KNIME
KNIME是一个开源的企业级分析平台,专为数据科学家而设计。KNIME的可视化界面包含从提取到呈现数据的所有节点,并强调统计模型。KNIME数据分析平台最引人注目的是其强大的数据和工具的集成能力,KNIME与其他几种数据科学工具(包括R,Python,Hadoop和H2O)以及许多结构化和非结构化数据类型集成。
推荐这款软件的主要优点是:
1-Knime软件开源,有大量带数据案例可以学习
2-Knime支持图形界面,细分非常小的节点和过程
3-knime支持Python、R和Weka语言,当然还有原生的Java编程,很容易语言集成
4-Knime有社区和实验室,Community Nodes和Knime Labs 不断更新处理新事物
RapidMiner快速挖掘[ˈræpɪd][ˈmaɪnər]
RapidMiner是世界领先的数据挖掘解决方案,通过在图像化界面拖拽建模,轻松实现了数据准备、机器学习和预测模型部署,无需编程,简单易用。下图展示了其工作流程
其具有如下优势:
- 统一的平台:
一个平台,一个用户界面,一个系统,支持从数据准备,模型部署到正在进行的模型管理的完整工作流程。
- 可视化工作流设计:
快速易学和方便使用的拖放方法加速了端到端的数据科学,从而提高生产力。
- 广泛的功能:
超出其他可视化平台更多的预定义机器学习函数和第三方库。
- 开源创新:
广泛接受的开源语言和技术,超过250K的数据科学专家的社区和强大的marketplace与不断发展的数据科学需求保持同步。
- 广泛的连接:
超过60种connectors可以轻松访问所有类型的数据:结构化、非结构化和大数据。
- 各种规模的数据科学:
在内存中或hadoop中运行工作流,为各种规模的项目提供最佳选择。
参考文章: