2021数据科学和机器学习平台的魔力象限
Altertyx由领导者变为挑战者

Gartner将数据科学和机器学习(DSML)平台定义为核心产品,并为相干集成的产品,组件,库和框架(包括专有的,合作伙伴来源的和开源的)提供支持组合。它的主要用户是数据科学专业人员,包括专家数据科学家,公民数据科学家,数据工程师,应用程序开发人员和机器学习(ML)专家。核心产品和支持产品组合:
  • 具有足够的集成度,以提供一致的“外观”。
  • 创建一种用户体验,其中所有组件都可以合理地互操作以支持分析管道。
DSML平台
  • 提供构建DSML解决方案必不可少的基本功能和高级功能(主要是预测模型和规范模型)。
  • 支持将这些解决方案合并到业务流程,周围的基础架构,产品和应用程序中。
  • 支持平台获得的见解的可持续消费,并提供量化和跟踪数据科学项目价值的功能。
  • 支持各种技能娴熟的数据科学专业人员(“数据科学家”是一个不一致的职务和专业荣誉)— DSML平台的用户群通常由具有不同技术和业务背景的专业人员组成。
  • 支持整个数据科学生命周期中的多项任务,包括:
    • 问题和业务环境理解
    • 数据提取
    • 资料准备
    • 数据探索
    • 特征工程
    • 模型创建和培训
    • 模型测试
    • 部署方式
    • 监控方式
    • 维护
    • 数据和模型治理
    • 可解释的人工智能(XAI)
    • 商业价值追踪
    • 合作

魔力象限

图1:数据科学和机器学习平台的魔力象限
阿里云
阿里云是这个魔力象限中的利基市场。它提供了两个软件产品,这些软件产品共同构成了其核心DSML平台:AI平台(PAI)Studio和Data Science Workshop。
除了中国以外,阿里巴巴还在南亚和东南亚市场拥有强大的客户群,但在其他地方却没有很多客户。其当前平台专注于零售,互联网和数据服务领域的应用
阿里云的产品和路线图非常适合互联网技术,数据服务,零售和政府等领域的专家数据科学家和数据工程师。阿里云强调支持DSML工作流程中某些任务的扩展,但是其平台缺乏功能和易用性,无法为公民数据科学家使用,这减缓了其不成熟组织的采用速度。
长处
  • 在中国建立的强大社区:阿里云通过天池平台展示其社区的实力,天池平台是类似于Kaggle的协作,竞争和知识共享平台。该平台已在中国市场广泛采用。
  • 高级用例建模:阿里巴巴为高级用例提供了强大的解决方案,例如图像标记,图像识别和分割以及推荐引擎,这对专家数据科学家很有用。
  • 无缝集成可创建一致性:阿里巴巴提供了一个一致性平台,可与其他产品很好地集成在一起,以进行数据准备,探索,机器学习,扩充和交付。它在其平台上提供拖放式交互建模功能,专家数据科学家可以使用该功能来支持ML管道。
注意事项
  • 地理策略:尽管阿里云在许多国家/地区都设有办事处和服务地点,但其服务的客户主要在亚太地区。潜在客户应确保他们对供应商在其所在地区的业务和支持感到满意。
  • 产品愿景:鉴于其他供应商当前的发展速度,阿里云必须迅速而敏捷,因为该市场可能仍将保持高度竞争。其产品路线图的一些关键主题及其内容已作为许多其他供应商的标准功能提供。
  • 狭义使用和缺乏公民数据科学家支持:当前的PAI Studio和Data Science Workshop产品提供有限的ML和高级分析功能,例如基于代理的建模,离散事件建模,蒙特卡洛模拟,对生成对抗网络和自我的支持监督学习。当前,该平台适合高级用户,但对于公民数据科学家或业务分析师而言可能不是一个不错的选择。
    Alteryx
    Alteryx在这个魔力象限中是一个挑战者。它通过引入分析过程自动化(APA)技术来重新定位其产品,以提供用于自动化分析过程并与应用程序和机器人过程自动化(RPA)集成的构建块。该平台包括Alteryx设计器,Alteryx智能套件,Alteryx服务器,Alteryx Connect和Alteryx Promote。Alteryx Analytics Hub为工作流自动化和调度,协作,多租户和数据连接管理提供了一个环境。
    Alteryx的业务在地理位置上是多元化的,该供应商在大多数领域和行业中都有客户。垂直行业包括制造业,金融服务,包装消费品,零售,医疗保健和政府。
    Alteryx的广泛改造正在进行中。新推出的Alteryx Analytics Hub提供了一种集中的方法,用于在管理分析和数据连接环境时协调工作流和协作。
    长处
    • 易于使用于各种角色:利用无代码和专家模式的协作用户体验有助于简化所有角色的使用。Alteryx还提供了业务线(LOB)和行业解决方案模板以及快速入门套件,以加快入门和使用速度。
    • 进入市场战略:通过APA,Alteryx强调了分析内容的创建以及从洞察力到行动的发展。强大的渠道和独立软件供应商合作伙伴关系以及纵向化的进入市场战略,包括Alteryx开发的和合作伙伴共同开发的解决方案,可以创造动力并提高知名度。
    • 客户体验和运营支持:从客户的反馈来看,Alteryx一直提供出色的功能和支持。当被问及他们在Alteryx方面的总体经验时,客户通常会给予非常积极的回应。
    注意事项
    • 不断变化的产品组合:随着APA的推出,Alteryx正在对其产品组合进行许多更改。客户应寻求澄清,并验证不断发展的APA框架是否适合其DSML策略和用户。
    • 成本高昂:Alteryx客户通常认为定价是一个问题。他们表示物有所值,但随着数据科学计划的发展,他们通常还会评估成本较低的替代方案。
    • 创新:尽管Alteryx通过RPA集成,增强和多角色方式提供了一些出色的创新,但其他供应商在尖端ML和关键领域(例如流,物联网(IoT)和XAI)方面处于领先地位。
    尼米(Knime)
    KNIME是这个魔力象限中的有远见者。它的开源产品KNIME Analytics Platform专注于DSML工作流和项目的创作。商业产品KNIME Server专注于自动化,部署和编排功能。
    KNIME在全球范围内具有多元化的业务,在欧洲和美国拥有强大的业务。其客户群涵盖了所有行业和公司规模。
    KNIME将继续发展并发展其愿景,以弥合开发与生产之间的鸿沟,并为数据科学家和最终用户提供新的协作方式。
    长处
    • DSML功能的广度和深度:十多年来,KNIME一直在逐步构建其产品,这体现在该平台提供的广泛功能中。它具有将近4,000个节点,用于连接到不同类型的数据源,转换和准备数据,ML和其他高级技术。KNIME的平台不支持很少的DSML任务。
    • 对开源平台的承诺:KNIME Analytics Platform并非完整产品的受限版本。大多数组件库都可以免费在平台中使用。这为试验DSML项目(进行测试和学习)提供了理想的方法,而无需对特定技术进行前期投资。然后,可以通过使用KNIME Server产品来实现可伸缩性。
    • 视觉工作流程的连贯性:KNIME Analytics Platform中的基本构建块是节点,组件和工作流程。平台内的所有内容,包括AutoML,数据可视化,交互式应用程序和部署模型,都是使用这些模块构建的,可以分解为具有相关元数据的单个组件和节点,以实现完全透明。
    注意事项
    • 对企业部署的有限客户支持:KNIME没有像其他DSML供应商那样积极地扩展。尽管有活跃的社区回答有关功能的问题,但是企业部署通常需要专家服务来提高采用率,并确保产品符合期望。KNIME依靠合作伙伴来提供这些服务。
    • 负责任的AI的愿景:KNIME为XAI提供了很多组件,例如SHapley Additive ExpPlanations(SHAP),部分依赖预处理(PDP)和个人条件期望(ICE)。但是,缺乏可以由数据科学团队中的所有学科应用的框架,指南,最佳实践和研究。
    • 低市场吸引力和销售创新:KNIME对DSML平台购买者的可见性仍然很低。因此,潜在客户可以通过更突出的销售和营销活动来筛选新的供应商。