跳转到主要内容

希望从人工智能中获得全部商业利益的企业正在转向 MLOps——一组旨在实现人工智能的新兴最佳实践和工具。

当公司第一次开始部署人工智能和构建机器学习项目时,重点往往是理论。 有没有可以提供必要结果的模型? 如何建造? 怎么训练?

但是数据科学家用来创建这些概念证明的工具通常不能很好地转化为生产系统。 因此,根据 IDC 的数据,部署 AI 或 ML 解决方案平均需要 9 个多月的时间。

IDC 分析师 Sriram Subramanian 说:“我们称之为‘模型速度’,即从开始到结束需要多少时间。”

这就是 MLOps 的用武之地。MLOps — 机器学习操作 — 是一组最佳实践、框架和工具,可帮助公司管理数据、模型、部署、监控以及采用理论概念验证 AI 系统的其他方面并投入使用。

“MLOps 将模型速度降低到几周——有时是几天,”Subramanian 说。 “就像使用 DevOps 加快构建应用程序的平均时间一样,这就是您需要 MLOps 的原因。”

他说,通过采用 MLOps,公司可以构建更多模型、更快地创新并解决更多用例。 “价值主张很明确,”他说。

IDC 预测,到 2024 年,60% 的企业将使用 MLOps 实施其 ML 工作流。 Subramanian 说,当对公司进行有关 AI 和 ML 采用挑战的调查时,缺乏 MLOps 是 AI 和 ML 采用的主要障碍,仅次于成本。

在这里,我们研究了 MLOP 是什么,它是如何演变的,以及组织需要完成和牢记什么,以充分利用这种新兴的人工智能操作方法。

MLOps的演进


几年前,当 Eugenio Zuccarelli 首次开始构建机器学习项目时,MLOps 只是一组最佳实践。从那时起,Zuccarelli 一直在多家公司从事人工智能项目,包括医疗保健和金融服务领域的公司,他看到 MLOps 随着时间的推移而发展到包括工具和平台。

如今,MLOps 为人工智能的操作提供了一个相当强大的框架,Zuccarelli 说,他现在是 CVS Health 的创新数据科学家。举例来说,Zuccarelli 提到了他之前从事的一个项目,该项目旨在创建一个可以预测不良结果的应用程序,例如再入院或疾病进展。

“我们正在探索数据集和模型,并与医生交谈以找出最佳模型的特征,”他说。 “但要使这些模型真正有用,我们需要将它们带到实际用户面前。”

这意味着创建一个可靠、快速和稳定的移动应用程序,后端有一个通过 API 连接的机器学习系统。 “如果没有 MLOps,我们将无法确保这一点,”他说。

他的团队使用 H2O MLOps 平台和其他工具为模型创建了健康仪表板。 “你不希望模型发生重大变化,”他说。 “而且你不想引入偏见。健康仪表板让我们了解系统是否发生了变化。”

使用 MLOps 平台还允许更新生产系统。 “在不停止应用程序工作的情况下换出文件是非常困难的,”Zuccarelli 说。 “即使系统正在生产中,MLOps 工具也可以更换系统,而对系统本身的干扰最小。”

他说,随着 MLOps 平台的成熟,它们会加速整个模型开发过程,因为公司不必为每个项目都重新发明轮子。数据管道管理功能对于人工智能的实施也至关重要。

“如果我们有多个需要相互通信的数据源,这就是 MLOps 可以发挥作用的地方,”他说。 “您希望流入 ML 模型的所有数据都是一致且高质量的。就像他们说的,垃圾进,垃圾出。如果模型的信息很差,那么预测本身就会很差。”

MLOps 基础:一个移动的目标


但不要认为仅仅因为平台和工具变得可用就可以忽略 MLOps 的核心原则。刚开始转向这一学科的企业应该记住,MLOps 的核心是在数据科学和数据工程之间建立牢固的联系。

“为了确保 MLOps 项目的成功,您需要数据工程师和数据科学家在同一个团队中,”Zuccarelli 说。

此外,防止偏见、确保透明度、提供可解释性和支持道德平台所必需的工具——这些工具仍在构建中,他说。 “它肯定还需要做很多工作,因为它是一个如此新的领域。”

因此,如果没有一个完整的交钥匙解决方案可供采用,企业必须精通使 MLOps 如此有效地实施 AI 的所有方面。这意味着在广泛的活动中发展专业知识,位于坦佩的技术咨询公司 Insight 的人工智能团队的国家实践经理 Meagan Gentry 说。

MLOps 涵盖了从数据收集、验证和分析到管理机器资源和跟踪模型性能的整个范围。可用于帮助企业的工具可以部署在本地、云端或边缘。它们可以是开源的或专有的。

但掌握技术方面只是等式的一部分。 MLOps 还借鉴了 DevOps 的敏捷方法和迭代开发原则,Gentry 说。此外,与任何与敏捷相关的学科一样,沟通至关重要。

“每个角色的沟通都至关重要,”她说。 “数据科学家和数据工程师之间的沟通。与 DevOps 和更大的 IT 团队进行沟通。”

对于刚起步的公司,MLOps 可能会令人困惑。有一般原则,数十家供应商,甚至更多的开源工具集。

“这就是陷阱所在,”Capgemini Americas 企业架构高级经理 Helen Ristov 说。 “其中很多都在开发中。没有一套正式的指导方针,就像你在 DevOps 中看到的那样。这是一项新兴技术,指导方针和政策需要时间才能赶上。”

Ristov 建议公司从他们的数据平台开始他们的 MLOps 之旅。 “也许他们有数据集,但他们生活在不同的地方,但他们没有一个有凝聚力的环境,”她说。

她说,公司不需要将所有数据转移到一个平台上,但确实需要一种方法来从不同的数据源中引入数据,这可能因应用程序而异。例如,数据湖非常适合那些在高频下进行大量分析并正在寻找低成本存储的公司。

她说,MLOps 平台通常带有用于构建和管理数据管道并跟踪不同版本的训练数据的工具,但这并不是一劳永逸的。

然后是模型创建、版本控制、日志记录、衡量功能集以及管理模型本身的其他方面。

“其中涉及大量编码,”Ristov 说,并补充说,建立一个 MLOps 平台可能需要几个月的时间,而且在集成方面,平台供应商还有很多工作要做。

“有很多不同方向的发展,”她说。 “有很多工具正在开发中,生态系统非常大,人们只是选择他们需要的任何东西。 MLOps 处于青春期。大多数组织仍在寻找最佳配置。”

理解 MLOps 格局


IDC 的 Subramanian 表示,到 2025 年,MLOps 市场预计将从 2020 年的约 1.85 亿美元增长到约 7 亿美元。但这可能是一个严重的低估,他说,因为 MLOps 产品通常与更大的平台捆绑在一起。他说,到 2025 年,市场的真实规模可能超过 20 亿美元。

Subramanian 说,MLOps 供应商往往分为三类,首先是大型云提供商,包括 AWS、Azure 和 Google 云,它们将 MLOps 功能作为服务提供。

再有就是DataRobot、Dataiku、Iguazio等ML平台厂商。

“第三类是他们过去所说的数据管理供应商,”他说。 “Cloudera、SAS 和 DataBricks 之类的。他们的优势在于数据管理能力和数据操作,他们扩展到了 ML 能力,并最终扩展到了 MLOps 能力。”

Subramanian 说,这三个领域都在爆炸式增长,并补充说,让 MLOps 供应商脱颖而出的是他们是否能够同时支持本地和云部署模型,他们是否能够实施值得信赖和负责任的人工智能,是否即插即用,以及它们扩展的难易程度。 “这就是差异化的来源,”他说。

根据 IDC 最近的一项调查,缺乏实施负责任 AI 的方法是采用 AI 和 ML 的三大障碍之一,与缺乏 MLOps 本身并列第二。

Gartner 的人工智能和机器学习研究分析师 Sumit Agarwal 表示,这在很大程度上是因为除了采用 MLOps 之外别无选择。

“其他方法是手动的,”他说。 “所以,真的,没有其他选择。如果你想扩展,你需要自动化。您需要代码、数据和模型的可追溯性。”

根据 Gartner 最近的一项调查,模型从概念验证到生产所需的平均时间已从 9 个月降至 7.3 个月。 “但 7.3 个月仍然很高,”阿加瓦尔说。 “组织有很多机会利用 MLOps。”

将文化转变为 MLOps


Genpact 的全球分析负责人 Amaresh Tripathy 表示,MLOps 还需要公司 AI 团队的文化变革。

“数据科学家的流行形象是一个疯狂的科学家,试图大海捞针,”他说。 “数据科学家是发现者和探索者,而不是生产小部件的工厂。但这就是你需要做的才能真正扩展它。”

他说,公司经常低估需要付出的努力。

“人们对软件工程有更好的理解,”他说。 “关于用户体验和要求有很多纪律。但不知何故,人们不认为如果我部署一个模型,我必须经历同样的过程。然后假设所有擅长测试环境的数据科学家都会很自然地去部署它并且能够部署它,或者他们可以派几个 IT 同事并能够做到这一点,这是错误的。人们对它所需要的东西缺乏欣赏。”

公司也无法理解 MLOps 会对公司的其他部分产生连锁反应,从而经常导致巨大的变化。

“你可以将 MLOps 放在呼叫中心,平均响应时间实际上会增加,因为简单的事情由机器、人工智能处理,而交给人类的事情实际上需要更长的时间,因为它更复杂,”他说。 “所以你需要重新考虑工作将是什么,你需要什么样的人,以及应该具备什么样的技能。”

他说,如今,一个组织中只有不到 5% 的决策是由算法驱动的,但这种情况正在迅速变化。 “我们预计未来五年将有 20% 到 25% 的决策由算法驱动。我们看到的每一个统计数据,都处于人工智能快速扩展的拐点。”

他说,MLOps 是关键部分。

“百分之一百,”他说。 “没有它,你将无法始终如一地使用人工智能。 MLOps 是企业中人工智能的扩展催化剂。”

本文:https://cio.ceo/making-most-mlops