0

0

MLOps:企业是否在重复同样的 DIY 错误?

PHPz

PHPz

发布时间:2023-04-08 14:11:06

|

779人浏览过

|

来源于51CTO.COM

转载

​译者 | 崔皓

审校 | 孙淑娟

开篇

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

MLOps:企业是否在重复同样的 DIY 错误?

一般而言,企业不会主动构建自有的云计算基础设施是有原因的。过去十年,IT 基础架构团队试图构建自己的私有云,因为他们认为与公共云相比,私有云会以性价比更高的方式支撑他们的业务。但事与愿违,最终花费在私有云上的的时间和成本都超过了预期,建成私有云以后反而需要更多的资源来对其进行维护,并且在安全和扩展方面都比公共云略逊一筹。这导致那些自建私有云的企业最终没有更多的资源投资于核心业务,而是将大量的时间和人员投入到无法扩展业务需求的基础设施上。 

现在,许多企业通过各种开源工具(如 Apache Spark)生成解决方案,但对于 MLOps 的大多数行为都需要进行重复地手动操作。

这会导致模型部署需要数周甚至数月的时间、低效的运行时间(通过计算和所需时间运行的推理来衡量),同时还缺乏对模型测试和监控的观察。并且,所用方法过于定制化,无法为企业的不同部门的多个用例提供可扩展、可复用的业务流程。

误诊问题的案例

此外,通过与业务线负责人、首席数据分析官的对话得出这样的结论,虽然组织雇用了很多的数据科学家,但并没有看到任何回报。随着研究的深入,他们会不断提出各种问题,通过这些问题去识别人工智能面临的困难和障碍。他们很快意识到关键问题在“最后一英里”——部署模型并应用于实时数据,有效地执行它们,这样一来才能使收益大于成本,从而更好地衡量其性能。

为了解决业务问题和制定业务决策,数据科学家将数据转化为模型。这一过程需要两类技能的支持,其一是,构建出色模型所需的专业知识和技能;其二是,使用代码在现实世界中推动模型,同时监控和更新模型的技能。然而这两类技能却完全不同。

正因为这种差异就有了ML 工程师的用武之地。ML 工程师负责将工具和框架进行集成,以确保数据、管道和基础设施协同工作,在此前提下大规模生产 ML 模型。 

sematic
sematic

一个开源的机器学习平台

下载

那么,现在怎么办?雇用更多的机器学习工程师?

即使拥有最好的 ML 工程师,企业在扩展 AI 时仍面临两个主要问题:

  • 无法快速雇用 ML 工程师:对 ML 工程师的需求变得非常强烈,ML 工程师的职位空缺增长速度比 IT 服务增长的速度快了 30 倍。有时需要等待数月甚至数年来填补岗位空缺,由此MLOps 团队需要找到一种高效的方式支持更多的 ML 模型和用例,而无需通过增加 ML 工程师的人数来满足对ML应用的需求。但这一措施又会带来了第二个瓶颈……
  • 无论在何处以及如何构建模型,都缺乏部署模型的可重复、可扩展的最佳实践:现代企业数据生态系统的现状是,不同的业务部门根据数据和技术的要求会使用不同的数据平台(例如,产品团队可能需要支持流数据,而财务需要为非技术用户提供简单的查询界面)。此外,数据科学还需要将应用分散到各个业务部门而不是集中应用。换句话说,不同的数据科学团队中针对他们关注的用例(领域)都有一套特有的模型训练框架,这意味着一刀切的训练框架针对整个企业(包含多个部门/领域)而言是无法成立的。 

如何从人工智能中获得最大价值

为了提高自动化能力;为了提供大规模的用户个性化体验;为了兑现更准确、更精细、可预测的用户承诺,企业已经向人工智能投入了数十亿美元。但到目前为止,人工智能的承诺和结果之间存在巨大差距,只有大约 10%的人工智能投资产生了可观的投资回报率。

最后,为了解决 MLOps 问题,首席数据分析官需要围绕业务核心的数据科学构建自己的能力,同时也要投资其他的与 MLOps自动化相关的技术。这是常见的“构建与购买”困境,不仅从运营的角度(成本收益)去考量,更多地需要考虑人工智能投资在整个企业中渗透的速度和效率,以及是否通过更好的方式产生新的收入产品和客户群,或通过提高自动化程度和减少浪费来削减成本。 

译者介绍

崔皓,51CTO社区编辑,资深架构师,拥有18年的软件开发和架构经验,10年分布式架构经验。曾任惠普技术专家。乐于分享,撰写了很多热门技术文章,阅读量超过60万。《分布式架构原理与实践》作者。

原文标题:​​MLOps | Is the Enterprise Repeating the Same DIY Mis​​takes?​

相关专题

更多
什么是分布式
什么是分布式

分布式是一种计算和数据处理的方式,将计算任务或数据分散到多个计算机或节点中进行处理。本专题为大家提供分布式相关的文章、下载、课程内容,供大家免费下载体验。

319

2023.08.11

分布式和微服务的区别
分布式和微服务的区别

分布式和微服务的区别在定义和概念、设计思想、粒度和复杂性、服务边界和自治性、技术栈和部署方式等。本专题为大家提供分布式和微服务相关的文章、下载、课程内容,供大家免费下载体验。

228

2023.10.07

常用的数据库软件
常用的数据库软件

常用的数据库软件有MySQL、Oracle、SQL Server、PostgreSQL、MongoDB、Redis、Cassandra、Hadoop、Spark和Amazon DynamoDB。更多关于数据库软件的内容详情请看本专题下面的文章。php中文网欢迎大家前来学习。

954

2023.11.02

apache是什么意思
apache是什么意思

Apache是Apache HTTP Server的简称,是一个开源的Web服务器软件。是目前全球使用最广泛的Web服务器软件之一,由Apache软件基金会开发和维护,Apache具有稳定、安全和高性能的特点,得益于其成熟的开发和广泛的应用实践,被广泛用于托管网站、搭建Web应用程序、构建Web服务和代理等场景。本专题为大家提供了Apache相关的各种文章、以及下载和课程,希望对各位有所帮助。

403

2023.08.23

apache启动失败
apache启动失败

Apache启动失败可能有多种原因。需要检查日志文件、检查配置文件等等。想了解更多apache启动的相关内容,可以阅读本专题下面的文章。

923

2024.01.16

人工智能在生活中的应用
人工智能在生活中的应用

人工智能在生活中的应用有语音助手、无人驾驶、金融服务、医疗诊断、智能家居、智能推荐、自然语言处理和游戏设计等。本专题为大家提供人工智能相关的文章、下载、课程内容,供大家免费下载体验。

401

2023.08.17

人工智能的基本概念是什么
人工智能的基本概念是什么

人工智能的英文缩写为AI,是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学;该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

289

2024.01.09

人工智能不能取代人类的原因是什么
人工智能不能取代人类的原因是什么

人工智能不能取代人类的原因包括情感与意识、创造力与想象力、伦理与道德、社会交往与沟通能力、灵活性与适应性、持续学习和自我提升等。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

620

2024.09.10

vlookup函数使用大全
vlookup函数使用大全

本专题整合了vlookup函数相关 教程,阅读专题下面的文章了解更多详细内容。

28

2025.12.30

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
麻省理工大佬Python课程
麻省理工大佬Python课程

共34课时 | 5万人学习

国外Web开发全栈课程全集
国外Web开发全栈课程全集

共12课时 | 0.9万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号