Front and center 是持续集成(CI)和持续部署(CD)的概念。该方法可用于以可重复和可靠的方式自动化发布 AI 模型的过程。准备好了解您需要了解的一切,以便利用容器在组织内正式化和管理 AI 模型。
部署过程的起点是源代码控制、版本化的 AI 模型。需要复习如何到达起点?查看本系列之前的博客,这些博客涵盖了如何使用可靠来源的数据生成模型,以及围绕模型训练和版本控制的软件开发最佳实践。
数据准备:为 AI
模型训练制定正确的流程:我们最喜欢的棚
模型版本控制工具。减少摩擦。创造稳定。自动化。
生活在一个集装箱化的世界
对于 ModelOps,容器是打包 AI 模型以在生产中利用的标准方式。本质上,容器是一个正在运行的软件应用程序,由运行应用程序所需的最低要求组成,包括操作系统、应用程序源代码、系统依赖项、编程语言库和运行时。容器由静态容器映像组成,这些映像概述了使应用程序在容器中栩栩如生所需的每个资源和指令。
您的组织可能已经在更传统的软件和 DevOps 设置中采用容器或微服务。但是你知道容器也可以应用于数据科学团队的 AI 模型的打包和分发吗?这对于投资开发 AI 模型的领导者来说是个好消息,因为这意味着模型及其难以安装的依赖项可以打包到可以在任何地方运行的容器中。提高数据科学团队的技能并让他们熟悉容器技术将使他们能够轻松打包自己的 AI 模型并参与强大的 CI/CD 流程——这可以缩短您实现 AI 投资回报的时间。
扩展 AI 模型的概念
Modzy 将容器概念扩展为在生产中运行的 AI 模型。AI 模型通过一个开放的标准化模板进行部署,该模板鼓励开发人员公开其 AI 模型的功能,同时确保它可以在任何地方运行(参见示例。) 将重点放在生产部署上,可以实施一套最佳实践. 如果没有标准化,模型开发人员通常在不同的开发环境中工作,从而在将模型从研究团队复制或移交给生产团队时产生挑战。
标准化模型打包过程可确保数据科学家不需要软件工程或 DevOps 方面的深厚专业知识。但是,他们可以从这些学科中获益。数据科学家可以专注于开发新模型来解决重要问题,而不是每次模型准备好部署时拼凑解决方案。
理想情况下,您需要一套适用于 TensorFlow 和 PyTorch 等流行机器学习框架的标准模板,让数据科学家能够灵活地使用他们选择的工具。这是模型训练中描述的模型训练过程的顶点:我们最喜欢的工具在棚子里。开发人员可以在每个模型的开发过程中做出个性化的决策,而不会影响模型开发和发布的简化流程。
利用 CI 进行自动化构建
为新开发的 AI 模型获取源代码并自动生成该模型的容器化版本的 CI/CD 流程是构建自动化实践的黄金标准。建立这样一个流程意味着部署是完全可重现的,没有可能引入错误并消耗宝贵的开发人员时间的手动策划步骤。Jenkins、CircleCI 或 GitHub Actions 等现代 CI 框架是 CI/CD 管道中的重要工具。他们让您的数据科学家专注于开发他们的模型,而不是解决复杂的部署细微差别——“直接转化为加速完成,从而使您的团队保持较高的开发速度。
Modzy 的方法将持续集成最佳实践与容器化相结合,为模型构建容器镜像。通过自动化构建过程,模型版本控制最佳实践被部署到模型中,确保每个模型都可以追溯到特定版本的安全、经过测试的代码。(查看模型版本控制中突出显示的位置:减少摩擦。创建稳定性。自动化博客。一旦模型开发人员将他们的代码签入到版本控制中,人工智能模型图像就会被构建、扫描和测试,使其为任何人都做好准备-off 或部署。这个简单、方便的过程使自动化构建成为开发人员所寻求的东西,而不是繁重的业务实践。
通过 CI 和容器化的稳健实践为数据科学家和机器学习工程师团队赋能,将有助于弥合 AI 开发和大规模部署之间的差距。
相关帖子DA内容精选
|