火山引擎机器学习平台现已支持使用 Ray 分布式计算引擎。算法工程师现在可以利用 Python 和 Ray Ai Runtime,轻松地进行大规模数据处理和分布式模型训练。我们致力于提供一站式的机器学习服务,助力客户打造高效、可靠的机器学习工作流程。我们进一步优化了服务,通过将 Ray 框架(ray.io)与自定义任务模块无缝集成,简化了 Ray 作业的创建和执行过程,实现了作业的灵活调度和按需执行。
使用 Ray 时,用户无需对代码进行任何修改或调整资源配置,只需携带包含 Ray Runtime 的镜像,即可快速启动 Ray 作业。此外,用户还可以通过 veMLP 中的开发机模块与 Ray 引擎连接,进行任务开发和调试。Ray(Preview)目前支持了华北2(北京)、华东2(上海)等地域。
平台支持通过控制台(Web 页面)和命令行工具发起训练任务,下文将介绍控制台提交 Ray Job 方式的操作步骤。