本文介绍如何使用开发机进行作业开发。
作业开发的典型做法是启动一台开发机进行远程作业开发。作业开发完毕之后,将作业打包,使用 LAS 任务管理功能运行线上作业。用户也可以选择在本地进行作业开发,但是由于操作系统、模型支持、python 包支持等方面的问题,还是推荐使用 LAS 预置开发机进行作业开发。
说明
创建开发机推荐挂载文件存储 vePFS 或者对象存储 TOS。原因基于以下两点:
已安装ve-daft且更新为最新版本。创建开发机时,如果选择 ve-daft 镜像,则 ve-daft 及其 python 依赖、模型依赖均已安装。
在开发机内更新 ve-daft 的方式如下:
# 安装 ve-daft 以及 LAS 提供的算子包 pip install {安装包名称}[las] pip install {安装包名称}[flash-attn] # 模型加速工具
已通过 SSH 远程连接开发机。详细操作请参考:远程连接开发机。
说明
方式二在开发阶段因需频繁打镜像和下载镜像而存在明显缺点,但在运行时能凭借镜像保障环境稳定,具有显著优势。
环境准备完毕,就可以在 TRAE/vscode/terminal 进行代码开发了。
可以参考任务管理,将开发好的作业提交任务管理运行。
export ACCESS_KEY=xxx export SECRET_KEY=xxx export TOS_ENDPOINT=https://tos-cn-beijing.volces.com # 内网使用 https://tos-cn-beijing.ivolces.com export TOS_REGION=cn-beijing