You need to enable JavaScript to run this app.
AI 数据湖服务

AI 数据湖服务

复制全文
开发机
创建开发机
复制全文
创建开发机

前提条件
  • 已开通火山引擎 LAS 服务,完成账号实名认证,具体步骤,请参考准备工作
  • 已具备 1 个及以上队列资源,可支持开发机部署需求,资源队列创建请参考资源管理
  • (可选)如果您希望在独占网络环境下连接开发机,您还需准备网络相关资源与配置:
    • 已创建 1 个及以上负载均衡实例,具体步骤请参考创建实例
    • 已创建私有网络,且VPC的核心配置要求如下,详细操作步骤请参考创建私有网络
      • VPC的子网可用区与队列可用区相同。
      • 完成VPC的安全组配置,且其入方向规则中应当至少包含一条允许来自 100.64.0.0/10 网段的所有流量通过的规则。

创建开发机
  1. 进入开发机页面。

    1. 登录 LAS 控制台 ,并选择目标地域和项目。
    2. 在左侧导航栏中选择数据处理 > 开发机,进入开发机页面。
  2. 单击创建开发机,​在开发机配置页面配置以下关键参数。

    1. 配置基本信息。
      Image

      参数名称

      说明

      名称

      填写开发机的名称。 必填

      • 支持 1~100 位可见字符,且只包含大小写字母、中文、数字、中划线、下划线。

      描述

      填写对开发机的适当描述。 选填

      • 支持 1~200 位可见字符。
    2. 资源配置。
      Image

      参数名称

      说明

      队列

      选择已准备好的队列资源,用于后续开发机的环境部署与任务开发。

      注意

      当前LAS AI支持独占队列和普通的计算队列两种队列资源,推荐您使用独占队列(即EMR Serverless队列),可提高队列资源利用率和灵活度。更多队列的介绍请参见队列管理

      可用区

      选择当前开发机使用的队列可用区。

      资源分配

      为当前开发机分配队列CU资源。

      资源交付策略

      设置队列资源的交付策略,即,若队列的资源被其他作业占用,无足够空闲资源可用,请选择合适交付策略。当前支持:

      • 等待:等待其他作业结束后释放资源。
      • 抢占:立刻结束任务释放资源,这可能导致其他任务失效
    3. 配置环境信息。
      Image

      参数名称

      说明

      镜像

      选择开发机的镜像。
      当前支持内置镜像、自定义镜像和火山引擎镜像仓库中的镜像,其中自定义镜像和火山引擎镜像仓库中的镜像需要安装 ssh-server 软件。

      说明

      Debian、Ubuntu、CentOS、SUSE 类型的操作系统在创建开发机时会自动为您安装 ssh-server,其余操作系统需要您在构建镜像时自行安装。

      • 内置镜像:LAS 提供 Daft、Ray、Spark 等官方内置镜像。
      • 自定义镜像:支持 LAS 平台上构建的自定义镜像部署启动开发机。
      • 火山引擎镜像:火山镜像仓库中的镜像。
      • 镜像URL:支持配置为公网可访问的自建镜像仓库URL。注意,当前使用独占队列时,不支持此种镜像方式。

      云盘

      选择云盘类型,填写开发机需要使用的云盘容量,至少为20 GiB 。选填

      • 用于存储开发过程中的文件,支持极速型 SSD PL0 和极速型 SSD FlexPL 两种云盘类型,性能请参考云盘规格
      • 单个开发机实例的云盘计费自首次运行时开始,删除时结束,具体收费详见计费说明
      • 云盘将作为持久化存储挂载在根目录/,该目录下的数据在关机或重启后均会被保留。
      • 云盘容量不足时,支持动态按需扩容。
      • 删除开发机时,云盘中的数据将一并被擦除,无法恢复,请注意重要数据的备份
      • 如果您需要永久性存储,可以配置存储路径挂载。

      数据集挂载

      选择需要挂载的LAS数据集。

      • 如果您已经将后续需要用于数据处理任务开发的数据创建为LAS的数据集,您可在此处将数据集挂载至开发机中,便于后续使用开发机时直接读取数据。
      • 当前最多支持挂载20个数据集,数据集创建的操作详情请参见数据集管理

      存储路径挂载

      选择需要挂载的文件系统,并配置挂载路径。选填。

      • 您可以使用存储挂载功能挂载不同类型的存储,以访问需要的数据,或者持久化存储开发过程中的文件。
      • 当前支持 vePFS、TOS 、NAS 存储挂载,后续版本将支持 TOS(cloudFS)、HDFS 等存储介质的挂载。使用限制请参见存储挂载说明
      • 目前最多可挂载20个文件系统。

      环境变量

      您可按需为开发机创建环境变量,支持以Key-Value的方式创建环境变量,便于后续直接在任务代码中引用。
      您可以按需选择通过KV模式、文本模式来配置环境变量。文本模式按照 key:value 的格式,在文本框中直接输入环境变量名和变量取值,支持输入多个环境变量,通过换行分隔多个环境变量。

    4. 配置网络信息与访问配置。
      Image

      分类

      参数名称

      说明

      网络信息

      SSH网络模式

      • 共享网络:平台默认会提供公网 IP 进行 SSH 登陆,但连接速度会有限制
      • 专享网络:用户可配置负载均衡来访问开发机,保证SSH连接体验

      负载均衡
      (专享网络需要配置)

      配置负载均衡用来访问开发机。

      • 当负载均衡配置了公网时,开发机默认会提供公网 SSH 登录命令,否则提供私网 SSH 登录命令。
      • 开发机默认会与配置的负载均衡所属 VPC 网络打通,因此您还需配置该 VPC 下的子网,且子网的可用区需与创建队列时所选的一致。

      高级网络模式

      • 开启后,可以打通开发机到目标 VPC 的网络。
      • 安全组入方向需要放通您 SSH 连接 client 端网段规则,其中其中协议类型:TCP,端口范围:2222,源地址为本机/本地网络出口 IP,否则无法登录开发机。如果配置了自定义端口,则端口范围上还需要配置自定义的监听端口值。

      访问配置

      SSH公钥

      开发机 SSH 登录仅支持公钥认证。

      • 开发机支持 SSH 方式登录,需要填入 SSH 公钥,如果没有,您可使用ssh-keygen -t rsa命令生成。
      • 多个公钥请通过换行输入。

      访问端口
      (专享网络需要配置)

      当前仅支持通过 SSH 登录。

      • 访问端口为范围1-65535。
      • 不同实例需要填写不同的端口。
      • 独占模式下,可以添加自定义端口,监听端口为容器中的端口,调用端口为负载均衡上的端口。

      说明

      添加自定义端口后,需要在安全组上添加规则,其中:

      • 协议类型:TCP。
      • 端口范围:填写的监听端口,源地址为本机/本地网络出口 IP。
  3. 完成上述参数配置后,查看并勾选右下角的服务协议,完成后单击“创建”按钮,开始创建开发机,此时开发机列表页面中,开发状态为“开机中”。
    Image
    当开发机状态变更为“运行中”表明开发机已创建完成。

后续步骤
  • 完成开发机创建后,您可远程登录开发机,开始任务开发,远程登录操作可参见远程连接开发机
  • 后续您也可查看开发机的操作日志、监控开发机队列资源用量等,也可对开发机进行启停、复制等管理操作,详情请参见管理开发机
最近更新时间:2026.01.15 18:06:19
这个页面对您有帮助吗?
有用
有用
无用
无用