You need to enable JavaScript to run this app.
最新活动
产品
解决方案
定价
生态与合作
支持与服务
开发者
了解我们
导航

Notebook

最近更新时间2023.08.01 13:27:58

首次发布时间2022.04.06 21:02:43

1 使用场景

为满足用户数据开发、数据探索场景提供的交互式开发环境。 Notebook 基于开源的 Jupyterlab 定制化开发,支持使用 Python、Markdown 语言、引入第三方库完成数据开发以及算法开发并且发布成定时调度执行任务。

2 前提条件

  • 若仅开通 DataLeap 产品大数据集成数据开发特惠版服务时,不支持创建 Notebook 任务。详见版本服务说明

3 操作步骤

3.1 新建任务

  1. 登录 DataLeap租户控制台

  2. 概览界面,显示加入的项目中,单击数据开发进入对应项目。

  3. 任务开发界面,左侧导航栏中,单击新建任务按钮,进入新建任务页面。

  4. 选择任务类型:交互式分析。

  5. 填写任务基本信息:

    1. 任务名称:输入任务的名称,只允许字符.、字母、数字、下划线、连字符、[]、【】、()、()以及中文字符,且在127个字符以内。

    2. 保存至: 选择任务存放的目标文件夹目录。

  6. 单击确认按钮,成功创建任务。

3.2 使用任务

3.2.1 配置环境启动信息

新建任务完成后,首次打开 Notebook,需先配置环境启动信息:

参数说明

选择Kernel

Notebook Kernel 是执行 Notebook 文件包含代码的计算引擎,比如 ipython kernel 执行 python 代码。打开 Notebook 后,将自动启动 Kernel,运行代码时,Kernel 执行计算并产出结果。
目前 Notebook 仅支持 Python on K8s 的 Kernel 类型。

计算资源组支持选择公共计算资源组、独享计算资源组
镜像仅支持选择默认镜像地址,预装了常用第三方库。
资源配置资源可根据实际需求进行配置,以 CU 为单位,默认配置 1CU(1CU = 1Core 4GB),下拉可选择更高规格的资源配置。

启动信息配置完成后,单击确认按钮,启动Kernel连接,待导航栏 Kernel 状态为 Idle 后,即代表启动成功,可进行后续的调试运行代码逻辑。

  • Kernel 状态说明:

    • Idle 空闲状态:Kernel 处于空闲状态,随时可运行任务。

    • Busy 状态:Kernel 处于忙碌状态,需等待资源释放后,再执行后续任务。

    • disconnected 断开状态 (断网):Kernel 有网络断开的情况,您需要手动再启动 Kernel 后,再执行任务。

    • connected 连接状态:Kernel 正处于连接状态。

    • dead 状态:连接失败状态,您可以在右侧查看失败原因。

  • 您可单击 Kernel 按钮,进行 Kernel 高级设置替换。

3.2.2 编辑任务

启动 Kernel 状态正常后,即可进入代码开发。目前已支持 Python、Markdown、Raw 三种语言。

  • 您可以在当前的 cell 框中,输入对应语言的代码逻辑,以 Python 语言为例:
# 如何查看预装第三方包
# cell类型选择python,执行以下操作
!pip3 list

# 如何安装第三方包
# cell类型选择python,执行以下操作,以安装library_name为例
!pip3 install  library_name
  • 示例代码 - 使用 plotly 画图
!pip3 install plotly

import plotly.express as px
df = px.data.iris()
fig = px.scatter(df, x="sepal_width", y="sepal_length", color="species")
fig.show()
  • 参数:支持时间参数 ${date}、${hour} 等,更多参数可参考:时间变量与常量说明

  • Cell 单元框功能按钮:

    序号参数说明
    1语言选择支持 Python、Markdown、Raw 三种语言选择。
    2Format Cell将书写代码格式化操作。
    3New Cell添加一个新的 Cell。
    4Copy Cell and Paste Below Cell复制并粘贴内容到当前单元框后面。
    5Cut Cell剪切当前单元框。
    6Paste Below Cell粘贴内容到当前单元框后面。
    7Delete Cell删除当前单元框。

    8

    Cell 框右键操作

    单元框的更多快捷操作,可通过在 Cell 框中右键查看更多操作项。
    其中 Enable Notebook Vim mode 可以将编辑框 开启/关闭 vim 模式。

3.2.3 执行设置

  1. 单击进入右侧侧边栏执行设置窗口。

  2. 选择计算资源组:支持选择公共计算资源组、独享计算资源组

  3. 镜像地址:仅支持选择默认镜像地址,预装了常用第三方库。

  4. 资源配置:资源可根据实际需求进行配置,以 CU 为单位,默认配置 1CU(1CU = 1Core 4GB),下拉可选择更多规格的资源配置。

    说明

    其中 0.25CU、0.5CU 规格,仅独享计算资源组支持选择。

3.2.4 调度设置

进入右侧边栏调度设置,配置节点调度相关属性。设置操作详见:调度设置

3.2.5 保存调试任务

  1. 配置完成后,单击上方操作栏中保存图标按钮,保存节点至服务器。

  2. 单击操作栏中运行所有/运行图标按钮,按顺序运行所有Cell或者运行单一的Cell,运行成功后,您可在Cell框下方查看运行结果。

3.2.6 提交发布任务

任务所需参数配置、调试等操作完成后,将任务提交发布到运维中心离线任务运维中执行。

单击操作栏中的提交上线按钮,在弹窗中,需先通过提交事前检查提交上线等上线流程,最后单击确认按钮,完成作业提交。详见概述---离线任务提交发布

注意

上线流程中的“提交事前检查”,需租户主账号或项目管理员先在项目控制台 > 流水线管理中,创建相应的流水线检查事宜后方可显示。详见流水线管理

后续任务运维操作详见:离线任务运维