最近更新时间:2023.08.01 13:27:58
首次发布时间:2022.04.06 21:02:43
为满足用户数据开发、数据探索场景提供的交互式开发环境。 Notebook 基于开源的 Jupyterlab 定制化开发,支持使用 Python、Markdown 语言、引入第三方库完成数据开发以及算法开发并且发布成定时调度执行任务。
登录 DataLeap租户控制台 。
在概览界面,显示加入的项目中,单击数据开发进入对应项目。
在任务开发界面,左侧导航栏中,单击新建任务按钮,进入新建任务页面。
选择任务类型:交互式分析。
填写任务基本信息:
任务名称:输入任务的名称,只允许字符.、字母、数字、下划线、连字符、[]、【】、()、()以及中文字符,且在127个字符以内。
保存至: 选择任务存放的目标文件夹目录。
单击确认按钮,成功创建任务。
新建任务完成后,首次打开 Notebook,需先配置环境启动信息:
参数 | 说明 |
---|---|
选择Kernel | Notebook Kernel 是执行 Notebook 文件包含代码的计算引擎,比如 ipython kernel 执行 python 代码。打开 Notebook 后,将自动启动 Kernel,运行代码时,Kernel 执行计算并产出结果。 |
计算资源组 | 支持选择公共计算资源组、独享计算资源组。 |
镜像 | 仅支持选择默认镜像地址,预装了常用第三方库。 |
资源配置 | 资源可根据实际需求进行配置,以 CU 为单位,默认配置 1CU(1CU = 1Core 4GB),下拉可选择更高规格的资源配置。 |
启动信息配置完成后,单击确认按钮,启动Kernel连接,待导航栏 Kernel 状态为 Idle 后,即代表启动成功,可进行后续的调试运行代码逻辑。
Kernel 状态说明:
Idle 空闲状态:Kernel 处于空闲状态,随时可运行任务。
Busy 状态:Kernel 处于忙碌状态,需等待资源释放后,再执行后续任务。
disconnected 断开状态 (断网):Kernel 有网络断开的情况,您需要手动再启动 Kernel 后,再执行任务。
connected 连接状态:Kernel 正处于连接状态。
dead 状态:连接失败状态,您可以在右侧查看失败原因。
您可单击 Kernel 按钮,进行 Kernel 高级设置替换。
启动 Kernel 状态正常后,即可进入代码开发。目前已支持 Python、Markdown、Raw 三种语言。
# 如何查看预装第三方包 # cell类型选择python,执行以下操作 !pip3 list # 如何安装第三方包 # cell类型选择python,执行以下操作,以安装library_name为例 !pip3 install library_name
!pip3 install plotly import plotly.express as px df = px.data.iris() fig = px.scatter(df, x="sepal_width", y="sepal_length", color="species") fig.show()
参数:支持时间参数 ${date}、${hour} 等,更多参数可参考:时间变量与常量说明。
Cell 单元框功能按钮:
序号 | 参数 | 说明 |
---|---|---|
1 | 语言选择 | 支持 Python、Markdown、Raw 三种语言选择。 |
2 | Format Cell | 将书写代码格式化操作。 |
3 | New Cell | 添加一个新的 Cell。 |
4 | Copy Cell and Paste Below Cell | 复制并粘贴内容到当前单元框后面。 |
5 | Cut Cell | 剪切当前单元框。 |
6 | Paste Below Cell | 粘贴内容到当前单元框后面。 |
7 | Delete Cell | 删除当前单元框。 |
8 | Cell 框右键操作 | 单元框的更多快捷操作,可通过在 Cell 框中右键查看更多操作项。 |
单击进入右侧侧边栏执行设置窗口。
选择计算资源组:支持选择公共计算资源组、独享计算资源组。
镜像地址:仅支持选择默认镜像地址,预装了常用第三方库。
资源配置:资源可根据实际需求进行配置,以 CU 为单位,默认配置 1CU(1CU = 1Core 4GB),下拉可选择更多规格的资源配置。
说明
其中 0.25CU、0.5CU 规格,仅独享计算资源组支持选择。
进入右侧边栏调度设置,配置节点调度相关属性。设置操作详见:调度设置。
配置完成后,单击上方操作栏中保存图标按钮,保存节点至服务器。
单击操作栏中运行所有/运行图标按钮,按顺序运行所有Cell或者运行单一的Cell,运行成功后,您可在Cell框下方查看运行结果。
任务所需参数配置、调试等操作完成后,将任务提交发布到运维中心离线任务运维中执行。
单击操作栏中的提交上线按钮,在弹窗中,需先通过提交事前检查和提交上线等上线流程,最后单击确认按钮,完成作业提交。详见概述---离线任务提交发布。
注意
上线流程中的“提交事前检查”,需租户主账号或项目管理员先在项目控制台 > 流水线管理中,创建相应的流水线检查事宜后方可显示。详见流水线管理。
后续任务运维操作详见:离线任务运维。