You need to enable JavaScript to run this app.
导航

使用数据集

最近更新时间2023.09.15 10:22:31

首次发布时间2023.08.14 18:02:04

数据集文件在使用的时候有两种方式:

  • 将所选数据制作成实体数据模型

  • 在工作流的运行参数中,选择具体的数据文件作为输入参数

使用方式一:实体数据模型

  1. 在数据集详情的任一页面(文件信息/样本信息)选择文件(可多选),点击分析;弹出导入workspace分析弹窗;如果使用已有workspace,则在下拉列表中选择,下拉列表中包含有该用户所有的workspace(和在Workspace页面看到的一致),除了选择已有的workspace,还可以新建workspace(和在Workspace页面新建的规则一致)。

  2. workspace准备好之后,系统将自动生成以所选数据文件相关信息为内容的实体数据模型文件。csv文件内容包含3列,表头为:Datasets_File_id,File_name,File_path。其中,

  • Datasets_File_id对应数据集的“File ID”

  • File_name对应数据集的“File name”

  • File_path对应数据集的“File path”

csv文件下载后的文件名为:“Datasets_File.csv”。
csv文件生成成功后,页面才会跳转到数据模型页面。当有新的数据集文件被添加到同一workspace时,将会追加到已有的实体数据模型文件中。用户可以直接使用该csv文件,或者依此在线下编辑新的csv文件,并上传使用。

使用方式二:在工作流-运行参数中选择

使用数据集中的数据文件进行分析的另一个方式,是在工作流的运行参数中直接选择具体的数据集文件作为参数。能够选择文件的数量以该参数的设置为准。

  1. 点击Workspace-工作流-某工作流-运行参数的文件夹图标


2. 点击选择数据集数据项目,从中选择对应的数据文件

alt
之后的所有内容和步骤都和在workspace中做其他分析一致,分析过程中,对于数据集中的数据文件只会读取,不会拷贝到该workspace中,但是,分析结果属于数据使用者,也存放在数据使用者的workspace存储空间中,在没有其他说明限制的情况下,与数据集所有者无关。