数据集发布

「一站式开发平台」提供基于不同版本进行内容区分的数据集管理功能。后续模型训练阶段可选择不同版本的数据集进行训练、开发。开发者在完成数据集的标注之后,就可以对数据集进行发布操作,生成此数据集的一个新版本。

前置条件

  • 当前数据集已经标注完成(自动标注完成,或者标注完成均可)

关于数据集版本

  • 新创建的数据集(未发布过),无数据集版本信息,只有执行发布操作之后,才能用于模型训练或开发
  • 数据集版本统一按照 V0001,V0002,... 规则命名
  • 「一站式开发平台」支持多种格式数据的加载,其中 OFRecord 格式是「天枢深度学习框架」原生的数据格式。平台目前会对图像分类的数据集发布的版本自动做 OFRecord 转换处理
  • 开发者可以指定特定版本作为数据集当前版本
  • 针对每个数据集版本,可以查看当前数据集文件数量、标注进度和数据集状态

操作步骤

1. 发布

数据集状态为完成的方可点击「发布」:

图 1 版本发布
图 1 版本发布

2. 确定发布

选填版本描述,点击「确定」按钮:

图 2 确定发布
图 2 确定发布

3. 查看历史版本

发布后的数据集点击操作栏中「更多」按钮中的「历史版本」可以查看此数据集的所有版本:

图 3 查看历史版本
图 3 查看历史版本
图 4 数据集版本管理
图 4 数据集版本管理

4. 数据集版本管理

进入「数据集版本管理」页面,点击「设置为当前版本」:

图 5 设置当前版本
图 5 设置当前版本

详情:

图 6 版本详情
图 6 版本详情

查看标注,进入当前数据集当前版本的详情页:

图 7 查看标注
图 7 查看标注

其他功能参考使用界面。

Last updated on