数据集发布
「一站式开发平台」提供基于不同版本进行内容区分的数据集管理功能。后续模型训练阶段可选择不同版本的数据集进行训练、开发。开发者在完成数据集的标注之后,就可以对数据集进行发布操作,生成此数据集的一个新版本。
前置条件
- 当前数据集已经标注完成(自动标注完成,或者标注完成均可)
关于数据集版本
- 新创建的数据集(未发布过),无数据集版本信息,只有执行发布操作之后,才能用于模型训练或开发
- 数据集版本统一按照 V0001,V0002,... 规则命名
- 「一站式开发平台」支持多种格式数据的加载,其中 OFRecord 格式是「天枢深度学习框架」原生的数据格式。平台目前会对图像分类的数据集发布的版本自动做 OFRecord 转换处理
- 开发者可以指定特定版本作为数据集当前版本
- 针对每个数据集版本,可以查看当前数据集文件数量、标注进度和数据集状态
操作步骤
1. 发布
数据集状态为完成的方可点击「发布」:

图 1 版本发布
2. 确定发布
选填版本描述,点击「确定」按钮:

图 2 确定发布
3. 查看历史版本
发布后的数据集点击操作栏中「更多」按钮中的「历史版本」可以查看此数据集的所有版本:

图 3 查看历史版本

图 4 数据集版本管理
4. 数据集版本管理
进入「数据集版本管理」页面,点击「设置为当前版本」:

图 5 设置当前版本
详情:

图 6 版本详情
查看标注,进入当前数据集当前版本的详情页:

图 7 查看标注
其他功能参考使用界面。