预置数据集

「一站式开发平台」预置了多种公开数据集,支持图片、视频、文本等多种数据标注格式。预置数据集可以直观地呈现标注算法任务的效果。

预置数据集

名称数据类型标注类型说明
Caltech-256图片图片分类Caltech-256 是一个图像物体识别数据集,包含 29780 张图片,256个物体类别。
COCO2017-train图片目标检测MS COCO 数据集训练集。 COCO 全称是 Common Objects in Context,是微软团队提供的一个大型的、丰富的目标检测、分割和识别的数据集。
COCO2017-val图片目标检测MS COCO 数据集验证集。
Data-Augment图片图片分类基于部分 O-HAZE 数据集和网络图片组成的内置数据增强算法的数据集(仅作功能示例)。
Object-Tracking视频目标跟踪基于「一站式开发平台」内置目标跟踪算法的数据集(仅作功能示例)。
NLP_IMDBtxt文本分类基于 IMDB 影评的文本数据集,分为 positive 和 negative

标注算法

算法名称算法描述是否需要 GPU所需环境
annotation自动标注算法,适用于图像分类、目标检测oneflow(0.3.4)、 python(>=3.7)
imagenet自动标注算法,使用于图像分类(其中标签组必须使用ImageNet)oneflow(0.3.4)、python(>=3.7)
imgprocess数据增强算法python(>=3.5)
ofrecordOFRecord转换算法oneflow(0.3.4)、 python(>=3.7)
text_classification文本分类oneflow(0.3.4)、python(>=3.7)
track目标跟踪算法python(>=3.5)
important
  1. OneFlow 是数据标注算法底层依赖的深度学习框架,详见 官网github 仓库
  2. 安装部署文档参考 部署数据处理算法

预置数据集效果

「预置数据集」是「一站式开发平台」提供的公共数据集模板,方便用户直观的查看数据处理后的效果:

图 1 预置数据集
图 1 预置数据集

1. 图像分类

「图像分类」预置数据集展示:

图 2 图像分类
图 2 图像分类

2. 目标检测

「目标检测」预置数据集展示:

图 3 目标检测
图 3 目标检测

3. 目标跟踪

「目标跟踪」预置数据集展示:

图 4 目标跟踪
图 4 目标跟踪

4. 数据增强

「数据增强」效果对比:

图 5 数据增强
图 5 数据增强

5. 文本分类

「文本分类」效果:

图 6 文本分类
图 6 文本分类
Last updated on