名词解释

数据集

数据集,又称为资料集、数据集合或资料集合。 在「一站式开发平台」中,数据集是指包含标注的数据集合,可用于图像分类、目标检测、目标跟踪、自然语言处理等特定任务。

数据标注

现阶段大量的 AI 应用高度依赖监督式学习,通过对数据进行标注,为下游训练提供真值,常用的方法包括人工标注和机器标注配合人工编辑确认。

图像分类

识别一张图片是否是某类物体/状态/场景,适用于图片中主体或者状态单一的场景。

图 1 图像分类
图 1 图像分类

目标检测

定制化识别图片中多个目标,提供目标物体的所在位置、对应名称等要素,如把一张路况监控的照片中的行人、汽车、自行车等标记出来并打上标签。

图 2 目标检测
图 2 目标检测

目标跟踪

目标跟踪是在视频序列中的每帧图像中找到指定的目标对象运动位置。我们可以根据视频实时跟踪一个或多个目标元素。

图 3 目标跟踪
图 3 目标跟踪

模型

模型本质上是一个函数,用以实现从一个样本到样本的标记值的映射。

模型训练

模型训练是指通过已知的数据和目标调节模型参数的过程。

算法

算法是完成特定任务的步骤的描述,在计算机中表现为指令的有限序列。一般来说,机器学习算法可以分为监督学习、无监督学习、半监督学习、强化学习以及推荐这几大类。

OFRecord

深度学习应用需要复杂的多阶段数据预处理流水线,数据加载是流水线的第一步。「天枢深度学习框架」支持多种格式数据的加载,其中 OFRecord 格式是 「天枢深度学习框架」原生的数据格式。OFRecord 文件中存储了多个 OFRecord 对象,在 「天枢深度学习框架」的训练和预测时经常使用 OFRecord 文件。

Last updated on