美图公司社交产品事业群视觉算法组与清华大年夜学主动化系智能视觉实验室合作,推出了业界最大年夜范围教程类行动数据集 COIN(COmprehensive INstructional video analysis),相干论文(COIN: A Large-scale Dataset for Comprehensive Instructional Video Analysis)已被 CVPR 2019 录用。

COIN 数据集概览

教程类行动视频(Instructional Video)可以赞助应用者获取完成各类行动义务的常识,然则现有教程类行动视频数据集在范围性和多样性上都存在较大年夜的局限性,难以应用于实际生活中的复杂场景。为此,美图公司社交产品事业群视觉算法组与清华大年夜学主动化系智能视觉实验室合作提出了名为 COIN 的大年夜范围教程类数据集,用于更周全的教程类行动视频分析。



COIN 数据集在标注构造上采取分层的组织构造,第一层是范畴(Domain)、第二层是义务(Task)、第三层是步调(Step),个中包含与日常生活相干的 11827 个视频,涉及交通对象、电器维修和家具装修等 12 个范畴的 180 个义务,共 778 个步调。

COIN 数据集的分层构造



AI 科技评论按,计算机视觉顶会 CVPR 2019 即将于 6 月在美国长滩召开,本年有跨越 5165 篇的大年夜会论文投稿,最终登科 1299 篇。跟着会议邻近,各大年夜公司纷纷揭晓自家被收录论文。

COIN 数据集的设计人员还开辟了立异性的标注对象,可以更高效更精确地标注目频行动的步调信息。此外,为了给数据集供给更精确的基准指标,数据集开辟人员还应用了 SSN、R-C3D 等评价办法对 COIN 数据集进行了测评。

COIN 数据集的步调定位精确率分析

论文地址:https://arxiv.org/abs/1903.02874

GitHub地址:https://coin-dataset.github.io

声明:该文观点仅代表作者本人,南宁资讯网系信息发布平台,本站仅提供信息存储空间服务。