前方高能!2000+开源数据集来袭,注意收藏
OpenDataLab平台上新啦~
OpenDataLab新版本上线,本次在数据集详情模块进行多方面优化,另外新增了大量优质公开数据集,助力各类模型开发、基准测试,不容错过。
亮点速览
● 支持数据集信息自定义编辑;
● 中文简介提高数据集查阅效率;
● 个性化推荐相似数据集;
● 上架2000+优质开源数据集。
一、新增数据集信息编辑按钮
支持用户共同维护数据集信息
丰富的结构化信息能够清晰地描述数据集的构成,为了提高内容准确率,我们在数据集详情页新增了字段“编辑”功能,欢迎用户共同参与维护。
查阅数据集信息时,如果发现不准确的内容,你可以点击编辑,即可自定义修改、新增、删除相关内容。提交后平台审核确认后完成更正。
数据集信息编辑(图源:OpenDataLab数据集详情)
二、新增中文版数据集简介
无需中英翻译,关键信息一目了然
从数据集简介中,可以了解数据分布、数据来源等重要信息。本次对数据集简介进行翻译优化,提供了直观的中文简介内容,极大地增加了用户获取关键信息的速度,提高数据集筛选效率。
中文版数据集简介(图源:OpenDataLab数据集详情)
三、新增相似数据集推荐
拓宽匹配范围,助你更快找到目标数据集
检索关键词没找到想要的数据集?数据集推荐来帮你。
每个数据集详情页底部,新增“相似数据集”推荐模块。系统将根据当前浏览的数据集的数据类型、任务类型综合智能推荐相似数据集,帮你快速找到目标数据集。
相似数据集推荐(图源:OpenDataLab数据集详情)
四、上架2000+权威优质数据集
全方位满足不同类型的数据集使用需求
OpenDataLab公开数据集平台已上线2000余个经典、权威、优质的数据集,涵盖目标检测、多目标跟踪、图像分割、动作识别、自然语言推理、3D重建等50余种任务。
这些数据集均来自权威开源数据平台,作为各类模型开发、基准测试的必备利器,保证满足你的使用需求。如果没有,欢迎联系小助手补充。
新上架数据集的数据类型统计
五、各领域任务数据集举例
● ImageNet 图像分类数据集
ImageNet数据集是一个大型计算机视觉数据集,是评估图像分类算法性能的基准之一。该数据集是由斯坦福大学的李飞飞教授带领创建,包含超过 1400 万张图像和 20,000 多个类别。ImageNet 数据集中的图片涵盖了大部分生活中会看到的图片类别。
下载链接:
https://opendatalab.com/ImageNet
● Kinetics-Skeleton视频分类数据集
包含多达 650,000 个视频剪辑的大规模、高质量 URL 链接数据集的集合,涵盖 400/600/700 个人类行为类别,具体取决于数据集版本。这些视频包括演奏乐器等人与物体的互动,以及握手和拥抱等人与人的互动。每个动作类至少有 400/600/700 个视频片段。每个剪辑都使用单个动作类进行人工注释,持续约 10 秒。
下载链接:
https://opendatalab.com/Kinetics-Skeleton
● GoPro图像去模糊数据集
用于去模糊的 GoPro 数据集由 3,214 张模糊图像组成,大小为 1,280×720,分为 2,103 张训练图像和 1,111 张测试图像。该数据集由成对的真实模糊图像和高速摄像机获得的相应地面实况图像组成。
下载链接:
● TQA视觉问答数据集
视觉问答 (VQA) 是一个包含关于图像的开放式问题的数据集。这些问题需要对视觉、语言和常识知识的理解才能回答。数据集的第一个版本于 2015 年 10 月发布。VQA v2.0 于 2017 年 4 月发布。
下载链接:
● KeypointNet 姿态估计
KeypointNet 是一个大规模且多样化的 3D 关键点数据集,基于 ShapeNet 模型,通过利用大量人工注释,包含来自 16 个对象类别的 83,231 个关键点和 8,329 个 3D 模型。
下载链接:
https://opendatalab.com/KeypointNet
……
这么丰富的数据集资源,小伙伴们不用再担心”无粮下锅“啦。更多AI 数据集资源、资讯,尽在OpenDataLab(https://opendatalab.com/),等你来探索~
更多推荐
所有评论(0)