总结:收藏 | 机器学习数据集汇总收集

优采云发布时间: 2022-11-08 16:34

　　总结:收藏 | 机器学习数据集汇总收集

　　转载于：机器学习算法与 Python 实战

　　大学公共数据集

　　（斯坦福）69G 大型无人机（校园）图像数据集【斯坦福】

　　人脸素描数据集 [中大]

　　自然语言推理（文本蕴涵标签）数据集 [NYU]

　　伯克利图像分割数据集 BSDS500 [伯克利]

　　宠物图像（分割）数据集 [牛津]

　　~vgg/数据/宠物/

　　发布ADE20K场景感知/解析/分割/多目标识别数据集[MIT]

　　多模式二元行为数据集 [GaTech]

　　计算机视觉/图像/视频数据集

　　Fashion-MNIST风格服装图像数据集【小涵】

　　大型（500,000）LOGO数据集

　　4D 扫描（60fps 移动非刚性物体 3D 扫描）数据集 [D-FAUST]

　　Counting MNIST，基于 MNIST 的视觉计数合成数据集

　　YouTube MV 视频数据集 [Keunwoo Choi]

　　大量计算机视觉合成数据集/工具 [unrealcv]

　　动物属性标签数据集 [ChristophH. Lampert／Daniel Pucher／JohannesDostal]

　　*敏*感*词*数据集 Manga109

　　架空舞蹈视频数据集

　　Pixiv（着色）图像数据集 [Jerry Li]

　　e-VDS 视频数据集

　　＃下载

　　快，画！简单的笔画涂鸦数据集

　　简单的笔画涂鸦数据集[hardmaru]

　　Clothing Portrait Generation Model (&Chictopia10K [HumanParsing] Fashion Portrait Analysis Dataset) [Christoph Lassner／Gerard Pons-Moll／Peter V. Gehler]

　　COCO 像素级标注数据集

　　*敏*感*词*街道级图像（分割）数据集 [Peter Kontschieder]

　　*敏*感*词*日本图像描述数据集

　　Cityscapes 街景语义分割数据集（50 个城市，30 个类别，5k 精细标签，20k 厚标签图像和带标签的视频）

　　（街头）时尚服装数据集（2000 多张带注释的图像）

　　PyTorch [BodoKaiser] 实现的 VOC2012 数据集的逐像素目标分割

　　200 亿个神经元对象复杂运动和交互视频数据集 [Nikita Johnson]

　　文本/评估/问答/自然语言数据集

　　(200,000) 个英语笑话数据集 [TaivoPungas]

　　机器学习保险行业问答开放数据集 [HainWang]

　　保险业问答 (QA) 数据集 [Minwei Feng]

　　斯坦福 NLP 发布新的多轮、跨领域、面向任务的对话数据集 [Mihail Eric]

　　实体/名词语义关系标签数据集 [David S. Batista]

　　NLVR：自然语言基础数据集（对象分组、数量、比较和空间关系推理）

　　28,000文章/100,000题*敏*感*词*（英语测试）阅读理解数据集

　　拼写错误的数据集

　　〜罗杰/corpora.html

　　文本缩减数据集

　　~dkauchak/简化/

　　英文单词/句子/语义框架标注数据集FrameNet

　　(另一个) 自然语言处理 (NLP) 数据集列表 [Nicolas Iderhoff]

　　用于跨语言/多样式/多粒度文本相似性检测的数据集

　　Quora 数据集：400,000 行潜在的重复问题

　　文本分类数据集

　　框架：Maluuba 对话数据集

　　跨域（亚马逊产品评论）情感数据集

　　~mdredze/数据集/sentiment/

　　语义 Web 机器学习系统评估/基准数据集采集

　　其他数据集

　　数据科学/机器学习数据集摘要

　　CORe50：连续对象识别数据集 [Vincenzo Lomonaco & Davide Maltoni]

　　(Matlab) 自动发现数据集的统计分布 [Isabel Valera]

　　（建筑）损害评估数据集 [海啸]

　　IndieWeb 社交图数据集 [IndieWeb]

　　DeepMind 开源环境/数据集/代码合集【DeepMind】

　　鸟叫数据集 [xeno-canto]

　　Wolfram 数据集存储库

　　*敏*感*词*音乐分析数据集 FMA

　　(300 万) Instacart 在线杂货*敏*感*词*集 [Jeremy Stanley]

　　用于欺诈检测的合成金融数据集 [TESTIMON]

　　NSynth：一个*敏*感*词*的高质量音符标记音频数据集

　　LIBSVM 格式分类/回归/多标签/字符串数据集

　　~cjlin/libsvmtools/datasets/binary.html

　　笔记本电脑使用逻辑回归拟合 100G 数据集 [DmitriySelivanov]

　　StackExchange 近似/重复问题数据集

　　2010-2017最全的KDD CUP试题及数据集

　　食谱数据集：超过 20,000 个带有评级、营养和类别信息的食谱 [HugoDarwood]

　　奥斯卡数据集【电影艺术与科学学院】

　　计算医学库：大型医学数据集的 (TensorFlow) 分析和机器学习建模 [AkshayBhat]

　　聚类数据集

　　官方开放气候数据集

　　全球恐怖袭击数据集【START联盟】

　　七个机器学习时间序列数据集

　　*敏*感*词*众包关系数据库自然语言查询语义解析数据集（80,000+查询样本）

　　赛马赔率数据集

　　新的 YELP 数据集：收录 470 万条评论和 156,000 个商家

　　JMIR 数据集特刊“JMIR 数据”

　　日本木刻版画文字识别数据集

　　多模式二元行为数据集

　　机器学习论文/数据集/工具集（日语）

　　机器学习公司的十大数据采集策略

　　NLP 数据集加载工具集

　　日语相似词数据集

　　*敏*感*词*以人为本的完形填空（多项选择阅读理解）数据集

　　高质量免费数据集列表

　　“数据之美”自然语言数据集/代码

　　微软数据集MS MARCO，阅读理解领域的“ImageNet”

　　AI2科学问答数据集（多选）

　　常用图像数据集

　　（分类、跟踪、分割、检测等）

　　搜狗实验室数据集：

　　互联网图片库来自搜狗图片搜索索引的部分数据。共有 2,836,535 张图片，类别包括人物、动物、建筑、机械、风景和运动。对于每张图片，原创图片、缩略图、图片所在的网页以及网页中的相关文本都在数据集中给出。超过200G

　　IMAGECLEF 致力于为图像相关领域（检索、分类、注释等）提供基准跨语言评估论坛（CLEF）。该比赛自2003年起每年举办一次。

　　~xirong/index.php?n=Main.Dataset

　　专业知识:seo专家：八个工具助您的外贸网站快速排名

　　八款工具助你外贸网站快速排名

　　做外贸网站，没有好的SEO策划，很难在激烈的竞争中脱颖而出。一个好的网站SEO需要分析网站本身，什么是外贸，以及竞争对手的网站。SEO分析对于外贸新手网站或者SEO不好的网站尤为重要。本文精选了 8 个 SEO 工具，可以帮助您发现 SEO网站的问题。同时还可以分析竞争对手的关键词选型、链式、链式设计，然后用在自己的外贸网站中，推广SEO的隐藏东西。

　　1. SEMrush

　　SEMrush 可以称为一个综合性的 SEO 工具，SEO 初学者和专家都可以通过 SEMrush 流程获得帮助。什么是外贸，从竞争对手分析和展示到关键词研究、广告策略分析、逆向检查、关键词难度、品牌展示等。你甚至可以用它来发现新的竞争对手，观察行业变化帮助您连接和领导的领域。

　　SEMrush 从 Google 和 Bing 中提取大量 SEO 数据，让您能够以难以置信的细节探索关键词。什么是外贸，以便捷的方式提供所有这些数据，并进行全面的现场审核和持续跟踪。如果您只为您的专业博客业务使用一种工具，那么设置 SEMrush 是一个不错的选择。

　　2. 最佳搜索引擎优化

　　Yoast SEO 是一个 WordPress SEO 插件。这是市场上最好的 SEO 插件之一。从主页面到文章页面，从存档页面到标签页，都提供了详细的设置。可以说，Yoast SEO对SEO设计的每一页的规划都是很小的。如可读性分析、关键词、meta关键词、关键词网页内容结构、图片分析、内外链接分析、标题和描述分析、链接地址分析等。

　　Yoast SEO 可能是您可以用来改善博客 SEO 的最佳整体工具。

　　3.Moz工具

　　Moz 工具可用于链接构建和分析、Web 功能、关键词sink 研究、网站拥抱、列表查看等。什么是外贸是互联网上最大最准确的SEO关键词数据库之一。在几秒钟内，专业博主可以使用它在网站上找到关键词并确定其优先级。没有用于分析或统计过滤的复杂图表，SEO 建议简单直观。

　　Moz 提供了许多可供博主用来推广 SEO 的工具。这个大扇区是免费的，几乎没有限制。

　　4. BuzzSumo

　　BuzzSumo 是一个智能工具。哪些*敏*感*词*绕该内容定制您的工作。

　　在快速搜索中，您可以在 Facebook、Twitter、Pinterest、Reddit 上查看关键词，包括订阅、反向链接、总份额。

　　5. 隔壁

　　强大的 SEO 集成，从关键词研究到链接分析，无所不能。Serpstat 提供范围广泛的 SEO 工具，几乎每个人都会在城市中找到方便的工具，包括长尾关键词研究、每次点击成本分析、PPC 竞争洞察、搜索量分析。

　　因此，您可以使用 Serpstat 做的最有用的事情是对您的站点进行全面审核。什么是外贸，包括反向链接和 Serpstat 本身，是完全自动的。

　　天蜘蛛网专注于SEO培训，大量学员受益。

0

2022-11-08

算法自动采集列表

0 个评论

要回复文章请先登录或注册

AI时代内容工厂

总结:收藏 | 机器学习数据集汇总收集

0 个评论

发起人