quickbrain

图像处理语音识别深度学习开放数据集

从图像处理到语音识别，25款数据科学家必知的深度学习开放数据集

本文介绍了 25 个深度学习开放数据集，包括图像处理、自然语言处理、语音识别和实际问题数据集。

介绍

深度学习（或生活中大部分领域）的关键在于实践。你需要练习解决各种问题，包括图像处理、语音识别等。每个问题都有其独特的细微差别和解决方法。

但是，从哪里获得数据呢？现在许多论文都使用专有数据集，这些数据集通常并不对公众开放。如果你想学习并应用技能，那么无法获取合适数据集是个问题。

如果你面临着这个问题，本文可以为你提供解决方案。本文介绍了一系列公开可用的高质量数据集，每个深度学习爱好者都应该试试这些数据集从而提升自己的能力。在这些数据集上进行工作将让你成为一名更好的数据科学家，你在其中学到的知识将成为你职业生涯中的无价之宝。我们同样介绍了具备当前最优结果的论文，供读者阅读，改善自己的模型。

如何使用这些数据集？

首先，你得明白这些数据集的规模非常大！因此，请确保你的网络连接顺畅，在下载时数据量没有或几乎没有限制。

使用这些数据集的方法多种多样，你可以应用各种深度学习技术。你可以用它们磨炼技能、了解如何识别和构建各个问题、思考独特的使用案例，也可以将你的发现公开给大家！

数据集分为三类——图像处理、自然语言处理和音频/语音处理。

让我们一起看看吧！

图像处理数据集

MNIST

链接：https://datahack.analyticsvidhya.com/contest/practice-problem-identify-the-digits/

MNIST 是最流行的深度学习数据集之一。这是一个手写数字数据集，包含一个有着 60000 样本的训练集和一个有着 10000 样本的测试集。对于在现实世界数据上尝试学习技术和深度识别模式而言，这是一个非常好的数据库，且无需花费过多时间和精力进行数据预处理。

大小：约 50 MB

数量：70000 张图像，共分为 10 个类别。

SOTA：《Dynamic Routing Between Capsules》

参考阅读：

终于，Geoffrey Hinton 那篇备受关注的 Capsule 论文公开了
浅析 Geoffrey Hinton 最近提出的 Capsule 计划
先读懂 CapsNet 架构然后用 TensorFlow 实现，这应该是最详细的教程了
Capsule 官方代码开源之后，机器之心做了份核心代码解读

MS-COCO

链接：http://cocodataset.org/#home

COCO 是一个大型数据集，用于目标检测、分割和标题生成。它有以下几个特征：

目标分割
在语境中识别
超像素物品分割
33 万张图像（其中超过 20 万张是标注图像）
150 万个目标实例
80 个目标类别
91 个物品分类
每张图像有 5 个标题
25 万张带有关键点的人像

大小：约 25 GB（压缩后）

数量：33 万张图像、80 个目标类别、每张图像 5 个标题、25 万张带有关键点的人像

SOTA：《Mask R-CNN》

参考阅读：

学界 | Facebook 新论文提出通用目标分割框架 Mask R-CNN：更简单更灵活表现更好

深度 | 用于图像分割的卷积神经网络：从 R-CNN 到 Mask R-CNN

资源 | Mask R-CNN 神应用：像英剧《黑镜》一样屏蔽人像

ImageNet

链接：http://www.image-net.org/

ImageNet 是根据 WordNet 层次来组织的图像数据集。WordNet 包含大约 10 万个短语，而 ImageNet 为每个短语提供平均约 1000 张描述图像。

大小：约 150 GB

数量：图像的总数约为 1,500,000；每一张图像都具备多个边界框和各自的类别标签。

SOTA：《Aggregated Residual Transformations for Deep Neural Networks》（https://arxiv.org/pdf/1611.05431.pdf）

Open Images 数据集

链接：https://github.com/openimages/dataset

Open Images 是一个包含近 900 万个图像 URL 的数据集。这些图像使用包含数千个类别的图像级标签边界框进行了标注。该数据集的训练集包含 9,011,219 张图像，验证集包含 41,260 张图像，测试集包含 125,436 张图像。

大小：500GB（压缩后）

数量：9,011,219 张图像，带有超过 5000 个标签

SOTA：Resnet 101 image classification model (trained on V2 data)：

模型检查点：https://storage.googleapis.com/openimages/2017_07/oidv2-resnet_v1_101.ckpt.tar.gz
Checkpoint readme：https://storage.googleapis.com/openimages/2017_07/oidv2-resnet_v1_101.readme.txt
推断代码：https://github.com/openimages/dataset/blob/master/tools/classify_oidv2.py

VisualQA

链接：http://www.visualqa.org/

VQA 是一个包含图像开放式问题的数据集。这些问题的解答需要视觉和语言的理解。该数据集拥有下列有趣的特征：

265,016 张图像（COCO 和抽象场景）
每张图像至少包含 3 个问题（平均有 5.4 个问题）
每个问题有 10 个正确答案
每个问题有 3 个看似合理（却不太正确）的答案
自动评估指标

大小：25GB（压缩后）

数量：265,016 张图像，每张图像至少 3 个问题，每个问题 10 个正确答案

SOTA：《Tips and Tricks for Visual Question Answering: Learnings from the 2017 Challenge》（https://arxiv.org/abs/1708.02711）

街景门牌号数据集（SVHN）

链接：http://ufldl.stanford.edu/housenumbers/

这是一个现实世界数据集，用于开发目标检测算法。它需要最少的数据预处理过程。它与 MNIST 数据集有些类似，但是有着更多的标注数据（超过 600,000 张图像）。这些数据是从谷歌街景中的房屋门牌号中收集而来的。

大小：2.5GB

数量：6,30,420 张图像，共 10 类

SOTA：《Distributional Smoothing With Virtual Adversarial Training》（https://arxiv.org/pdf/1507.00677.pdf）

这篇论文中，日本京都大学提出了局部分布式平滑度（LDS），一个关于统计模型平滑度的新理念。它可被用作正则化从而提升模型分布的平滑度。该方法不仅在 MNIST 数据集上解决有监督和半监督学习任务时表现优异，而且在 SVHN 和 NORB 数据上，Test Error 分别取得了 24.63 和 9.88 的分值。以上证明了该方法在半监督学习任务上的表现明显优于当前最佳结果。

CIFAR-10

链接：http://www.cs.toronto.edu/~kriz/cifar.html

该数据集也用于图像分类。它由 10 个类别共计 60,000 张图像组成（每个类在上图中表示为一行）。该数据集共有 50,000 张训练集图像和 10,000 个测试集图像。数据集分为 6 个部分——5 个训练批和 1 个测试批。每批含有 10,000 张图像。

大小：170MB

数量：60,000 张图像，共 10 类

SOTA：《ShakeDrop regularization》（https://openreview.net/pdf?id=S1NHaMW0b）

Fashion-MNIST

链接：https://github.com/zalandoresearch/fashion-mnist

Fashion-MNIST 包含 60,000 个训练集图像和 10,000 个测试集图像。它是一个类似 MNIST 的时尚产品数据库。开发人员认为 MNIST 的使用次数太多了，因此他们把这个数据集用作 MNIST 的直接替代品。每张图像都以灰度显示，并具备一个标签（10 个类别之一）。

大小：30MB

数量：70,000 张图像，共 10 类

SOTA：《Random Erasing Data Augmentation》（https://arxiv.org/abs/1708.04896）

自然语言处理

IMDB 电影评论数据集

链接：http://ai.stanford.edu/~amaas/data/sentiment/

该数据集对于电影爱好者而言非常赞。它用于二元情感分类，目前所含数据超过该领域其他数据集。除了训练集评论样本和测试集评论样本之外，还有一些未标注数据可供使用。此外，该数据集还包括原始文本和预处理词袋格式。

大小：80 MB

数量：训练集和测试集各包含 25,000 个高度两极化的电影评论

SOTA：《Learning Structured Text Representations》（https://arxiv.org/abs/1705.09207）

Twenty Newsgroups 数据集

链接：https://archive.ics.uci.edu/ml/datasets/Twenty+Newsgroups

顾名思义，该数据集涵盖新闻组相关信息，包含从 20 个不同新闻组获取的 20000 篇新闻组文档汇编（每个新闻组选取 1000 篇）。这些文章有着典型的特征，例如标题、导语。

大小：20MB

数量：来自 20 个新闻组的 20,000 篇报道

SOTA：《Very Deep Convolutional Networks for Text Classification》（https://arxiv.org/abs/1606.01781）

Sentiment140

链接：http://help.sentiment140.com/for-students/

Sentiment140 是一个用于情感分析的数据集。这个流行的数据集能让你完美地开启自然语言处理之旅。数据中的情绪已经被预先清空。最终的数据集具备以下六个特征：

推文的情绪极性
推文的 ID
推文的日期
查询
推特的用户名
推文的文本

大小：80MB（压缩后）

数量： 1,60,000 篇推文

SOTA：《Assessing State-of-the-Art Sentiment Models on State-of-the-Art Sentiment Datasets》（http://www.aclweb.org/anthology/W17-5202）

WordNet

链接：https://wordnet.princeton.edu/

上文介绍 ImageNet 数据集时提到，WordNet 是一个大型英语 synset 数据库。Synset 也就是同义词组，每组描述的概念不同。WordNet 的结构让它成为 NLP 中非常有用的工具。

大小：10 MB

数量：117,000 个同义词集，它们通过少量的「概念关系」与其他同义词集相互关联

SOTA：《Wordnets: State of the Art and Perspectives》（https://aclanthology.info/pdf/R/R11/R11-1097.pdf）

Yelp 数据集

链接：https://www.yelp.com/dataset

这是 Yelp 出于学习目的而发布的开放数据集。它包含数百万个用户评论、商业属性（businesses attribute）和来自多个大都市地区的超过 20 万张照片。该数据集是全球范围内非常常用的 NLP 挑战赛数据集。

大小：2.66 GB JSON、2.9 GB SQL 和 7.5 GB 的照片（全部压缩后）

数量：5,200,000 个评论、174,000 份商业属性、200,000 张照片和 11 个大都市地区

SOTA：《Attentive Convolution》（https://arxiv.org/pdf/1710.00519.pdf）

Wikipedia Corpus

链接：http://nlp.cs.nyu.edu/wikipedia-data/

该数据集是维基百科全文的集合，包含来自超过 400 万篇文章的将近 19 亿单词。你能逐单词、逐短语、逐段地对其进行检索，这使它成为强大的 NLP 数据集。

大小：20 MB

数量：4,400,000 篇文章，包含 19 亿单词

SOTA：《Breaking The Softmax Bottelneck: A High-Rank RNN language Model》（https://arxiv.org/pdf/1711.03953.pdf）

Blog Authorship Corpus

链接：http://u.cs.biu.ac.il/~koppel/BlogCorpus.htm

该数据集包含从数千名博主那里收集到的博客文章，这些数据从 http://blogger.com 中收集而来。每篇博客都以一个单独的文件形式提供。每篇博客至少出现 200 个常用的英语单词。

大小：300 MB

数量：681,288 篇博文，共计超过 1.4 亿单词。

SOTA：《Character-level and Multi-channel Convolutional Neural Networks for Large-scale Authorship Attribution》（https://arxiv.org/pdf/1609.06686.pdf）

欧洲语言机器翻译数据集

链接：http://statmt.org/wmt18/index.html

该数据集包含四种欧洲语言的训练数据，旨在改进当前的翻译方法。你可以使用以下任意语言对：

法语 - 英语
西班牙语 - 英语
德语 - 英语
捷克语 - 英语

大小：约 15 GB

数量：约 30,000,000 个句子及对应的译文

SOTA：《Attention Is All You Need》

参考阅读：

学界 | 机器翻译新突破：谷歌实现完全基于 attention 的翻译架构

资源 | 谷歌全 attention 机器翻译模型 Transformer 的 TensorFlow 实现

音频/语音数据集

Free Spoken Digit 数据集

链接：https://github.com/Jakobovski/free-spoken-digit-dataset

这是本文又一个受 MNIST 数据集启发而创建的数据集！该数据集旨在解决识别音频样本中口述数字的任务。这是一个公开数据集，所以希望随着人们继续提供数据，它会不断发展。目前，它具备以下特点：

3 种人声
1500 段录音（每个人口述 0- 9 各 50 次）
英语发音

大小： 10 MB

数量： 1500 个音频样本

SOTA：《Raw Waveform-based Audio Classification Using Sample-level CNN Architectures》（https://arxiv.org/pdf/1712.00866）

Free Music Archive (FMA)

链接：https://github.com/mdeff/fma

FMA 是音乐分析数据集，由整首 HQ 音频、预计算的特征，以及音轨和用户级元数据组成。它是一个公开数据集，用于评估 MIR 中的多项任务。以下是该数据集包含的 csv 文件及其内容：

tracks.csv：记录每首歌每个音轨的元数据，例如 ID、歌名、演唱者、流派、标签和播放次数，共计 106,574 首歌。
genres.csv：记录所有 163 种流派的 ID 与名称及上层风格名（用于推断流派层次和上层流派）。
features.csv：记录用 librosa 提取的常见特征。
echonest.csv：由 Echonest（现在的 Spotify）为 13,129 首音轨的子集提供的音频功能。

大小：约 1000 GB

数量：约 100,000 个音轨

SOTA：《Learning to Recognize Musical Genre from Audio》（https://arxiv.org/pdf/1803.05337.pdf）

Ballroom

链接：http://mtg.upf.edu/ismir2004/contest/tempoContest/node5.html

该数据集包含舞厅的舞曲音频文件。它以真实音频格式提供了许多舞蹈风格的一些特征片段。以下是该数据集的一些特点：

实例总数：698
单段时长：约 30 秒
总时长：约 20940 秒

大小：14 GB（压缩后）

数量：约 700 个音频样本

SOTA：《A Multi-Model Approach To Beat Tracking Considering Heterogeneous Music Styles》（https://pdfs.semanticscholar.org/0cc2/952bf70c84e0199fcf8e58a8680a7903521e.pdf）

Million Song 数据集

链接：https://labrosa.ee.columbia.edu/millionsong/

Million Song 数据集包含一百万首当代流行音乐的音频特征和元数据，可免费获取。其目的是：

鼓励研究商业规模的算法
为评估研究提供参考数据集
作为使用 API 创建大型数据集的捷径（例如 The Echo Nest API）
帮助入门级研究人员在 MIR 领域展开工作

数据集的核心是一百万首歌曲的特征分析和元数据。该数据集不包含任何音频，只包含导出要素。示例音频可通过哥伦比亚大学提供的代码（https://github.com/tb2332/MSongsDB/tree/master/Tasks_Demos/Preview7digital）从 7digital 等服务中获取。

大小：280 GB

数量：一百万首歌曲！

SOTA：《Preliminary Study on a Recommender System for the Million Songs Dataset Challenge》（http://www.ke.tu-darmstadt.de/events/PL-12/papers/08-aiolli.pdf）

LibriSpeech

链接：http://www.openslr.org/12/

该数据集是一个包含约 1000 小时英语语音的大型语料库。数据来源为 LibriVox 项目的音频书籍。该数据集已经得到了合理地分割和对齐。如果你还在寻找起始点，那么点击 http://www.kaldi-asr.org/downloads/build/6/trunk/egs/查看在该数据集上训练好的声学模型，点击 http://www.openslr.org/11/查看适合评估的语言模型。

大小：约 60 GB

数量：1000 小时的语音

SOTA：《Letter-Based Speech Recognition with Gated ConvNets》（https://arxiv.org/abs/1712.09444）

VoxCeleb

链接：http://www.robots.ox.ac.uk/~vgg/data/voxceleb/

VoxCeleb 是一个大型人声识别数据集。它包含来自 YouTube 视频的 1251 位名人的约 10 万段语音。数据基本上是性别平衡的（男性占 55％）。这些名人有不同的口音、职业和年龄。开发集和测试集之间没有重叠。对大明星所说的话进行分类并识别——这是一项有趣的工作。

大小：150 MB

数量：1251 位名人的 100,000 条语音

SOTA：《VoxCeleb: a large-scale speaker identification dataset》（https://www.robots.ox.ac.uk/~vgg/publications/2017/Nagrani17/nagrani17.pdf）

为了帮助你练习，我们还提供了一些真实生活问题和数据集，供读者上手操作。这一部分，我们列举了 DataHack 平台上关于深度学习的问题。

推特情感分析数据集

链接：https://datahack.analyticsvidhya.com/contest/practice-problem-twitter-sentiment-analysis/

涉及种族主义和性别歧视的偏激言论已成为 Twitter 的难题，因此将这类推文与其它推文分开已十分重要。在这个实际问题中，我们提供的 Twitter 数据包含普通言论和偏激言论。作为数据科学家，你的任务是确定哪些推文是偏激型推文，哪些不是。

大小： 3 MB

数量： 31,962 篇推文

印度演员年龄检测数据集

链接：https://datahack.analyticsvidhya.com/contest/practice-problem-age-detection/

对于深度学习爱好者来说，这是一个令人着迷的挑战。该数据集包含数千名印度演员的图像，你的任务是确定他们的年龄。所有图像都由人工从视频帧中挑选和剪切而来，这导致规模、姿势、表情、亮度、年龄、分辨率、遮挡和妆容具有高度可变性。

大小：48 MB（压缩后）

数量：训练集中有 19,906 幅图像，测试集中有 6636 幅图像

城市声音分类数据集

链接：https://datahack.analyticsvidhya.com/contest/practice-problem-urban-sound-classification/

该数据集包含超过 8000 个来自 10 个类别的城市声音片段。这个实际问题旨在向你介绍常见分类场景中的音频处理。

大小：训练集 - 3 GB（压缩后）、测试集 - 2 GB（压缩后）

数量：来自 10 个类别的 8732 个标注城市声音片段（单个片段音频时长 <= 4s）

原文链接：https://www.analyticsvidhya.com/blog/2018/03/comprehensive-collection-deep-learning-datasets/

你可能感兴趣的:(经验,资源)

基于Deepseek+RAG构建企业知识库：文档预处理与数据整理大势下的牛马搭建本地gpt 人工智能 RAG Deepseek 知识库
在当今数字化时代，企业知识库的构建对于知识管理和高效决策至关重要。基于Deepseek+RAG（Retrieval-AugmentedGeneration）技术构建企业知识库，能够有效整合企业内外部知识资源，实现知识的快速检索和精准应用。而在这一过程中，文档预处理与数据整理是关键的基础环节，直接关系到知识库的质量和后续应用效果。一、文件预处理：格式转换与数据清洗（一）支持格式与转换要求优先格式：在
2025 Next.js项目提前编译并在服务器风吹落叶花飘荡前端 javascript 服务器开发语言
要让一个Next.js项目提前编译并在服务器上运行，可以按照以下步骤操作：1.本地构建项目首先在开发环境中完成构建：#安装依赖pnpminstall#生产环境构建（生成优化版本）npmrunbuild这会生成：.next/目录（包含编译后的应用）public/目录（静态资源）node_modules/（生产依赖）2.准备部署文件需要上传到服务器的文件：.next/public/package.js
LeetCode 刷题：数据结构与算法的实战经验分享
LeetCode刷题：数据结构与算法的实战经验分享关键词：LeetCode、数据结构、算法、刷题经验、实战摘要：本文将围绕LeetCode刷题展开，深入探讨数据结构与算法在实际刷题过程中的应用。通过分享实战经验，帮助读者更好地理解和掌握数据结构与算法知识，提升解题能力。文章将从背景介绍入手，阐述刷题的目的和意义，接着详细解释核心概念，分析它们之间的关系，然后介绍核心算法原理和具体操作步骤，结合数学
在教育领域中，如何通过用户ID跑马灯来对视频进行加密？菜包eo 音视频容器同态加密
文章目录前言一、什么是用户跑马灯二、用代码如何实现用户ID跑马灯的功能三、如何通过用户ID跑马灯来对视频进行加密？总结前言在教育领域，优质视频课程易遭非法传播。为强化版权保护与责任追溯，引入基于用户ID的跑马灯水印技术成为有效手段。该技术将唯一用户标识动态叠加于视频画面，显著增加盗录难度，并在泄密时可精准溯源，有力保障教学资源安全与知识产权。一、什么是用户跑马灯将用户I的ID、电话号码或其他信息内
S7-300 400与S7-200 SMART PLC以太网通讯（S7协议）资源文件介绍滑展妙Bernice
S7-300400与S7-200SMARTPLC以太网通讯（S7协议）资源文件介绍【下载地址】S7-300400与S7-200SMARTPLC以太网通讯S7协议资源文件介绍本资源文件详细解析了S7-300400与S7-200SMARTPLC通过以太网进行通讯的技术细节，涵盖硬件连接、软件配置及通讯调试等关键环节。通过学习，您将掌握S7协议在PLC通讯中的实际应用，提升自动化与电气工程领域的专业技能
Python爬虫实战：使用最新技术爬取头条新闻数据 Python爬虫项目 2025年爬虫实战项目 python 爬虫开发语言 scrapy 音视频
一、前言：Python爬虫在现代数据获取中的重要性在当今信息爆炸的时代，数据已经成为最宝贵的资源之一。作为数据获取的重要手段，网络爬虫技术在各个领域发挥着越来越重要的作用。Python凭借其简洁的语法、丰富的库生态系统和强大的社区支持，已经成为网络爬虫开发的首选语言。本文将详细介绍如何使用Python及其最新的爬虫技术来爬取头条新闻数据。我们将从基础概念讲起，逐步深入到高级技巧，最后给出完整的爬虫
Python通关秘籍之基础教程(一） Smile丶Life丶 Python 通关指南：从零基础到高手之路 python 开发语言后端
引言在编程的世界里，Python就像一位温和而强大的导师，它以简洁优雅的语法和强大的功能吸引着无数初学者和专业人士。无论你是想开发网站、分析数据、构建人工智能，还是仅仅想学习编程思维，Python都是你的理想选择。Python的魅力在于它的易读性和广泛的应用场景。它的代码就像英语句子一样自然，即使是完全没有编程经验的人也能快速上手。同时，Python拥有庞大的生态系统，从Web开发（Django、
Python协程从入门到精通：9个案例解析yield、gevent与asyncio实战 python_chai Python python 开发语言协程并发 yield生成器 gerrnlet gevent
引言痛点分析：传统多线程在高并发场景下的性能瓶颈。协程优势：轻量级、高并发、低资源消耗。本文目标：通过9个代码案例，系统讲解协程的核心技术和应用场景。目录引言1.协程基础：理解yield生成器1.1yield的暂停与恢复机制1.2生产者-消费者模型实战1.3双向通信：send()方法详解2.手动协程控制：greenlet进阶2.1greenlet的显式切换原理2.2多任务协作案例3.自动化协程：g
Python爬虫在社交平台数据挖掘中的应用：深入探索用户互动程序员威哥 python 爬虫数据挖掘
引言社交媒体已经成为全球用户互动的主要平台，每天都有大量的信息生成，用户之间的互动行为如点赞、评论、分享、转发等构成了宝贵的数据资源。如何利用这些互动数据为商业决策、用户行为分析以及产品优化提供支持，已经成为数据科学与大数据分析领域的一个重要课题。Python作为一款强大的编程语言，凭借其丰富的爬虫库和数据分析工具，已经成为挖掘社交平台数据的重要工具。在本文中，我们将通过Python爬虫技术，深入
为什么HashMap选择红黑树而非AVL树？揭秘JDK的深度权衡今天你慧了码码码码码码码码码码 JavaSE基础 java 开发语言
当你为HashMap的链表转红黑树机制赞叹时，是否曾疑惑：为什么是红黑树而不是更“平衡”的AVL树？这个看似简单的选择背后，是JDK开发团队在数据结构领域数十年的经验结晶。本文将用真实场景数据，彻底解析这个高频面试题的底层逻辑。一、痛点直击：链表性能崩溃的噩梦想象一个极端场景：恶意攻击者精心构造大量哈希冲突的key，使HashMap退化成超长链表。此时查询效率从O(1)暴跌至O(n)！JDK8的解
深入解读 Qwen3 技术报告（一）：引言小爷毛毛（卓寿杰）大模型AIGC 深度学习基础/原理人工智能自然语言处理 python 语言模型深度学习
重磅推荐专栏：《大模型AIGC》《课程大纲》《知识星球》本专栏致力于探索和讨论当今最前沿的技术趋势和应用领域，包括但不限于ChatGPT和StableDiffusion等。我们将深入研究大型模型的开发和应用，以及与之相关的人工智能生成内容（AIGC）技术。通过深入的技术解析和实践经验分享，旨在帮助读者更好地理解和应用这些领域的最新进展1.引言：迎接大型语言模型的新纪元我们正处在一个由人工智能（AI
数字化时代练歌神器：卡拉OK点唱机应用全解析
本文还有配套的精品资源，点击获取简介：卡拉OK点唱机是一款专为音乐爱好者和练歌者设计的软件，提供网络点播、音轨分离、音调调整、评分系统、回放功能和歌词同步显示等辅助功能，帮助用户随时随地进行歌唱练习，提升演唱技巧。高级版本还提供专业音效处理功能，使得卡拉OK点唱机成为业余爱好者和专业歌手的理想训练工具。1.网络点播功能的实现与应用网络点播功能改变了我们获取媒体内容的方式，赋予了用户前所未有的主动性
上位机软件开发哪家好？深圳市由你创科技上位机开发自动化 c#labview c++python c语言 matlab
在工业自动化、医疗设备、新能源等领域，上位机软件如同“指挥官”，负责设备控制、数据分析和人机交互，直接影响生产效率和系统稳定性。然而，面对多协议兼容性差、开发周期不可控、后期维护成本高等难题，企业如何选择一家技术过硬、服务优质的上位机软件开发服务商？深圳市由你创科技有限公司凭借全栈技术能力、垂直行业经验及高效服务体系，深圳市由你创成为众多企业首选的上位机开发合作伙伴。本文深度解析上位机开发的关键要
SpringBoot-19-企业云端开发实践之web开发晋级皮皮冰燃 SpringBoot spring boot 前端后端
文章目录1静态资源访问1.1static静态资源目录1.2application.properties(过滤规则)2文件上传2.1文件上传原理2.2SprintBoot文件上传功能2.3FileUploadController.java2.4配置访问上传的文件3拦截器3.1interceptor/LoginInterceptor3.2config/WebConfig4RESTful服务和Swagg
深入企业内部的MCP知识（二）：FastMCP客户端三大核心能力深度解析：资源、工具与提示的全场景实践炼丹上岸大模型 #MCP microsoft 人工智能 python 交互 mcp
引言：MCP协议交互的“三驾马车”在ModelContextProtocol（MCP）的技术生态中，资源（Resources）、工具（Tools）与提示（Prompts）构成了客户端与服务器交互的核心支柱。FastMCP通过统一的API设计，将这三者转化为可直接调用的编程接口，既隐藏了底层协议的复杂性，又保留了高度的灵活性。本文将从技术原理、实战案例到性能优化，系统拆解这三大能力的使用方法与协同逻
MATLAB随机模拟技术在气候模型中的应用
本文还有配套的精品资源，点击获取简介：MATLAB是科学研究和工程领域中广泛使用的一款数学计算与编程软件，尤其在气象学和气候模拟方面有着重要的应用。’Fletcher_2019_Learning_Climate’项目通过MATLAB实现的随机模拟方法帮助理解气候变化。本文将详细探讨该项目的关键内容，包括气候模型的构成、随机过程与统计方法的运用、MATLAB编程技能、气候数据处理与分析、结果可视化以
LabVIEW串口通信实战教程：上位机与下位机数据交互安检
本文还有配套的精品资源，点击获取简介：LabVIEW作为一种图形化编程工具，非常适合开发用于测试、测量和控制的应用程序。本文介绍了一个LabVIEW串口通信实例——“串口助手.vi”，通过它可以作为上位机接收下位机通过串口发送的数据。文章详细解释了LabVIEW中串口通信的关键技术点，包括串口配置、打开和关闭串口、数据读取与写入、错误处理、数据解析、用户界面设计、事件结构以及实时监控。掌握这些技术
实现顶部固定与平滑滑动二级菜单的网页导航设计
本文还有配套的精品资源，点击获取简介：现代网页设计中，高效的导航菜单对用户体验至关重要。本设计涵盖固定在顶部的导航栏和二级菜单项的平滑滑动效果。通过CSS实现导航栏的固定定位，而JavaScript则负责二级菜单的平滑过渡动画。包含的文件如HTML结构、JavaScript交互逻辑、CSS样式和可能的图像资源，共同构建了这种流行的导航菜单布局。1.顶部固定、二级栏目之间相互滑动的导航菜单在现代网页
快速启动静态网络服务器的Run工具使用指南闫泽华
本文还有配套的精品资源，点击获取简介：本文介绍了如何使用run工具，一个通过npm全局安装的Node.js包，来启动一个简单的静态文件服务器。介绍了npm的作用，以及如何全局安装run。随后，文章解释了run工具的用途，包括从任何目录快速启动静态网站服务器的能力，并讨论了它在开发、测试和演示中的应用。还涉及了使用run工具时涉及的一些基本任务，如处理HTTP请求和返回静态资源，以及提供了源代码文件
【亲测免费】基于51单片机的温度报警系统：实时监测与智能报警杭林菲
基于51单片机的温度报警系统：实时监测与智能报警【下载地址】基于51单片机的温度报警系统源代码论文本项目提供了一个基于51单片机的温度报警系统的完整资源，包括源代码和相关论文。该系统采用单片机、18B20温度传感器、数码管和蜂鸣器等硬件组件设计而成，能够实时监测环境温度，并在温度超出预设范围时发出报警信号项目地址:https://gitcode.com/open-source-toolkit/1f
基于FPGA的Verilog电子密码锁设计资源文件：为安全而生，智控锁码
基于FPGA的Verilog电子密码锁设计资源文件：为安全而生，智控锁码【下载地址】基于FPGA的Verilog电子密码锁设计资源文件基于FPGA和Verilog语言设计的电子密码锁项目，提供完整的硬件设计原理图、Verilog代码、仿真波形图和硬件描述文档。通过FPGA的可编程特性，实现密码设置、验证及锁定功能，适合学术研究、教学演示或个人兴趣学习。项目文件清晰，包含详细的使用说明，帮助用户快速
《数字集成电路——课程设计报告》资源介绍幸刚磊Thomas
《数字集成电路——课程设计报告》资源介绍【下载地址】数字集成电路课程设计报告资源介绍该开源项目提供了《数字集成电路——课程设计报告》的完整资源，专为电子工程及相关专业的学生和研究人员设计。报告详细介绍了与非门、或非门、反相器、主从JK触发器以及二-四译码器等基础逻辑电路的搭建与仿真过程。通过使用Cadence和LTspice软件，学习者可以掌握数字集成电路的实际设计技能。报告内容深入浅出，适合具备
lxcfs：容器虚拟化资源视图的关键利器
随着容器技术的快速普及，如何让容器内的应用准确感知和使用自身的资源限制，成为容器运行时和编排系统必须面对的重要问题一、为什么需要lxcfs？容器通过Linux的cgroup实现资源隔离，限制CPU、内存等资源的使用上限。但容器内的进程访问/proc文件系统时，默认看到的是宿主机的全局资源视图，而非自身的配额。例如：容器限制了2核CPU，但/proc/cpuinfo显示宿主机的全部CPU信息。容器内
领域驱动设计核心解析
我是廖志伟，一名Java开发工程师、《Java项目实战——深入理解大型互联网企业通用技术》（基础篇）、（进阶篇）、（架构篇）清华大学出版社签约作家、Java领域优质创作者、CSDN博客专家、阿里云专家博主、51CTO专家博主、产品软文专业写手、技术文章评审老师、技术类问卷调查设计师、幕后大佬社区创始人、开源项目贡献者。拥有多年一线研发和团队管理经验，研究过主流框架的底层源码(Spring、Spri
DDD实践精髓：战略与战术 Java廖志伟 Java场景面试宝典 DDD Software Architecture Business Logic
我是廖志伟，一名Java开发工程师、《Java项目实战——深入理解大型互联网企业通用技术》（基础篇）、（进阶篇）、（架构篇）清华大学出版社签约作家、Java领域优质创作者、CSDN博客专家、阿里云专家博主、51CTO专家博主、产品软文专业写手、技术文章评审老师、技术类问卷调查设计师、幕后大佬社区创始人、开源项目贡献者。拥有多年一线研发和团队管理经验，研究过主流框架的底层源码(Spring、Spri
ShardingSphere核心技术揭秘 Java廖志伟 Java场景面试宝典 Database Sharding Distributed Systems Performance Scaling
我是廖志伟，一名Java开发工程师、《Java项目实战——深入理解大型互联网企业通用技术》（基础篇）、（进阶篇）、（架构篇）清华大学出版社签约作家、Java领域优质创作者、CSDN博客专家、阿里云专家博主、51CTO专家博主、产品软文专业写手、技术文章评审老师、技术类问卷调查设计师、幕后大佬社区创始人、开源项目贡献者。拥有多年一线研发和团队管理经验，研究过主流框架的底层源码(Spring、Spri
人工智能开源的大模型训练微调框架LLaMA-Factory
LLaMA-Factory是一个开源的大模型训练微调框架，具有模块化设计和多种高效的训练方法，能够满足不同用户的需求。用户可以通过命令行或Web界面进行操作，实现个性化的语言模型微调。LLaMA-Factory是一个专注于高效微调LLaMA系列模型的开源框架（GitHub项目地址：https://github.com/hiyouga/LLaMA-Factory）。它以极简配置、低资源消耗和对中文任
Kafka 数据倾斜原因、影响与权威解决方案
一、数据倾斜的概念在Kafka环境中，数据倾斜是指数据在主题（Topic）的各个分区（Partition）之间分布不均匀的状况。理想情况下，分区设计期望数据能在各个分区均衡分布，如此一来，消费者组内的消费者便可均衡地从不同分区消费数据，从而充分利用系统资源实现高效并行处理。但当数据倾斜发生时，部分分区会承载大量数据，而其他分区的数据量则相对较少。二、数据倾斜产生的原因（一）生产者端原因分区键（Pa
【亲测免费】京东扫码登陆Python脚本：轻松实现账号安全登陆金琴莺
京东扫码登陆Python脚本：轻松实现账号安全登陆【下载地址】京东扫码登陆Python脚本京东扫码登陆Python脚本本仓库提供了一个名为“京东扫码登陆python脚本.rar”的资源文件，该文件包含了一个支持京东扫码登陆的Python脚本项目地址:https://gitcode.com/open-source-toolkit/4ca8d项目介绍在数字化时代，账号安全与便捷登陆成为了用户关注的焦点
大一小白初学51单片机——安装开发软件Keil5C51 老虎0627 51单片机嵌入式硬件单片机
前言本文主要是结合B站上江科大的51单片机入门教程进行的经验总结，希望能帮助大家能快速入手单片机，快速安装使用开发软件Keil5C51。Keil5C51的安装软件获取首先我们先根据视频，把软件安装包提取下载到电脑上文件解压缩后要注意，使用视频中提供下载好的软件包，其内部含有如下图所示的两个文件。但是因为windows自带的保护系统，往往会把keygen软件当成病毒清理掉，因此我们需要在弹出病毒隔离
JVM StackMapTable 属性的作用及理解 lijingyao8206 jvm 字节码 Class文件 StackMapTable
在Java 6版本之后JVM引入了栈图(Stack Map Table)概念。为了提高验证过程的效率，在字节码规范中添加了Stack Map Table属性，以下简称栈图，其方法的code属性中存储了局部变量和操作数的类型验证以及字节码的偏移量。也就是一个method需要且仅对应一个Stack Map Table。在Java 7版
回调函数调用方法百合不是茶 java
最近在看大神写的代码时,.发现其中使用了很多的回调 ,以前只是在学习的时候经常用到 ,现在写个笔记记录一下代码很简单: MainDemo :调用方法得到方法的返回结果
[时间机器]制造时间机器需要一些材料 comsci 制造
根据我的计算和推测,要完全实现制造一台时间机器,需要某些我们这个世界不存在的物质和材料... 甚至可以这样说,这种材料和物质,我们在反应堆中也无法获得......
开口埋怨不如闭口做事邓集海邓集海做人做事工作
“开口埋怨，不如闭口做事。”不是名人名言，而是一个普通父亲对儿子的训导。但是，因为这句训导，这位普通父亲却造就了一个名人儿子。这位普通父亲造就的名人儿子，叫张明正。　　　　张明正出身贫寒，读书时成绩差，常挨老师批评。高中毕业，张明正连普通大学的分数线都没上。高考成绩出来后，平时开口怨这怨那的张明正，不从自身找原因，而是不停地埋怨自己家庭条件不好、埋怨父母没有给他创造良好的学习环境。　　　　
jQuery插件开发全解析，类级别与对象级别开发 IT独行者 jquery 开发插件　函数
jQuery插件的开发包括两种：一种是类级别的插件开发，即给 jQuery添加新的全局函数，相当于给 jQuery类本身添加方法。 jQuery的全局函数就是属于 jQuery命名空间的函数，另一种是对象级别的插件开发，即给 jQuery对象添加方法。下面就两种函数的开发做详细的说明。 1 、类级别的插件开发类级别的插件开发最直接的理解就是给jQuer
Rome解析Rss 413277409 Rome解析Rss
import java.net.URL; import java.util.List; import org.junit.Test; import com.sun.syndication.feed.synd.SyndCategory; import com.sun.syndication.feed.synd.S
RSA加密解密无量加密解密 rsa
RSA加密解密代码代码有待整理 package com.tongbanjie.commons.util; import java.security.Key; import java.security.KeyFactory; import java.security.KeyPair; import java.security.KeyPairGenerat
linux 软件安装遇到的问题 aichenglong linux 遇到的问题 ftp
1 ftp配置中遇到的问题 500 OOPS: cannot change directory 出现该问题的原因:是SELinux安装机制的问题.只要disable SELinux就可以了修改方法:1 修改/etc/selinux/config 中SELINUX=disabled 2 source /etc
面试心得 alafqq 面试
最近面试了好几家公司。记录下；支付宝，面试我的人胖胖的，看着人挺好的；博彦外包的职位，面试失败；阿里金融，面试官人也挺和善，只不过我让他吐血了。。。由于印象比较深，记录下； 1，自我介绍 2，说下八种基本类型；（算上string。楼主才答了3种，哈哈，string其实不是基本类型，是引用类型） 3，什么是包装类，包装类的优点； 4，平时看过什么书？NND，什么书都没看过。。照样
java的多态性探讨百合不是茶 java
java的多态性是指main方法在调用属性的时候类可以对这一属性做出反应的情况 //package 1; class A{ public void test(){ System.out.println("A"); } } class D extends A{ public void test(){ S
网络编程基础篇之JavaScript-学习笔记 bijian1013 JavaScript
1.documentWrite <html> <head> <script language="JavaScript"> document.write("这是电脑网络学校"); document.close(); </script> </h
探索JUnit4扩展：深入Rule bijian1013 JUnit Rule 单元测试
本文将进一步探究Rule的应用，展示如何使用Rule来替代@BeforeClass，@AfterClass，@Before和@After的功能。在上一篇中提到，可以使用Rule替代现有的大部分Runner扩展，而且也不提倡对Runner中的withBefores()，withAfte
[CSS]CSS浮动十五条规则 bit1129 css
这些浮动规则，主要是参考CSS权威指南关于浮动规则的总结，然后添加一些简单的例子以验证和理解这些规则。 1. 所有的页面元素都可以浮动 2. 一个元素浮动后，会成为块级元素，比如<span>,a, strong等都会变成块级元素 3.一个元素左浮动，会向最近的块级父元素的左上角移动，直到浮动元素的左外边界碰到块级父元素的左内边界；如果这个块级父元素已经有浮动元素停靠了
【Kafka六】Kafka Producer和Consumer多Broker、多Partition场景 bit1129 partition
0.Kafka服务器配置 3个broker 1个topic，6个partition，副本因子是2 2个consumer，每个consumer三个线程并发读取 1. Producer package kafka.examples.multibrokers.producers; import java.util.Properties; import java.util.
zabbix_agentd.conf配置文件详解 ronin47 zabbix 配置文件
Aliaskey的别名，例如 Alias=ttlsa.userid:vfs.file.regexp[/etc/passwd,^ttlsa:.:([0-9]+),,,,\1]，或者ttlsa的用户ID。你可以使用key：vfs.file.regexp[/etc/passwd,^ttlsa:.: ([0-9]+),,,,\1]，也可以使用ttlsa.userid。备注: 别名不能重复，但是可以有多个
java--19.用矩阵求Fibonacci数列的第N项 bylijinnan fibonacci
参考了网上的思路，写了个Java版的： public class Fibonacci { final static int[] A={1,1,1,0}; public static void main(String[] args) { int n=7; for(int i=0;i<=n;i++){ int f=fibonac
Netty源码学习-LengthFieldBasedFrameDecoder bylijinnan java netty
先看看LengthFieldBasedFrameDecoder的官方API http://docs.jboss.org/netty/3.1/api/org/jboss/netty/handler/codec/frame/LengthFieldBasedFrameDecoder.html API举例说明了LengthFieldBasedFrameDecoder的解析机制，如下：实
AES加密解密 chicony 加密解密
AES加解密算法，使用Base64做转码以及辅助加密： package com.wintv.common; import javax.crypto.Cipher; import javax.crypto.spec.IvParameterSpec; import javax.crypto.spec.SecretKeySpec; import sun.misc.BASE64Decod
文件编码格式转换 ctrain 编码格式
package com.test; import java.io.File; import java.io.FileInputStream; import java.io.FileOutputStream; import java.io.IOException; import java.io.InputStream; import java.io.OutputStream;
mysql 在linux客户端插入数据中文乱码 daizj mysql 中文乱码
1、查看系统客户端，数据库，连接层的编码查看方法： http://daizj.iteye.com/blog/2174993 进入mysql，通过如下命令查看数据库编码方式： mysql> show variables like 'character_set_%'; +--------------------------+------
好代码是廉价的代码 dcj3sjt126com 程序员读书
长久以来我一直主张：好代码是廉价的代码。当我跟做开发的同事说出这话时，他们的第一反应是一种惊愕，然后是将近一个星期的嘲笑，把它当作一个笑话来讲。当他们走近看我的表情、知道我是认真的时，才收敛一点。当最初的惊愕消退后，他们会用一些这样的话来反驳： “好代码不廉价，好代码是采用经过数十年计算机科学研究和积累得出的最佳实践设计模式和方法论建立起来的精心制作的程序代码。” 我只
Android网络请求库——android-async-http dcj3sjt126com android
在iOS开发中有大名鼎鼎的ASIHttpRequest库，用来处理网络请求操作，今天要介绍的是一个在Android上同样强大的网络请求库android-async-http，目前非常火的应用Instagram和Pinterest的Android版就是用的这个网络请求库。这个网络请求库是基于Apache HttpClient库之上的一个异步网络请求处理库，网络处理均基于Android的非UI线程，通
ORACLE 复习笔记之SQL语句的优化 eksliang SQL优化 Oracle sql语句优化 SQL语句的优化
转载请出自出处：http://eksliang.iteye.com/blog/2097999 SQL语句的优化总结如下 sql语句的优化可以按照如下六个步骤进行：合理使用索引避免或者简化排序消除对大表的扫描避免复杂的通配符匹配调整子查询的性能 EXISTS和IN运算符下面我就按照上面这六个步骤分别进行总结：
浅析：Android 嵌套滑动机制（NestedScrolling） gg163 android 移动开发滑动机制嵌套
谷歌在发布安卓 Lollipop版本之后，为了更好的用户体验，Google为Android的滑动机制提供了NestedScrolling特性 NestedScrolling的特性可以体现在哪里呢？ 比如你使用了Toolbar，下面一个ScrollView，向上滚
使用hovertree菜单作为后台导航 hvt JavaScript jquery .net hovertree asp.net
hovertree是一个jquery菜单插件，官方网址：http://keleyi.com/jq/hovertree/ ，可以登录该网址体验效果。 0.1.3版本：http://keleyi.com/jq/hovertree/demo/demo.0.1.3.htm hovertree插件包含文件： http://keleyi.com/jq/hovertree/css
SVG 教程（二）矩形天梯梦 svg
SVG <rect> SVG Shapes SVG有一些预定义的形状元素，可被开发者使用和操作：矩形 <rect> 圆形 <circle> 椭圆 <ellipse> 线 <line> 折线 <polyline> 多边形 <polygon> 路径 <path>
一个简单的队列 luyulong java 数据结构队列
public class MyQueue { private long[] arr; private int front; private int end; // 有效数据的大小 private int elements; public MyQueue() { arr = new long[10]; elements = 0; front
基础数据结构和算法九：Binary Search Tree sunwinner Algorithm
A binary search tree (BST) is a binary tree where each node has a Comparable key (and an associated value) and satisfies the restriction that the key in any node is larger than the keys in all
项目出现的一些问题和体会 Steven-Walker DAO Web servlet
第一篇博客不知道要写点什么，就先来点近阶段的感悟吧。这几天学了servlet和数据库等知识，就参照老方的视频写了一个简单的增删改查的，完成了最简单的一些功能，使用了三层架构。 dao层完成的是对数据库具体的功能实现，service层调用了dao层的实现方法，具体对servlet提供支持。 &
高手问答：Java老A带你全面提升Java单兵作战能力！ ITeye管理员 java
本期特邀《Java特种兵》作者：谢宇，CSDN论坛ID: xieyuooo 针对JAVA问题给予大家解答，欢迎网友积极提问，与专家一起讨论! 作者简介：淘宝网资深Java工程师，CSDN超人气博主，人称“胖哥”。 CSDN博客地址： http://blog.csdn.net/xieyuooo 作者在进入大学前是一个不折不扣的计算机白痴，曾经被人笑话过不懂鼠标是什么，

图像处理 语音识别 深度学习 开放数据集

从图像处理到语音识别，25款数据科学家必知的深度学习开放数据集

图像处理数据集

自然语言处理

音频/语音数据集

你可能感兴趣的:(经验,资源)

图像处理语音识别深度学习开放数据集