kuanzi0001

深度学习开放数据集

来源：DeepLearning4J

原文地址：https://deeplearning4j.org/cn/opendata

本页为您整理汇总了各类可供机器学习研究使用的高质量数据集。欢迎您为本页列表推荐新的数据集！您还可以在维基百科等其他地方找到类似的数据集一览表。

最近添加

开源生物特征识别数据
谷歌Audioset：包含取自YouTube视频的2,084,320条人工标记的10秒声音片段，数据集本体由632种音频事件类别组成，目前仍在不断扩大。
优步20亿行程数据：逐步开放20亿次行程的数据。
Yelp公开数据集：Yelp商户、评论及用户数据的子集，用于自然语言处理（NLP）。

自然图像数据集

MNIST：手写数字：最常用的合理性检验数据集，由黑白手写数字图像组成，图像大小为25x25，数字居中显示。MNIST是一项比较简单的任务，通过MNIST测试不一定表明模型本身能有效运作。

CIFAR10 / CIFAR100：32×32自然图像数据集，10或100种类别。目前已不再普遍使用，但还是可以用来进行合理性检验。

_ITEMS_TO_DESCRIPTIONS = {
'image': 'A [32 x 32 x 3] color image.',
'label': 'A single integer between 0 and 9',
}

Caltech 101：101类物体的图片。
Caltech 256：256类物体的图片。
STL-10数据集：一个用于开发无监督特征学习、深度学习、自学习算法的图像识别数据集。与CIFAR-10相似但有些改动。
街景门牌号码（SVHN）数据集: 来自谷歌街景的门牌号码图像，可将其视作自然的循环式MNIST数据集。
NORB：以不同照明及摆放方式摄制的玩具模型的双目图像。
Pascal VOC：通用图像分割/分类数据集，对建立实际图像标注网络的作用有限，但很适合作为基线。
Labelme：大型已标注图像数据集。
ImageNet：各类新算法实际使用的图像数据集。ImageNet采用包含1000种类别的WordNet分类层级，而许多图像API公司的REST接口提供的标签似乎都与ImageNet的体系颇为相似。
LSUN：用于场景理解和多项辅助任务（房间布局估测、显著性预测等）的竞赛数据集。
MS COCO：通用图像理解/描述生成的竞赛数据集。
COIL 20：360度旋转拍摄的各类物体图像。
COIL100 ：360度旋转拍摄的各类物体图像。
谷歌开放图像数据集：汇集了900万条图像URL链接，经创作共用协议授权，所有图像“均已用6000多种类别的标签进行标注”。
flower：图像大小不固定。http://www.robots.ox.ac.uk/~vgg/data/flowers/

地理空间数据

OpenStreetMap：开放授权的数据集，包含整个地球的向量数据。包含美国统计局数据（的较老版本）。
Landsat8：整个地球表面的卫星照片，每隔数周更新一次。
NEXRAD：多普勒雷达扫描的美国大气环境数据。

人工数据集

Arcade Universe：－一个人工数据集生成器，图像包括各种电子游戏形象，比如俄罗斯方块中的五连/四连方块。这一生成器基于O. Breleux的bugland数据集生成器。
受BabyAISchool的构想启发的一系列数据集
BabyAIShapesDatasets：分辨三种简单的形状
BabyAIImageAndQuestionDatasets：一个“问题－图像－回答”数据集
为对深度学习架构开展实证评价研究而生成的数据集（DeepVsShallowComparisonICML2007）：
MnistVariations：在MNIST数据集中引入可控变化
RectanglesData：区分宽的和高的长方形
ConvexNonConvex：区分凸多边形和凹多边形
BackgroundCorrelation：控制有噪声的MNIST背景中的像素关联程度。

脸部图像数据集

自然脸部检测（LFW）数据集：包含13000幅经裁剪的脸部区域图像（采用Viola-Jones检测框架），标记了图中人的姓名。数据集中的一部分人有两幅图像，人们常用它训练脸部匹配系统。
UMD Faces：已标注的人脸图像数据集，包括来自8501个人的367920幅脸部图像。
CASIA WebFace：包含453453幅人脸图像的数据集，经人脸检测后共识别出超过10575个身份。需要进行一些筛选来提高质量。
MS-Celeb-1M：100万幅世界名人图像。需要进行一些筛选才能在深度神经网络上取得最佳结果。
Olivetti：一些人的不同脸部图像。
Multi-Pie：CMU的Multi-PIE人脸数据库
Face-in-Action
JACFEE：日本人和高加索人不同情绪的脸部表情
FERET：脸部识别技术数据库
mmifacedb：MMI脸部表情数据库
IndianFaceDatabase
耶鲁人脸数据库和耶鲁人脸数据库B)。

视频数据集

Youtube-8M：用于视频理解研究的大型多样化已标记视频数据集。

文本数据集

20个新闻组数据集：分类任务，将出现的词映射至新闻组ID。文本分类的经典数据集之一，通常可以用于纯分类算法的基准测试，或者用于验证任意一种IR/索引算法。
路透社新闻数据集：（较老）纯分类用途的新闻电讯文本数据集。常用于教程。
Penn Treebank：用于下一词预测或下一字预测。
UCI垃圾邮件数据库Spambase：（较老）来自著名的UCI机器学习库的经典垃圾邮件数据集。该数据集经过细致的审编，因此可以作为个性化垃圾邮件筛选学习的基线。
广播新闻数据集：用于下一词预测的经典大型文本数据集。
文本分类数据集：来自Zhang等人，2015；八个内容丰富的文本分类数据集，可用于新文本分类基线的基准测试。样例大小为120K至3.6M，问题所涉及的类别从两个到14个不等。数据集内容来自DBPedia、亚马逊、Yelp、雅虎和AG。
WikiText：取自高质量维基百科文章的大型语言模型语料库，由Salesforce MetaMind进行审编。
SQuAD：斯坦福问答数据集——用途广泛的问题回答及阅读理解数据集，每项问题的答案都是一段文本。
十亿词数据集：大型通用语言模型数据集，常用于训练Word2Vec等词的分布式表示。
Common Crawl：万兆字节级的网页爬取数据集——最常用于学习词向量。可通过亚马逊S3免费获取。数据集的内容从万维网爬取获得，因此也可以用作互联网的数据集。
谷歌图书Ngram数据集：取自谷歌图书的连续词数据，是探索一个词何时开始被广泛使用的简易方法。
Yelp公开数据集：Yelp商户、评论及用户数据的子集，用于自然语言处理（NLP）。

问答

Maluuba新闻问答数据集：基于CNN新闻报道的1.2万对问答。
Quora问答对：Quora发布的首个数据集，包含副本/语义相似度标签。
CMU问答数据集：用维基百科文章人工生成的事实型问答对，配有难度评级。
Maluuba目标导向对话：程序型会话数据集，对话旨在完成一项任务或决策，常用于聊天机器人。
bAbi：来自Facebook人工智能研究所（FAIR）的综合型阅读理解及问答数据集。
儿童图书测试：从古腾堡计划提供的儿童图书中提取问答对（问题 + 上下文、答案）作为基线，可以用于问题回答（阅读理解）和事实型查询。

情感

多领域情感分析数据集：较老的学术型数据集。
IMDB：较老且相对较小的二元情感分类数据集。目前的研究论文中多改用更大的数据集来进行基准测试。
斯坦福情感Treebank：斯坦福的情感数据集，每个句子的解析树的各个节点都有高精度的情感标注。

推荐和评价系统

Movielens：来自Movielens网站的电影评价数据，数据集有多个不同大小的版本，最小为演示版，最大为中型规模。
Million Song数据集：百万首流行歌曲：Kaggle提供的大型开源数据集，元数据丰富，适合进行混合型推荐系统的实验。
Last.fm：音乐推荐数据集，可访问基础社交网络及其他类型的元数据，可用于混合型系统。
Book-Crossing数据集：来自Book-Crossing社区。包括278858位用户对271379本书的1149780项评价。
Jester：73421位用户对100个笑话的410万项连续评价（-10.00到+10.00）。
Netflix Prize：Netflix发布了其电影评价数据集的匿名版本；其中包括1亿项评价，共有48万名用户参与评价，每人评价的电影数量为1部到所有17770部不等。首个大型Kaggle式数据挑战赛。由于隐私方面的问题，只能通过非官方渠道获取。

网络与图像

亚马逊关联购买及评价数据：从亚马逊的“购买了该商品的用户还购买了……”部分爬取的数据，以及相关产品的评价数据。适合在互联网中进行推荐系统测试。
Friendster社交网络数据集：在转型为游戏网站前，Friendster曾以好友列表的形式公开了103750348名用户的匿名数据。

语音数据集

2000 HUB5英语数据：英语语音数据集，百度最近的深度语音识别论文中采用了该数据集。
LibriSpeech：包括文本和语音的有声书数据集。由多位朗读者朗读的有声书录音，总计近500小时，语音清晰，按章节划分，同时包含文本和语音。
VoxForge：清晰的带口音英语语音数据集，可用于提高算法遇到不同口音或语调时的稳健性。
TIMIT：英语语音识别数据集。
CHIME：嘈杂环境语音识别挑战赛数据集，包含了真实、模拟和清晰的语音数据。真实语音是4位讲话人在超过4个嘈杂地点录制的近9000条录音，模拟语音是用多种环境噪音与语音叠加生成的录音，而清晰语音则是无噪音的录音。
TED-LIUM： TED演讲的音频文字稿。1495段TED演讲的录音及其完整转录文字稿。

符号化音乐数据集

Piano-midi.de：古典钢琴乐曲
Nottingham：1000多首民歌
MuseData：古典音乐电子乐谱库
JSB Chorales：众赞歌四声部合唱乐谱

其他数据集

CMU动作捕捉数据集
Brodatz数据集：纹理建模
来自CERN的大型强子对撞机（LHC）的300TB高质量数据
纽约市出租车数据集：依据美国信息自由法提出要求后获得的纽约市出租车数据，造成了隐私问题。
优步FOIL数据集：依据美国信息自由法（FOIL）提出要求后获得的纽约市的450万次优步行程数据。
Criteo点击流数据：来自欧洲一家大型重定向广告公司的大型互联网广告数据集。

卫生与生物数据

欧盟传染病监测地图
默克分子活性预测挑战赛
麝香数据集：麝香数据集描述了不同构象的分子。每种分子或者是麝香，或者是非麝香，而这一属性由某一种构象决定。

政府与统计数据

Data USA：最全面的美国公共数据可视化网站
欧盟性别统计数据库
荷兰国家地理信息数据库（荷兰语）
联合国开发计划署项目
感谢deeplearning.net和Luke de Oliveira提供多项链接和数据集说明。欢迎提出其他任何值得向Deeplearning4j社区介绍的开数据集！

你可能感兴趣的:(语音识别(speech,recognition),目标跟踪(object,tracking),其他项目&课程)

Linux_C编程—信号处理函数的返回 Aspirant-GQ Linux Linux 信号处理函数信号处理返回
文章目录信号处理函数执行完怎么办setjmp()/longjmp()sigsetjmp()/siglongjmp()信号处理函数执行完怎么办一般来讲，信号处理函数执行完毕都会正常返回，也可以调用其他函数返回到程序的主函数中。这里总结一下信号处理函数执行完毕后跳转到主函数中指定的位置的操作（有点类似goto语句，但goto不支持函数间的跳转，只能在一个函数中跳转），主要是通过俩对函数来实现的：set
解决后端的set-cookie无法写入浏览器的问题 yudaleng 前端 json javascript 后端 springboot
前言:最近做项目，遇到了set-cookie无法写入的问题。一开始以为是浏览器安全设置的问题导致无法写入cookie，后面发现并不是。在网上翻阅了许多文章，终于定位到了问题。写这篇文章用于记录一下，以免以后忘了。后端：1.后端需要配置好跨域2.响应头必须包含httpServletResponse.setHeader("Access-Control-Allow-Credentials","true"
JavaScript闭包+函数内部的this指向落日九号 javascript
关于闭包，什么是闭包？闭包就是能够读取其他函数内部变量的函数。如果我们把闭包改称做闭包函数这样理解起来可能更容易一些。闭包就是能够读取其他函数内部变量的函数。例如在javascript中，只有函数内部的子函数才能读取局部变量，所以闭包可以理解成“定义在一个函数内部的函数“。在本质上，闭包是将函数内部和函数外部连接起来的桥梁。真正的定义闭包————英文连接闭包————中文连接Aclosure
Linux：信号处理原理与实现「已注销」 linux 运维服务器
什么是信号信号本质上是在软件层次上对中断机制的一种模拟，其主要有以下几种来源：程序错误：除零，非法内存访问等。外部信号：终端Ctrl-C产生SGINT信号，定时器到期产生SIGALRM等。显式请求：kill函数允许进程发送任何信号给其他进程或进程组。目前Linux支持64种信号。信号分为非实时信号(不可靠信号)和实时信号(可靠信号)两种类型，对应于Linux的信号值为1-31和34-64。信号是异
操作系统——windows 时间海里的溺水者 windows
1.操作系统的介绍操作系统（OperatingSystem，简称OS）是管理和控制计算机硬件与软件资源的计算机程序，是直接运行在“裸机”上的最基本的系统软件，任何其他软件都必须在操作系统的支持下才能运行。2.操作系统的分类（主流操作系统）2.1.Windows简介：Windows是微软公司研发的操作系统，自1985年推出以来，已成为全球应用广泛的操作系统。Windows采用了图形用户界面，提升了系
健身房预约小程序开发，开启智能健身时代冠品网络科技小程序开发小程序小程序制作健身房预约小程序健身房预约系统
在移动互联网时代，人们的生活习惯发生了巨大改变，促使行业都在寻求数字化转型，线下健身房也不例外。传统的线下健身房预约方式已经不能满足用户的需求，数字化预约方式能够带来便捷、高效的体验，不仅可以提升用户体验，还可以为健身行业带来新的发展机遇。健身房预约系统带来的优势1、便捷预约用户无需拨打电话或到店咨询，只需通过小程序即可随时随地查看课程安排、教练信息、场馆情况等，并完成预约，提高了场馆的转化率。2
ngx_http_subrange_module 使用指南汤璞亚Heath
ngx_http_subrange_module使用指南ngx_http_subrange_moduleSplitonebigHTTP/Rangerequesttomultiplesubrangerequesets项目地址:https://gitcode.com/gh_mirrors/ng/ngx_http_subrange_module项目介绍ngx_http_subrange_module是一
服务器上部署springboot项目学习笔记 Warren98 服务器 spring boot 学习后端阿里云 java
Java相关命令运行jar包:在linux中,进入到jar包所在目录后,直接tab补全名称即可java-jarjar包名称查看jar包是否在运行：ps-ef|grepjava终止运行的jar包:kill#是jar包的id根据jar包名称查看运行状态psaux|grepMyBlog-0.0.1-SNAPSHOT.jar设置jar包一直运行每次启动jar包时,都需要打开SSH远程连接工具,比如fina
Charles 抓包工具使用指南：设置、功能详解与最佳实践技术博主狂热者 http udp https websocket 网络安全网络协议 tcp/ip
引言前段时间入职了一家公司，项目中的代码注释比较少，而且代码量大，比较难以理解每个接口的数据情况。为了分析接口的行为，我们需要安装项目测试环境包，并通过抓包来查看请求参数和header，借此来理解代码逻辑。我选择了使用Charles配合模拟器进行抓包调试。今天我来总结一下Charles的用法以及结合模拟器的简单使用。Charles与SniffmasterCharles是一款强大的抓包调试工具，相信
IDEA 出现 Cannot access aliyunmaven in offline mode 问题解决方案 z2637305611 intellij-idea java spring boot
一、问题现象在使用IntelliJIDEA构建Maven项目时，可能会遇到如下错误提示：Cannotaccessaliyunmaven(https://maven.aliyun.com/repository/public)inofflinemode这种错误通常意味着Maven正在尝试从远程仓库（如阿里云Maven仓库）下载依赖，但由于某种原因，IDEA处于离线模式，导致无法访问远程仓库3。二、问题
Python实现微博关键词爬虫才华是浅浅的耐心 python 新浪微博爬虫
1.背景介绍随着社交媒体的广泛应用，微博上的海量数据成为了很多研究和分析的重要信息源。为了方便获取微博的相关内容，本文将介绍如何使用Python编写一个简单的爬虫脚本，从微博中抓取指定关键词的相关数据，并将这些数据保存为Excel文件。本文将以关键词“樊振东”为例，展示从微博抓取该关键词相关数据的全过程。废话不多说，先上结果图。2.项目实现思路该爬虫通过向微博的搜索接口发送HTTP请求，获取与指定
【面试题】数据结构高频面试题城仕数据结构面试题面试
1.简述什么是数据结构？数据结构是计算机存储、组织数据的方式，它使得我们可以有效地访问和修改数据。简单来说，数据结构就像是一个容器，这个容器可以以不同的方式（如线性的、树形的、表格的等）组织数据，以便于数据的查找、添加、删除和其他操作。例如，想象一下你有一本书。如果这本书没有目录、没有章节划分，你想找到某个特定的信息可能会非常困难，因为你必须一页一页地翻阅。这本书就像是一个没有组织的数据结构。现在
LiteIDE中配置golang编译生成无CMD窗口EXE的步骤 ac.char golang 经验分享 golang 开发语言后端
LiteIDE中配置golang编译生成无CMD窗口EXE的步骤一、环境配置1、设置GOROOT‌2、配置GOPATH‌二、项目编译参数设置1、新建/打开项目‌2、修改编译配置‌3、其他优化选项（可选）‌三、构建与验证1、编译生成EXE‌2、验证无窗口效果‌四、注意事项一、环境配置1、设置GOROOT‌打开LiteIDE→菜单栏选择‌查看→编辑当前环境‌确认GOROOT变量指向Go语言的安装路径（
Python Tkinter库实战（用Entry和button控件做一个小型的浏览器） IT界小菜鸡笔记 python 开发语言
大家好，上一期我们大概了解了一下PythonTkinter库。这是一个方便快捷的GUI库；可以用短短几行代码生成出一个用户图形化接口的窗口。算是非常方便。既然前一期我们了解了tk库。那么我们今天就来做一个实战。今天这个实战项目源自于我一个奇奇怪怪的想法。当时打开浏览器的时候想着，既然我打开浏览器输入网址，搜索URL。既然别人可以，那我为什么不可以自己做一个呢？抱着这个想法，我就开始了这个实验。废话
基于Python+Django的可视化学习系统设计与实现（毕业设计源码+技术文档+系统部署）逐梦设计 Python毕业设计实战案例 python django 课程设计 vue.js 毕业设计源码
博主简介作者简介：Java领域优质创作者、CSDN博客专家、CSDN内容合伙人、掘金特邀作者、阿里云博客专家、51CTO特邀作者、多年架构师设计经验、多年校企合作经验，被多个学校常年聘为校外企业导师，指导学生毕业设计并参与学生毕业答辩指导，有较为丰富的相关经验。期待与各位高校教师、企业讲师以及同行交流合作主要内容：Java项目、Python项目、前端项目、PHP、ASP.NET、人工智能与大数据、
【前端构建】使用Docker打包多个前端项目到一个Nginx镜像，并给conf文件动态传递参数 Zacks_xdc 前端 docker nginx
提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录背景正文DockerFileNginx配置模板接收变量并替换Shell脚本将Nginx配置模板替换成配置文件使用构建镜像运行容器总结背景公司给一些客户要部署三个前端项目。最初，每个前端项目都以独立的镜像形式交付并部署。然而，随着客户数量的增加，每个客户都提出了一些自定义需求，后端也进行了对应改造。这导致了部署过程变得复杂且繁琐
Python图形界面(GUI)Tkinter笔记（十四）：Entry与Button的碰撞（1）小叶肥辉 tkinter python gui tkinter
用功能按钮(Button)、单行文本输入框(Entry)、文本框内容读取(get)实现一个极简易的加法运算，及与其他控件的交互，提高体验，主要体现其人机交互的意义。因为Entry()文本输入框没有限制输入内容属性的参数，它是把所有的输入都视作它特有的一个类属性，所以用get()方法读取出来是一个字符串而这字符串可包括字母或其它符号。因此我们必须对其进行判断后再计算，若直接计算可能会出现不可预料的错
Fyrox 游戏引擎教程秋或依
Fyrox游戏引擎教程Fyrox3Dand2DgameenginewritteninRust项目地址:https://gitcode.com/gh_mirrors/fy/Fyrox项目介绍Fyrox是一个功能丰富的游戏引擎，使用Rust语言编写。它支持2D和3D游戏开发，并提供了一个场景编辑器，方便开发者进行游戏内容的创建和管理。Fyrox引擎的前身是rg3d，自2019年以来一直在积极开发中。项
【开源宝藏】30天学会CSS - DAY6 第六课流光文字动画 hikktn 开源宝藏开源 css 前端
第0步：项目结构lighting-text/├─index.html└─style.cssindex.html：包含列表，其中每个放一个字母或符号。style.css：设置背景、文字样式，以及关键帧动画（lighting）让文字逐个闪光。第1步：编写HTML结构在index.html中，核心就是一个无序列表，每个对应一个字母/符号：CSSAnimationDESAFIO♡CSS代码要点每个都是一个
设计模式：深度解析单例模式 WeiLai1112 设计模式单例模式设计模式面试 java 后端分布式中间件
深度解析单例模式：从理论到实践1.引言在软件开发中，设计模式是解决常见问题的经典解决方案。单例模式（SingletonPattern）作为创建型模式之一，广泛应用于需要全局唯一实例的场景。本文将深入探讨单例模式的定义、实现方式、优缺点以及应用场景，并结合实际项目经验，为大厂面试中的深度追问提供详细解决方案。2.单例模式的定义与结构2.1定义单例模式确保一个类只有一个实例，并提供一个全局访问点。它通
Java Panama 项目：Java 与 AI 的融合 AI天才研究院计算 Java实战 DeepSeek R1 &大数据AI人工智能大模型人工智能 java python
JavaPanama项目：Java与AI的融合Java在AI领域的优势Java在AI领域的优势主要体现在以下几个方面：强大的生态系统：Java拥有丰富的库和框架，为AI开发提供了坚实的基础。跨平台性：Java的“一次编写，到处运行”特性，降低了AI应用的运维成本。高性能与稳定性：Java虚拟机（JVM）的优化和垃圾回收机制，确保了AI应用的高效运行和内存管理。实时数据处理能力：Java可以高效处理
安心联车辆管理系统二次开发方向全分析安心联-车辆监控管理系统人工智能大数据
安心联车辆动态监控管理系统作为基于北斗/GPS的综合性车辆管理平台，其二次开发方向可从功能扩展、技术优化、行业适配等多个维度展开。结合搜索结果中的技术架构、功能模块及行业需求，以下是主要的二次开发方向及相关技术实现建议：1.协议兼容性与硬件集成扩展方向：支持更多行业协议与传感器类型。当前系统已兼容JT/T808、JT/T809等交通行业协议，可扩展至其他领域（如物流、冷链运输）的专用协议（如GB/
掌握 Postman：高级 GET 请求技术与响应分析
欢迎阅读本指南，它将详细介绍如何在Postman中发送GET请求并理解API响应。对于希望提升API测试和开发能力的开发者来说，这是不可或缺的技能。Postman对开发者的重要性Postman是API开发和测试中不可或缺的工具。它不仅简化了发送请求和分析响应的过程，还提供了一个有组织的环境来管理多个API版本和团队协作项目。在Postman中发送GET请求第1步：创建一个集合（Collection
OpenCV 基础模块 Python 版 ice_junjun OpenCV opencv python 计算机视觉
OpenCV基础模块权威指南（Python版）一、模块全景图plaintextOpenCV架构(v4.x+)├─核心层│├─core：基础数据结构与操作（Mat/Scalar/Point）│└─imgproc：图像处理流水线（滤波→变换→检测）├─交互层│├─highgui：GUI与媒体I/O（显示/捕获/交互）│└─video：视频分析（运动检测/目标跟踪）├─3D视觉层│└─calib3d：相
腾讯面经，有点难度~ 后端go
今天分享组织内的朋友在腾讯安全的实习面经。内容涵盖了QPS测试方法、SQL聚合查询、Linux进程管理、Redis数据结构与持久化、NAT原理、Docker隔离机制、Go语言GMP调度模型、协程控制、系统调用流程、变量逃逸分析及map操作等等知识点。下面是我整理的面经详解：面经详解一个表，里面有数据列，id，name,class，查学生最喜欢的前10个课程，sql语句实现SELECTclass,C
技术书籍推荐(001):电子书免费下载 c++
[0000]CodeLikeaProinRust(英文版)免费电子书PDF下载下载地址：http://t-book.sunlogging.com/2025/03/19/book/book_0000/书籍简介：本书是一本面向中高级Rust开发者的进阶指南，旨在帮助读者快速掌握Rust语言的核心工具、数据结构、内存管理、测试策略、异步编程及优化技巧。全书分为五个部分：ProRust基础涵盖Rust项目
DunTrust IP SSL证书——支持多端口验证 https
市面上99%的证书品牌的IPSSL证书在签发过程中会涉及默认80或者443端口开放问题，但是也有少数服务商也支持其他端口验证。一、IPSSL证书概述IPSSL证书是一种用于保护IP地址安全的SSL证书，它能够对IP地址进行HTTPS加密，确保传输数据的安全性和完整性。IPSSL证书通常用于没有域名或需要直接使用IP地址进行访问的场景。二、多端口验证的支持情况市面上99%的证书品牌的IPSSL证书在
leetcode_位运算 67.二进制求和 MiyamiKK57 leetcode 算法 python
67.二进制求和给你两个二进制字符串a和b，以二进制字符串的形式返回它们的和。1.内置函数classSolution(object):defaddBinary(self,a,b):""":typea:str:typeb:str:rtype:str"""res=int(a,2)+int(b,2)returnbin(res)[2:]时间复杂度分析：int(a,2)和int(b,2)：这两步将二进制字符
leetcode_双指针 557. 反转字符串中的单词 III MiyamiKK57 leetcode 算法职场和发展
557.反转字符串中的单词III给定一个字符串s，你需要反转字符串中每个单词的字符顺序，同时仍保留空格和单词的初始顺序。思路:1.首先用split()切割字符串中用空格分隔的单词2.用切片法反转每个单词3.用join()把反转后的单词用空格连接classSolution(object):defreverseWords(self,s):""":types:str:rtype:str"""#使用spl
使用PHP对接StockTV全球金融市场数据API实战指南 php股票接口
关键词：PHPAPI开发、金融市场数据、WebSocket实时数据、cURL实战一、项目概述StockTV作为全球领先的金融数据平台，提供覆盖股票、外汇、期货和加密货币的实时行情服务。本文将手把手教你使用PHP实现以下核心功能：✅RESTAPI调用：获取历史行情数据✅WebSocket订阅：实时价格推送✅生产级特性：异常重试、速率控制、数据缓存✅高性能优化：连接池、异步处理二、环境准备1.运行环境
用MiddleGenIDE工具生成hibernate的POJO（根据数据表生成POJO类） AdyZhang POJO eclipse Hibernate MiddleGenIDE
推荐:MiddlegenIDE插件, 是一个Eclipse 插件. 用它可以直接连接到数据库, 根据表按照一定的HIBERNATE规则作出BEAN和对应的XML ，用完后你可以手动删除它加载的JAR包和XML文件! 今天开始试着使用
.9.png Cb123456 android
“点九”是andriod平台的应用软件开发里的一种特殊的图片形式，文件扩展名为：.9.png 　　智能手机中有自动横屏的功能,同一幅界面会在随着手机(或平板电脑)中的方向传感器的参数不同而改变显示的方向,在界面改变方向后,界面上的图形会因为长宽的变化而产生拉伸,造成图形的失真变形。　　我们都知道android平台有多种不同的分辨率，很多控件的切图文件在被放大拉伸后，边
算法的效率天子之骄算法效率复杂度最坏情况运行时间大O阶平均情况运行时间
算法的效率效率是速度和空间消耗的度量。集中考虑程序的速度，也称运行时间或执行时间，用复杂度的阶(O)这一标准来衡量。空间的消耗或需求也可以用大O表示，而且它总是小于或等于时间需求。以下是我的学习笔记： 1.求值与霍纳法则，即为秦九韶公式。 2.测定运行时间的最可靠方法是计数对运行时间有贡献的基本操作的执行次数。运行时间与这个计数成正比。
java数据结构何必如此 java 数据结构
Java 数据结构 Java工具包提供了强大的数据结构。在Java中的数据结构主要包括以下几种接口和类：枚举（Enumeration）位集合（BitSet）向量（Vector）栈（Stack）字典（Dictionary）哈希表（Hashtable）属性（Properties）以上这些类是传统遗留的，在Java2中引入了一种新的框架-集合框架(Collect
MybatisHelloWorld 3213213333332132
//测试入口TestMyBatis package com.base.helloworld.test; import java.io.IOException; import org.apache.ibatis.io.Resources; import org.apache.ibatis.session.SqlSession; import org.apache.ibat
Java|urlrewrite|URL重写|多个参数 7454103 java xml Web 工作
个人工作经验！如有不当之处，敬请指点 1.0 web -info 目录下建立 urlrewrite.xml 文件类似如下： <?xml version="1.0" encoding="UTF-8" ?> <!DOCTYPE u
达梦数据库+ibatis darkranger sql mysql ibatis SQL Server
--插入数据方面如果您需要数据库自增... 那么在插入的时候不需要指定自增列. 如果想自己指定ID列的值, 那么要设置 set identity_insert 数据库名.模式名.表名; ----然后插入数据; example: create table zhabei.test( id bigint identity(1,1) primary key, nam
XML 解析四种方式 aijuans android
XML现在已经成为一种通用的数据交换格式,平台的无关性使得很多场合都需要用到XML。本文将详细介绍用Java解析XML的四种方法。 XML现在已经成为一种通用的数据交换格式,它的平台无关性,语言无关性,系统无关性,给数据集成与交互带来了极大的方便。对于XML本身的语法知识与技术细节,需要阅读相关的技术文献,这里面包括的内容有DOM(Document Object
spring中配置文件占位符的使用 avords
1.类 <?xml version="1.0" encoding="UTF-8"?><!DOCTYPE beans PUBLIC "-//SPRING//DTD BEAN//EN" "http://www.springframework.o
前端工程化-公共模块的依赖和常用的工作流 bee1314 webpack
题记：一个人的项目，还有工程化的问题嘛？我们在推进模块化和组件化的过程中，肯定会不断的沉淀出我们项目的模块和组件。对于这些沉淀出的模块和组件怎么管理？另外怎么依赖也是个问题？你真的想这样嘛？ var BreadCrumb = require(‘../../../../uikit/breadcrumb’); //真心ugly。
上司说「看你每天准时下班就知道你工作量不饱和」，该如何回应？ bijian1013 项目管理沟通 IT职业规划
问题：上司说「看你每天准时下班就知道你工作量不饱和」，如何回应正常下班时间6点，只要是6点半前下班的，上司都认为没有加班。 Eno-Bea回答，注重感受，不一定是别人的虽然我不知道你具体从事什么工作与职业，但是我大概猜测，你是从事一项不太容易出现阶段性成果的工作
TortoiseSVN，过滤文件征客丶 SVN
环境： TortoiseSVN 1.8 配置：在文件夹空白处右键选择 TortoiseSVN -> Settings 在 Global ignote pattern 中添加要过滤的文件：多类型用英文空格分开 *name ：过滤所有名称为 name 的文件或文件夹 *.name ：过滤所有后缀为 name 的文件或文件夹 --------
【Flume二】HDFS sink细说 bit1129 Flume
1. Flume配置 a1.sources=r1 a1.channels=c1 a1.sinks=k1 ###Flume负责启动44444端口 a1.sources.r1.type=avro a1.sources.r1.bind=0.0.0.0 a1.sources.r1.port=44444 a1.sources.r1.chan
The Eight Myths of Erlang Performance bookjovi erlang
erlang有一篇guide很有意思： http://www.erlang.org/doc/efficiency_guide 里面有个The Eight Myths of Erlang Performance： http://www.erlang.org/doc/efficiency_guide/myths.html Myth: Funs are sl
java多线程网络传输文件(非同步)-2008-08-17 ljy325 java 多线程 socket
利用 Socket 套接字进行面向连接通信的编程。客户端读取本地文件并发送；服务器接收文件并保存到本地文件系统中。使用说明:请将TransferClient, TransferServer, TempFile三个类编译，他们的类包是FileServer. 客户端: 修改TransferClient: serPort, serIP, filePath, blockNum,的值来符合您机器的系
读《研磨设计模式》-代码笔记-模板方法模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.sql.Connection; import java.sql.DriverManager; import java.sql.PreparedStatement; import java.sql.ResultSet;
配置心得 chenyu19891124 配置
时间就这样不知不觉的走过了一个春夏秋冬，转眼间来公司已经一年了，感觉时间过的很快，时间老人总是这样不停走，从来没停歇过。作为一名新手的配置管理员，刚开始真的是对配置管理是一点不懂，就只听说咱们公司配置主要是负责升级，而具体该怎么做却一点都不了解。经过老员工的一点点讲解，慢慢的对配置有了初步了解，对自己所在的岗位也慢慢的了解。做了一年的配置管理给自总结下： 1.改变从一个以前对配置毫无
对“带条件选择的并行汇聚路由问题”的再思考 comsci 算法工作软件测试嵌入式领域模型
2008年上半年，我在设计并开发基于”JWFD流程系统“的商业化改进型引擎的时候，由于采用了新的嵌入式公式模块而导致出现“带条件选择的并行汇聚路由问题”(请参考2009-02-27博文)，当时对这个问题的解决办法是采用基于拓扑结构的处理思想，对汇聚点的实际前驱分支节点通过算法预测出来，然后进行处理，简单的说就是找到造成这个汇聚模型的分支起点，对这个起始分支节点实际走的路径数进行计算，然后把这个实际
Oracle 10g 的clusterware 32位下载地址 daizj oracle
Oracle 10g 的clusterware 32位下载地址 http://pan.baidu.com/share/link?shareid=531580&uk=421021908 http://pan.baidu.com/share/link?shareid=137223&uk=321552738 http://pan.baidu.com/share/l
非常好的介绍：Linux定时执行工具cron dongwei_6688 linux
Linux经过十多年的发展，很多用户都很了解Linux了，这里介绍一下Linux下cron的理解，和大家讨论讨论。cron是一个Linux 定时执行工具，可以在无需人工干预的情况下运行作业，本文档不讲cron实现原理，主要讲一下Linux定时执行工具cron的具体使用及简单介绍。新增调度任务推荐使用crontab -e命令添加自定义的任务（编辑的是/var/spool/cron下对应用户的cr
Yii assets目录生成及修改 dcj3sjt126com yii
assets的作用是方便模块化，插件化的，一般来说出于安全原因不允许通过url访问protected下面的文件，但是我们又希望将module单独出来，所以需要使用发布，即将一个目录下的文件复制一份到assets下面方便通过url访问。 assets设置对应的方法位置 \framework\web\CAssetManager.php assets配置方法在m
mac工作软件推荐 dcj3sjt126com mac
mac上的Terminal + bash ＋ screen组合现在已经非常好用了，但是还是经不起iterm＋zsh＋tmux的冲击。在同事的强烈推荐下，趁着升级mac系统的机会，顺便也切换到iterm＋zsh＋tmux的环境下了。我为什么要要iterm2 切换过来也是脑袋一热的冲动，我也调查过一些资料，看了下iterm的一些优点： * 兼容性好，远程服务器 vi 什么的低版本能很好兼
Memcached(三)、封装Memcached和Ehcache frank1234 memcached ehcache spring ioc
本文对Ehcache和Memcached进行了简单的封装，这样对于客户端程序无需了解ehcache和memcached的差异，仅需要配置缓存的Provider类就可以在二者之间进行切换，Provider实现类通过Spring IoC注入。 cache.xml <?xml version="1.0" encoding="UTF-8"?>
Remove Duplicates from Sorted List II hcx2013 remove
Given a sorted linked list, delete all nodes that have duplicate numbers, leaving only distinct numbers from the original list. For example,Given 1->2->3->3->4->4->5,
Spring4新特性——注解、脚本、任务、MVC等其他特性改进 jinnianshilongnian spring4
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
MySQL安装文档 liyong0802 mysql
工作中用到的MySQL可能安装在两种操作系统中，即Windows系统和Linux系统。以Linux系统中情况居多。安装在Windows系统时与其它Windows应用程序相同按照安装向导一直下一步就即，这里就不具体介绍，本文档只介绍Linux系统下MySQL的安装步骤。 Linux系统下安装MySQL分为三种：RPM包安装、二进制包安装和源码包安装。二
使用VS2010构建HotSpot工程 p2p2500 HotSpot OpenJDK VS2010
1. 下载OpenJDK7的源码： http://download.java.net/openjdk/jdk7 http://download.java.net/openjdk/ 2. 环境配置 ▶
Oracle实用功能之分组后列合并 seandeng888 oracle 分组实用功能合并
1 实例解析由于业务需求需要对表中的数据进行分组后进行合并的处理，鉴于Oracle10g没有现成的函数实现该功能，且该功能如若用JAVA代码实现会比较复杂，因此，特将SQL语言的实现方式分享出来，希望对大家有所帮助。如下：表test 数据如下： ID,SUBJECTCODE,DIMCODE,VALUE 1&nbs
Java定时任务注解方式实现 tuoni java spring jvm xml jni
Spring 注解的定时任务，有如下两种方式：第一种： <?xml version="1.0" encoding="UTF-8"?> <beans xmlns="http://www.springframework.org/schema/beans" xmlns:xsi="http
11大Java开源中文分词器的使用方法和分词效果对比 yangshangchuan word分词器 ansj分词器 Stanford分词器 FudanNLP分词器 HanLP分词器
本文的目标有两个： 1、学会使用11大Java开源中文分词器 2、对比分析11大Java开源中文分词器的分词效果本文给出了11大Java开源中文分词的使用方法以及分词结果对比代码，至于效果哪个好，那要用的人结合自己的应用场景自己来判断。 11大Java开源中文分词器，不同的分词器有不同的用法，定义的接口也不一样，我们先定义一个统一的接口： /** * 获取文本的所有分词结果, 对比

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他