深度学习世界

自学深度学习，这些途径可以获取数据集

来源：景略集智

学好机器学习的关键是用许多不同的数据集来练习。因为对不同的问题，需要有不同的数据准备和建模方法。我们首先分享一些有趣的数据集，权当练习资源，然后会说一说可以去哪里获得干净的高质量数据集。

20个趣味数据集

在Medium上有位叫Oliver Cameron的程序猿小哥特地分享了20个有趣的数据集，比如UFO目击报告等。整理如下：

20 Newsgroups

从20个网络新闻组中收集的20000条文本数据，可用于文本分析、分类等。

文件大小：61.6 M

http://kdd.ics.uci.edu/databases/20newsgroups/20newsgroups.data.html

Amazon Reviews

从亚马逊网站上获取的多达1亿4千2百万条顾客的购物评论，可用于情感分析、推荐系统研究等等。

文件大小：20G

http://jmcauley.ucsd.edu/data/amazon/

Football Strategy

包含数千个足球的踢球场景，用于帮足球教练做出最优决策。

文件大小：876 KB

https://link.zhihu.com/?target=https%3A//www.crowdflower.com/wp-content/uploads/2016/03/Football-Scenarios-DFE-832307.csv

Horses for Courses

赛马数据，用于预测赛马结果。

文件大小：19 M

https://www.kaggle.com/lukebyrne/horses-for-courses

Human Activity Recognition with Smartphones

识别人类日常活动比如走路、坐下等的感应数据。

文件大小：25 M

https://www.kaggle.com/uciml/human-activity-recognition-with-smartphones

Labeled Faces in the Wild

1万3千张附有人物名字的人脸照片，可用于人脸识别训练、多远训练，也可作为测试集。

文件大小：173 M

http://vis-www.cs.umass.edu/lfw/

National Survey on Drug Use and Health

根据健康调查问题预测药物使用状况。

文件大小：2 G

http://www.icpsr.umich.edu/icpsrweb/ICPSR/studies/34933

NORB 3D Object Recognition

50个玩具雕塑的立体图像数据集，可用于图像中的3D物体识别。

文件大小：包含多个文件，约5G

https://cs.nyu.edu/~ylclab/data/norb-v1.0/

One Million Songs

1百万首歌曲的音频特征及元数据的数据集，可用于音频识别与分类。

文件大小：1.8 G

https://labrosa.ee.columbia.edu/millionsong/

SMS Spam Collection

收集了5574份SMS文本数据，部分是正常内容，部分是垃圾内容，可用于训练垃圾过滤系统。

文件大小：204 KB

http://www.dt.fee.unicamp.br/~tiago/smsspamcollection/

Hate Speech Identification

收集的推特推文样本，已经根据是否具有攻击性和包含仇恨内容进行了判断，可用于训练社交网络内容审核。

文件大小：2.66 M

下载地址：https://www.crowdflower.com/wp-content/uploads/2016/03/twitter-hate-speech-classifier-DFE-a845520.csv

Hidden Beauty of Flickr Pictures

1万5千个Flikr照片ID，均以按照美观度进行了分级，可用于图像分析。

文件大小：138 KB，需使用Flikr API获取照片。

http://www.di.unito.it/~schifane/dataset/beauty-icwsm15/

Yahoo Instant Messenger Friends Connectivity Graph

雅虎用户之间使用雅虎Messenger相互之间联系和交流的数据，可用于识别重要的社交联系和社交中有影响力的人。

文件大小：28 M

http://webscope.sandbox.yahoo.com/catalog.php?datatype=g

Record of Heart Sound

正常心跳和不正常心跳的数据，用于识别心脏杂音、预测心脏病等。

文件大小：47.7 M

http://mldata.org/repository/data/viewslug/record-of-heart-sound/

Banknote Dataset

根据给定钞票的数个度量的照片预测是真钞还是假钞。它是一个二元分类问题。每个类的观测值数量不均等。一共有 1372 个观察值，4个输入变量和1个输出变量。

文件大小：45 KB

http://archive.ics.uci.edu/ml/datasets/banknote+authentication

Wine Quality

白葡萄酒和红葡萄酒的化学属性和酒的品质，用于酒的分类问题。

文件大小：共3个文件，343KB

http://archive.ics.uci.edu/ml/datasets/Wine+Quality

Mushroom Identification

根据蘑菇的特点进行假设性地分类蘑菇属于有毒还是可食用。

文件大小：共3个文件，480 KB

http://archive.ics.uci.edu/ml/datasets/Mushroom

UFO Reports

一共8万份历史上的UFO事件报告，可用于UFO事件的分类和回归分析。该数据集以经过标准化处理。

文件大小：14.6 M

https://github.com/planetsig/ufo-reports

Militarized Interstate Disputes

过去200年世界各地冲突和威胁的数据集，包括军事行动、伤亡状况、敌对程度和冲突结果等，可用于地区冲突事件的建模与分析。

文件大小：962 KB

http://www.correlatesofwar.org/data-sets/MIDs

NBA & MLB Stats

过去十几年各个赛季NBA和MLB各大球队与球员的状态（截止到2017年），可用于NBA及超级碗大型赛事的预测。

文件大小：包含多个数据集

http://www.dougstats.com/

俗话说授人以鱼不如授人以渔嘛。看完这20个数据集后，我们再说一些发现数据集的好去处。不然等这20个数据集用完你肯定就把我忘了..

自学深度学习，这些途径可以获取数据集_第1张图片

去哪里找高质量数据集？

在进行机器学习项目时，都希望能从数据集中的一些列预测出另一列，为了能做到这点，我们需要确保：

数据集不能太混乱——如果太混乱，我们需要花费大量时间清理数据。
要有个有趣的目标列作为预测目标。
其它变量对目标列有一定的解释力。

幸好，网上有一些专为机器学习准备的数据集，都预先经过了清理，能很快用来测试算法。我们可以去这些地方获取这样的干净数据集：

1. Kaggle

Kaggle是一个举办机器学习比赛的数据科学社区，网站上有很多有意思的数据集。可以通过参加Kaggle机器学习比赛来下载相关数据集。

Kaggle数据集地址：

https://www.kaggle.com/datasets

这里是Kaggle上举办的一些机器学习比赛：

https://www.kaggle.com/competitions

2. UCI Machine Learning Repository

UCI Machine Learning Repository可以说是互联网上资历最老的数据集来源之一，上面包含了各种各样的数据集，而且绝大部分数据集都很干净，可以直接应用于机器学习项目。无需注册就可下载：

http://mlr.cs.umass.edu/ml/datasets.html

3. Quandl

Quandl是一个专门针对经济学和金融学领域的数据集资源库，部分可免费下载，部分需要付费。对于预测经济指标和股票等这样的机器学习项目，Quandl上的数据集是很适合的资源：https://www.quandl.com/search

4. Socrata OpenData

Socrata OpenData包含很多干净的数据集，可以直接在浏览器上使用，也可以下载下来，主要是用作数据分析。

https://opendata.socrata.com/

此外，如果你对数据集的质量要求不是很严格，一些科技公司推出的数据集也是不错的资源：

亚马逊公共数据集：

https://aws.amazon.com/cn/datasets/?_encoding=UTF8&jiveRedirect=1

谷歌公共数据集：

https://cloud.google.com/bigquery/public-data/

BuzzFeed数据集：

https://github.com/BuzzFeedNews

最后推出一个重磅资源，大神 Antoine Miech 将 27 个视频数据集整合在了一起，包含人类手势、动作识别等十几个类型，基本上你想用的视频数据集都能在这里找到：

https://www.di.ens.fr/~miech/datasetviz/

好了，今天的车就先开到这里。快下车去找找自己需要的数据集吧！

自学深度学习，这些途径可以获取数据集_第2张图片

点击下方“阅读原文”了解【大数据实验平台】 ↓↓↓

你可能感兴趣的:(自学深度学习，这些途径可以获取数据集)

spring之事务管理 writeanewworld
1.spring简介spring中认为一切java类都是资源，而资源都是Bean,容纳这些Bean的是spring提供的Ioc容器，所以Spring是一种基于bean的编程。spring的作用主要是整合框架。2.spring中的事务管理，首先事务的基本概念就是一处报错，全部回滚。这也是spring事务管理的基本作用。3.spring事务管理分为xml跟注解案例：（1）实体类Employee.jav
全链路跟踪关键技术-ThreadLocal txxs 架构
转自：https://github.com/alibaba/transmittable-thread-local/issues/123应用场景的文章Java多线程上下文传递在复杂场景下的实践byvivo互联网技术（海外商城租户区分）2021-02-01SpringSecurityOAuth2.0认证授权五：用户信息扩展到jwt2021-01-14再谈Token认证，如何快速方便获取用户信息By尹吉
Agent架构与工作原理：理解智能体的核心机制 hdzw20 agent学习 ai 机器学习 agent 智能体
Agent架构与工作原理：深入理解智能体的核心机制AIAgent的核心组成部分一个完整的AIAgent通常由以下几个核心模块组成：1.规划模块（PlanningModule）规划模块是Agent的"大脑"，负责制定行动策略。它接收目标任务，分析当前状态，并制定一系列行动计划。规划可以是：短期规划：针对当前步骤的即时决策长期规划：面向整体目标的战略性规划动态规划：根据执行结果实时调整计划2.记忆模块
Python训练 + Go优化 + C#部署：端到端AI模型的跨语言实践威哥说编程人工智能学习资料库 python golang c#
在现代AI应用中，如何高效地训练、优化、并最终部署AI模型是一项复杂且具有挑战性的任务。在这一过程中，选择合适的编程语言和工具可以显著提高效率和系统的性能。Python作为AI领域的主流语言，具有丰富的深度学习框架（如PyTorch和TensorFlow），在模型训练方面处于领先地位。然而，针对计算密集型任务（如数据预处理、加密等），Go语言因其高效的并发处理和出色的性能，成为优化计算的理想选择。
自律从早睡早起开始邱兰芳
空闲时翻阅网文，大篇幅的都在说自律。自律到底是什么？可以统一答案“早睡早起”百度搜索：自律，出自《左传·哀公十六年》，指在没有人现场监督的情况下，通过自己要求自己，变被动为主动，自觉地遵循法度，拿它来约束自己的一言一行。指不受外界约束和情感支配,据自己善良意志按自己颁布的道德规律而行事的道德原则。朴素简洁的说，自律就是自我约束。有没有数据标准？好像很难定义。我自律的唯一标准就是早睡早起。只要能做到
适合女生的五大高薪职业哪些工作前景好氧惠购物达人
这几年每一位女性消费者们也希望个人的经济独立，这样就能够有花钱的自由，而且也能够展现出自己的魅力。那么女人在家干点啥最挣钱？1、开展一家小型的加工厂虽然说女人的体力不如男的高，但是现在很多的女性消费者们在做事情的时候并不比男性差，经营者们就可以在家经营一家小型的加工厂，比如说服装加工厂。2、制作手工工艺品总共一品这几年得到了迅速的发展，很多的消费者们对于手工艺品是非常的喜欢，不少的手工艺品进入到市
怎么充话费便宜？充话费怎么充划算？高省APP珊珊
充话费便宜且划算的方法有多种，以下是一些建议：一、选择优惠活动运营商官方活动：运营商（如中国移动、中国联通、中国电信）会定期推出充值优惠活动，如满减、折扣券等。关注运营商的官方网站、APP或社交媒体账号，可以及时了解这些活动信息。例如，中国移动曾在特定时间段内推出88折话费充值券活动，用户抢到充值券后，充值50元即可减6元。返利APP和网站：使用返利APP（如高省、氧惠、直返、麦芽妈妈）进行话费充
高省的邀请码怎么获取小心坑码获得高省邀请码步骤! 凌风导师
写点什么..推荐填联合创始人邀请码500888直升2皇冠，佣金更高，升级无忧，送万元推广大礼包，教授百度霸屏、强势引流技术！高省-各大应用商城下载即可-购物领劵返利高，邀请码切记填500888，凌风高省邀请码500888，全网唯一教你技术的老师码填对码直送2皇冠总裁等级，《凌风导师V:125130414》送价值百万引流技术推广绝密大礼包，也可以后台联系老师进高省官方群。星巴克说：每分享保举位新主顾
手机兼职平台正规app有哪些？用手机做的正规兼职古楼
很多用户想在自己空闲的时候找一份兼职的工作来赚一些零花钱，今天小编就来介绍一下找兼职哪个app靠谱2022，以方便用户们更快的找到一款合适的找兼职工作app。用户可以根据自己的需求下载不同的兼职app，以下是最新能找靠谱兼职的app前十名。1、高省app使用【高省app】网购，更便宜更划算！高省app上每天都有大额内部优惠券，还有返利佣金，而且高省的返利佣金在全网超高的！手机应用商城搜索【高省】直
《度五行》生活报报壬子140：浪的好可以引领新潮流，创造新时代 YangduSam2021
221026壬寅庚戌壬子，20221026，周三，兴大上海六班2590天，西交大2013上海班3290天，后TA15410天，度生活700天，《度.生活五行》:天干金生水，壬壬反吟。地支寅戌合。浪，什么叫做浪？你觉得什么是浪？浪一般用来形容人表现出玩世不恭、自信膨胀、不按常理出牌的行为和心理状态，带有无所谓、我行我素、行为随意、举止轻佻的意味。浪用做动词的时候，是玩的意思。一般被他人用“浪”字形容
长沙正规亲子鉴定办理-亲子鉴定中心地址大全（附2024年更新办理流程攻略）中量国鉴知识科普
在生活中，亲子鉴定有时成为解开疑惑、确认亲缘关系的关键需求。当身处长沙这座繁华都市，人们常常会困惑：长沙正规亲子鉴定在哪里可以办理呢？毕竟，亲子鉴定是一件严肃且重要的事情，需要专业、可靠的机构来进行操作。选择正规的亲子鉴定机构，不仅关乎结果的准确性，更涉及到个人隐私的保护和法律的权威性。那么，让我们一同来探寻长沙那些可以放心办理亲子鉴定的地方。长沙亲子鉴定在哪里可以办理？长沙亲子鉴定可以到“长沙中
侯府千金本小姐多财又多亿李知月程长宴完整版免费阅读_李知月程长宴精彩小说热门小说_5
书名：侯府千金本小姐多财又多亿主角：李知月程长宴简介：醒来后，她发现自己成为了一个家族即将破产的败家女。面对朝廷的流放，她决定依靠自己，将家族中的纨绔子弟培养成才子。可以关注微信公众号【书香名斋】去回个书名或主配角，即可免费阅读【侯府千金本小姐多财又多亿】小说全文！>>>>>>>>>>戳我继续阅读>>>>>>>>>戳我继续阅读>>>>>>>>>戳我继续阅读>>>>>>>>>戳我继续阅读<<<<<<
WorkPlus聊天群伍戈的low carbon-碳中和伍戈碳排放不够出金受阻，不要再上当了! 法律咨询维权
随着互联网的普及和金融科技的发展，越来越多的人开始使用线上平台进行投资、交易等活动。然而，一些不法分子也利用这些平台实施诈骗行为，给投资者带来了巨大的损失。本文将介绍一种常见的骗局——黑平台无法出金，以帮助大家提高警惕性，避免上当受骗。推荐网上投资理财、炒*的、做外汇的、炒数字货币、虚拟币慈善投票网站买数字的等等都是，广大市民对此要提高警惕，遇到此类情况一概不要相信。（注明：该文章出现名字为网上冒
Java注解家族--`@ResponseBody`
@ResponseBody@ResponseBody是Spring框架中的一个注解，在基于Spring的Web开发中扮演着重要角色，以下是对它的详细总结：1.定义与基本功能定义：@ResponseBody注解用于将Controller方法的返回值，通过适当的HttpMessageConverter转换为指定格式后写入HTTP响应体中返回给客户端。它可以应用在方法上，也可以用在类上（当用在类上时，表
【PGCCC】Postgres 18 Beta 版发布：您应该了解的 7 个功能 PGCCC-PostgeSQL培训认证 postgresql
Postgres18Beta1刚刚发布。与之前的主要版本一样，此Beta版本包含所有计划正式发布的功能的预览版。您可以阅读发行说明来了解完整的更新列表，但我们将在本文中重点介绍一些更新亮点。Postgres18中的新功能异步I/OPostgres18最令人兴奋的功能之一是引入了全新的异步I/O子系统。此前，Postgres中的所有I/O都是同步的：每次读取都会阻塞查询执行，直到数据到达。而使用异步
在淘宝上买月饼怎么领优惠券？氧惠帮朋友一起省
1.通过淘宝APP领券中心领取打开淘宝APP，在首页顶部导航栏找到“领券中心”或类似栏目，点击进入。在领券中心页面，可以通过搜索关键词（如“月饼”）来查找相关的优惠券，或者直接浏览推荐的优惠券列表。找到心仪的月饼优惠券后，点击“领取”按钮即可。领取成功后，在购买月饼时会自动使用优惠券，享受优惠价格。2.在商品详情页领取在淘宝搜索框中输入月饼相关的关键词，找到想要购买的月饼商品。进入商品详情页后，留
常见Hash算法 LUCIAZZZ 算法哈希算法 java spring boot 操作系统 spring 密码学
部分内容来源：JavaGuide什么是Hash算法哈希算法也叫散列函数或摘要算法，它的作用是对任意长度的数据生成一个固定长度的唯一标识也叫哈希值、散列值或消息摘要哈希算法的是不可逆的，你无法通过哈希之后的值再得到原值哈希值的作用是可以用来验证数据的完整性和一致性哈希算法可以简单分为两类：加密哈希算法：安全性较高的哈希算法，它可以提供一定的数据完整性保护和数据防篡改能力，能够抵御一定的攻击手段，安全
抖音极速版邀请码是多少,2024新版抖音极速版邀请码有哪些? 熊熊福利
抖音极速版邀请码是多少呢？拉到文章末尾就可以看到！在文章的结尾可以看到抖音极速版邀请码是多少。抖音极速版邀请码怎么填写第1步首先打开【抖音极速版】客户端，然后点击底部【来赚钱】第2步接着点击【填写邀请码】右侧的【去填写】第3步再输入邀请码，最后点击【立即领取】即可。2024年抖音极速版为了回馈广大用户朋友的支持和厚爱，特推出邀请好友填写邀请码来获得一系列特权的活动。只要您是首次下载抖音极速版，并且
华为P30系列海外已发布，OPPO Reno更稳了！灵感科技
华为P30在巴黎正式发布，作为年度的摄影旗舰，特别是P30Pro可以说是目前手机影像的天花板机型，特别是在暗光拍照上以及长焦拍摄上的表现着实让人感觉到惊艳。在长焦拍摄上，华为P30Pro在硬件上采用了潜望式的长焦镜头，10倍长焦焦段为125mm，结合华为自己的技术可以获得大约10倍混合变焦以及50倍的数码变焦，单看参数华为P30Pro已经比大部分的数码相机要强上一些。但是毕竟还是无损数码变焦，即便
Redis Copy-on-Write机制： SHENKEM redis 数据库缓存
Copy-on-Write机制：父子进程共享内存页当父进程修改数据时，内核会复制被修改的页这可能导致内存使用量暂时增加通俗的话描述一下可以用一个生活中的例子来通俗解释Copy-on-Write（写时复制）机制：比喻：父子共用一本作业本假设有一对父子（父进程和子进程）要完成以下任务：初始状态：父亲有一本写满数据的作业本（Redis内存数据），现在孩子需要做一份完全相同的作业（RDB持久化）。传统方式
京东返利的软件是什么?分享十款京东高佣返利平台! 直返APP京东优惠券
在当今网购潮流中，优惠券和返利成为了吸引消费者的关键。京东作为中国领先的电商平台，也推出了多种返利工具，让用户在享受购物乐趣的同时，还能获得额外的收益。本文将为您揭秘京东返利软件，并分享十大高佣返利平台，让您购物更省钱！一、直返直返的口号是“返利就用直返”，它强调没有上级赚差价，直接为用户提供商家和消费者之间的综合优惠券返利平台。用户可以在直返上获取自己感兴趣的商品，购买后可以获得一定比例的返利。
Flutter（二十三）编译模式 AlanGe
Flutter编译模式在Android和iOS中，应用程序运行分为debug和release模式，分别对应调试阶段和发布阶段；在Flutter中，应用程序分为以下三种模式1.debug2.profile3.release下面我们就聊一下三种模式的区别和应用；一.Flutter编译模式1.1.debug模式在Debug模式下，app可以被安装在真机、模拟器、仿真器上进行调试。Debug模式有如下特点
Ubuntu/linux小操作楚潸潸 linux ubuntu 运维
最近重装了一个ubuntu系统，借机整理一下一些基本要用到的操作。1.磁盘扩容右键虚拟机设置可以更改虚拟机最大储存空间；不过这并不能直接修改磁盘大小。进入虚拟机，下载gparted，在gparted中选择调整磁盘空间，才可以真正修改sudoaptinstallgpartedsudogparted2.挂载共享文件夹（VMware）sudomount-tfuse.vmhgfs-fuse.host://
【职场小技巧】技术管理者的困惑@稀土永磁Amy@20210104@上海稀土永磁Amy
技术出身的管理者会沉迷于技术细节，把大量的时间花在学习新技术或者解决技术难题上。“告诉你怎么干，还不如我自己干更容易”是技术专家型管理者常说的一句话，尤其是他们看到团队成员中，有人的工作令人不满意，而这项工作又恰恰是自己老本行时，更是如此。因为对结果不满意，就亲自动手来做，第1次我来，第2次我来，很快就把猴子背到自己的背上。这些管理者必须明白，判断管理工作是否有效的标准是团队的绩效，而不是自己做的
ps aux、top和ps -ef区别奋斗的蛋黄 linux 运维
显示信息的全面性-psaux：能显示当前系统中所有用户的进程信息，包括进程的所有者、CPU和内存占用情况、进程状态等。-top：不仅能显示进程的基本信息，还能实时动态地显示系统资源（如CPU、内存）的使用情况，以及各个进程对资源的占用比例等详细信息，并且会不断更新。-ps-ef：可以显示系统中所有进程的详细信息，包括进程的启动时间、命令行参数等，信息较为全面，但不具备实时动态更新功能。显示格式-p
标记语言---XML MzKyle 标记语言 xml java 前端
一、XML的定义与核心定位XML（ExtensibleMarkupLanguage，可扩展标记语言）是由万维网联盟（W3C）于1998年2月发布的一种标记语言，其核心设计目标是传输和存储数据，而非直接用于显示数据（这一点与HTML有本质区别）。XML的“可扩展性”体现在：它没有预定义标签，用户可以根据需求自定义标签，只要遵循语法规则即可。这种灵活性使其成为跨平台、跨系统数据交换的重要标准，广泛应用
汕头8家权威亲子鉴定亲子鉴定中心大全（附2024年最新办理指南）国医基因张主任
汕头市哪些鉴定中心可以做亲子鉴定？汕头市国医基因可以做亲子鉴定，咨询地址在汕头市金平区外马路2号。今天小编整理了汕头市能做亲子鉴定的一些地方，排名不分先后，注：各鉴定中心的鉴定类别不同。请根据自身情况和鉴定咨询的经营范围进行选择。内容仅供参考。汕头市可以做亲子鉴定的地址如下：汕头8家权威亲子鉴定亲子鉴定中心大全（附2024年最新办理指南）汕头做亲子鉴定的正规机构1、汕头国医基因亲子鉴定咨询中心（国
长沙最全10家亲子鉴定机构一览（附鉴定中心目录整理/最新）中量国鉴知识科普
什么是个人隐私亲子鉴定?个人隐私亲子鉴定又称匿名亲子鉴定，可以匿名，保护个人隐私，不具有法律效力DNA亲子鉴定。长沙个人隐私亲子鉴定机构地址在哪里?长沙中量国鉴可以做亲子鉴定咨询。为了方便大家快速找到亲子同时小编整理了长沙正规亲子鉴定中心地址分享给大家，排名不分先后，希望对大家有所帮助。注：部分鉴定机构服务类型不同，请根据实际情况进行选择。一、长沙市亲子鉴定咨询中心信息一览1、长沙中量国鉴亲子鉴定
六盘水最全亲子鉴定医院办理的5个地方（附2024年鉴定机构手续）国医基因黄主任
六盘水可以做亲子鉴定的医院在哪里？六盘水市人民医院、六盘水市妇幼保健院、六盘水市钟山人民医院、六盘水市水城区人民医院不可以做亲子鉴定。六盘水可以做亲子鉴定的中心机构地址位于六盘水市钟山区钟山西路56号（六盘水国医基因）。今天小编整理了六盘水能做亲子鉴定的机构名单以及六盘水可以做亲子鉴定采样的医院名单，排名不分先后，部分医院采样中心不确定能否做亲子鉴定采样，还需要根据业务范围选择希望对大家有所帮助。
就想安安静静地做个花痴益德居士
最喜欢春天满天都是花的季节，感觉空气里都是花香。走马灯一般，各种各样的花次第开放，轮番上阵，精彩瞬间每天都在上演。就想找一个静悄悄的地方，面对着花做个纯粹的花痴。没有别的理由，就是喜欢春天，这是一个花朵主宰的时候。就想安安静静地做个花痴，闻着花香入眠，花瓣可以入药，可以疗伤，还可以喂心。看花的时候，心花也可以怒放。花被风吹动的时候，心也会动的。
mondb入手木zi_鸣 mongodb
windows 启动mongodb 编写bat文件， mongod --dbpath D:\software\MongoDBDATA mongod --help 查询各种配置配置在mongob 打开批处理，即可启动，27017原生端口，shell操作监控端口扩展28017，web端操作端口启动配置文件配置，数据更灵活
大型高并发高负载网站的系统架构 bijian1013 高并发负载均衡
扩展Web应用程序一.概念简单的来说，如果一个系统可扩展，那么你可以通过扩展来提供系统的性能。这代表着系统能够容纳更高的负载、更大的数据集，并且系统是可维护的。扩展和语言、某项具体的技术都是无关的。扩展可以分为两种： 1.
DISPLAY变量和xhost(原创) czmmiao display
DISPLAY 在Linux/Unix类操作系统上, DISPLAY用来设置将图形显示到何处. 直接登陆图形界面或者登陆命令行界面后使用startx启动图形, DISPLAY环境变量将自动设置为:0:0, 此时可以打开终端, 输出图形程序的名称(比如xclock)来启动程序, 图形将显示在本地窗口上, 在终端上输入printenv查看当前环境变量, 输出结果中有如下内容:DISPLAY=:0.0
获取B/S客户端IP 周凡杨 java 编程 jsp Web 浏览器
最近想写个B/S架构的聊天系统，因为以前做过C/S架构的QQ聊天系统，所以对于Socket通信编程只是一个巩固。对于C/S架构的聊天系统，由于存在客户端Java应用，所以直接在代码中获取客户端的IP，应用的方法为： String ip = InetAddress.getLocalHost().getHostAddress(); 然而对于WEB
浅谈类和对象朱辉辉33 编程
类是对一类事物的总称，对象是描述一个物体的特征，类是对象的抽象。简单来说，类是抽象的，不占用内存，对象是具体的，占用存储空间。类是由属性和方法构成的，基本格式是public class 类名{ //定义属性 private/public 数据类型属性名； //定义方法 publ
android activity与viewpager+fragment的生命周期问题肆无忌惮_ viewpager
有一个Activity里面是ViewPager，ViewPager里面放了两个Fragment。第一次进入这个Activity。开启了服务，并在onResume方法中绑定服务后，对Service进行了一定的初始化，其中调用了Fragment中的一个属性。 super.onResume(); bindService(intent, conn, BIND_AUTO_CREATE);
base64Encode对图片进行编码 843977358 base64 图片 encoder
/** * 对图片进行base64encoder编码 * * @author mrZhang * @param path * @return */ public static String encodeImage(String path) { BASE64Encoder encoder = null; byte[] b = null; I
Request Header简介 aigo servlet
当一个客户端(通常是浏览器)向Web服务器发送一个请求是，它要发送一个请求的命令行，一般是GET或POST命令，当发送POST命令时，它还必须向服务器发送一个叫“Content-Length”的请求头(Request Header) 用以指明请求数据的长度，除了Content-Length之外，它还可以向服务器发送其它一些Headers，如：
HttpClient4.3 创建SSL协议的HttpClient对象 alleni123 httpclient 爬虫 ssl
public class HttpClientUtils { public static CloseableHttpClient createSSLClientDefault(CookieStore cookies){ SSLContext sslContext=null; try { sslContext=new SSLContextBuilder().l
java取反 -右移-左移-无符号右移的探讨百合不是茶位运算符位移
取反：在二进制中第一位，1表示符数，0表示正数 byte a = -1; 原码：10000001 反码：11111110 补码：11111111 //异或: 00000000 byte b = -2; 原码：10000010 反码：11111101 补码：11111110 //异或: 00000001
java多线程join的作用与用法 bijian1013 java 多线程
对于JAVA的join，JDK 是这样说的：join public final void join （long millis ）throws InterruptedException Waits at most millis milliseconds for this thread to die. A timeout of 0 means t
Java发送http请求(get 与post方法请求) bijian1013 java spring
PostRequest.java package com.bijian.study; import java.io.BufferedReader; import java.io.DataOutputStream; import java.io.IOException; import java.io.InputStreamReader; import java.net.HttpURL
【Struts2二】struts.xml中package下的action配置项默认值 bit1129 struts.xml
在第一部份，定义了struts.xml文件，如下所示： <!DOCTYPE struts PUBLIC "-//Apache Software Foundation//DTD Struts Configuration 2.3//EN" "http://struts.apache.org/dtds/struts
【Kafka十三】Kafka Simple Consumer bit1129 simple
代码中关于Host和Port是割裂开的，这会导致单机环境下的伪分布式Kafka集群环境下，这个例子没法运行。实际情况是需要将host和port绑定到一起， package kafka.examples.lowlevel; import kafka.api.FetchRequest; import kafka.api.FetchRequestBuilder; impo
nodejs学习api ronin47 nodejs api
NodeJS基础什么是NodeJS JS是脚本语言，脚本语言都需要一个解析器才能运行。对于写在HTML页面里的JS，浏览器充当了解析器的角色。而对于需要独立运行的JS，NodeJS就是一个解析器。每一种解析器都是一个运行环境，不但允许JS定义各种数据结构，进行各种计算，还允许JS使用运行环境提供的内置对象和方法做一些事情。例如运行在浏览器中的JS的用途是操作DOM，浏览器就提供了docum
java-64.寻找第N个丑数 bylijinnan java
public class UglyNumber { /** * 64.查找第N个丑数具体思路可参考 [url] http://zhedahht.blog.163.com/blog/static/2541117420094245366965/[/url] * 题目：我们把只包含因子 2、3和5的数称作丑数（Ugly Number）。例如6、8都是丑数，但14
二维数组（矩阵）对角线输出 bylijinnan 二维数组
/** 二维数组对角线输出两个方向例如对于数组： { 1, 2, 3, 4 }, { 5, 6, 7, 8 }, { 9, 10, 11, 12 }, { 13, 14, 15, 16 }, slash方向输出： 1 5 2 9 6 3 13 10 7 4 14 11 8 15 12 16 backslash输出： 4 3
[JWFD开源工作流设计]工作流跳跃模式开发关键点(今日更新) comsci 工作流
既然是做开源软件的,我们的宗旨就是给大家分享设计和代码,那么现在我就用很简单扼要的语言来透露这个跳跃模式的设计原理大家如果用过JWFD的ARC-自动运行控制器,或者看过代码,应该知道在ARC算法模块中有一个函数叫做SAN(),这个函数就是ARC的核心控制器,要实现跳跃模式,在SAN函数中一定要对LN链表数据结构进行操作,首先写一段代码,把
redis常见使用 cuityang redis 常见使用
redis 通常被认为是一个数据结构服务器，主要是因为其有着丰富的数据结构 strings、map、 list、sets、 sorted sets 引入jar包 jedis-2.1.0.jar (本文下方提供下载) package redistest; import redis.clients.jedis.Jedis; public class Listtest
配置多个redis dalan_123 redis
配置多个redis客户端 <?xml version="1.0" encoding="UTF-8"?><beans xmlns="http://www.springframework.org/schema/beans" xmlns:xsi=&quo
attrib命令 dcj3sjt126com attr
attrib指令用于修改文件的属性.文件的常见属性有:只读.存档.隐藏和系统. 只读属性是指文件只可以做读的操作.不能对文件进行写的操作.就是文件的写保护. 存档属性是用来标记文件改动的.即在上一次备份后文件有所改动.一些备份软件在备份的时候会只去备份带有存档属性的文件.
Yii使用公共函数 dcj3sjt126com yii
在网站项目中，没必要把公用的函数写成一个工具类，有时候面向过程其实更方便。在入口文件index.php里添加 require_once('protected/function.php'); 即可对其引用，成为公用的函数集合。 function.php如下： <?php /** * This is the shortcut to D
linux 系统资源的查看（free、uname、uptime、netstat） eksliang netstat linux uname linux uptime linux free
linux 系统资源的查看转载请出自出处：http://eksliang.iteye.com/blog/2167081 http://eksliang.iteye.com 一、free查看内存的使用情况语法如下： free [-b][-k][-m][-g] [-t] 参数含义 -b:直接输入free时，显示的单位是kb我们可以使用b(bytes),m
JAVA的位操作符 greemranqq 位运算 JAVA位移 <<>>>
最近几种进制，加上各种位操作符，发现都比较模糊，不能完全掌握，这里就再熟悉熟悉。 1.按位操作符：按位操作符是用来操作基本数据类型中的单个bit,即二进制位，会对两个参数执行布尔代数运算，获得结果。与（&）运算： 1&1 = 1, 1&0 = 0, 0&0 &
Web前段学习网站 ihuning Web
Web前段学习网站菜鸟学习：http://www.w3cschool.cc/ JQuery中文网：http://www.jquerycn.cn/ 内存溢出：http://outofmemory.cn/#csdn.blog http://www.icoolxue.com/ http://www.jikexue
强强联合：FluxBB 作者加盟 Flarum justjavac r
原文：FluxBB Joins Forces With Flarum作者：Toby Zerner译文：强强联合：FluxBB 作者加盟 Flarum译者：justjavac FluxBB 是一个快速、轻量级论坛软件，它的开发者是一名德国的 PHP 天才 Franz Liedke。FluxBB 的下一个版本(2.0)将被完全重写，并已经开发了一段时间。FluxBB 看起来非常有前途的，
java统计在线人数（session存储信息的） macroli java Web
这篇日志是我写的第三次了前两次都发布失败！郁闷极了！由于在web开发中常常用到这一部分所以在此记录一下，呵呵，就到备忘录了！我对于登录信息时使用session存储的，所以我这里是通过实现HttpSessionAttributeListener这个接口完成的。 1、实现接口类，在web.xml文件中配置监听类，从而可以使该类完成其工作。 public class Ses
bootstrp carousel初体验快速构建图片播放 qiaolevip 每天进步一点点学习永无止境 bootstrap 纵观千象
img{ border: 1px solid white; box-shadow: 2px 2px 12px #333; _width: expression(this.width > 600 ? "600px" : this.width + "px"); _height: expression(this.width &
SparkSQL读取HBase数据，通过自定义外部数据源 superlxw1234 spark sparksql sparksql读取hbase sparksql外部数据源
关键字：SparkSQL读取HBase、SparkSQL自定义外部数据源前面文章介绍了SparSQL通过Hive操作HBase表。 SparkSQL从1.2开始支持自定义外部数据源(External DataSource)，这样就可以通过API接口来实现自己的外部数据源。这里基于Spark1.4.0，简单介绍SparkSQL自定义外部数据源，访
Spring Boot 1.3.0.M1发布 wiselyman spring boot
Spring Boot 1.3.0.M1于6.12日发布，现在可以从Spring milestone repository下载。这个版本是基于Spring Framework 4.2.0.RC1,并在Spring Boot 1.2之上提供了大量的新特性improvements and new features。主要包含以下： 1.提供一个新的sprin

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他