是Yu欸

数据挖掘2.3——数据预处理知识点整理

数据挖掘2.3——数据预处理知识点整理

1.数据质量
2.数据预处理方法
- 2.1 数据清洗
- 2.2 数据集成
- - 1. 模式集成
  - 2. 实体识别问题
  - 3. 数据冲突检测
- 2.3数据规约
- - 1.降维
  - 2.降数据
  - 3.数据压缩
- 2.4数据转换和离散化
3.数据特征构造

1.数据质量

2.数据预处理方法

数据清理
填写缺失值，平滑噪声数据，识别或删除离群，并解决不一致问题
数据集成
整合多个数据库，多维数据集或文件
数据缩减
降维
Numerosity reduction
数据压缩
数据转换和数据离散化
正常化
生成概念层次结构

2.1 数据清洗

脏数据
- 不完整的：缺少属性值，缺乏某些属性值，或只包含总数据
- 忽略元组、手动填写、自动填写
含嘈杂的噪音，错误或离群
- 例如，工资= -10 (错误)
- 处理：盒装图检测并删除离群点
不一致的代码或不符的名称
- 年龄= “42” 生日=“03/07/1997”
- 曾经评级 “1,2,3” , 现在评级 “A, B, C”
- 计算推理替换、全局替换

2.2 数据集成

将来自多个数据源的数据组合成一个连贯的数据源

1. 模式集成

2. 实体识别问题

3. 数据冲突检测

2.3数据规约

原因

由于数据仓库可以存储TB的数据，因此在一个完整的数据集上运行时，复杂的数据分析可能需要一个很长的时间

1.降维

原因
①随着维数的增加，数据变得越来越稀疏
②子空间的可能的组合将成倍增长
③需要学习的参数越多，模型越复杂，需要更多的训练集，越容易欠拟合

需要降维的场景

参数据稀疏，维度高
高维数据采用基于规则的分类方法
采用复杂模型，但是训练集数目较少
需要可视化

方法

PCA主成分分析法

2.降数据

方法
抽样法

抽样类型

简单随机抽样(Simple Random Sampling)

相等的概率选择

不放回抽样(Sampling without replacement)

一旦对象被选中，则将其删除

有放回抽样(Sampling with replacement)

选择对象不会被删除

分层抽样

每组抽相同个数

用于偏斜数据

3.数据压缩

2.4数据转换和离散化

函数映射，给定的属性值更换了一个新的表示方法，每个旧值与新的值可以被识别。

方法

规范化：按比例缩放到一个具体区间
- 最小-最大规范化
- Z-得分正常化
- 小数定标规范化
  移动属性A的小数点位置(移动位数依赖于属性A的最大值）
离散化
原因：部分挖掘算法仅适用于离散数据
方法：
①非监督离散
等宽法、等频法、聚类

3.数据特征构造

你可能感兴趣的:(数据挖掘,笔记,数据挖掘,数据仓库,数据分析)

探索图形知识梳理[3.29] 虫zi
【课题名称】人教版数学五年级下册第三单元——探索图形【学习时间】2022年3月29日上午8：30-9：10【学习平台】国家中小学网络云平台(https://ykt.eduyun.cn/)【学习准备】准备笔记本和草稿本，边观看边记录。适时控制播放，按老师指令完成相应的课上练习。【学习任务】（1）进一步认识和理解正方体的特征。（2）通过观察、列表、想象等活动，经历发现正方体涂色和位置的规律的全过程，获
IA IP笔记金麟༒ tcp/ip 笔记网络协议
OSI参考模型应用层-----用来接收用户数据，人机交互接口表示层-----将逻辑语言转换为机器语言会话层-----针对传输的每一种数据建立一条独立的通道。数据的整合控制层面—上三层----不会对数据本身进行修改数据层面—下四层----对数据进行加工传输层-----区分流量信息，定义数据传输方式。TCP协议、UDP协议网络层-----通过IP地址进行逻辑寻址，IP协议数据链路层-----逻辑链路控
你的云边是否有小卖部？ 0e1d1f4192ce
山这边是刘十三的童年，山那边是外婆的海。——题记新书刚出来，就在网易蜗牛读书上用最快的速度看完这本书。让我不禁感慨，我们何曾不都是书中的刘十三。从前面的毛头少年默默在泛黄的笔记本上写下我要考清华北大到后来同村伙伴骑车送他去一所毫不知名的大学期间经历的糗事，从《悲伤和希望都是一缕光》到《云下丢失的人，月下团圆的饭》开始有了而一点悲伤的预感。外婆王莺莺为了刘十三的保险任务量开始小卖部的优惠活动，刘十三
Linux笔记8 web服务器的部署及优化月熊笔记 linux
用户常用关于web的信息www概念www是worldwideweb的缩写，及万维网，也就是全球信息广播的意思通常说的上网就是使用www来查询用户所需要的信息。www可以结合文字、图形、影像以及声音等多媒体，超链接的方式将信息以Internet传递到世界各处去。当你连接www网站，该网站会提供一些数据，客户端要使用可以解析这些数据的软件来处理，那就是浏览器网址URI：UniformResourceI
Linux笔记9 DNS域名解析服务器月熊服务器 linux 笔记
简介DNS（DomainNameSystem）是互联网上的一项服务，它作为将域名和IP地址相互映射的一个分布式数据库，能够使人更方便的访问互联网。DNS使用的是53端口，通常DNS是以UDP这个较快速的数据传输协议来查询的，但是没有查询到完整的信息时，就会再次以TCP这个协议来重新查询所以启动DNS时，会同时启动TCP以及UDP的port53。因特网的域名结构由于因特网的用户数量较多，所以因特网在
2023-08-21 de5ea6d11ab2
易佳npdp学习笔记NPDP（NewProductDevelopmentProfessional）是产品经理国际资格认证。NPDP由美国产品开发与管理协会（PDMA）所发起，是国际公认的唯一的新产品开发专业认证，集理论、方法与实践为一体的全方位知识体系，为公司组织层级进行规划、决策、执行提供良好的方法体系支撑。经IBM采用后来被华为公司引入并取得巨大商业成功的IPD（IntegratedProdu
打车优惠券领取公众号？滴滴出行优惠券领取方式氧惠评测
滴滴出行优惠券的领取方式多种多样，以下是几种常见的领取途径：月入十万必看！都在挣钱！推荐几个月入几千到几万的靠谱副业项目！（公众号：善士思维笔记）氧惠APP是与以往完全不同的抖客+淘客app！2024全新模式，我的直推也会放到你下面。主打：带货高补贴，深受各位带货团队长喜爱（训练营导师每天出单带货几万单）。注册即可享受高补贴+0撸+捡漏等带货新体验。送万元推广大礼包，教你如何1年做到百万团队。金珊
在职四战考研102day MM加油女孩
已完成今日想做之事：政治内容理解；英语研词学习；专业课划重点并进行绘制思维导图；听书《我不要稳定的活着》反思：通过近几天的学习，感觉自己的进度还是很慢的，尤其是英语跟专业课这一块，它们是必不可少而且最耗时的科目，通过自己的思考，我再次对自己的计划作出调整：第一，晚上进行第二天内容的听课，截屏下来，尤其是政治、研词、真题讲解都利用晚上时间来听完，还有就是划专业课的笔记；第二，次日，上午进行一个英语真
2018年10月成长记录薯果
「9、10月成长记录」1、完成了瑜伽教练的培训；2、10月5日决定日更，坚持了25天了3、坚持每天发朋友圈和画小人图76天了；4、看完了两本书，并写了读书笔记；5、瑜伽练习，体型有了很大地改善；6、看了《印象莫奈》的艺术展；7、成功举办了两次线下活动，得到一致好评，小伙伴极力要求一直办下去；8、工作上遇到问题也不那么急躁了，更从容；9、做好定位，不管遇到什么变化，自己都能有的放矢地去做选择；10、
2/7 关于正念冥想的几点注意方知方行
这是得到课程《怎样学会正念冥想》的部分学习笔记，把平时我在冥想的桑侯没有注意和意识到的问题总结下，以备后续练习实践：1有意的关注（平时练习时，通过调整赞成注意力的方式在做）。2非评判的态度（这里的意思并不是说不评判，而是意识到到评判，不要被自己的评判牵着走。产生评判是自然的。我之前的认知是：不能产生评判）。3理解当下（“当下”是我们身心所体验到的一切。大体分为两类：一类是发生在我们的内在体验，也可
《你要活成一束光》读书笔记彩云悦读乐教
这是一本很有温度的书。本书以写信的形式道出了人间条条真理，语言朴实却给人感触至深，书中的四十封书信，有写给女儿、儿子的；有写给老爸、妈妈的；有写给爱人、亲人、朋友的；还有写给陌生的兄弟的，每一封信都会有不同的感悟与体会，每一封信都传达着真挚的爱意，它像是一束光，周身散发着巨大而美好的能量…该书文笔流畅，语言清新优美，画面感十足，字里行间充满了浓浓的亲情、友情、爱情，让人感动！读的时候会让人大笑，会
Python编程：从入门到实践 YC运维 Python_study python 学习开发语言
这是基于《Python编程：从入门到实践》这本书以一个初学者的视角去学习而记录的笔记，浓缩了精华的部分以及分享了一些我自己的见解。做这个既是为了让自己边学边记录也是为了保留自己的问题去和小伙伴一起谈论。一，python是什么以及核心作用Python是一种高级、解释型、面向对象的编程语言，由荷兰人GuidovanRossum于1989年圣诞节期间创建，第一个公开发行版发行于1991年。它的设计哲学强
2020/4/1，《教育的勇气》读书笔记。刘霞辉
2020/4/1，《教育的勇气》读书笔记。很快就到了本书的最后一部分----突围或改变：教育困境中的思与行。读张老师的书，如果不写读书笔记，真的是一口气可以读完一本书。读他的书，像是一种享受，由内到外地放松。更多时候是可以引起内心的共情、共鸣。一，维持一种有意义团体的生命活力作者开篇从谢云老师的“知行社”说起，知行社、优培写作班、1＋1教育、勇气更新等都是非常有意义的团体。这些团体在开始建设的时候
读书笔记：SFBT其他重要晤谈技巧与原则风雨彩虹1219
中原焦点团队坚持分享1453天2022-07-09一、以“澄清式自我揭露”与“温和挑战”取代面质1、SFBT不建议咨询师告诉当事人有关自己的过去经验，尤其是个人之前的惨痛故事或者直接建议当事人的个人体验。但是并不表示不能揭露自己，SFBT自我揭露是以“澄清”的方式来询问当事人，并要扣着目标导向与优势观点。2、如果当事人坚持想知道咨询师的个人故事，SFBT的咨询师会先询问当事人认为获得这样的信息对自
百天创业笔记04 七色阳光l
七色阳光:浙江兰溪人，退休后选择走进思涵读书荟，不留遗憾，以往生活一去不复返，最重要的是余生怎么过，与读书绑在一起，会很精彩，用心去体会！成长蜕变挑战营打卡第18天每日任务:（完成打✓）①6:00起床进行魔力练习（√）②每日营养早餐，群内打卡（√）③每天运动20分钟以上（√）④每月更新20个短视频，本月目前为止更新第几个了？（14）⑤每天在官微连麦分享书籍（√）⑥每天直播不低于1个小时（√）⑦每天
破茧成蝶：负债女性如何通过工作重拾财务自由氧惠购物达人
女人负债累累该做什么工作？首先，需要明确的是，没有任何一种工作可以迅速还清债务。因此，选择工作的关键在于其稳定性、可靠性和可持续性。以下是一些适合负债累累女性的工作：1.客服代表：客服代表可以在家里工作，并且可以灵活安排自己的时间。这意味着，你可以在保持稳定收入的同时，也有足够的时间来处理债务问题。月入十万必看！都在挣钱！推荐几个月入几千到几万的靠谱副业项目！（公众号：善士思维笔记）氧惠APP是与
Javaweb笔记笙鹿鸣 html 前端 html5
HTMLHTML网页常用基础知识网页结构JavaSEC/SClientserver客户端–服务器JavaWebB/SBroswerServer浏览器–服务器网页的组成部分：内容（结构）、表现、行为HTML:HyperTextMarkupLanguage(超文本标记语言)ALT+F2选择浏览器HTML书写规范：表示整个html页面的开始头信息标题标题body是页面的主体内容页面主体内容表示整个htm
数据仓库是什么，一文读懂数据仓库设计步骤 Leo.yuan 数据数据仓库大数据人工智能数据库信息可视化
目录一、数据仓库：干啥用的？1.数据仓库是啥？2.数据仓库有啥大用？二、设计之前：准备啥？1.搞清楚业务要啥2.摸清数据家底3.划好仓库边界三、概念设计：搭框架1.定好主题域2.分清维度和事实3.画出概念模型四、逻辑设计：定细节1.设计维度表和事实表2.想好怎么存数据3.定好安全规矩五、物理设计：落地实施1.选好数据库软件2.优化数据库性能3.部署上线六、实施与测试：跑起来1.ETL：灌数据2.全
京东内部优惠券怎么领？京东怎么找内部优惠券？氧惠评测
京东内部优惠券的领取方式多样，以下是一些主要途径和具体步骤：月入十万必看！都在挣钱！推荐几个月入几千到几万的靠谱副业项目！（公众号：善士思维笔记）氧惠APP是与以往完全不同的抖客+淘客app！2024全新模式，我的直推也会放到你下面。主打：带货高补贴，深受各位带货团队长喜爱（训练营导师每天出单带货几万单）。注册即可享受高补贴+0撸+捡漏等带货新体验。送万元推广大礼包，教你如何1年做到百万团队。金珊
利用 Python 爬取小红书热门笔记并进行标签关键词分析程序员威哥最新爬虫实战项目 python 笔记开发语言
一、背景与目标小红书（RED）作为中国最活跃的内容社区之一，拥有大量关于美妆、穿搭、美食、旅游等领域的用户生成内容（UGC）。对于产品、品牌方或研究人员来说，提取热门笔记的标签关键词，可以有效捕捉用户关注点、消费趋势及内容热词。本项目目标：使用Python爬取小红书某个话题下的热门笔记；分析每篇笔记中的标题、正文、标签等字段；利用NLP技术提取高频关键词；对关键词进行可视化与聚类分析。二、技术难点
按时写作|2021-04-17 格莱在创作
旷野上的风和老人.jpg（哈哈，声明一下：所有在发布的图片均为格莱诺本人的摄影作品）按时写作是一种训练方式，是通往作家之路的一种办法。就像是人们常说的那样，要想成为作家，你就要天天写，要想成为画家，你就要天天画。是的，每天都要按时写作，成为习惯，结合不断的输入，水到渠成的那天便是指日可待。按时写作是自己生活的笔记，是用来保存记忆场景、对话，以及为自己的创作埋下种子，还有训练文笔流畅，提升思辨力等等
每日复盘Day53 米果果教育张滢
10月7号复盘图片发自App米果果教育张滢【每日目标】每天三目标1.早起、早餐✅2.英语学习作业打卡✅3.赢效率手册和总结笔记✅【每日早起】6:30(今天6点醒来，起床后晨跑，好久没晨跑感觉好棒)【每日学习】萌姐英语课《第40课》；樊登读书会《运动改造大脑》【每日关爱】晨跑、一组减脂训练、胶原肽果饮、水光疗套装图片发自App图片发自App【每日成就】早上比计划早起，老妈在也不担心早饭，花30分钟晨
java学习day6 + leetcode31 下一个排列冬夜戏雪 java 学习算法
1.消息队列和一些功能P74P75P76基于stream的消息队列单消费模式消费者组P77基于消息队列的异步秒杀下单shift2提及，插入已知笔记P78探店笔记P79查看探店笔记p80点赞功能一人一赞这里也有并发P81点赞排行榜sortedsetset集合的选择redis里面的zsetmybatis改sql排序语句p82好友关注关注和取关p83共同关注redis里的set交集功能解析id集合没看懂
《数据结构》学习笔记二：算法（二）小曼blog
继续上节的学习，我们在这一篇文章里把“算法”这一章内容学习完。本节解决问题：算法的好坏到底是如何评估的？知识点：1.函数的渐进增长2.算法的时间复杂度3.常见的时间复杂度4.算法的空间复杂度1.函数的渐进增长这一知识点与数学相关，不过没关系都是很容易理解的内容。问题：假如两个算法的输入规模都是n,A的执行次数是2n+3,B的执行次数是3n+1,那么这两个算法哪一个更好呢？我们来分析一下，用数学的折
集群技术笔记-HAProxy 与 Keepalived 高可用负载均衡实战
目录前言HAProxy一、HAProxy介绍（一）定义（二）核心优势（三）调度算法速查表（四）工作模式（五）配置文件结构（六）健康检查字段二、搭建负载均衡集群（一）准备基本环境（二）配置流程配置真实服务器配置代理服务器（三）客户端验证三、配置健康检查页面（一）修改配置文件追加配置内容（二）重启服务（三）浏览器访问验证Keepalived一、Keepalived介绍（一）定义（二）功能（三）工作原理
【数据结构】详解堆排序当中的topk问题（leetcode例题） ylfxw 数据结构 leetcode 算法
文章目录前言如何理解topk问题代码逻辑代码实现前言Leetcode相关题目：215.数组中的第K个最大元素如何理解topk问题**TopK问题是一个经典的问题，在计算机科学中，它的目标是在一组数据中找到前K个最大或最小的元素。**这个问题在许多场景下都很重要，比如搜索引擎的搜索结果排名、数据分析中的热门元素筛选等。.在最简单的形式中，给定一个数组（或列表）和一个整数K，TopK问题要求返回数组中
拼多多官方返利新动向，高省App引领购物省钱新趋势古楼
电商行业的快速发展带来了无数的新趋势和新机遇，而拼多多官方返利的新趋势无疑是其中的一大亮点。高省App作为这一趋势的敏锐洞察者和积极参与者，致力于帮助用户精准把握这些新机遇。通过高省App，用户可以及时了解拼多多官方返利的最新政策和活动信息，从而做出更加明智的购物决策。同时，高省App还提供了专业的数据分析工具，帮助用户分析自己的消费行为和省钱效果，让省钱之路更加清晰和明确。我们在开始讲今天的文章
香严工作日记第十天（2月12日）素琴本无弦
【读书笔记】摘要1我相信医院里的药物为上帝所憎恶，但如果那天晚上我手头有吗啡，肯定会给卢克服用。疼痛令他喘不过气来。他躺在床上，豆大的汗珠从额头滑落至胸前，他屏住呼吸直到脸变红，继而变紫，仿佛让大脑缺氧才能撑到下一分钟。当肺部疼痛超过烧伤带来的痛苦时，他哭着大口大口地呼气——肺部解脱了，腿却痛到极点。感悟：隔着屏幕都能感受到那份疼痛╯﹏╰。他们似乎已经习以为常，没有感受到任何的慌乱和不安。但是生活
《我不惧怕成为这样“强硬”的姑娘》读书笔记05 幺拐妖怪
在大学那些年因为我考取的并不是什么名牌大学，所以我一直羡慕着那些考上名牌大学的学霸们。作者刘媛媛与北大的那些年让我意识到：学霸之所以是学霸，是因为他们都在抓住飞逝的光阴，为着出厂的一刻做准备，努力变成一盒优质的牛奶。反观我的大学四年，好像都沉浸在社团活动里面，对学业并不怎么上心，而且也没怎么多多跟专业的老师们沟通交流，获取学习经验和心得。在大学里面，我也看到过许多不同的人，有些人在学校里面就肆意开
筑基笔记三十六王婷灏常用
一、《筑基笔记三十六》王婷灏，中原焦点团队讲师、心理咨询师，持续原创分享第1391天,2022年9月18日一、心境障碍又称情感性精神障碍；以持续而显著的情绪低落或高涨为主要表现，包括抑郁症和躁狂症；伴有相应认知、行为改变，可有精神病性症状;—般为发作性病程，间歇期完全正常；虽有反复发作的倾向，但不出现精神衰退,具有复发倾向，大多可缓解。预后较好。二、躁狂症“三高”：思维奔逸、情感高涨、意志增强。易
Java实现的简单双向Map，支持重复Value superlxw1234 java 双向map
关键字：Java双向Map、DualHashBidiMap 有个需求，需要根据即时修改Map结构中的Value值，比如，将Map中所有value=V1的记录改成value=V2，key保持不变。数据量比较大，遍历Map性能太差，这就需要根据Value先找到Key，然后去修改。即：既要根据Key找Value，又要根据Value
PL/SQL触发器基础及例子百合不是茶 oracle数据库触发器 PL/SQL编程
触发器的简介; 触发器的定义就是说某个条件成立的时候，触发器里面所定义的语句就会被自动的执行。因此触发器不需要人为的去调用，也不能调用。触发器和过程函数类似过程函数必须要调用, 一个表中最多只能有12个触发器类型的,触发器和过程函数相似触发器不需要调用直接执行, 触发时间：指明触发器何时执行，该值可取： before：表示在数据库动作之前触发
[时空与探索]穿越时空的一些问题 comsci 问题
我们还没有进行过任何数学形式上的证明,仅仅是一个猜想..... 这个猜想就是; 任何有质量的物体(哪怕只有一微克)都不可能穿越时空,该物体强行穿越时空的时候,物体的质量会与时空粒子产生反应,物体会变成暗物质,也就是说,任何物体穿越时空会变成暗物质..(暗物质就我的理
easy ui datagrid上移下移一行商人shang js 上移下移 easyui datagrid
/** * 向上移动一行 * * @param dg * @param row */ function moveupRow(dg, row) { var datagrid = $(dg); var index = datagrid.datagrid("getRowIndex", row); if (isFirstRow(dg, row)) {
Java反射 oloz 反射
本人菜鸟，今天恰好有时间，写写博客，总结复习一下java反射方面的知识，欢迎大家探讨交流学习指教首先看看java中的Class package demo; public class ClassTest { /*先了解java中的Class*/ public static void main(String[] args) { //任何一个类都
springMVC 使用JSR-303 Validation验证杨白白 spring mvc
JSR-303是一个数据验证的规范，但是spring并没有对其进行实现，Hibernate Validator是实现了这一规范的，通过此这个实现来讲SpringMVC对JSR-303的支持。 JSR-303的校验是基于注解的，首先要把这些注解标记在需要验证的实体类的属性上或是其对应的get方法上。登录需要验证类 public class Login { @NotEmpty
log4j 香水浓 log4j
log4j.rootCategory=DEBUG, STDOUT, DAILYFILE, HTML, DATABASE #log4j.rootCategory=DEBUG, STDOUT, DAILYFILE, ROLLINGFILE, HTML #console log4j.appender.STDOUT=org.apache.log4j.ConsoleAppender log4
使用ajax和history.pushState无刷新改变页面URL agevs jquery 框架 Ajax html5 chrome
表现如果你使用chrome或者firefox等浏览器访问本博客、github.com、plus.google.com等网站时，细心的你会发现页面之间的点击是通过ajax异步请求的，同时页面的URL发生了了改变。并且能够很好的支持浏览器前进和后退。是什么有这么强大的功能呢？ HTML5里引用了新的API，history.pushState和history.replaceState，就是通过
centos中文乱码 AILIKES centos OS ssh
一、CentOS系统访问 g.cn ，发现中文乱码。于是用以前的方式：yum -y install fonts-chinese CentOS系统安装后，还是不能显示中文字体。我使用 gedit 编辑源码，其中文注释也为乱码。后来，终于找到以下方法可以解决，需要两个中文支持的包： fonts-chinese-3.02-12.
触发器 baalwolf 触发器
触发器(trigger)：监视某种情况，并触发某种操作。触发器创建语法四要素：1.监视地点(table) 2.监视事件(insert/update/delete) 3.触发时间(after/before) 4.触发事件(insert/update/delete) 语法： create trigger triggerName after/before
JS正则表达式的i m g bijian1013 JavaScript 正则表达式
g:表示全局（global)模式，即模式将被应用于所有字符串，而非在发现第一个匹配项时立即停止。 i:表示不区分大小写（case-insensitive）模式，即在确定匹配项时忽略模式与字符串的大小写。 m:表示
HTML5模式和Hashbang模式 bijian1013 JavaScript AngularJS Hashbang模式 HTML5模式
我们可以用$locationProvider来配置$location服务（可以采用注入的方式，就像AngularJS中其他所有东西一样）。这里provider的两个参数很有意思，介绍如下。 html5Mode 一个布尔值，标识$location服务是否运行在HTML5模式下。 ha
[Maven学习笔记六]Maven生命周期 bit1129 maven
从mvn test的输出开始说起当我们在user-core中执行mvn test时，执行的输出如下： /software/devsoftware/jdk1.7.0_55/bin/java -Dmaven.home=/software/devsoftware/apache-maven-3.2.1 -Dclassworlds.conf=/software/devs
【Hadoop七】基于Yarn的Hadoop Map Reduce容错 bit1129 hadoop
运行于Yarn的Map Reduce作业，可能发生失败的点包括 Task Failure Application Master Failure Node Manager Failure Resource Manager Failure 1. Task Failure 任务执行过程中产生的异常和JVM的意外终止会汇报给Application Master。僵死的任务也会被A
记一次数据推送的异常解决端口解决 ronin47 记一次数据推送的异常解决
　　需求：从db获取数据然后推送到B 程序开发完成，上jboss,刚开始报了很多错，逐一解决，可最后显示连接不到数据库。机房的同事说可以ping 通。　　自已画了个图，逐一排除，把linux 防火墙　和　setenforce　设置最低。　　　service iptables stop
巧用视错觉-UI更有趣 brotherlamp UI ui视频 ui教程 ui自学 ui资料
我们每个人在生活中都曾感受过视错觉（optical illusion）的魅力。视错觉现象是双眼跟我们开的一个玩笑，而我们往往还心甘情愿地接受我们看到的假象。其实不止如此，视觉错现象的背后还有一个重要的科学原理——格式塔原理。格式塔原理解释了人们如何以视觉方式感觉物体，以及图像的结构，视角，大小等要素是如何影响我们的视觉的。在下面这篇文章中，我们首先会简单介绍一下格式塔原理中的基本概念，
线段树-poj1177-N个矩形求边长（离散化+扫描线） bylijinnan 数据结构算法线段树
package com.ljn.base; import java.util.Arrays; import java.util.Comparator; import java.util.Set; import java.util.TreeSet; /** * POJ 1177 (线段树+离散化+扫描线)，题目链接为http://poj.org/problem?id=1177
HTTP协议详解 chicony http协议
引言
Scala设计模式 chenchao051 设计模式 scala
Scala设计模式我的话：在国外网站上看到一篇文章，里面详细描述了很多设计模式，并且用Java及Scala两种语言描述，清晰的让我们看到各种常规的设计模式，在Scala中是如何在语言特性层面直接支持的。基于文章很nice，我利用今天的空闲时间将其翻译，希望大家能一起学习，讨论。翻译
安装mysql daizj mysql 安装
安装mysql (1)删除linux上已经安装的mysql相关库信息。rpm -e xxxxxxx --nodeps (强制删除) 执行命令rpm -qa |grep mysql 检查是否删除干净 (2)执行命令 rpm -i MySQL-server-5.5.31-2.el
HTTP状态码大全 dcj3sjt126com http状态码
完整的 HTTP 1.1规范说明书来自于RFC 2616，你可以在http://www.talentdigger.cn/home/link.php?url=d3d3LnJmYy1lZGl0b3Iub3JnLw%3D%3D在线查阅。HTTP 1.1的状态码被标记为新特性，因为许多浏览器只支持 HTTP 1.0。你应只把状态码发送给支持 HTTP 1.1的客户端，支持协议版本可以通过调用request
asihttprequest上传图片 dcj3sjt126com ASIHTTPRequest
NSURL *url =@"yourURL"; ASIFormDataRequest*currentRequest =[ASIFormDataRequest requestWithURL:url]; [currentRequest setPostFormat:ASIMultipartFormDataPostFormat];[currentRequest se
C语言中，关键字static的作用 e200702084 C++c C#
在C语言中，关键字static有三个明显的作用： 1)在函数体，局部的static变量。生存期为程序的整个生命周期，（它存活多长时间）；作用域却在函数体内（它在什么地方能被访问（空间））。一个被声明为静态的变量在这一函数被调用过程中维持其值不变。因为它分配在静态存储区，函数调用结束后并不释放单元，但是在其它的作用域的无法访问。当再次调用这个函数时，这个局部的静态变量还存活，而且用在它的访
win7/8使用curl geeksun win7
1. WIN7/8下要使用curl，需要下载curl-7.20.0-win64-ssl-sspi.zip和Win64OpenSSL_Light-1_0_2d.exe。下载地址： http://curl.haxx.se/download.html 请选择不带SSL的版本，否则还需要安装SSL的支持包 2. 可以给Windows增加c
Creating a Shared Repository; Users Sharing The Repository hongtoushizi git
转载自： http://www.gitguys.com/topics/creating-a-shared-repository-users-sharing-the-repository/ Commands discussed in this section: git init –bare git clone git remote git pull git p
Java实现字符串反转的8种或9种方法 Josh_Persistence 异或反转递归反转二分交换反转 java字符串反转栈反转
注：对于第7种使用异或的方式来实现字符串的反转，如果不太看得明白的，可以参照另一篇博客： http://josh-persistence.iteye.com/blog/2205768 /** * */ package com.wsheng.aggregator.algorithm.string; import java.util.Stack; /**
代码实现任意容量倒水问题 home198979 PHP 算法倒水
形象化设计模式实战 HELLO!架构 redis命令源码解析倒水问题：有两个杯子，一个A升，一个B升，水有无限多，现要求利用这两杯子装C
Druid datasource zhb8015 druid
推荐大家使用数据库连接池 DruidDataSource. http://code.alibabatech.com/wiki/display/Druid/DruidDataSource DruidDataSource经过阿里巴巴数百个应用一年多生产环境运行验证，稳定可靠。它最重要的特点是：监控、扩展和性能。下载和Maven配置看这里： http
两种启动监听器ApplicationListener和ServletContextListener spjich java spring 框架
引言:有时候需要在项目初始化的时候进行一系列工作，比如初始化一个线程池，初始化配置文件，初始化缓存等等，这时候就需要用到启动监听器，下面分别介绍一下两种常用的项目启动监听器 ServletContextListener 特点: 依赖于sevlet容器，需要配置web.xml 使用方法: public class StartListener implements
JavaScript Rounding Methods of the Math object 何不笑 JavaScript Math
The next group of methods has to do with rounding decimal values into integers. Three methods — Math.ceil(), Math.floor(), and Math.round() — handle rounding in differen

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他