Hadoop入门（2）HDFS的核心概念和工作原理

Hadoop之HDFS

目录

一、简述Hadoop的生态系统

二、分布式文件系统

三、HDFS

（一）HDFS优点和缺点

（二）HDFS的部分专业术语

（三）HDFS的部分核心组件

（四）HDFS的工作流程

1、如何分块

2、如何备份

3、检测数据（块）损坏流程

4、检测数据节点（DN）损坏流程

5、写文件流程

6、读文件流程

四、参考与推荐

一、简述Hadoop的生态系统

Hadoop的核心是HDFS(分布式存储系统)+MapReduce（分布式计算框架）

Flume（日志收集，常用于推荐系统的数据收集）
Sqoop（数据转移，用于两个数据库的数据转移传递）
Storm（数据分析，即时计算，不同于hadoop的批量计算）
Ambari（简化Hadoop复杂操作的工具）
Mapreduce（解决数据计算问题，比较笨重，过时啦）
YARN（资源管理调度系统，出现在Hadoop2.x）
Hive（"Hadoop的sql"，将sql语言翻译成MapReduce程序）
Zookeeper（数据管理，约等于文件系统+通知机制）
Spark（数据清洗，简化Mapreduce的上手难度）
HDFS（解决数据存储问题）
Hbase（数仓建模，解决数据查询问题）

二、分布式文件系统

集群：多个人在一起作同样的事。
分布式：多个人在一起作不同的事。
分布式结构如下。

简而言之，分布式系统就是由多台机器组成的大的机器集群系统。而分布式文件系统就是将一个大文件分成多个小文件并存储，负责管理文件的系统。
分布式文件系统在物理结构上是由计算机集群中的多个节点构成的，这些节点分为两类，一类叫“主节点”(Master Node)或者也被称为“名称结点”(NameNode)，另一类叫“从节点”（Slave Node）或者也被称为“数据节点”(DataNode)，正如字面意思一样，主机负责与外界打交道，从机被主机管理。

三、HDFS

Hadoop的分布式文件系统。

（一）HDFS优点和缺点

大存储（分布式）
比传统机器读写快（并发读写，不受单台机器的吞吐量和容量限制）
成本低，支持廉价硬件
容错率高（因为支持备份）
移动计算（把计算任务下发到数据所在的节点进行处理）
不适合小文件存储。（生成的记录信息浪费空间）。
适合用于处理批量数据，而不适合于随机定位访问（量大难查）。
不适合多次修改（满足一致性原则）

（二）HDFS的部分专业术语

数据块（Block)

当我们遇到一个大的数据时，HDFS会将它拆分成许多个小的数据块（Block），以便分布式存储。

元数据（MateData)

记录了这些数据块分别在哪个数据节点存储，顺序按照距离远近排序，越近越前。
描述数据的数据，这种信息一般称为“元数据”。

（三）HDFS的部分核心组件

名称节点（简称NN，NameNode）

也称主节点，作为中心服务器，主要负责接受客户端的读写请求。在主节点的统一调度下进行数据块的创建、删除和复制等操作，主节点的元数据信息会在启动后加载到内存里，以便快速查询。
管理数据节点。
控制客户端的访问权限。
需要维护块信息表和数据节点信息表。
NameNode有两个重要文件，如下。

fsimage：元数据镜像文件，保存文件系统的目录树。
edits：元数据操作日志（针对目录树的修改操作），被写入共享存储系统中。

第二名称节点(简称SNN，Secondary NameNode)

并不是主节点的备份文件，但是是备用主节点。
它主要为了帮助主节点分担压力，类似主节点的“助手”。它的主要工作是在主节点忙时，帮助主节点合并edits ，减少NN启动时间，合并流程如下图。

数据节点（简称DN，DataNode）

主要为了存储数据块。
必须向主节点汇报心跳、块列表和其他确认信息ack。

（四）HDFS的工作流程

1、如何分块

当我们遇到一个大的数据时，HDFS会将它拆分成许多个小的数据块（Block），以便分布式存储。
数据块容量太小不合适，寻址困难。
数据块容量太大也不合适，容易产生外部碎片。
在Hadoop2.x，这个块的大小默认是128MB，Hadoop1.x版本，默认大小是64MB。若文件大小不到128MB，则单独存成一个块。

2、如何备份

分好块后，为了保证容错性（软硬件出错导致的数据丢失之类），HDFS需要对数据块进行备份。Hadoop默认一个数据块备份3个副本，分布策略如下。
第一个副本：随机挑选一台磁盘不太满，CPU不太忙的节点。
第二个副本：放置在于第一个副本不同的机架的节点上。
第三个副本：与第二个副本相同机架的节点。
更多副本：随机节点

存储过程正如下图一般。 (右上角的是元数据表)

3、检测数据（块）损坏流程

数据节点会周期性向主节点汇报自己的块列表信息。
汇报信息前，数据节点会通过验证校验码去筛选是否存在数据块的数据损失，如果发现数据块数据有所损失，则不上报。
主节点通过对比自己的块列表和数据节点上报的信息，知道数据块的损坏情况，并更新自己的块表。

4、检测数据节点（DN）损坏流程

数据节点通过向主节点发送心跳保持与其联系（3秒一次）。
如果主节点10分钟没有收到数据节点的心跳，则认为其已经意外丢失，主节点会开始复制他在其他数据节点上的备份数据块，重新备份。

5、写文件流程

数据通常以64kb被写入（被称为数据包），所有数据包在被节点接受写入后，都会返回一个确认信息给客户端，如果客户端没收到确认信息，它就会重新调整管道。

下面是详细的解释。

(1)客户端调用DistributedFileSystem对象的create()方法新建文件。
(2) DistributedFileSystem会对NameNode创建一个RPC调用, 在文件系统的命名空间中创建一个新文件，需要注意的是，此刻该文件中还没有相应的数据块。
(3) NameNode通过执行不同的检查来确保这个文件不存在而且客户端有新建该文件的权限。如果这些检查都通过了，NameNode就会为创建新文件写下一条记录;反之,如果文件创建失败，则向客户端抛出一个IOException异常。
(4)随后DistributedFileSystem向客户端返回一个FSDataOutputStream对象,这样客户端就可以写入数据了。和读取事件类似，FSDataOutputStream封装一个DFSOutputStream对象，该对象负责处理DataNode和NameNode之间的通信。在客户端写入数据的时候，DFSOutputStream将它分成一个个的数据包，并且写入内部队列，被称之为”数据队列”(data queue)。
(5) DataStream处理数据队列，它的任务是选出适合用来存储数据副本的一组DataNode,并据此要求NameNode分配新的数据块。这一组DataNode会构成一条管线,DataStream会将数据包流式传输到管线中的第一个DataNode,然后依次存储并发送给下一个DataNode.
(6) DFSOutPutStream也维护着一个内部数据包队列来等待DataNode的收到确认回执，称为"确认队列”(askqueue)。收到管道中所有DataNode确认信息后，该数据包才会从确认队列删除。
(7)客户端完成数据的写入后，会对数据流调用close()方法。

6、读文件流程

如果出现了因为数据错误导致的读错误，那么客户端会去列表中的其他备份节点读数据。

下面是详细的解释。

(1)客户端通过调用FileSystem对象的open(方法打开要读取的文件，对于HDFS来说，这个对象是DistributedFileSystem的一个实例。
(2) DistributedFileSystem通过使用远程过程调用 (RPC) 来调用NameNode,以确定文件起始块的位置。
(3)对于每个块，NameNode返回到存有该块副本的DataNode地址。此外,这些DataNode根据它们与客户端的距离来排序。如果该客户端本身就是一个DataNode,那么该客户端将会从包含有相应数据块副本的本地DataNode读取数据。DistributedFileSystem类返回一个FSDatalnputStream对象给客户端并读取数据，FSDatalnputStream转而封装DFSInputStream对象，该对象管理着DataNode和NameNode的I/O。接着，客户端对这个输入流调用read()方法。
(4)存储着文件起始几个块的DataNode地址的DFSInputStream,接着会连接距离最近的文件中第一个块所在的DataNode。通过对数据流的反复调用read()方法,实现将数据从DataNode传输到客户端。
(5)当快到达块的末端时，DFSInputStream会关闭与该DataNode的连接, 然后寻找下一个块最佳的DataNode.
(6)当客户端从流中读取数据时，块是按照打开的DFSInputStream与DataNode新建连接的顺序进行读取的。它也会根据需要询问NameNode从而检索下一批数据块的DataNode的位置。一旦客户端完成读取，就对FSDatalnputStream调用close()方法。

四、参考与推荐

用漫画形式解说HDFS的存储原理，通俗易懂，感谢画家作者。
详解HDFS，通俗易懂，感谢画家作者。
《Google file system》（暂未看），用于处理存储的分布式文件系统（GFS
《Google MapReduce》（暂未看），用于计算的分布式计算框架MAPREDUCE
《从零开始学Hadoop大数据分析》，hdfs的读写流程的详细解释转载自此书，感谢作者。

你可能感兴趣的:(Hadoop入门（2）HDFS的核心概念和工作原理)

Unit2 Part1 Emotions&Hobbies 南半球不加糖
Emotions情绪She‘sscreamingbecausesheisreallyscared.她尖叫是因为她真的很害怕。Somethingischasinghersosheisscreamingforhelp.有什么东西在追她，所以她尖叫着求救。He’sshoutingbecauseheisangry.他在喊叫，因为他生气了。Whenheisreallyangryheoftenshoutsli
京东优惠券怎么领取？详细步骤揭秘，折扣大礼包等你来拿浮沉导师
作为中国知名的电商平台，京东一直以来都深受用户的喜爱。而京东优惠券更是让用户在购物时享受到额外的优惠。那么，京东优惠券怎么领取？京东支付券又在哪里领取呢？本文将为大家详细介绍京东优惠券的领取攻略以及京东支付券的获取方法。一、京东优惠券的领取方式1.活动页面领取：京东会定期在首页、活动页面等位置推出优惠券活动专区。用户可以进入该页面，浏览并领取自己感兴趣的优惠券。2.商家优惠券领取：在京东的店铺页面
难寻好文章 xmlyly
在今天这个信息发达的时代，真正沉的住气来用心写文章的人寥寥无几。信息爆炸，通讯发达的好处是，文字的曝光率大大提高，人们甚至可以从文字中获利不少。浏览文字的渠道变多了，但我却觉得好文章，好作者却比从前更少了。在碎片式阅读风靡的今天，人们在公共交通上滑着屏幕浏览的大多是些段子，网络小说，娱乐八卦。静下来读书的人变少了，静下心来写作的人也愈发稀有。我希望我还是可以做一个把写作和阅读当作真正的兴趣和愉悦来
今天是个好日子清风拂尘369
今天是个好日子！因为今天是2022年的3月4号，是我家宝贝的生日；今天还是农历的二月二，龙抬头的日子。就在今天，两个孩子突然给我们来了个惊喜：他们俩领证了！我和先生收到他们俩发来的照片，一时半会儿都没有回过神来。因为他们俩之前曾经告诉过我们说是打算在今年的五月二十号去领证的，还说520那天似乎排队领证的人特别多。没想到今天给我们来了个突然袭击，还问我们惊不惊喜！我和先生当时都懵了，在孩子连连追问“
Error: Could not installed packages due to anOSError: [Errno 28] No space left on device 不废江河954 linux
Error:CouldnotinstalledpackagesduetoanOSError:[Errno28]Nospaceleftondevice前言安装torch时出现标题所示报错。尝试1（失败）可能是磁盘占用过多，查看磁盘占用情况：df-h，发现剩余空间绰绰有余。但还是使用sudoaptautoremove--purgesnapd清理了下。果然没有任何用，继续报同样的错。尝试2（失败）可能是
【C语言回调函数】跳跃的蜗牛 c语言开发语言嵌入式
C语言回调函数在C语言中，是通过函数指针来实现函数回调的，具体可以分成4个步骤：1、声明一个函数指针p_A2、定义一个函数A3、注册函数（其实就是把上面的函数地址赋值给函数指针p_A=&A，俗称“挂钩子”）4、通过函数指针调用函数（在需要的地方直接使用p_A(),和调用A()效果一样）1、什么是函数指针？函数指针就跟指针变量差不多，不过它里面存储的不再是变量的地址，而是函数的入口地址。以前我们调用
我的爸爸妈妈，他们的人生只剩归途沧浪先生
昨天，我的姥姥去世了，这意味着，从此我的爸妈都是无父无母之人了。我的爷爷、奶奶、姥爷若都活着，现在应该都是80多岁。不过我奶因为肺不好，60多就走了；我姥爷有严重静脉炎，70多也去世了；前年我爷爷病逝，而昨天，我的祖辈的最后一位亲人，也永远离开了我。我昨天在文字中强行试图用回忆驱散内心的悲伤，但依旧揪心疼痛。昨夜一夜乱梦，想来父母更是伤心，姥姥走后，他们从此此生与世再无来处，人生漫漫长路只剩归途。
营业执照识别OCR接口如何用PHP调用 loosenivy 识别类接口 ocr 营业执照识别营业执照图片识别营业执照ocr 营业执照信息识别
一、什么是营业执照OCR识别接口？营业执照识别OCR接口，即营业执照识别，通过上传图片或URL，识别图片内容，能够识别营业执照上的多种信息，如企业名称、统一社会信用代码、法定代表人等基本信息，以及经营范围、注册地址等详细信息。二、营业执照OCR识别接口适用哪些场景？例如：电商与零售行业：1.商户入驻审核：电商平台和零售企业在接纳新商户入驻时，需要对商户的营业执照进行审核。OCR识别可以自动提取营业
Python打包工具开源技术 Python python 开发语言后端
目前几个主要的活跃PyInstaller，成熟，用户最多；其原理就是复制文件。支持打包成onefile的可执行文件、目录两个方式。PyArmor有对其官方适配。cx_Freezer，原理与PyInstaller类似，但用户少、功能少。Nuitka，since2019。核心功能是其使用Python实现的与CPython兼容的编译器，直接将Python代码编译为二进制。虽然编译后的代码执行更快，但不能
记忆中的摊饼笔墨人生_c964
文/笔墨人生有很久时间没吃过摊饼饼了，特别是荞麦面摊饼。有一次，偶尔路过益民市场，碰到一家小摊的白面鸡蛋摊饼，要一份尝尝，总感觉不过瘾，吃不美气。最近吃过一家挂牌名曰＂老家养生杂粮馆＂的荞面摊饼，但荞面太少，白面太多，吃不饱，亦不改馋。即使要求店家按农村老家土法摊制的摊饼，也吃不出当年的味道来！为此纠结了许久。也许这一生再也无缘吃到荞面摊饼饼了。因为在老家好多年都没见过种植荞麦了，那红杆杆子绿叶叶
metamask简述小朴同学
metamask是一个谷歌插件。他是一个很轻的以太坊钱包，支持正式的以太坊网络，支持主流的三种以太坊测试网络：Ropsten，Kovan，Rinkeby。也支持Localhost8545(尝试连接一个未可知的私人网络，可能会连接失败)和CustomRPC(自定义RPC)。简单功能创建新的账户发币和收币购买正式币和测试币（根据不同的测试网络获取的方式不一致）更改地址所在的网络调用合约功能未测试成功T
面试Spring Cloud 问了我35个问题，全部分享出来！套马杆的程序员
❝对于目前来说，微服务已经是程序员必会的技能之一了。SpringCloud作为一个优质的微服务框架，已经被很多公司使用。以下小编给大家整理35道SpringCloud的知识点，或者说是面试题都不冲突。后续还会继续更新⛽️❞1.什么是SpringCloud?SpringCloud为开发人员提供了工具，以快速构建分布式系统中的一些常见模式（例如，配置管理，服务发现，断路器，智能路由，微代理，控制总线，
薅羊毛犯法吗怎样算违法薅羊毛的群主是靠什么挣钱日常购物技巧呀
“薅羊毛”通常是指在购物或者其他活动中，以不正当的方式获取更多的优惠或回报的行为。这个行为在很多国家和地区都是不被允许的，可能会被视为违法或者不道德。具体来说，如果你使用虚假信息、欺诈消费者、操纵市场等手段来薅羊毛，那么你可能会违反相关的法律法规，面临刑事或民事责任。因此，建议大家在享受各种优惠和回报的同时，一定要遵守相关的法律法规和商业道德，不要使用任何不正当的方式来薅羊毛。薅羊毛首选高省app
2今天星期二狂奔的阿肥
晚上粑粑，以后早上有感觉一定要去蹲一蹲一天一餐，晚餐，吃了9片烤馍，6片面皮体重并没有掉我的身后什么都没有，也只有自己可以依靠
一分钟了解网络安全风险评估！亿林科技网络安全 web安全网络安全
网络安全风险评估是一种系统性的分析过程，旨在识别和评估网络系统中的潜在安全风险。这个过程包括识别网络资产、分析可能的威胁和脆弱性、评估风险的可能性和影响，以及提出缓解措施。网络安全风险评估有助于组织了解其网络安全状况，制定相应的安全策略和应急计划，以减少安全事件发生的风险。评估流程网络安全风险评估通常遵循以下步骤：确定评估目标和范围：明确评估的网络系统、信息系统和网络基础设施的边界。资产识别和分类
穿越时空的创业愿景 —— 20年前的辉煌创业计划书神州永泰创业大模型新商机创业创新新媒体运营大模型
一、前言在时光的隧道里，有一份承载着梦想与激情的创业计划书，静静躺在了历史的书页中，那时20年前的我，以非凡的远见和勇气，绘制的未来蓝图。如今，当我们轻轻拂去岁月的尘埃，这份计划书依旧闪耀着智慧与创意的光芒，仿佛穿越时空，邀请我们一同回顾那段激情燃烧的岁月。当年，这份计划书曾得到风投巨头IDG的关注，但受限于资金的匮乏，这份计划书中的宏伟蓝图未能付诸实践。然而，时间的流转并未抹去其光芒，反而让其中
子网掩码 g200407331 qt qt
将两台以上计算机组网是件很容易的事，接入同一个交换机，设置同一个网段的IP地址和一样的子网掩码就搞定了。说起子网掩码大家都不陌生，就是那个默认的“255.255.255.0”，可子网掩码到底是什么，究竟有什么作用，估计很多用了十年以上电脑的人都答不上来，本文就带大家了解这个熟悉又陌生的东西。子网掩码与IP地址都是由4个数段组成，每个数段的取值范围是0-255（共256个值，等于2的8次方），如我们
信息安全、网络安全、网络空间安全傻傻分不清？亿林科技网络安全 web安全安全
信息安全、网络安全、网络空间安全：三个概念的解析与区分随着信息技术的迅猛发展，信息安全、网络安全、网络空间安全这三个概念逐渐进入人们的视野。虽然它们密切相关，但在含义上却有所区别。本文将深入探讨这三个概念的定义、内涵及其区别。一、信息安全信息安全是指保护信息免受未经授权的访问、使用、破坏或泄露的科学与技术手段的总和。其核心目标是确保信息的机密性、完整性和可用性。信息安全涉及的范围包括计算机系统、网
一元硬币的收藏价值怎么样？富哥爱收藏
一元硬币值钱吗，是否有收藏价值？在回答这个问题之前，我们应该先了解一元硬币的种类有多少，以及版式的划分，不同种类的收藏价值都是不一样的，这里面大致可分为三类：1.古代时期的一元硬币、2.近代发行流通的一元硬币3.发行的纪念币一元，这三种都有一定的收藏价值，下面我们就一一分享吧！古代时期的一元钱，收藏价值如何！常见的有袁大头银币（三年、八年、九年、十年），大清银币，袁世凯共和国纪念币，还有袁世凯洪宪
复盘 | 奇偶位差法的应用牛小丫53
一、复习奇偶位差法判断一个数能否被11整除方法最简单判断方法:奇偶位差法具体方法:第一步:编号，从个位往前编号，编号是奇数就是奇位，编号是偶数就是偶位第二步:做差，奇位数和减偶位数和第三步:判断是否整除，所得的差可以被11整除，这个数就能被11整除图片发自App二、用奇偶位差法解决问题（一）四个数用数字1、3、5、7各一个，能组成多少个被11整除的四位数？根据奇偶位差法，只要保证奇位和与偶位和的差
验证resneXt，densenet，mobilenet和SENet的特色结构 dfj77477 人工智能 python
简介图像分类对网络结构的要求，一个是精度，另一个是速度。这两个需求推动了网络结构的发展。resneXt：分组卷积，降低了网络参数个数。densenet：密集的跳连接。mobilenet：标准卷积分解成深度卷积和逐点卷积，即深度分离卷积。SENet：注意力机制。简单起见，使用了[1]的代码，注释掉layer4，作为基本框架resnet14。然后改变局部结构，验证分类效果。实验结果GPU：gtx107
通信工程单片机毕设项目选题分享 cnhush 单片机 stm32 毕业设计
文章目录1前言2如何选题2.1不要给自己挖坑2.2难度把控2.3如何命名题目3单片机嵌入式选题大全3.1嵌入式方向3.2算法方向3.3移动通信方向3.4学长作品展示4最后1前言近期不少学弟学妹询问学长关于单片机和嵌入式相关的毕设选题，学长特意写下这篇文章以作回应！以下是学长亲手整理的物联网相关的毕业设计选题，都是经过学长精心审核的题目，适合作为毕设，难度不高，工作量达标，对毕设有任何疑问都可以问学
基于STM32F4开发的智能台灯 canoe1996 STM32 stm32 单片机物联网
基于STM32F4开发的智能台灯写这篇博客的目的有2个，首先是记录一下学习STM32大半年来的第一个自己动手开发的项目，整理一下开发过程和思路；其次也是希望可以和更多的同行交流开发经验，有什么问题可以多多讨论，集思广益，共同进步~设计目标以及功能说明开发的智能台灯功能有2个：1.手动模式：可通过按键调节LED灯亮度，共10档；2.自动模式：当检测到有人在的条件下，根据环境光照强度自动调节LED灯亮
推五本好看的轻小说云庭花水
1，《予懦弱者以铁之心》，作者：月饼书评：主角穿越成真嗣，eva开局，受盖塔影响进化，与初号机融合升华，成神后踏上旅途。文中的真嗣不仅实力强，心性也很强，文章剧情精彩，文笔不错，值得一看。2，《这个日式物语不太冷》作者：和风遇月书评：单女主，能靠武力解决就绝不说废话的怨灵克星男主，好奇心旺盛但贤妻良母的活泼聪明女主，两人的感情算是水到渠成。本文文风恐怖中透着温馨搞笑，故事情节衔接合理，行文流畅，文
想爱不敢爱的和尚,一点不难受！汪曾祺饱含人性之美的《受戒》寻找答案去图书馆好运来
汪曾祺，1920年生于江苏高邮，中国当代作家、散文家。他在短篇小说创作和戏剧、民间文艺的深入研究方面都取得了巨大成就。他长期保持着冷静开放的心态，创造了积极乐观的文学生活。（比如晚年写的《受戒》）把不公平待遇作为一种锻炼和教育，是个人经验的总结，是他对中国传统文化优秀元素的继承和发展。自强不息是中国传统文化的基本精神之一。孟子是中国古代的圣人，他强调正确对待生活中的各种困难，认为正是这些困难造就了
《隐秘的角落》分集深度解析第五回（连载） Ricky的成长疗愈空间
第五集妈妈第一幕：晶晶的葬礼结束后，王瑶在公安局质问办案人员为什么不去抓凶手朱朝阳，朱永平说朝阳出现在少年宫不能说明什么。王瑶找到朝阳试探他是否知道事情的细节，朝阳慌张露出马脚。王瑶追打朝阳时，周春红赶来导致了更激烈的纠缠。王瑶一口咬定朝阳妈妈是幕后主谋，两人都是杀人凶手。王瑶质问周春红当天在哪里，周春红无法回答，加深了她的怀疑。在邻居的阻拦下，王瑶只好离开，并说“我一定让你们两个偿命！”启发：当
相交线（上）于是乎aci
第一章相遇那一天是否已经注定了一段缘分每一年的年底，张希所在的医院都要做一次人事调动，有时是几个人，有时是十几个人，不过大小也算是单位里的一件大事，毕竟涉及到分离与重逢，还可能暗示着某些高就的可能性。所以大多还没开始调动，全院就开始议论纷纷。不过对于张希来说，他并不关心，一来因为他刚刚来工作才一年多，周围的一切对他来说还很陌生，没有什么太多的感情，所以说不上分离与重逢，也不关心谁要高就——谁高就跟
十几岁的年纪，应该把野心写在脸上，正视自己的欲望秦泊淮
我希望通过努力在世界上留下很厉害的痕迹——易烊千玺你爬的高，走的远，并不是让世界看到你，而且让你看到世界。生活在阴沟里依旧有仰望星空的权利天下没有掉馅饼的好事霸总文，男主总是放弃家世好，长的好看，有学识的女二，而选择什么都不如女二的女主，总是女主一贫如洗。可小说终究是小说，如果我是男主，我断不会选择女主，自己本身都那么优秀，为何不找个优秀的人，。什么样的人和什么样的人在一起，你接触的是社会高层的人
通俗理解线性回归(Linear Regression) 小夏refresh 机器学习数据挖掘机器学习算法人工智能数据挖掘
线性回归,最简单的机器学习算法,当你看完这篇文章,你就会发现,线性回归是多么的简单.首先,什么是线性回归.简单的说,就是在坐标系中有很多点,线性回归的目的就是找到一条线使得这些点都在这条直线上或者直线的周围,这就是线性回归(LinearRegression).是不是有画面感了?那么我们上图片:![1.png][1]那么接下来,就让我们来看看具体的线性回归吧首先,我们以二维数据为例:我们有一组数据x
Google 释出 Android 15 源代码 CIb0la 系统安全运维程序人生
Google向AndroidOpenSourceProject(AOSP)释出了Android15源代码。Android15将在未来几周内推送给Pixel手机，未来几个月推送给三星、摩托罗拉、一加和小米等厂商的兼容手机。Android15的新特性包括：简化passkey的登陆，防盗检测，改进大屏幕设备的多任务处理，应用访问限制，增强了屏幕阅读器TalkBack，集成GeminiAI用于图像的音频描
怎么样才能成为专业的程序员？ cocos2d-x小菜编程 PHP
如何要想成为一名专业的程序员？仅仅会写代码是不够的。从团队合作去解决问题到版本控制，你还得具备其他关键技能的工具包。当我们询问相关的专业开发人员，那些必备的关键技能都是什么的时候，下面是我们了解到的情况。关于如何学习代码，各种声音很多，然后很多人就被误导为成为专业开发人员懂得一门编程语言就够了？！呵呵，就像其他工作一样，光会一个技能那是远远不够的。如果你想要成为
java web开发高并发处理 BreakingBad java Web 并发开发处理高
java处理高并发高负载类网站中数据库的设计方法（java教程,java处理大量数据，java高负载数据）一：高并发高负载类网站关注点之数据库没错,首先是数据库,这是大多数应用所面临的首个SPOF。尤其是Web2.0的应用，数据库的响应是首先要解决的。一般来说MySQL是最常用的，可能最初是一个mysql主机，当数据增加到100万以上，那么，MySQL的效能急剧下降。常用的优化措施是M-S（
mysql批量更新 ekian mysql
mysql更新优化：一版的更新的话都是采用update set的方式，但是如果需要批量更新的话，只能for循环的执行更新。或者采用executeBatch的方式，执行更新。无论哪种方式，性能都不见得多好。三千多条的更新，需要3分多钟。查询了批量更新的优化，有说replace into的方式，即： replace into tableName(id,status) values
微软BI（3） 18289753290 微软BI SSIS
1) Q：该列违反了完整性约束错误；已获得 OLE DB 记录。源:“Microsoft SQL Server Native Client 11.0” Hresult: 0x80004005 说明:“不能将值 NULL 插入列 'FZCHID'，表 'JRB_EnterpriseCredit.dbo.QYFZCH'；列不允许有 Null 值。INSERT 失败。”。 A：一般这类问题的存在是
Java中的List g21121 java
List是一个有序的 collection（也称为序列）。此接口的用户可以对列表中每个元素的插入位置进行精确地控制。用户可以根据元素的整数索引（在列表中的位置）访问元素，并搜索列表中的元素。与 set 不同，列表通常允许重复
读书笔记永夜-极光读书笔记
1. K是一家加工厂,需要采购原材料,有A,B,C,D 4家供应商,其中A给出的价格最低,性价比最高,那么假如你是这家企业的采购经理,你会如何决策? 传统决策: A:100%订单 B,C,D:0% &nbs
centos 安装 Codeblocks 随便小屋 codeblocks
1.安装gcc,需要c和c++两部分,默认安装下,CentOS不安装编译器的,在终端输入以下命令即可yum install gccyum install gcc-c++ 2.安装gtk2-devel,因为默认已经安装了正式产品需要的支持库,但是没有安装开发所需要的文档.yum install gtk2* 3. 安装wxGTK yum search w
23种设计模式的形象比喻 aijuans 设计模式
1、ABSTRACT FACTORY—追MM少不了请吃饭了，麦当劳的鸡翅和肯德基的鸡翅都是MM爱吃的东西，虽然口味有所不同，但不管你带MM去麦当劳或肯德基，只管向服务员说“来四个鸡翅”就行了。麦当劳和肯德基就是生产鸡翅的Factory 　　工厂模式：客户类和工厂类分开。消费者任何时候需要某种产品，只需向工厂请求即可。消费者无须修改就可以接纳新产品。缺点是当产品修改时，工厂类也要做相应的修改。如：
开发管理 CheckLists aoyouzi 开发管理 CheckLists
开发管理 CheckLists(23) -使项目组度过完整的生命周期开发管理 CheckLists(22) -组织项目资源开发管理 CheckLists(21) -控制项目的范围开发管理 CheckLists(20) -项目利益相关者责任开发管理 CheckLists(19) -选择合适的团队成员开发管理 CheckLists(18) -敏捷开发 Scrum Master 工作开发管理 C
js实现切换百合不是茶 JavaScript 栏目切换
js主要功能之一就是实现页面的特效,窗体的切换可以减少页面的大小,被门户网站大量应用思路: 1,先将要显示的设置为display:bisible 否则设为none 2,设置栏目的id ,js获取栏目的id,如果id为Null就设置为显示 3,判断js获取的id名字;再设置是否显示代码实现: html代码: <di
周鸿祎在360新员工入职培训上的讲话 bijian1013 感悟项目管理人生职场
这篇文章也是最近偶尔看到的，考虑到原博客发布者可能将其删除等原因，也更方便个人查找，特将原文拷贝再发布的。“学东西是为自己的，不要整天以混的姿态来跟公司博弈，就算是混，我觉得你要是能在混的时间里，收获一些别的有利于人生发展的东西，也是不错的，看你怎么把握了”，看了之后，对这句话记忆犹新。 &
前端Web开发的页面效果 Bill_chen html Web Microsoft
1.IE6下png图片的透明显示： <img src="图片地址" border="0" style="Filter.Alpha(Opacity)=数值(100),style=数值(3)"/> 或在<head></head>间加一段JS代码让透明png图片正常显示。 2.<li>标
【JVM五】老年代垃圾回收：并发标记清理GC(CMS GC) bit1129 垃圾回收
CMS概述并发标记清理垃圾回收(Concurrent Mark and Sweep GC）算法的主要目标是在GC过程中，减少暂停用户线程的次数以及在不得不暂停用户线程的请夸功能，尽可能短的暂停用户线程的时间。这对于交互式应用，比如web应用来说，是非常重要的。 CMS垃圾回收针对新生代和老年代采用不同的策略。相比同吞吐量垃圾回收，它要复杂的多。吞吐量垃圾回收在执
Struts2技术总结白糖_ struts2
必备jar文件早在struts2.0.*的时候，struts2的必备jar包需要如下几个： commons-logging-*.jar Apache旗下commons项目的log日志包 freemarker-*.jar
Jquery easyui layout应用注意事项 bozch jquery 浏览器 easyui layout
在jquery easyui中提供了easyui-layout布局，他的布局比较局限，类似java中GUI的border布局。下面对其使用注意事项作简要介绍：如果在现有的工程中前台界面均应用了jquery easyui，那么在布局的时候最好应用jquery eaysui的layout布局，否则在表单页面（编辑、查看、添加等等）在不同的浏览器会出
java-拷贝特殊链表：有一个特殊的链表，其中每个节点不但有指向下一个节点的指针pNext，还有一个指向链表中任意节点的指针pRand，如何拷贝这个特殊链表？ bylijinnan java
public class CopySpecialLinkedList { /** * 题目：有一个特殊的链表，其中每个节点不但有指向下一个节点的指针pNext，还有一个指向链表中任意节点的指针pRand，如何拷贝这个特殊链表？拷贝pNext指针非常容易，所以题目的难点是如何拷贝pRand指针。假设原来链表为A1 -> A2 ->... -> An，新拷贝
color Chen.H JavaScript html css
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/TR/html4/loose.dtd"> <HTML> <HEAD>&nbs
[信息与战争]移动通讯与网络 comsci 网络
两个坚持:手机的电池必须可以取下来光纤不能够入户,只能够到楼宇建议大家找这本书看看:<&
oracle flashback query(闪回查询) daizj oracle flashback query flashback table
在Oracle 10g中，Flash back家族分为以下成员： Flashback Database Flashback Drop Flashback Table Flashback Query(分Flashback Query,Flashback Version Query，Flashback Transaction Query) 下面介绍一下Flashback Drop 和Flas
zeus持久层DAO单元测试 deng520159 单元测试
zeus代码测试正紧张进行中,但由于工作比较忙,但速度比较慢.现在已经完成读写分离单元测试了,现在把几种情况单元测试的例子发出来,希望有人能进出意见,让它走下去. 本文是zeus的dao单元测试: 1.单元测试直接上代码 package com.dengliang.zeus.webdemo.test; import org.junit.Test; import o
C语言学习三printf函数和scanf函数学习 dcj3sjt126com c printf scanf language
printf函数 /* 2013年3月10日20:42:32 地点：北京潘家园功能：目的：测试%x %X %#x %#X的用法 */ # include <stdio.h> int main(void) { printf("哈哈！\n"); // \n表示换行 int i = 10; printf
那你为什么小时候不好好读书? dcj3sjt126com life
dady, 我今天捡到了十块钱, 不过我还给那个人了 good girl! 那个人有没有和你讲thank you啊没有啦....他拉我的耳朵我才把钱还给他的, 他哪里会和我讲thank you 爸爸, 如果地上有一张5块一张10块你拿哪一张呢.... 当然是拿十块的咯... 爸爸你很笨的, 你不会两张都拿爸爸为什么上个月那个人来跟你讨钱, 你告诉他没
iptables开放端口 Fanyucai linux iptables 端口
1，找到配置文件 vi /etc/sysconfig/iptables 2，添加端口开放，增加一行，开放18081端口 -A INPUT -m state --state NEW -m tcp -p tcp --dport 18081 -j ACCEPT 3，保存 ESC :wq! 4，重启服务 service iptables
Ehcache（05）——缓存的查询 234390216 排序 ehcache 统计 query
缓存的查询目录 1. 使Cache可查询 1.1 基于Xml配置 1.2 基于代码的配置 2 指定可搜索的属性 2.1 可查询属性类型 2.2 &
通过hashset找到数组中重复的元素 jackyrong hashset
如何在hashset中快速找到重复的元素呢?方法很多，下面是其中一个办法： int[] array = {1,1,2,3,4,5,6,7,8,8}; Set<Integer> set = new HashSet<Integer>(); for(int i = 0
使用ajax和window.history.pushState无刷新改变页面内容和地址栏URL lanrikey history
后退时关闭当前页面 <script type="text/javascript"> jQuery(document).ready(function ($) { if (window.history && window.history.pushState) {
应用程序的通信成本 netkiller.github.com 虚拟机应用服务器陈景峰 netkiller neo
应用程序的通信成本什么是通信一个程序中两个以上功能相互传递信号或数据叫做通信。什么是成本这是是指时间成本与空间成本。时间就是传递数据所花费的时间。空间是指传递过程耗费容量大小。都有哪些通信方式全局变量线程间通信共享内存共享文件管道 Socket 硬件（串口，USB）等等全局变量全局变量是成本最低通信方法，通过设置
一维数组与二维数组的声明与定义恋洁e生二维数组一维数组定义声明初始化
/** * */ package test20111005; /** * @author FlyingFire * @date:2011-11-18 上午04:33:36 * @author ：代码整理 * @introduce :一维数组与二维数组的初始化 *summary： */ public c
Spring Mybatis独立事务配置 toknowme mybatis
在项目中有很多地方会使用到独立事务，下面以获取主键为例（1）修改配置文件spring-mybatis.xml  <tx:annotation-driven transaction-manager="transactionManager" /> &n
更新Anadroid SDK Tooks之后，Eclipse提示No update were found xp9802 eclipse
使用Android SDK Manager 更新了Anadroid SDK Tooks 之后，打开eclipse提示 This Android SDK requires Android Developer Toolkit version 23.0.0 or above, 点击Check for Updates 检测一会后提示 No update were found

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他