Jackson_MVP

Hadoop快速入门系列(1) | 大数据启蒙

虽然我走得很慢,但我从不后退！

目录

一.What?Why?How？

1.什么是大数据？(What)
2.为什么要学习大数据? (Why)
3.如何才能更好的学习大数据? (How)

二.单机处理VS分布式处理海量数据？

需求1：我有一万个元素（比如数字或单词）需要存储？
需求2：如果查找某一个元素，最简单的遍历方式复杂的是多少？
需求3：如果我期望复杂度是O(4)呢？
需求4：很多行，查找出相同内容的俩行
需求5：如果是1T数值文件，那么如何全排序呢？
需求6：对比，思考总结

三.对比得出什么结论？

一.What?Why?How？

其实每接触到一样新鲜技术，都需要What? Why? How？让自己知其然，知其所以然。更多的学会思考，才能学的更加完善。

1.什么是大数据？(What)

“大数据”这个词相信很多小伙伴听过，那么什么是大数据呢？

①下面是标准的定义：

大数据（big data），IT行业术语，是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合，是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。

②自己的理解

从标准定义，可以看出大数据是一种新的技术发展模式。那么为什么会产生这么模式呢？归根到底是社会的快速发展，催生出海量数据。随着人们对数据重要性的认知，开始分析和挖掘海量丰富数据资源价值，于是大数据的价值才能更好的脱颖而出

2.为什么要学习大数据? (Why)

1.国家对大数据发展的支持。

国务院以及各级地方政府从2012年开始，颁布了大量政策来扶持大数据产业
大数据发展已被列入国家发展战略了，大数据发展前景毋庸置疑。

2.应用领域广泛

大数据已经不仅仅是政府用来分析居民生活状态的工具了，现在它被广泛的应用于各个领域。医疗，教育，体育，金融，娱乐产业，房地产，电影电视剧的制作等等，都用上了大数据。

3.人才需求巨大

利用大数据优势，获取更高的利益，大数据发展势头十分迅猛。近年来，中国互联网三巨头BAT(百度、阿里、腾讯)均耗费巨资投入大数据发展，纷纷建立大数据研究院、大数据实验室等，提供大数据专业服务，一批大数据专业分析公司也应运而生。

3.如何才能更好的学习大数据? (How)

1.首先明确个人学习大数据方向，才能更加针对的学习。
大致分为这四种：我目前选择的是大数据开发，后面可能也会全面发展。

大数据开发工程师
大数据分析工程师
大数据运维工程师
大数据挖掘工程师

2.自己要搞清楚自己为什么要学大数据，可能是工资高，也可能是热爱。自己要搞清楚这个问题，很关键。因为，这将是学习大数据持续源源不断的动力。

3.要对大数据技术有一个整体认知，学什么，哪些是重点技术，都要了解。

4.学习没有捷径，同时学习的过程需要大量自己的思考，加上自己的练习，这样基本功才扎实。俗话说：“底层建筑，决定上层高度”。

学习要思考，学习要思考，学习思考…,重要的事情只说2.5遍

二.单机处理VS分布式处理海量数据？

需求1：我有一万个元素（比如数字或单词）需要存储？

答案：数组:Array,List , 集合:Map

需求2：如果查找某一个元素，最简单的遍历方式复杂的是多少？

答案：O(n), 因为可能要遍历一整遍。

需求3：如果我期望复杂度是O(4)呢？

答案：1万个元素，可以分成2500个链，每个链上有4个元素。
2500个链可以当成2500个对象，然后用数组去存。即便如此，此时要查的结果还是O(n)。

此时可以逆推下，如果确定链是不是就可以确定查找复杂度是O(4)了？
如何确定链：此时可以用上图的方法，采用x.hashCode与模的方式。因为如果设置2500个链，那么肯定对应2500个数组。模与值的方式，找到数组下标，就可以确定再哪个链上。然后确定好链，就可以再确定复杂度O(4)了。

单机版：hashCode的作用:分而治之，减少复杂度。类似这种需求就靠hashCode取模。hashCode底层还是靠hashTable来实现。就是一巨大的张散列表。

总结：分而治之，大而化小

需求4：很多行，查找出相同内容的俩行

有一个非常大的文本文件，里面有很多很多的行，只有两行一样，它们出现在未知的位置，需要查找到它们。

注意：单机，而且可用的内存很少，也就几十兆。

答案：1TB可以大致拆分为2000个500MB。IO速度是500MB/S，也就是需要2000s可以读完，差不多30分钟。

1.第一种：最简单的方式（效率是最低）
读取上一次的与第一个元素对比，依次类似循环到最后复杂度为O(n)。这才是第一遍。然后开始上一次元素与第二个元素对比，再一次循环到最后复杂度为O(n),一共的复杂度为nO(n)。

2.第二种方法: 分而治之，采用readLine方法（单机版）

一个小的知识点：IO的速度是500MB/S，传统机械硬盘是100MB/S.

首先来看下1T文件很难放到内存。因此，要把1T文件切分成2000个小文件。
readLine() .hashCode % 2000，对应着一行一个小文件。30分钟读完，然后划分的越小越好，然后放到内存。然后2000个小文件开始进行排序，也需要30分钟。因为内存寻址比Io寻址快10万倍。所以寻址时间就按1S,因此一共1小时1S完成。排序是为了方便找出相同俩行，内部有序，外部无序。

网络IO往往是ms为单位,而内存却是ns为单位，所以相差10万倍。往往IO是互联网技术发展的瓶颈。

第三种方法：分布式方法，分成块处理（分布式版）****

2000台，每台有500MB大小。此时采用的是分块读取，而不是用条件判断，逐个读取。因为是分布式的，所以可以同时进行，此时每台只要1S就可以读完500M。采用readLine() .hashCode % 2000方法，生成2000个小文件。

由于，判定的是很多行，查找出相同内容的俩行，所以将每一台对应相同的号小文件，进行合并。此时，网卡速度按100MB/S，因为每台对应读取的依然是500M,因为是分布式可以并行计算拉取数据，所以大致需要5S就可以全部读取完。

然后到内存进行判定。由于内存的寻址时间是磁盘的10万倍，所以2000个小文件立刻判定完。就按一秒算完成。因此一共需要1S+5S+1S=7S就可以完成结果。

可以看出分布式的效率是十分的高（注：暂且不考虑1T数据分发到2000台时间）后面再讨论这个问题。

需求5：如果是1T数值文件，那么如何全排序呢？

1.第一种方法：条件判断，放到对应的小文件当中
if(x>0&&x<100) => 0 号小文件
if(x>10-&&x<1000) => 1 号小文件
…
if(x>x&&x n 号小文件

假如说：产生了1000个小文件。注意：这些小文件是内部无序，外部有序。

如果是这样的方式，结果还是要2个30分钟，也就是一小时才可以完成。

2.第二种方法：采用分布式方法，切块处理。

先读500M进行排序 ——> ①号文件
再读500M进行排序 ——> ②号文件
依次进行循环…
最后读500M进行排序 ——> 2000号文件

此时需要30分钟来完成。因为现在是外部无序，内部有序。因为只要文件足够小，然后放到内存进行排序，追加到另一个文件，很快就可读取完，就按一分钟来完成。时间一共是30分钟+1分钟=31分钟。效率基本上是上一种方法的一倍。

需求6：对比，思考总结

2000台真的比一台速度快吗？如果考虑分发上传文件的时间呢？

如果不考虑分发数据时间，确实比一台快超级多。
如果考虑分发数据时间，当数据为1T时，确实没有一台快。因为网卡分发速度为200MB/S,，分发到2000台要30分钟*5=2小时30分钟，然后再加上计算完成的时间31分钟左右，差不多分布式版要3个小时。而单机版却只要1个小时左右。

如果考虑每天都有1T数据的产生呢? 如果增量了一年，最后一天计算数据呢?

每天都有1T数据，那肯定是分布式效率最高。
当是单机版，1T是需要1个小时，365天就是365个小时。
当时分布式版，全量导入进去，只需要2个小时30分钟，因为是并行。计算全量数据的时候就按9个小时，那么一共才需要12个小时左右。
所以单机版365个小时,分布式版12个小时，肯定是分布式版效率更加之高。

分布式文件系统那么多，为什么hadoop项目中还要开发一个hdfs文件系统？

因为，HDFS可以将数据进行分块处理，很大一部分程度提高数据计算效率。此外，HDFS还有一些独有的特点，比如副本放置策略，也能高效的提高效率，再加上是并行运行，效率更加得以凸显。因此，HDFS是特别合适得存储文件系统，应用到Hadoop生态之中。

三.对比得出什么结论？

这些结论是十分核心的，具有重大意义。思考，是学习效率的重要方式。
学习知识的时候要去搞明白它存在的意义,这样学习成本才会低!

后面我会持续更新，喜欢的小伙伴可以关注或者点赞评论哟…

你可能感兴趣的:(【Hadoop生态圈】)

大数据技术之Hadoop（一） pauls
Hadoop概述1.1Hadoop是什么Hadoop是什么1）Hadoop是一个由Apache基金会所开发的分布式系统基础架构。2）主要解决，海量数据的存储和海量数据的分析计算问题。3）广义上来说，Hadoop通常是指一个更广泛的概念——Hadoop生态圈。Hadoop生态1.2Hadoop发展历史（了解）Hadoop发展历史1）Hadoop创始人DougCutting，为了实现与Google类似
Hadoop生态圈陈超Terry的技术屋
生态圈1.HBase的数据存储在HDFS里2.MapReduce可以计算HBase里的数据，也可以计算HDFS里的数据3.Hive是数据分析数据引擎，也是MapReduce模型，支持SQL4.Pig也是一个数据分析引擎，不支持SQL，有自己的PigLatin数据5.Sqoop是数据采集工具，针对关系数据库6.Flume是针对文件等数据的采集7.Hadoop的HA通过Zookeeper来实现8.HU
大数据Hadoop生态圈技术之浅析PageRank计算原理 A尚学堂Nancy老师
一、什么是PageRank？——PageRank是Google提出的算法，用于衡量特定网页相对于搜索引擎索引中的其他网页而言的重要程度。——是Google创始人拉里·佩奇和谢尔盖·布林于1997年创造的——PageRank实现了将链接价值概念作为排名因素。二、计算环境——Hadoop-2.5.2——四台主机——两台NN的HA——两台RM的HA——离线计算框架MapReduce三、计算原理（1）思考
Apache Hadoop VincentLeon
ApacheHadoop_狭义上说，Hadoop指Apache一款java语言开发的开源框架，它的核心组件有：HDFS（分布式文件系统）：解决海量数据存储YARN（作业调度和集群资源管理的框架）：解决资源任务调度MAPREDUCE（分布式运算编程框架）：解决海量数据计算_广义上来说，Hadoop通常是指一个更广泛的概念——Hadoop生态圈，包括大数据处理流程中的各个阶段的软件：HDFS：分布式文
Hadoop生态圈-组件介绍苏尔伯特
Hadoop是目前应用最为广泛的分布式大数据处理框架，其具备可靠、高效、可伸缩等特点。Hadoop的核心组件是HDFS、MapReduce。随着处理任务不同，各种组件相继出现，丰富Hadoop生态圈，目前生态圈结构大致如图所示：image.png根据服务对象和层次分为：数据来源层、数据传输层、数据存储层、资源管理层、数据计算层、任务调度层、业务模型层。接下来对Hadoop生态圈中出现的相关组件做一
浅析大数据的技术生态圈(Hadoop，hive，spark) Rysinal hadoop 大数据 hadoop spark 生态圈
大数据本身是个很宽泛的概念，Hadoop生态圈（或者泛生态圈）基本上都是为了处理超过单机尺度的数据处理而诞生的。你可以把它比作一个厨房所以需要的各种工具。锅碗瓢盆，各有各的用处，互相之间又有重合。你可以用汤锅直接当碗吃饭喝汤，你可以用小刀或者刨子去皮。但是每个工具有自己的特性，虽然奇怪的组合也能工作，但是未必是最佳选择。大数据，首先你要能存的下大数据。传统的文件系统是单机的，不能横跨不同的机器。H
Impala：基于内存的MPP查询引擎对许 Java大数据 #Hadoop及生态圈 #数据湖仓大数据
Impala查询引擎1、Impala概述1.1、Impala简介1.2、Impala的特点1.3、Impala与Hive1、Impala概述1.1、Impala简介Impala是Cloudera公司主导研发的高性能、低延迟的交互式SQL查询引擎，它提供SQL语义，能查询存储在Hadoop的HDFS和HBase中的PB级大数据。Impala主要用于解决Hadoop生态圈无法支持交互式查询数据的痛点，
Hadoop基础知识坐在风口上de猪 hadoop 大数据分布式
Hadoop基础知识1、Hadoop简介广义上来说，Hadoop通常是指一个更广泛的概念——Hadoop生态圈。狭义上说，Hadoop指Apache这款开源框架，它的核心组件有：HDFS（分布式文件系统）：解决海量数据存储YARN（作业调度和集群资源管理的框架）：解决资源任务调度MAPREDUCE（分布式运算编程框架）：解决海量数据计算2、Hadoop特性优点扩容能力（Scalable）：Hado
大数据开发之Hadoop（完整版+练习） Key-Key hadoop hdfs mapreduce 分布式大数据
第1章：Hadoop概述1.1Hadoop是什么1、Hadoop是一个由Apache基金会所开发的分布式系统基础架构。2、主要解决，海量数据的存储和海量数据的分析计算问题。3、Hadoop通常是指一个更广泛的概念-Hadoop生态圈1.2Hadoop优势（4高）1、高可靠性：Hadoop底层维护多个数据副本，所以即使Hadoop某个计算元素或存储出现故障，也不会导致数据的丢失。2、高扩展性：再集群
大数据开发之Hadoop（入门） Key-Key 大数据 hadoop 分布式
第1章：Hadoop概述1.1Hadoop是什么1、Hadoop是一个由Apache基金会所开发的分布式系统基础架构。2、主要解决，海量数据的存储和海量数据的分析计算问题。3、Hadoop通常是指一个更广泛的概念-Hadoop生态圈1.2Hadoop优势（4高）1、高可靠性：Hadoop底层维护多个数据副本，所以即使Hadoop某个计算元素或存储出现故障，也不会导致数据的丢失。2、高扩展性：再集群
架构设计：远程调用服务架构设计及zookeeper技术详解 Java圈子
Hadoop是一个技术生态圈，zookeeper是hadoop生态圈里一个非常重要的技术。当我研究学习hadoop的相关技术时候，有两块知识曾经让我十分的困惑，一个是hbase，一个就是zookeeper。hbase的困惑源自于它在颠覆了我对数据库建模的理解，而zookeeper的困惑却是我无法理解它到底是干嘛的。远程调用服务的架构设计总述首先我们要再深入理解下为什么应用软件服务里需要一个远程调用
大数据哈斯勒
image.pnghadoop主要解决海量数据的存储和海量数据的分析计算问题。广义来说，hadoop通常指一个更广泛的概念，hadoop生态圈：image.pngHive是基于Hadoop的一个数据仓库工具，可以将结构化的数据文件映射为一张数据库表，并提供简单的SQL查询功能，可以将SQL语句转换为MapReduce任务进行运行。其优点是学习成本低，可以通过类SQL语句快速实现简单的MapRedu
kudu NoSQL数据库详解 wespten 数据库存储块存储文件存储对象存储分布式网络存储 ui
一、Hbase、Kudu和ClickHouse对比Hadoop生态圈中HDFS一直用来保存底层数据。Hbase作为一款Nosql也是Hadoop生态圈的核心组件，它海量的存储能力，优秀的随机读写能力，能够处理一些HDFS不足的地方。Clickhouse是一个用于联机分析(OLAP)的列式数据库管理系统(DBMS)。能够使用SQL查询实时生成分析数据报告。它同样拥有优秀的数据存储能力。ApacheK
2018-05-21 CrUelAnGElPG
1.hadoop是什么广义就是hadoop生态圈，狭义就是单指hadoop2.hadoop三大组件是什么?分别做什么hdfs是存储数据的，yarn是管理调度作业的，mr是计算处理的3.hdfs在部署时，要配置信任关系，请问root和hadoop用户部署时，区别是什么root的权限高，可以不用管，普通用户需要修改autoxx4.hdfs三个进程是什么namenode,datanode,seconda
Hadoop大数据实战系列文章之HDFS文件系统测试帮日记
Hadoop附带了一个名为HDFS(Hadoop分布式文件系统)的分布式文件系统，专门存储超大数据文件，为整个Hadoop生态圈提供了基础的存储服务。本章内容：1)HDFS文件系统的特点，以及不适用的场景2)HDFS文件系统重点知识点：体系架构和数据读写流程3)关于操作HDFS文件系统的一些基本用户命令1.HDFS特点：HDFS专为解决大数据存储问题而产生的，其具备了以下特点：1)HDFS文件系统
数据同步利器之seatunnel篇以茉萱大数据 etl
前言前面几篇文章分别介绍了hadoop生态圈的一些组件，但都是用来处理和接收消息的，虽然也具备同步数据的能力，但或多或少的都会涉及一些编程相关的知识，对于只是简单快速的数据同步需求来说，可能稍显麻烦，这时候就如果有一个数据同步的工具，只需修改下配置的模式，即可根据配置文件的不同来同步不同的数据，效率会提升很多，而且受众面会更广，不知道大家平时项目中都接触过哪些数据同步工具，我这边目前接触的比较多的
架构设计：远程调用服务架构设计及zookeeper技术详解 Java圈子
Hadoop是一个技术生态圈，zookeeper是hadoop生态圈里一个非常重要的技术。当我研究学习hadoop的相关技术时候，有两块知识曾经让我十分的困惑，一个是hbase，一个就是zookeeper。hbase的困惑源自于它在颠覆了我对数据库建模的理解，而zookeeper的困惑却是我无法理解它到底是干嘛的。远程调用服务的架构设计总述首先我们要再深入理解下为什么应用软件服务里需要一个远程调用
【Hadoop面试】Hadoop面试题汇总附答案话数Science 大数据 Hadoop 面试 hadoop 面试大数据
题目介绍下HadoopHadoop的特点说下Hadoop生态圈组件及其作用Hadoop主要分哪几个部分?他们有什么作用?Hadoop1.x，2x，3.x的区别Hadoop集群工作时启动哪些进程?它们有什么作用?在集群计算的时候，什么是集群的主要瓶颈搭建Hadoop集群的xml文件有哪些?Hadoop的checkpoint流程Hadoop的默认块大小是多少?为什么要设置这么大?Block划分的原因H
kudu由来、架构、数据存储结构、注意事项 AllenGd KUDU kudu
一、kudu背景介绍Kudu是Cloudera开源的新型列式存储系统，是ApacheHadoop生态圈的成员之一(incubating)，专门为了对快速变化的数据进行快速的分析，填补了以往Hadoop存储层的空缺。1.1一方面：在KUDU之前，大数据主要以两种方式存储；（1）静态数据：以HDFS引擎作为存储引擎，适用于高吞吐量的离线大数据分析场景。这类存储的局限性是数据无法进行随机的读写。（2）动
Hadoop 概述撕得失败的标签 Hadoop hadoop 大数据分布式 Hadoop生态圈
文章目录Hadoop概述Hadoop是什么Hadoop主要发展历程Hadoop优势Hadoop组成Hadoop1.x、2.x、3.x区别HDFS概述YARN概述MapReduce架构概述HDFS、YARN、MapReduce三者关系Hadoop生态圈Hadoop概述Hadoop是什么Hadoop是一个由Apache基金会开发的开源分布式计算框架，旨在处理和分析海量数据。它提供了对大数据进行存储、处
大数据Hadoop技术的发展历史与未来前景人工智能和大数据时代大数据 Hadoop
大数据概念火了又火，但是好多人对大数据的概念却一知半解，今天主要来细说下Hadoop：1.Hadoop是什么1）Hadoop是一个由Apache基金会所开发的分布式系统基础架构2）主要解决，海量数据的存储和海量数据的分析问题。3）广义上来说，HADOOP通常是指一个更广泛的概念——HADOOP生态圈2.Hadoop发展历史1）Lucene–DougCutting开创的开源软件，用java书写代码，
2.Spark运行模式想成为数据分析师的开发工程师 Spark框架 spark 大数据分布式
1.Spark运行模式概述Local多用于本地测试，如在IDEA、PyCharm、VisualStudioCode中写程序测试等。StandaloneStandalone是Spark自带的一个资源调度框架，它支持完全分布式。YarnHadoop生态圈里面的一个资源调度框架，Spark也是可以基于Yarn来计算的。Windows模式云服务模式（运行在云平台上）Kubernetes(K8S)容器模式S
HDFS、MapReduce原理--学习笔记祈愿lucky 大数据 hdfs mapreduce 学习
1.Hadoop框架1.1框架与Hadoop架构简介（1）广义解释从广义上来说，随着大数据开发技术的快速发展与逐步成熟，在行业里，Hadoop可以泛指为：Hadoop生态圈。也就是说，Hadoop指的是大数据生态圈整体。（2）狭义解释从狭义上来说，Hadoop是指Hadoop这个开源框架，它的核心组件有：a）HDFS（分布式文件系统）：解决海量数据存储；b）MapReduce（分布式计算）：解决海
05-Hadoop01之HDFS YuPangZa 大数据 hdfs hadoop 大数据
一、Hadoop介绍Hadoop分为三部分：Common、HDFS、Yarn、MapReduce(有点过时了)Hadoop生态圈：除了hadoop技术以外，还有hive、zookeeper、flume、sqoop、datax、azkaban等一系列技术。Hadoop是道格·卡丁本身他是Lucene的创始人。Lucene其实是一个jar包。检索现在主流的是Solr以及ES（ElasticSearch
3️⃣Hadoop WovJf hadoop 大数据分布式
1.Hadoop1.1.Hadoop是什么？分布式系统基础架构。主要解决海量数据的存储和海量数据的分析计算问题。Hadoop生态圈。1.2.Hadoop优势高可靠性：Hadoop底层维护多个数据副本，所以即使Hadoop某个计算元素或存储出现故障，也不会导致数据的丢失。【对数据存储的可靠性（将数据多备份几份）】高扩展性：在集群间分配任务数据，可方便的扩展数千计的节点。【如果我机器的资源不够，可以买
hadoop安装网址北辰Charih hadoop 大数据
Hadoop是什么1）Hadoop是一个有Apache基金会所开发的分布式系统基础架构。2）主要解决海量数据的存储和海量数据的分析计算问题。3）广义上来说，Hadoop通常是指一个更广泛的概念---Hadoop生态圈。Hadoop发行版本Hadoop发行的三个版本：Apache、Cloudera、Hortonworks。1）ApacheHadoop官网地址：http://hadoop.apache
hadoop生态圈-- 个人笔记学习05 HDFS优化 JamSlade Hadoop hadoop 笔记学习
DFSClient和DN在一个节点——localreads，远程阅读Remotereads。处理方式是一样的DN读数据通过RPC(TCP协议）把数据给DFSClient。DN在中间会做中转，处理简单但是性能收影响（Localread的情况下，会希望绕过DN直接读取Data，这就是短路短路本地读取DFSClient自行打开文件读取数据，需要配置白名单定义可读取数据的User——安全漏洞，不建议使用两
hadoop介绍部署文档王亭_666 运维数据库大数据 hadoop hdfs mapreduce 运维大数据
hadoop部署文档hadoop简介hadoop是什么1）Hadoop是一个由Apache基金会所开发的分布式系统基础架构。2）主要解决，海量数据的存储和海量数据的分析计算问题。3）广义上来说，Hadoop通常是指一个更广泛的概念——Hadoop生态圈。hadoop发展历史1）Lucene框架是DougCutting开创的开源软件，用Java书写代码，实现与Google类似的全文搜索功能，它提供了
大数据开发笔记（十）：Hbase实践 GoAI #Hbase 大数据笔记大数据 hadoop mysql zookeeper hbase
✨大数据开发笔记推荐：大数据开发面试知识点总结_GoAI的博客-CSDN博客_大数据开发面试本文详细介绍大数据hadoop生态圈各部分知识，包括不限于hdfs、yarn、mapreduce、hive、sqoop、kafka、flume、spark、flink等技术，总结内容适合大数据开发者学习，希望能够和大家多多交流。https://blog.csdn.net/qq_36816848/articl
大数据开发笔记（四）：Hive分区详解 GoAI #Hive 大数据笔记分区表大数据 hive
✨大数据开发笔记推荐：大数据开发面试知识点总结_GoAI的博客-CSDN博客_大数据开发面试本文详细介绍大数据hadoop生态圈各部分知识，包括不限于hdfs、yarn、mapreduce、hive、sqoop、kafka、flume、spark、flink等技术，总结内容适合大数据开发者学习，希望能够和大家多多交流。https://blog.csdn.net/qq_36816848/articl
Java实现的简单双向Map，支持重复Value superlxw1234 java 双向map
关键字：Java双向Map、DualHashBidiMap 有个需求，需要根据即时修改Map结构中的Value值，比如，将Map中所有value=V1的记录改成value=V2，key保持不变。数据量比较大，遍历Map性能太差，这就需要根据Value先找到Key，然后去修改。即：既要根据Key找Value，又要根据Value
PL/SQL触发器基础及例子百合不是茶 oracle数据库触发器 PL/SQL编程
触发器的简介; 触发器的定义就是说某个条件成立的时候，触发器里面所定义的语句就会被自动的执行。因此触发器不需要人为的去调用，也不能调用。触发器和过程函数类似过程函数必须要调用, 一个表中最多只能有12个触发器类型的,触发器和过程函数相似触发器不需要调用直接执行, 触发时间：指明触发器何时执行，该值可取： before：表示在数据库动作之前触发
[时空与探索]穿越时空的一些问题 comsci 问题
我们还没有进行过任何数学形式上的证明,仅仅是一个猜想..... 这个猜想就是; 任何有质量的物体(哪怕只有一微克)都不可能穿越时空,该物体强行穿越时空的时候,物体的质量会与时空粒子产生反应,物体会变成暗物质,也就是说,任何物体穿越时空会变成暗物质..(暗物质就我的理
easy ui datagrid上移下移一行商人shang js 上移下移 easyui datagrid
/** * 向上移动一行 * * @param dg * @param row */ function moveupRow(dg, row) { var datagrid = $(dg); var index = datagrid.datagrid("getRowIndex", row); if (isFirstRow(dg, row)) {
Java反射 oloz 反射
本人菜鸟，今天恰好有时间，写写博客，总结复习一下java反射方面的知识，欢迎大家探讨交流学习指教首先看看java中的Class package demo; public class ClassTest { /*先了解java中的Class*/ public static void main(String[] args) { //任何一个类都
springMVC 使用JSR-303 Validation验证杨白白 spring mvc
JSR-303是一个数据验证的规范，但是spring并没有对其进行实现，Hibernate Validator是实现了这一规范的，通过此这个实现来讲SpringMVC对JSR-303的支持。 JSR-303的校验是基于注解的，首先要把这些注解标记在需要验证的实体类的属性上或是其对应的get方法上。登录需要验证类 public class Login { @NotEmpty
log4j 香水浓 log4j
log4j.rootCategory=DEBUG, STDOUT, DAILYFILE, HTML, DATABASE #log4j.rootCategory=DEBUG, STDOUT, DAILYFILE, ROLLINGFILE, HTML #console log4j.appender.STDOUT=org.apache.log4j.ConsoleAppender log4
使用ajax和history.pushState无刷新改变页面URL agevs jquery 框架 Ajax html5 chrome
表现如果你使用chrome或者firefox等浏览器访问本博客、github.com、plus.google.com等网站时，细心的你会发现页面之间的点击是通过ajax异步请求的，同时页面的URL发生了了改变。并且能够很好的支持浏览器前进和后退。是什么有这么强大的功能呢？ HTML5里引用了新的API，history.pushState和history.replaceState，就是通过
centos中文乱码 AILIKES centos OS ssh
一、CentOS系统访问 g.cn ，发现中文乱码。于是用以前的方式：yum -y install fonts-chinese CentOS系统安装后，还是不能显示中文字体。我使用 gedit 编辑源码，其中文注释也为乱码。后来，终于找到以下方法可以解决，需要两个中文支持的包： fonts-chinese-3.02-12.
触发器 baalwolf 触发器
触发器(trigger)：监视某种情况，并触发某种操作。触发器创建语法四要素：1.监视地点(table) 2.监视事件(insert/update/delete) 3.触发时间(after/before) 4.触发事件(insert/update/delete) 语法： create trigger triggerName after/before
JS正则表达式的i m g bijian1013 JavaScript 正则表达式
g:表示全局（global)模式，即模式将被应用于所有字符串，而非在发现第一个匹配项时立即停止。 i:表示不区分大小写（case-insensitive）模式，即在确定匹配项时忽略模式与字符串的大小写。 m:表示
HTML5模式和Hashbang模式 bijian1013 JavaScript AngularJS Hashbang模式 HTML5模式
我们可以用$locationProvider来配置$location服务（可以采用注入的方式，就像AngularJS中其他所有东西一样）。这里provider的两个参数很有意思，介绍如下。 html5Mode 一个布尔值，标识$location服务是否运行在HTML5模式下。 ha
[Maven学习笔记六]Maven生命周期 bit1129 maven
从mvn test的输出开始说起当我们在user-core中执行mvn test时，执行的输出如下： /software/devsoftware/jdk1.7.0_55/bin/java -Dmaven.home=/software/devsoftware/apache-maven-3.2.1 -Dclassworlds.conf=/software/devs
【Hadoop七】基于Yarn的Hadoop Map Reduce容错 bit1129 hadoop
运行于Yarn的Map Reduce作业，可能发生失败的点包括 Task Failure Application Master Failure Node Manager Failure Resource Manager Failure 1. Task Failure 任务执行过程中产生的异常和JVM的意外终止会汇报给Application Master。僵死的任务也会被A
记一次数据推送的异常解决端口解决 ronin47 记一次数据推送的异常解决
　　需求：从db获取数据然后推送到B 程序开发完成，上jboss,刚开始报了很多错，逐一解决，可最后显示连接不到数据库。机房的同事说可以ping 通。　　自已画了个图，逐一排除，把linux 防火墙　和　setenforce　设置最低。　　　service iptables stop
巧用视错觉-UI更有趣 brotherlamp UI ui视频 ui教程 ui自学 ui资料
我们每个人在生活中都曾感受过视错觉（optical illusion）的魅力。视错觉现象是双眼跟我们开的一个玩笑，而我们往往还心甘情愿地接受我们看到的假象。其实不止如此，视觉错现象的背后还有一个重要的科学原理——格式塔原理。格式塔原理解释了人们如何以视觉方式感觉物体，以及图像的结构，视角，大小等要素是如何影响我们的视觉的。在下面这篇文章中，我们首先会简单介绍一下格式塔原理中的基本概念，
线段树-poj1177-N个矩形求边长（离散化+扫描线） bylijinnan 数据结构算法线段树
package com.ljn.base; import java.util.Arrays; import java.util.Comparator; import java.util.Set; import java.util.TreeSet; /** * POJ 1177 (线段树+离散化+扫描线)，题目链接为http://poj.org/problem?id=1177
HTTP协议详解 chicony http协议
引言
Scala设计模式 chenchao051 设计模式 scala
Scala设计模式我的话：在国外网站上看到一篇文章，里面详细描述了很多设计模式，并且用Java及Scala两种语言描述，清晰的让我们看到各种常规的设计模式，在Scala中是如何在语言特性层面直接支持的。基于文章很nice，我利用今天的空闲时间将其翻译，希望大家能一起学习，讨论。翻译
安装mysql daizj mysql 安装
安装mysql (1)删除linux上已经安装的mysql相关库信息。rpm -e xxxxxxx --nodeps (强制删除) 执行命令rpm -qa |grep mysql 检查是否删除干净 (2)执行命令 rpm -i MySQL-server-5.5.31-2.el
HTTP状态码大全 dcj3sjt126com http状态码
完整的 HTTP 1.1规范说明书来自于RFC 2616，你可以在http://www.talentdigger.cn/home/link.php?url=d3d3LnJmYy1lZGl0b3Iub3JnLw%3D%3D在线查阅。HTTP 1.1的状态码被标记为新特性，因为许多浏览器只支持 HTTP 1.0。你应只把状态码发送给支持 HTTP 1.1的客户端，支持协议版本可以通过调用request
asihttprequest上传图片 dcj3sjt126com ASIHTTPRequest
NSURL *url =@"yourURL"; ASIFormDataRequest*currentRequest =[ASIFormDataRequest requestWithURL:url]; [currentRequest setPostFormat:ASIMultipartFormDataPostFormat];[currentRequest se
C语言中，关键字static的作用 e200702084 C++c C#
在C语言中，关键字static有三个明显的作用： 1)在函数体，局部的static变量。生存期为程序的整个生命周期，（它存活多长时间）；作用域却在函数体内（它在什么地方能被访问（空间））。一个被声明为静态的变量在这一函数被调用过程中维持其值不变。因为它分配在静态存储区，函数调用结束后并不释放单元，但是在其它的作用域的无法访问。当再次调用这个函数时，这个局部的静态变量还存活，而且用在它的访
win7/8使用curl geeksun win7
1. WIN7/8下要使用curl，需要下载curl-7.20.0-win64-ssl-sspi.zip和Win64OpenSSL_Light-1_0_2d.exe。下载地址： http://curl.haxx.se/download.html 请选择不带SSL的版本，否则还需要安装SSL的支持包 2. 可以给Windows增加c
Creating a Shared Repository; Users Sharing The Repository hongtoushizi git
转载自： http://www.gitguys.com/topics/creating-a-shared-repository-users-sharing-the-repository/ Commands discussed in this section: git init –bare git clone git remote git pull git p
Java实现字符串反转的8种或9种方法 Josh_Persistence 异或反转递归反转二分交换反转 java字符串反转栈反转
注：对于第7种使用异或的方式来实现字符串的反转，如果不太看得明白的，可以参照另一篇博客： http://josh-persistence.iteye.com/blog/2205768 /** * */ package com.wsheng.aggregator.algorithm.string; import java.util.Stack; /**
代码实现任意容量倒水问题 home198979 PHP 算法倒水
形象化设计模式实战 HELLO!架构 redis命令源码解析倒水问题：有两个杯子，一个A升，一个B升，水有无限多，现要求利用这两杯子装C
Druid datasource zhb8015 druid
推荐大家使用数据库连接池 DruidDataSource. http://code.alibabatech.com/wiki/display/Druid/DruidDataSource DruidDataSource经过阿里巴巴数百个应用一年多生产环境运行验证，稳定可靠。它最重要的特点是：监控、扩展和性能。下载和Maven配置看这里： http
两种启动监听器ApplicationListener和ServletContextListener spjich java spring 框架
引言:有时候需要在项目初始化的时候进行一系列工作，比如初始化一个线程池，初始化配置文件，初始化缓存等等，这时候就需要用到启动监听器，下面分别介绍一下两种常用的项目启动监听器 ServletContextListener 特点: 依赖于sevlet容器，需要配置web.xml 使用方法: public class StartListener implements
JavaScript Rounding Methods of the Math object 何不笑 JavaScript Math
The next group of methods has to do with rounding decimal values into integers. Three methods — Math.ceil(), Math.floor(), and Math.round() — handle rounding in differen

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他