路漫漫小菜狗

虚拟机总结（大数据技术原理与应用概念、存储、处理、分析与应用(第2版)）

第一章大数据概论

2.信息科技为大数据时代提供技术支持:
①存储（存储设备容量不断增加）
②计算（CPU处理能力大幅提升）
③网络（网络带宽不断增加）
3.数据产生方式:运营式系统阶段 -> 用户原创内容阶段 -> 感知式系统阶段（物联网）
4.大数据
（1）是数据与大数据技术的综合体；
（2）特性（4V）:大量化、快速化、多样化、价值密度低；
（3）由结构化数据和非结构化数据组成；
（4）影响:全样而非样、效率而非精确、相关而非因果；
（5）技术层次:
①数据采集
②数据存储与管理（核心）
③数据处理与分析（核心）
④数据隐私与安全；
（6）大数据关键技术:①分布式存储:解决海量数据的存储问题②分布式处理；
（7）大数据计算模式

大数据计算模式	解决问题
批处理计算	针对大规模数据的批量处理
流计算	针对流数据的实时计算，实时响应
图计算	针对大规模图结构数据的处理
查询分析计算	大规模数据的存储管理和查询分析

5.科学研究的四种范式:实验科学、理论科学、计算科学、数据密集型科学
6.云计算
（1）是通过网络以服务的方式为用户提供非常廉价的IT资源；
（2）解决分布式存储与分布式处理的问题；
（3）典型特征（虚拟化和多租户）；
（4）模式（公有云、混合云、私有云）；
（5）层次:
①面向网络架构师 -> 基础设施即服务IaaS、
②面向应用开发者 -> 平台即服务PaaS、
③面向用户 -> 软件即服务SaaS
7.物联网
（1）层次架构（感知层、网络层、处理层、应用层）；
（2）关键技术:①识别和感知技术（二维码、RFID）②网络与通信技术③数据挖掘与融合技术
8.三者之间的关系

第二章大数据处理架构Hadoop

（可以断网安装虚拟机默认是国内源，连接网络安装默认是国外源比较慢）
1.用VMware Workstation安装Linux18.04
（1）安装Linux18.04我选择了清理整个磁盘并安装Ubuntu，并没有选择分区（这样做需要把虚拟机安装在一个空文件夹里）不能跳过安装！！！虽然下载慢但是不能跳过，第一次因为跳过安装失败
（2）配置hadoop时那些安装包只需将他们拖入终端就可以有他们的名称不需要手打，或者输入前几个字母用tab补全（之前是手打名称，系统不能识别找不到文件）
（3）JAVA和hadoop都要配置路径加入到path中去，不把hadoop加入路径，输入./sbin/start-dfs.sh是无效的。记住hadoop的路径（直接输入./sbin/start-dfs.sh〈启动namenodes,datanodes,secondary namenodes〉不能找到文件，所以得在hadoop路径里输入）
（4）web界面打不开（终端输入hostname发现是ubuntu，把localhost改成ubuntu输入http://ubuntu:50070还是打不开。最后输入http://ubuntu:9870和http://ubuntu:8088〈这个需要输入./sbin/start-yarn.sh启动resourcemanager〉打开了界面）
（5）为了安装搜狗输入法得先安装fcitx，然后更改系统语言为中文（一直中文包没下载成功，以为是没有联网，打开浏览器却能上网。于是换了国内源，下载成功中文包，换了fcitx安装搜狗输入法成功）
2.用Oracle VM VirtualBox安装Linux16.04
（1）一样没分区（因为分区页面的下半部分一直没办法上拖，按住Alt键也不能拖动，最后就放弃了）
（2）安装系统时间比VMware Workstation慢了很多，语言包比较齐全而且直接可以选择中文界面，不用再去下载中文包，更换国内源
（3）安装系统比较方便，但是一些设置基本找不到，个人还是觉得VMware Workstation比较好用
3.hadoop
（1）两大核心 -> HDFS+MapReduce；
（2）特性:高可靠性、高效率、高可扩展性、成本低、运行在Linux平台、支持多种编程语言；
（3）生态系统:HDFS、HBase、MapReduce、HIVE、Pig、Mahout、Zookeeper、Flume、Sqoop、Ambari

第三章分布式文件系统HDFS

1.实现目标:
①兼容廉价的硬件设备
②实现流数据读写
③支持大数据集
④支持简单的文件模型
⑤强大的跨平台兼容性
2.局限性:不适合低延迟数据访问、无法高效储存大量小文件、不支持多用户写入及任意修改文件
3.块（HDFS最核心概念）
（1）目的（为了支持面向大规模数据存储，降低分布式节点的寻址开销）
（2）缺点（如果块过大会导致MapReduce只有少量任务在执行，完全牺牲了MapReduce的并行度，发挥不了分布式并行处理的效果）
（3）HDFS采用块的好处（支持大规模文件存储、简化系统设计、适合数据备份）
4.HDFS两大组件
（1）名称节点（整个HDFS集群的管家）
①FsImage（保存系统文件树）
文件的复制等级、修改和访问时间、访问权限、块大小以及组成文件的块
②EditLog（记录对数据进行的诸如创建、删除、重命名等操作）
③EditLog不断增大，第二名称节点（名称节点的冷备份，对EditLog的处理）定期和名称节点进行通信，停止使用EditLog文件
（2）数据节点（存储实际数据）
存取数据，把它们保存到Linux本地文件里
5.HDFS体系结构局限性
（1）命名空间限制（名称节点是保存在内存中的，因此，名称节点能够容纳的对象〈文件、块〉的个数会受到空间大小限制）
（2）性能的瓶颈（整个分布式文件的吞吐量受限于单个名称节点的吞吐量）
（3）隔离问题（由于集群中只有一个名称节点，只有一个命名空间，因此无法对不同应用程序进行隔离）
（4）集群的可用性（一旦这个唯一的名称节点发生故障，会导致整个集群变得不可用）
6.HDFS存储原理
（1）冗余数据保存的问题
①加快数据传输速度
②很容易检查数据错误
③保证数据可靠性
（2）数据保存策略问题
①数据存放
②数据读取（就近原则）
（3）数据恢复问题
①名称节点出错（通过第二名称节点恢复）
②数据节点出错（数据节点通过远程调用把心脏信息不断发给名称信息，若收不到信息则数据节点发生故障，此时名称节点把它标记为宕机，名称节点把故障数据节点的数据的备份复制一份就可以恢复）
③数据本身出错（计算的校验码与之前的校验码不同则出错）
7.HDFS读数据过程
（1）打开文件（HDFS客户端向DistributedFileSystem）
（2）获取数据块信息（FSDataInputStream向名称节点沟通）
（3）读取请求（名称节点返回数据位置给客户端，HDFS客户端向FSDataInputStream）
（4）读取数据（FSDataInputStream向数据节点）
（5）获取数据块信息（可能发生，FSDataInputStream向名称节点沟通）
（6）读取数据（FSDataInputStream向数据节点）
（7）关闭文件（HDFS客户端向FSDataInputStream）
8.HDFS写数据过程
（1）创建文件请求（HDFS客户端向DistributedFileSystem）
（2）创建文件元数据（FSDataOutputStream向名称节点，名称节点检查是否存在文件是否有权限）
（3）写入数据（HDFS客户端向FSDataOutputStream）
（4）写入数据包（FSDataOutputStream向数据节点）
（5）接收确认数据包（数据节点向FSDataOutputStream）
（6）关闭文件（HDFS客户端向FSDataOutputStream）
（7）写操作完成（FSDataOutputStream向名称节点）
9.运行代码提示hadoop本地库和平台不匹配:重新导入jar包，并导入hadoop-hdfs-client-3.1.1.jar就可以了

第四章分布式数据库HBase

1.分布式数据库可以用来存储非结构化和半结构化的松散数据
特性：高可靠，高性能，面向列，可伸缩
底层分布式文件系统 -> 存储完全非结构化的数据
HBase -> 允许几千台服务器存储海量文件
2.Hadoop主要解决大规模数据离线批量处理，但是Hadoop没办法满足大数据实时处理需求，随着数据大规模爆炸式增长，传统关系型数据库的扩展能力非常有限。
3.HBase和传统关系数据库的联系与区别
（1）数据类型：传统关系数据库是关系数据模型；
（2）数据操作：关系数据库定了很多数据操作；
（3）存储模式：关系数据库基于行模式存储，HBase基于列存储；
（4）数据索引：关系数据库可以直接针对各个不同的列，构建复杂的索引，HBase只支持对行键的简单索引；
（5）数据维护：关系数据库做更新时，实际上里面的值会被新值覆盖，HBase在这方面不存在覆盖；
（6）可伸缩性：关系数据库很难实现水平扩展，最多实现纵向扩展
4.HBase访问接口
（1）提供一个原生Java API{shell命令、Thrift Gateway方式、REST Gateway}
（2）提供SQL类型接口{Pig、数据仓库产品Hive}
5.HBase是一个稀疏的多维度的排序的映射表。
（1）列限定符（列）；
（2）每个值都是未经解释的字符串也就是bytes数组；
（3）一个行可以有一个行键和任意多个列；
（4）列族（支持动态扩展，保留旧版本）
列限定符、行键、列族、时间戳（新版本会通过时间戳来进行区分）
6.数据坐标
（1）HBase对数据定位{采用四维坐标来定位、必须确定行键列族列限定符时间戳、键值数据库}
（2）传统的关系数据库的定位{只要通过一个行一个列这两个维度就可以确定一个唯一得到数据、Excel表格就类似于关系数据库}
7.HBase采用列式存储可以带来很高的数据压缩率（一列的数据类型很相似，适用于分析数据）；传统关系数据库采用行式存储不可能达到很高的数据压缩率（一行的数据类型极有可能不同，适用于事务型操作多）
8.功能组件
（1）库函数（一般用于链接每个客户端）
（2）Master服务器（充当管家的作用->分区信息进行维护和管理，维护了一个Region服务器列表，整个集群当中有哪些Region服务器在工作，负责对Region进行分配，负载平衡）
（3）Region服务器（负责存储不同的Region）
9.HBase三层结构
（1）第一层:Zookeeper文件（记录-ROOT-表的位置）
（2）第二层:-ROOT-表（记录.META.表的Region位置信息-ROOT-表只能有一个Region。通过-ROOT-表，就可以访问.META.表中数据）
（3）第三层:.META.表（记录了用户数据表的Region位置信息，.META.表可以有多个Region，保存了HBase中所有用户数据表的Region位置信息）
10.HBase系统架构
（1）客户端（为了加快访问速度->访问HBase的接口）
（2）Zookeeper（实现协同管理服务、提供管家功能<维护和管理整个HBase集群>）
（3）Master（①对表增删改查②负责不同Region服务器的负载均衡③负责调整分裂、合并后Region的分布④负责重新分配故障、失效的Region服务器，也要借助于Master来进行重新分配）
11.性能优化方法
（1）时间靠近的数据都存在一起->时间戳->{按升序排序、越到后面时间戳会越大、长整型变量64位}
（2）用系统最大的整型值减去时间戳->排序就反过来了从而改变了排序的顺序
12.提升读写性能
（1）设置HColumnDescriptor.setlnMemory选项为true
（2）把相关的表放到Region服务器的缓存中，根据需要来决定是否放入缓存

第五章 NoSQL数据库

1.NoSQL数据库特点
灵活的可扩展性、灵活的数据模型、和云计算紧密结合
2.关系数据库
优点：非常完备的关系理论基础、具有事务性机制的支持、高效的查询优化机制、有严格的标准
不足：①无法满足海量数据的管理需求②无法满足高并发的需求③无法满足高可扩展性和高可用性的需求
3.MySQL集群方式的缺陷
①复杂性，整个集群部署管理配置都非常复杂
②延迟性，当主库压力较大时，就会带来较大的延迟
③扩容问题，整个集群压力过大时，需要增加新机器对整个数据集进行重新分区，非常复杂
4.NoSQL兴起原因：①关系型数据库无法满足为web2.0的需求②数据模型局限性③web2.0关系型数据库许多特性没有发挥
5.NoSQL与关系数据库的比较

6.NoSQL四大类型
（1）键值数据库
可以成为理想的缓冲层解决方案

键值数据库	说明
相关产品	Redis,Riak,SimpleDB,Chordless,Scalaris,Memcached
数据模型	键/值对，键是一个字符串对象，值可以是任意类型的数据，如：整型、字符型、数组、列表、集合等
典型应用	涉及频繁读写，拥有简单数据模型的应用；内容缓存，如：会话、配置文件、参数、购物车等；存储配置和用户数据信息等移动应用
优点	扩展性好，灵活性好，大量写操作性能高
缺点	无法存储结构化信息，条件查询效率较低
不适用情形	没有通过值查询的途径；不能通过两个及以上的键来关联数据；在一些键值数据库中产生故障时不可以回滚

（2）列族数据库

列族数据库	说明
相关产品	BigTable,HBase,Cassandra,HadoopDB,GreenPlum,PNUTS
数据模型	列族
典型应用	分布式数据存储与管理；数据在地理上分布于多个数据中心的应用程序；可以容忍副本中存在短期不一致情况的应用程序；拥有动态字段的应用程序
优点	查找速度快、可扩展性强、容易进行分布式扩展、复杂性低
缺点	功能较少，大都不支持强事务一致性
不适用情形	需要ACID事务支持的情形Cassandra等产品就不适用

(3)文档数据库
特性:能够将它自己的数据的内容和类型进行自我描述
数据结构:JSON数据格式

文档数据库	说明
相关产品	CouchDB,MongoDB,Terrastore,ThruDB,RavenDB,SisoDB,RaptorDB,CloudKit,Perservere,Jackrabbit
数据模型	版本化文档，就是一个键值，本质上是一个键值数据库
典型应用	存储、索引并管理面向文档的数据或者类似的半结构化数据
优点	性能好（高并发），灵活性高；提供嵌入式文档功能，将经常查看的数据存储在同一个文档中
缺点	缺乏统一的查询语句
不适用情形	不支持文档间的事务，如果对这方面有需求，则不应该选取这个解决方案

(4)图数据库

图数据库	说明
相关产品	Neo4j,OrientDB,InfoGrid,Infinite Graph,GraphDB
数据模型	图结构
典型应用	专门用于处理具有高度相互关联关系的数据，比较适合于社交网络、模式识别、依赖分析、推荐系统以及路径寻找等问题
优点	灵活性高，支持复杂的图形算法，可用于构建复杂的关系图谱
缺点	数据模型应用范围非常有限

7.NoSQL三大理论基石
（1）CAP理论
C:一致性，任何一个读操作总是能够读到之前完成的写操作的结果
A：可用性，快速获取数据，可以在确定的时间内返回操作结果
P：分区容忍性，当出现网络分区的情况时（即系统中的一部分节点无法和其他节点进行通信），分离的系统也能够正常运行
（2）BASE
①基本可用
②软状态
③最终一致性
（3）最终一致性
①因果一致性
②读己之所写一致性
③会话一致性
④单调读一致性
⑤单调写一致性
8.NoSQL->NewSQL（一种架构支持多类应用->多架构支持多类应用）

第六章云数据库

1.云计算概念：通过网络以服务的方式为用户提供非常廉价的IT资源
2.云计算八大优势：
（1）按需服务
（2）随时服务
（3）通用性
（4）高可靠性
（5）极其廉价
（6）超大规模
（7）虚拟化
（8）高可扩展性
3.云数据库特性
（1）动态可扩展
（2）高可用性
（3）较低的使用代价
（4）易用性
（5）高性能
（6）免维护
（7）安全
4.个性化存储需求：大企业海量数据储存需求，中小企业低成本数据存储需求，企业动态变化存储需求
5.云数据库产品
Amazon-> 亚马逊RDS、SimpleDB、DynamoDB、Amazon ElastiCache
谷歌Google -> Google Cloud SQL
微软Microsoft -> Microsoft SQL Azure
6.UMP系统
（1）整个系统保持单一的对外访问入口
（2）消除单点故障，保证服务的高可用性
（3）具有良好的可伸缩，能够动态地增加、减少计算资源
（4）可以实现资源之间的相互隔离
7.UMP系统架构
（1）Mnesia
①是一个分布式数据库管理系统
②支持事务，支持透明的数据分片，利用两阶段锁实现分布式事务，可以线性扩展到至少50个节点③Mnesia的数据库模式（schema）可在运行时动态重配置
（2）RabbitMQ：是一个工业级的消息队列产品
（3）ZooKeeper：高效可靠的协调服务（统一命名服务、状态同步服务、集群管理）
①作为全局的配置服务器
②提供分布式锁（选出一个集群的“总管”）
③监控所有MySQL实例
（5）LVS：即Linux虚拟服务器，是一个虚拟的服务器集群系统
①实现集群内部的负载均衡
②采用IP负载均衡技术和基于内容请求分发技术
③调度器是LVS集群系统的唯一入口④整个服务器集群的结构对客户是透明的
（5）Controller服务器：UMP集群的总管（集群成员的管理、元数据的存储、MySQL实例管理、故障恢复、备份迁移扩容），
为了避免单点故障 -> 设置了多个Controller服务器
|
|
ZooKeeper服务器 -> 确定总管 -> 提供对外服务
（6）Web控制台：向用户提供系统管理界面
（7）Proxy服务器
①向用户提供访问MySQL数据库的服务
②使用MySQL数据库时下载客户端、连接MySQL服务器，
MySQL客户端-> Proxy服务器 ->( 用户的认证信息、后台MySQL实例地址、资源配额的限制）
（8）Agent服务器：部署在运行MySQL进程的机器上用来管理每台物理机上的MySQL实例
（9）日志分析服务器：对整个日志进行分析
（10）信息统计服务器 -> 系统运营数据->(用户连接数、MySQL实例进程状态、每秒查询数（QPS）)
（11）愚公系统
①数据迁移
②系统允许在不停机的情况下，可以实现动态的扩容、缩容、迁移
8.UMP系统功能
（1）容灾
①是云数据库必须具备的基础功能
②为实现容灾UMP系统会为每个用户创建两个MySQL实例（主库、从库）
（2）读写分离
①充分利用主从库实现用户读写操作的分离，实现负载均衡
②SQL语句查询（写操作直接发送到主库；读操作被均衡地发送到主库和从库上执行）
（3）分库分表
①Proxy服务器解析用户SQL语句，提取出重写和分发SQL语句所需要的信息
②对SQL语句进行重写，得到多个针对相应MySQL实例的子语句，分发到对应的MySQL实例上执行
③接受来自各个MySQL实例的SQL语句执行结果合并得到最终结果
（4）资源管理
（5）资源调度
①小规模用户：多个用户共享一个MySQL实例
②中等用户：每个用户独占一个MySQL实例
③分库分表用户：占有多个独立MySQL实例
（6）资源隔离
（7）数据安全
①SSL数据库连接
②提供数据访问IP白名单
③记录用户操作日志
④SQL拦截
9.Amazon AWS上的云数据库服务
（1）关系数据库服务RDS
（2）键值数据库SimpleDB
（3）NoSQL 数据库DynamoDB
（4）数据仓库Redshift
（5）分布式内存缓存ElastiCache
10.微软云数据库SQL Azure
（1）SQL Server实例
（2）全局分区管理器：维护分区映射表信息
（3）协议网关：负责将用户的数据库连接请求转发到相应的主分区上
（4）分布式基础部件

第七章MapReduce

1.MapReduce是一种分布式并行编程框架
2.适合用MapReduce来处理的数据集需要满足的一个前提条件：待处理的数据集可以分解成许多小的数据集，而且每一个小数据集都可以完全并行地进行处理
3.Map和Reduce

4.MapReduce的策略
（1）MapReduce采用分而治之
（2）把非常庞大的数据集，切分成非常多的独立的小分片
（3）为每个分片单独地启动一个map任务
（4）最终通过多个map任务，并行地在多个机器上去处理
5.MapReduce的理念
（1）计算向数据靠拢而不是数据向计算靠拢
（2）要完成一次数据分析时，选择一个计算节点，把运行数据分析的程序放到计算节点上运行
（3）然后把它所涉及的数据，全部从各个不同节点上面拉过来，传输到计算发生的地方
6.MapReduce的结构体系
（1）Client（客户端）
①通过Client可以提交用户编写的应用程序，用户通过它将应用程序交到JobTracker端
②通过这些Client，用户也可以通过它提供的一些接口去查看当前提交作业的运行状态
（2）JobTracker（作业跟踪器）
①负责资源的监控和作业的调度
②监控底层的其他TaskTracker以及当前运行的Job的健康状况
③一旦检测到失败的情况就把这个任务转移到其他节点，继续执行跟踪任务执行进度和资源使用量
（3）TaskTracker（任务调度器）
①执行具体的相关任务，一般接受JobTracker发送过来的命令
②把一些自己的资源使用情况，以及任务的运行进度通过心跳的方式，也就是heartbeat发送给JobTracker，同时接收JobTracker发送过来的命令并执行相应的操作
③TaskTracker使用slot等量划分本节点的资源量（CPU、内存等），一个Task获取到一个slot后才有机会运行，而Hadoop调度器的作用就是将各个TaskTracker上的空闲slot分配给Task使用，slot分为Map slot和Reduce slot，分别供Map Task和Reduce Task使用
（4）Task（任务）
一台机器可以同时运行Map Task和Reduce Task，均由TaskTracker启动

7.MapReduce工作流程
（1）①不同的Map任务之间不会进行通信
②不同的Reduce任务之间也不会发生任何信息交换
③用户不能显式地从一台机器向另一台机器发送消息
④所有数据交换都是通过MapReduce框架自身去是实现的
（2）split分片
HDFS 以固定大小的block为基本单位存储数据，MapReduce处理单位是split，split包含一些元数据信息（数据起始位置、数据长度、数据所在结点等），它的划分由用户自己定义
（3）Map任务数量
Hadoop为每个split创建一个Map任务，split的多少决定了Map任务的数目，大多数情况下，理想的分片大小是一个HDFS块
（4）Reduce任务数量
最优的Reduce任务个数取决于集群中可用的reduce任务槽（slot）的数目，通常设置比reduce任务槽数目稍小一些的Reduce任务个数（预留系统资源处理可能发生的错误）
8.Map端的Shuffle过程
（1）输入数据和执行Map任务
（2）写入缓存
（3）溢写（分区、排序、合并）
（4）文件归并
9.Reduce端的Shuffle过程
（1）“领取”数据
（2）归并数据
（3）把数据输入给Reduce任务
10.MapReduce应用程序执行过程
（1）程序部署
（2）执行map任务，执行reduce任务
（3）读数据，键值对
（4）本地写数据
（5）远程读数据
（6）写数据
11.MaprReduce具体应用
（1）关系的选择运算
（2）关系的投影运算
（3）关系的并、交、差运算
（4）关系的自然连接运算
12.MapReduce编程实践
（1）编写Map处理逻辑，输入，输出<单词，出现次数>
（2）编写Reduce处理逻辑，输入
（3）编写main方法
（4）编译打包代码以及运行程序，编译成可执行程序，生成.class文件，把.class文件打包成jar包，启动hadoop运行jar包，查看结果
13.在hadoop中执行MapReduce任务的方式
（1）hadoop jar
（2）Pig
（3）Hive
（4）Python
（5）shell脚本
11.MaprReduce具体应用
（1）关系的选择运算
（2）关系的投影运算
（3）关系的并、交、差运算
（4）关系的自然连接运算
12.MapReduce编程实践
（1）编写Map处理逻辑，输入，输出<单词，出现次数>
（2）编写Reduce处理逻辑，输入
（3）编写main方法
（4）编译打包代码以及运行程序，编译成可执行程序，生成.class文件，把.class文件打包成jar包，启动hadoop运行jar包，查看结果
13.在hadoop中执行MapReduce任务的方式
（1）hadoop jar
（2）Pig
（3）Hive
（4）Python
（5）shell脚本
14.WordCount.java

import java.io.IOException;
import java.util.Iterator;
import java.util.StringTokenizer;
import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.io.IntWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Job;
import org.apache.hadoop.mapreduce.Mapper;
import org.apache.hadoop.mapreduce.Reducer;
import org.apache.hadoop.mapreduce.lib.input.FileInputFormat;
import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat;
import org.apache.hadoop.util.GenericOptionsParser;
public class WordCount {
    public WordCount() {
    }
    public static void main(String[] args) throws Exception {
        Configuration conf = new Configuration();
        String[] otherArgs = (new GenericOptionsParser(conf, args)).getRemainingArgs();
        if(otherArgs.length < 2) {
            System.err.println("Usage: wordcount  [...] ");
            System.exit(2);
        }
        Job job = Job.getInstance(conf, "word count");
        job.setJarByClass(WordCount.class);
        job.setMapperClass(WordCount.TokenizerMapper.class);
        job.setCombinerClass(WordCount.IntSumReducer.class);
        job.setReducerClass(WordCount.IntSumReducer.class);
        job.setOutputKeyClass(Text.class);
        job.setOutputValueClass(IntWritable.class);
        for(int i = 0; i < otherArgs.length - 1; ++i) {
            FileInputFormat.addInputPath(job, new Path(otherArgs[i]));
        }
        FileOutputFormat.setOutputPath(job, new Path(otherArgs[otherArgs.length - 1]));
        System.exit(job.waitForCompletion(true)?0:1);
    }
    public static class IntSumReducer extends Reducer<Text, IntWritable, Text, IntWritable> {
        private IntWritable result = new IntWritable();
        public IntSumReducer() {
        }
        public void reduce(Text key, Iterable<IntWritable> values, Reducer<Text, IntWritable, Text, IntWritable>.Context context) throws IOException, InterruptedException {
            int sum = 0;
            IntWritable val;
            for(Iterator i$ = values.iterator(); i$.hasNext(); sum += val.get()) {
                val = (IntWritable)i$.next();
            }
            this.result.set(sum);
            context.write(key, this.result);
        }
    }
    public static class TokenizerMapper extends Mapper<Object, Text, Text, IntWritable> {
        private static final IntWritable one = new IntWritable(1);
        private Text word = new Text();
        public TokenizerMapper() {
        }
        public void map(Object key, Text value, Mapper<Object, Text, Text, IntWritable>.Context context) throws IOException, InterruptedException {
            StringTokenizer itr = new StringTokenizer(value.toString());
            while(itr.hasMoreTokens()) {
                this.word.set(itr.nextToken());
                context.write(this.word, one);
            }
        }
    }
}

15.使用命令行编译打包运行MapReduce程序（Hadoop3.1.3伪分布式）
（1）新建wordcount文件夹，编写WordCount.java文件
（2）在wordcount目录里运行javac WordCount.java，把生成的.class打包成jar，在wordcount目录里运行jar -cvf WordCount.jar ./WordCount*.class
（3）在hadoop/home目录里新建input目录，新建文件file0和file1，文件内容如下：

（4）把本地目录input里的文件上传到伪分布式HDFS上的input目录里，运行打包的WordCount.jar，输入文件为HDFS里的input，输出为HDFS里的output（如果没有output电脑会自己建立）

（5）读取output里的part-r-00000文件就可以知道统计单词结果

（6）如果是运行Hadoop自带的wordcount单词统计程序：
第四步里运行WordCount.jar,不用自己打包的WordCount.jar，直接用Hadoop自带的例子，把WordCount.jar换成/usr/local/hadoop/share/hadoop/mapreduce/hadoop-mapreduce-examples-3.1.3.jar；不用自己写的WordCount方法，直接调用Hadoop自带的wordcount方法，把org/apache/hadoop/examples/WordCount换成wordcount

你可能感兴趣的:(虚拟机)

简单了解 JVM 记得开心一点啊 jvm
目录♫什么是JVM♫JVM的运行流程♫JVM运行时数据区♪虚拟机栈♪本地方法栈♪堆♪程序计数器♪方法区/元数据区♫类加载的过程♫双亲委派模型♫垃圾回收机制♫什么是JVMJVM是JavaVirtualMachine的简称，意为Java虚拟机。虚拟机是指通过软件模拟的具有完整硬件功能的、运行在一个完全隔离的环境中的完整计算机系统（如：JVM、VMwave、VirtualBox）。JVM和其他两个虚拟机
JVM、JRE和 JDK：理解Java开发的三大核心组件 Y雨何时停T Java java
Java是一门跨平台的编程语言，它的成功离不开背后强大的运行环境与开发工具的支持。在Java的生态中，JVM（Java虚拟机）、JRE（Java运行时环境）和JDK（Java开发工具包）是三个至关重要的核心组件。本文将探讨JVM、JDK和JRE的区别，帮助你更好地理解Java的运行机制。1.JVM：Java虚拟机（JavaVirtualMachine）什么是JVM？JVM，即Java虚拟机，是Ja
第1步win10宿主机与虚拟机通过NAT共享上网互通学习3人组大数据大数据
VM的CentOS采用NAT共用宿主机网卡宿主机器无法连接到虚拟CentOS要实现宿主机与虚拟机通信，原理就是给宿主机的网卡配置一个与虚拟机网关相同网段的IP地址，实现可以互通。1、查看虚拟机的IP地址2、编辑虚拟机的虚拟网络的NAT和DHCP的配置，设置虚拟机的网卡选择NAT共享模式3、宿主机的IP配置，确保vnet8的IPV4属性与虚拟机在同一网段4、ping测试连通性[root@localh
KVM虚拟机源代码分析【转】 xidianjiapei001 #虚拟化技术
1.KVM结构及工作原理1.1KVM结构KVM基本结构有两部分组成。一个是KVMDriver，已经成为Linux内核的一个模块。负责虚拟机的创建，虚拟内存的分配，虚拟CPU寄存器的读写以及虚拟CPU的运行等。另外一个是稍微修改过的Qemu，用于模拟PC硬件的用户空间组件，提供I/O设备模型以及访问外设的途径。KVM基本结构如图1所示。其中KVM加入到标准的Linux内核中，被组织成Linux中标准
KVM+GFS分布式存储系统构建KVM高可用 henan程序媛分布式 GFS 高可用 KVM
一、案列分析1.1案列概述本章案例主要使用之前章节所学的KVM及GlusterFs技术,结合起来从而实现KVM高可用。利用GlusterFs分布式复制卷，对KVM虚拟机文件进行分布存储和冗余。分布式复制卷主要用于需要冗余的情况下把一个文件存放在两个或两个以上的节点,当其中一个节点数据丢失或者损坏之后，KVM仍然能够通过卷组找到另一节点上存储的虚拟机文件，以保证虚拟机正常运行。当节点修复之后，Glu
Docker学习十一：Kubernetes概述爱打羽球的程序猿 Docker学习系列 docker kubernetes 学习
一、Kubernetes简介2006年，Google提出了云计算的概念，当时的云计算领域还是以虚拟机为代表的云平台。2013年，Docker横空出世，Docker提出了镜像、仓库等核心概念，规范了服务的交付标准，使得复杂服务的落地变得更加简单，之后Docker又定义了OCI标准，Docker在容器领域称为事实的标准。但是，Docker诞生只是帮助定义了开发和交付标准，如果想要在生产环境中大批量的使
synchronized锁升级过程 liang8999 java jvm 开发语言
一、synchronized锁加到什么地方synchronized上锁，其实锁信息是加在对象头中的markdown，对象中的前四个字节表示markdown；markdown还记录了对象的gc、hashcode信息注意：markdown结构与jvm虚拟机的实现有关，I）32位Hotspot虚拟机markdown结构如下：II）64位Hotspot虚拟机的markdown结构如下：二、synchron
Java面试题--JVM大厂篇之深入解析JVM中的Serial GC：工作原理与代际区别青云交 Java大厂面试题 Java虚拟机（JVM）专栏 Java技术栈 Serial GC工作原理年轻代垃圾回收Minor GC 老年代垃圾回收 MajorGC FullGC 年轻代和老年代的区别 SerialGC垃圾收集器单线程垃圾收集器
目录引言：正文：一、SerialGC工作原理年轻代垃圾回收（MinorGC）：老年代垃圾回收（MajorGC或FullGC）：二、年轻代和老年代的区别年轻代（YoungGeneration）：老年代（OldGeneration）：结束语：引言：Java虚拟机（JVM）作为Java程序的运行环境，其性能和稳定性在很大程度上依赖于垃圾收集器（GC）的效率。SerialGC是JVM中最古老也是最简单的一
JAVA相关知识 M_灵均 java jvm 开发语言
JAVA基础知识说一下对象创建的过程？类加载检查：当Java虚拟机（JVM）遇到一个类的new指令时，它首先检查这个类是否已经被加载、链接和初始化。如果没有，JVM会通过类加载器（ClassLoader）加载这个类。分配内存：JVM为新对象分配内存。这个内存分配是在堆（Heap）上进行的，堆是JVM用来存储对象实例的地方。分配内存的大小在类加载时就已经确定，因为类的结构（包括字段和方法）已经确定。
在 Mac 上安装双系统会影响性能吗，安装双系统会清除数据吗？星空爱忆 Parallels Mac
在Mac系统安装并使用双系统已经成为了许多用户办公的选择之一，双系统可以让用户在Mac上同时运行Windows或其他操作系统。然而，许多用户担心这样做会对Mac的性能产生影响。接下来将给大家介绍Mac装双系统会影响性能吗，Mac装双系统会清空数据吗的具体内容。Mac装双系统会影响性能吗当我们使用Mac装双系统时，需要使用专业的虚拟机软件。安装完成的Windows系统需要借助虚拟机软件才能够在mac
Mac上有哪些虚拟机软件？性能兼容性都怎么样该如何下载安装 Hot1422 macos windows
Mac上常用的虚拟机软件大概有三个，一个是VMwareFusionVM虚拟机，一个是ParallelsDesktopPD虚拟机，还有一个是CrossOver其中PD与VM都是纯正的虚拟机软件，通过安装windows操作系统来运行windows软件，而CrossOver是无需安装操作系统的，但兼容性比较差，下面详细介绍一下：ParallelsDesktop（PD虚拟机）PD虚拟机对于RAM架构的Ma
在Mac上更好的运行Windows，推荐这几款Mac虚拟机 mac运行windows虚拟机性能是软妹子呀果粉新潮 macos Mac运行Windows 虚拟机软件开源软件
想要在MacOS上更好的运行Windows系统吗？推荐你使用mac虚拟机。虚拟机通过生成现有操作系统的全新虚拟镜像，它具有真实windows系统完全一样的功能，进入虚拟系统后，所有操作都是在这个全新的独立的虚拟系统里面进行，可以独立安装运行软件，保存数据，拥有自己的独立桌面，不会对真正的系统产生任何影响。ParallelsDesktop19forMac虚拟机ParallelsDesktop是一款功
Java中的垃圾回收机制是如何工作的？ Good_tea_h java jvm 算法
Java中的垃圾回收机制（GarbageCollection,GC）是Java虚拟机（JVM）的一个重要组成部分，它负责自动管理内存的分配和释放，以减轻程序员在内存管理方面的负担，并防止内存泄漏和内存溢出等问题。一、垃圾回收机制的核心思想Java的垃圾回收机制主要基于两个核心思想：标记和回收。标记：垃圾收集器会定期自动扫描内存中的对象，根据特定的算法（如可达性分析法）来判断哪些对象已经不再被程序使
Android 开发必备知识点整理(1) 2401_84123113 程序员 android arm开发
1.虚拟机栈/本地方法栈中引用的对象2.方法区中常量/静态变量引用的对象四种引用强引用：不会被回收软引用：内存不足时会被回收弱引用：gc时会被回收虚引用：无法通过虚引用得到对象，可以监听对象的回收ClassLoader类的生命周期：1.加载；2.验证；3.准备；4.解析；5.初始化；6.使用；7.卸载类加载过程：1.加载：获取类的二进制字节流；生成方法区的运行时存储结构；在内存中生成Class对象
Ubuntu虚拟机在node命令行中编译.sol文件报错：{“errors“:[{“component“:“general“,“formattedMessage“...（已解决）拔牙不打麻药疑难杂症区块链虚拟机 node
Ubuntu虚拟机在node命令行下编译.sol文件报错'{"errors":[{"component":"general","formattedMessage":"*Line1,Column1\\nSyntaxerror:value,objectorarrayexpected.\\n*Line1,Column2\\nExtranon-whitespaceafterJSONvalue.\\n","
JVM---内存管理 Wangwq. 八股文 JVM
JVM是一种用于计算设备的规范，他是一个虚构的计算机。是通过在实际的计算机上的仿真模拟各种计算机的功能来实现的。引入java虚拟机后，java语言在不同的平台上运行时不需要重新编译，运行字节码即可。五大内存区域1、方法区（1）所有线程共享的内存区域（2）用于存储已被虚拟机加载的类信息、常量、静态常量等。如：被static修饰的常量（3）方法区中的信息来源于类装载子系统，其加载class信息（4）这
源代码怎么防泄露？9种方法教会你！ Felixwb 服务器运维
想做源代码加密防止泄漏，首先要了解程序员可以通过哪些方式将源代码传输出去！程序员泄密的常见方式物理方法：—网线直连，即把网线从墙上插头拔下来，然后和一个非受控电脑直连;—winPE启动，通过光盘或U盘的winPE启动，甚至直接用ISO镜像启动；—虚拟机，通过安装VMWare虚拟机，在虚拟机内使用外设U盘，网络；—其他非受控电脑中转，即把数据拷贝给网络内其他非受控电脑上，中转；—网络上传，通过在公网
DMDPC安装部署丷月亮是指路牌数据库
1.DMDPC架构DMDPC架构由计划生成节点SP、数据存储节点BP和元数据服务器节点MP三部分组成：1、SP对外提供分布式数据库服务，用户可以登录到任意一个SP节点，获得完整的数据库服务；2、BP负责存储数据，执行SP的调度指令并将执行结果返回给SP；3、MP负责存储元数据并向SP、BP提供元数据服务。本文是在1台Linux虚拟机上通过创建四个实例的方式进行集群搭建.2.DMDPC集群规划DMD
AWS Nitro架构简介河马虚拟化计算机架构虚拟化 aws 虚拟机架构
AWS（AmazonWebServices）Nitro架构为Amazon的云服务提供了底层的支持。Nitro架构的总体设计思想是：轻量化的hypervisor配合定制化的硬件，让用户无法区分出运行在虚拟机内和运行在裸金属上操作系统的性能差异。为了实现定制化的硬件（ASIC），Amazon和以色列的一家芯片公司——Annapurna实验室合作，并在后面将其收购，其芯片的logo就是Annapurna
Ubuntu 22.04网络无法连接的解决方法威桑 Linux ubuntu linux
在使用Ubuntu22.04系统时，在一次重启后桌面右上角并没有有线网络图标，并且打开浏览器无法访问百度。虚拟机网络连接方式是NAT模式，电脑主机也是有网络的。删除NetworkManager缓存文件，重启网络后问题就解决了。sudoserviceNetworkManagerstopsudorm/var/lib/NetworkManager/NetworkManager.statesudoserv
java class 获取类_Java中通过Class类获取Class对象的方法详解洪九(李戈) java class 获取类
Java中通过Class类获取Class对象的方法详解前言本文主要给大家介绍的是关于Java通过Class类获取Class对象的相关内容，分享出来供大家参考学习，下面话不多说了，来一起看看详细的介绍：阅读API的Class类得知，Class没有公共构造方法。Class对象是在加载类时由Java虚拟机以及通过调用类加载器中的defineClass方法自动构造的获取Class对象的三种方式(实例采用P
Java 和 Python 有哪些区别？淋风沐雨数据库算法 c++java 编程语言
区别一、python虚拟机没有java强，java虚拟机是java的核心，python的核心是可以很方便地使用c语言函数或c++库。二、python是全动态性的，可以在运行时自己修改自己的代码，java只能通过变通方法实现。python的变量是动态的，而java的变量是静态的，需要事先声明，所以javaide的代码提示功能优于pythonide。三，python的产生几十年了，几十年前面向过程是主
Java虚拟机：运行时内存结构栗筝i 栗筝i 的 Java 技术栈 #Java 基础栗筝i 的 Java 技术栈 Java 基础 Java 虚拟机
大家好，我是栗筝i，这篇文章是我的“栗筝i的Java技术栈”专栏的第035篇文章，在“栗筝i的Java技术栈”这个专栏中我会持续为大家更新Java技术相关全套技术栈内容。专栏的主要目标是已经有一定Java开发经验，并希望进一步完善自己对整个Java技术体系来充实自己的技术栈的同学。与此同时，本专栏的所有文章，也都会准备充足的代码示例和完善的知识点梳理，因此也十分适合零基础的小白和要准备工作面试的同
VMware Fusion 13.6 OEM BIOS 2.7 - 在 macOS 中运行 Windows 虚拟机的最佳方式 sysin.org VMware macos windows fusion oem bios 虚拟化 2025
VMwareFusion13.6OEMBIOS2.7-在macOS中运行Windows虚拟机的最佳方式VMwareFusion13原版App中集成OEMBIOS请访问原文链接：https://sysin.cn/blog/vmware-fusion-13-oem/，查看最新版。原创作品，转载请保留出处。作者主页：sysin.org2024-09-03，版本13.6更新，支持macOSSequoia作
【CTF】MISC常用工具集锦/使用方法简介不会代码的小徐 misc 网络安全测试工具
前言#MISC题型多变而且工具繁杂，因此自己花时间整理了一份工具列表，以便日后参考用流畅地阅读这篇博客，你可能需要：Python2.7.18+Python3.8+任何一个更高版本的Python，使用conda管理Linux虚拟机，kali即可流畅访问Google/GitHub等站点的网络通用工具#PuzzleSolver#专为misc手打造的瑞士军刀(?)，整合了多种脚本（base，字频分析，pn
VMware工具下centos7虚拟机无法使用yum的解决方法 hardly study centos linux 运维服务器 centos
一、检查网络配置是否正常执行pingwww.baidu.com，如果测试不通，则需进一步检查网卡配置（建议安装虚拟机时选择NAT模式）二、检查网卡信息2.1确认并修改网卡信息路径：/etc/sysconfig/network-scripts/ifcfg-ens33ONBOOT=no表示在系统启动时不激活ens33的网卡设备，修改onboot=yes，激活网卡2.2重启network服务system
源码到class字节码的编译流程 & 字节码到内存的Java类加载流程 Tinty0o0 java 开发语言
类加载：字节码—>内存Java类的加载流程是一个复杂但有序的过程，它确保了类文件能够被正确地加载到Java虚拟机（JVM）中，并被正确地初始化和使用。这个过程主要包括以下几个阶段：1.加载（Loading）加载阶段是类加载过程的第一个阶段。在这个阶段，JVM通过类加载器（ClassLoader）完成以下三件事情：通过一个类的全限定名（包括包名和类名）来获取定义此类的二进制字节流。将这个字节流所代表
Docker 的概念和理解 AlienPaul
Docker容器和虚拟机的区别虚拟机需要安装GuestOS。如果运行多个虚拟机，需要安装多个GuestOS。比较浪费存储资源。Docker运行的机器不用安装多个GuestOS，Dockercontainer的容器其实还是主机的操作系统上运行。虚拟机启动需要经历安装的操作系统启动过程，启动比较缓慢。Docker容器的启动仅仅是启动一个在宿主机运行的进程，启动非常快速。虚拟机可以实现完全彻底的资源隔离
centos7-安装docker-compose 报错/lib64/libc.so.6: version `GLIBC_2.28‘ not found wangying202 docker docker centos
新增安装的centos7虚拟机，按要求需要安装docker-compose，遇到了使用docker-compose命令时报错“[11798]ErrorloadingPythonlib‘/tmp/_MEIztwHzf/libpython3.9.so.1.0’:dlopen:/lib64/libc.so.6:version‘GLIBC_2.28’notfound(requiredby/tmp/_MEI
揭秘Java世界的清洁工——JVM垃圾回收机制青云交 Java大厂面试题 Java虚拟机（JVM）专栏 java jvm Java世界的清洁工 JVM垃圾回收机制堆内存引用计数 vs.可达性分析标记清扫压缩
在我们深入探索Java虚拟机（JVM）神秘世界的奇幻之旅中，有一件魔法工具始终令我着迷--那就是JVM的垃圾回收机制。这项技术就像一个无形的魔法师，默默清理掉那些被遗忘的、不再需要的东西，保证了Java世界的整洁和有序。今天，让我们从Java之父的视角，一探究竟。引言：在设计Java的过程中，我们有一个宏伟的梦想：打造一种能够自行处理零碎和废弃数据的语言，让开发者能够释放其创造力，不再被繁琐的内存
PHP，安卓，UI，java，linux视频教程合集 cocos2d-x小菜 java UI PHP android linux
╔-----------------------------------╗┆
各表中的列名必须唯一。在表 'dbo.XXX' 中多次指定了列名 'XXX'。 bozch .net .net mvc
在.net mvc5中，在执行某一操作的时候，出现了如下错误：各表中的列名必须唯一。在表 'dbo.XXX' 中多次指定了列名 'XXX'。经查询当前的操作与错误内容无关，经过对错误信息的排查发现，事故出现在数据库迁移上。回想过去：在迁移之前已经对数据库进行了添加字段操作，再次进行迁移插入XXX字段的时候，就会提示如上错误。 &
Java 对象大小的计算 e200702084 java
Java对象的大小如何计算一个对象的大小呢？
Mybatis Spring 171815164 mybatis
ApplicationContext ac = new ClassPathXmlApplicationContext("applicationContext.xml"); CustomerService userService = (CustomerService) ac.getBean("customerService"); Customer cust
JVM 不稳定参数 g21121 jvm
-XX 参数被称为不稳定参数，之所以这么叫是因为此类参数的设置很容易引起JVM 性能上的差异，使JVM 存在极大的不稳定性。当然这是在非合理设置的前提下，如果此类参数设置合理讲大大提高JVM 的性能及稳定性。可以说“不稳定参数”
用户自动登录网站永夜-极光用户
1.目标:实现用户登录后,再次登录就自动登录,无需用户名和密码 2.思路:将用户的信息保存为cookie 每次用户访问网站,通过filter拦截所有请求,在filter中读取所有的cookie,如果找到了保存登录信息的cookie,那么在cookie中读取登录信息,然后直接
centos7 安装后失去win7的引导记录程序员是怎么炼成的操作系统
1.使用root身份(必须)打开 /boot/grub2/grub.cfg 2.找到 ### BEGIN /etc/grub.d/30_os-prober ### 在后面添加 menuentry "Windows 7 (loader) (on /dev/sda1)" {
Oracle 10g 官方中文安装帮助文档以及Oracle官方中文教程文档下载 aijuans oracle
Oracle 10g 官方中文安装帮助文档下载：http://download.csdn.net/tag/Oracle%E4%B8%AD%E6%96%87API%EF%BC%8COracle%E4%B8%AD%E6%96%87%E6%96%87%E6%A1%A3%EF%BC%8Coracle%E5%AD%A6%E4%B9%A0%E6%96%87%E6%A1%A3 Oracle 10g 官方中文教程
JavaEE开源快速开发平台G4Studio_V3.2发布了無為子 AOP oracle mysql javaee G4Studio
我非常高兴地宣布,今天我们最新的JavaEE开源快速开发平台G4Studio_V3.2版本已经正式发布。大家可以通过如下地址下载。访问G4Studio网站 http://www.g4it.org G4Studio_V3.2版本变更日志功能新增 (1).新增了系统右下角滑出提示窗口功能。 (2).新增了文件资源的Zip压缩和解压缩
Oracle常用的单行函数应用技巧总结百合不是茶日期函数转换函数(核心)数字函数通用函数(核心)字符函数
单行函数; 字符函数,数字函数,日期函数,转换函数(核心),通用函数(核心) 一:字符函数: .UPPER(字符串) 将字符串转为大写 .LOWER (字符串) 将字符串转为小写 .INITCAP(字符串) 将首字母大写 .LENGTH (字符串) 字符串的长度 .REPLACE(字符串,'A','_') 将字符串字符A转换成_
Mockito异常测试实例 bijian1013 java 单元测试 mockito
Mockito异常测试实例： package com.bijian.study; import static org.mockito.Mockito.mock; import static org.mockito.Mockito.when; import org.junit.Assert; import org.junit.Test; import org.mockito.
GA与量子恒道统计 Bill_chen JavaScript 浏览器百度 Google 防火墙
前一阵子，统计**网址时，Google Analytics（GA）和量子恒道统计（也称量子统计），数据有较大的偏差，仔细找相关资料研究了下，总结如下：为何GA和量子网站统计（量子统计前身为雅虎统计）结果不同？首先：没有一种网站统计工具能保证百分之百的准确出现该问题可能有以下几个原因：（1）不同的统计分析系统的算法机制不同；（2）统计代码放置的位置和前后
【Linux命令三】Top命令 bit1129 linux命令
Linux的Top命令类似于Windows的任务管理器，可以查看当前系统的运行情况，包括CPU、内存的使用情况等。如下是一个Top命令的执行结果： top - 21:22:04 up 1 day, 23:49, 1 user, load average: 1.10, 1.66, 1.99 Tasks: 202 total, 4 running, 198 sl
spring四种依赖注入方式白糖_ spring
平常的java开发中，程序员在某个类中需要依赖其它类的方法，则通常是new一个依赖类再调用类实例的方法，这种开发存在的问题是new的类实例不好统一管理，spring提出了依赖注入的思想，即依赖类不由程序员实例化，而是通过spring容器帮我们new指定实例并且将实例注入到需要该对象的类中。依赖注入的另一种说法是“控制反转”，通俗的理解是：平常我们new一个实例，这个实例的控制权是我
angular.injector boyitech AngularJS AngularJS API
angular.injector 描述: 创建一个injector对象, 调用injector对象的方法可以获得angular的service, 或者用来做依赖注入. 使用方法: angular.injector(modules, [strictDi]) 参数详解: Param Type Details mod
java-同步访问一个数组Integer[10]，生产者不断地往数组放入整数1000，数组满时等待；消费者不断地将数组里面的数置零，数组空时等待 bylijinnan Integer
public class PC { /** * 题目：生产者-消费者。 * 同步访问一个数组Integer[10]，生产者不断地往数组放入整数1000，数组满时等待；消费者不断地将数组里面的数置零，数组空时等待。 */ private static final Integer[] val=new Integer[10]; private static
使用Struts2.2.1配置 Chen.H apache spring Web xml struts
Struts2.2.1 需要如下 jar包: commons-fileupload-1.2.1.jar commons-io-1.3.2.jar commons-logging-1.0.4.jar freemarker-2.3.16.jar javassist-3.7.ga.jar ognl-3.0.jar spring.jar struts2-core-2.2.1.jar struts2-sp
[职业与教育]青春之歌 comsci 教育
每个人都有自己的青春之歌............但是我要说的却不是青春... 大家如果在自己的职业生涯没有给自己以后创业留一点点机会,仅仅凭学历和人脉关系,是难以在竞争激烈的市场中生存下去的.... &nbs
oracle连接(join)中使用using关键字 daizj JOIN oracle sql using
在oracle连接(join)中使用using关键字 34. View the Exhibit and examine the structure of the ORDERS and ORDER_ITEMS tables. Evaluate the following SQL statement: SELECT oi.order_id, product_id, order_date FRO
NIO示例 daysinsun nio
NIO服务端代码： public class NIOServer { private Selector selector; public void startServer(int port) throws IOException { ServerSocketChannel serverChannel = ServerSocketChannel.open(
C语言学习homework1 dcj3sjt126com c homework
0、课堂练习做完 1、使用sizeof计算出你所知道的所有的类型占用的空间。 int x; sizeof(x); sizeof(int); # include <stdio.h> int main(void) { int x1; char x2; double x3; float x4; printf(&quo
select in order by , mysql排序 dcj3sjt126com mysql
If i select like this: SELECT id FROM users WHERE id IN(3,4,8,1); This by default will select users in this order 1,3,4,8, I would like to select them in the same order that i put IN() values so:
页面校验-新建项目 fanxiaolong 页面校验
$(document).ready( function() { var flag = true; $('#changeform').submit(function() { var projectScValNull = true; var s =""; var parent_id = $("#parent_id").v
Ehcache（02）——ehcache.xml简介 234390216 ehcache ehcache.xml 简介
ehcache.xml简介 ehcache.xml文件是用来定义Ehcache的配置信息的，更准确的来说它是定义CacheManager的配置信息的。根据之前我们在《Ehcache简介》一文中对CacheManager的介绍我们知道一切Ehcache的应用都是从CacheManager开始的。在不指定配置信
junit 4.11中三个新功能 jackyrong java
junit 4.11中两个新增的功能，首先是注解中可以参数化，比如 import static org.junit.Assert.assertEquals; import java.util.Arrays; import org.junit.Test; import org.junit.runner.RunWith; import org.junit.runn
国外程序员爱用苹果Mac电脑的10大理由 php教程分享 windows PHP unix Microsoft perl
Mac 在国外很受欢迎，尤其是在设计/web开发/IT 人员圈子里。普通用户喜欢 Mac 可以理解，毕竟 Mac 设计美观，简单好用，没有病毒。那么为什么专业人士也对 Mac 情有独钟呢？从个人使用经验来看我想有下面几个原因： 1、Mac OS X 是基于 Unix 的这一点太重要了，尤其是对开发人员，至少对于我来说很重要，这意味着Unix 下一堆好用的工具都可以随手捡到。如果你是个 wi
位运算、异或的实际应用 wenjinglian 位运算
一．位操作基础，用一张表描述位操作符的应用规则并详细解释。二．常用位操作小技巧，有判断奇偶、交换两数、变换符号、求绝对值。三．位操作与空间压缩，针对筛素数进行空间压缩。 &n
weblogic部署项目出现的一些问题（持续补充中……） Everyday都不同 weblogic部署失败
好吧，weblogic的问题确实…… 问题一： org.springframework.beans.factory.BeanDefinitionStoreException: Failed to read candidate component class: URL [zip:E:/weblogic/user_projects/domains/base_domain/serve
tomcat7性能调优（01） toknowme tomcat7
Tomcat优化： 1、最大连接数最大线程等设置 <Connector port="8082" protocol="HTTP/1.1" useBodyEncodingForURI="t
PO VO DAO DTO BO TO概念与区别 xp9802 java DAO 设计模式 bean 领域模型
O/R Mapping 是 Object Relational Mapping（对象关系映射）的缩写。通俗点讲，就是将对象与关系数据库绑定，用对象来表示关系数据。在O/R Mapping的世界里，有两个基本的也是重要的东东需要了解，即VO，PO。它们的关系应该是相互独立的，一个VO可以只是PO的部分，也可以是多个PO构成，同样也可以等同于一个PO（指的是他们的属性）。这样，PO独立出来，数据持

虚拟机总结（大数据技术原理与应用概念、存储、处理、分析与应用(第2版)）

第一章 大数据概论

第二章 大数据处理架构Hadoop

第三章 分布式文件系统HDFS

第四章 分布式数据库HBase