eRRRchou

Hadoop各组件原理汇总（附练习）

文章目录

Hadoop知识点汇总

前言：
1. Hadoop是什么？
2.Hadoop配置：
3.Hadoop Shell命令
4.HDFS概述
5.Hadoop API

6. 官方文档查漏补缺

NameNode和DataNodes
副本安置
副本选择
文件系统元数据的持久性
稳健性

7.MapReduce

7.1 MapReduce是一个分布式运算程序的编程框架
7.2序列化和自定义排序
7.3 mapTask怎么切数据
7.4 Partitioner分区实现
7.5 shuffle
7.6 关于大量小文件的优化策略

7.7 GroupingComparator
7.8 官方文档查漏补缺

Mapper：
Reducer：
Job
任务执行与环境
工作提交和监督
工作输入
工作输出

8.YARN
9.MapReduce实例练习

wordcount
统计流量并并排序
找出共同好友

Hadoop知识点汇总

前言：

spark之前的知识已经学习过很久了，但是中途没有很好的整理，也没有发博客，导致知识点得不到复习，所以也快忘得干净，特写此篇来复习巩固一下，把自己以为重点的知识用整理下来，以后会不定期的整理和修改

2019-8-22

添补了官方文档的查漏补缺和更改，对一些细节的东西进行了增加，建议在明白了整个hadoop框架之后在进行查看和学习，也可以自己去官网查询。

2019-8-28

头疼的两天，搞了一些皮毛的源码思路，有点头皮发麻，可能以后还会更新，不确定源码的分析一定是对的，不要太纠结，只是一个思路，有的地方也没有深入研究。
2019-9-2

文章目录

Hadoop知识点汇总

前言：
1. Hadoop是什么？
2.Hadoop配置：
3.Hadoop Shell命令
4.HDFS概述
5.Hadoop API

6. 官方文档查漏补缺

NameNode和DataNodes
副本安置
副本选择
文件系统元数据的持久性
稳健性

7.MapReduce

7.1 MapReduce是一个分布式运算程序的编程框架
7.2序列化和自定义排序
7.3 mapTask怎么切数据
7.4 Partitioner分区实现
7.5 shuffle
7.6 关于大量小文件的优化策略

7.7 GroupingComparator
7.8 官方文档查漏补缺

Mapper：
Reducer：
Job
任务执行与环境
工作提交和监督
工作输入
工作输出

8.YARN
9.MapReduce实例练习

wordcount
统计流量并并排序
找出共同好友

1. Hadoop是什么？

hadoop作用：利用服务器集群，根据用户的自定义业务逻辑，对海量数据进行分布式处理。

hadoop的核心组件：
- HDFS：（分布式文件系统）
- YARN：（运算资源调动系统）
- MAPREDUCE：（分布式运算编程框架）
广义上来讲，Hadoop是一个生态圈，本文所涉及的是Hadoop这个框架，其他的工具会后续更新。

2.Hadoop配置：

高可用需要Zookeeper，这里给出的是普通配置，（推荐: 普通–>secondaryNameNode–>HA）

这样可以对配置文件中的具体property是做什么有一定的了解。

安装hadoop2.4.1
	先上传hadoop的安装包到服务器上去/home/hadoop/
	注意：hadoop2.x的配置文件$HADOOP_HOME/etc/hadoop
	伪分布式需要修改5个配置文件
	配置hadoop
	第一个：hadoop-env.sh
		vim hadoop-env.sh
		export JAVA_HOME=/usr/java/jdk1.7.0_65	
	第二个：core-site.xml
		<!-- 指定HADOOP所使用的文件系统schema（URI），HDFS的老大（NameNode）的地址 -->
		<property>
			<name>fs.defaultFS</name>
			<value>hdfs://mini01:9000</value>
		</property>
		<!-- 指定hadoop运行时产生文件的存储目录 -->
		<property>
			<name>hadoop.tmp.dir</name>
			<value>/home/hadoop/hdpdata</value>
                                </property>
	第三个：hdfs-site.xml   
		<!-- 指定HDFS副本的数量 -->
		<property>
			<name>dfs.replication</name>
			<value>2</value>
		</property>
	第四个：mapred-site.xml (mv mapred-site.xml.template mapred-site.xml)
		mv mapred-site.xml.template mapred-site.xml
		vim mapred-site.xml
		<!-- 指定mr运行在yarn上 -->
		<property>
			<name>mapreduce.framework.name</name>
			<value>yarn</value>
		</property>
		
	第五个：yarn-site.xml
		<!-- 指定YARN的老大（ResourceManager）的地址 -->
		<property>
			<name>yarn.resourcemanager.hostname</name>
			<value>weekend-1206-01</value>
		</property>
		<!-- reducer获取数据的方式 -->
		<property>
			<name>yarn.nodemanager.aux-services</name>
			<value>mapreduce_shuffle</value>
		</property>
     	
	3.2将hadoop添加到环境变量
	
	vim /etc/proflie
		export JAVA_HOME=/usr/java/jdk1.7.0_65
		export HADOOP_HOME=/itcast/hadoop-2.4.1
		export PATH=$PATH:$JAVA_HOME/bin:$HADOOP_HOME/bin:$HADOOP_HOME/sbin

	source /etc/profile
	
	格式化namenode（是对namenode进行初始化）
		hdfs namenode -format 
		
	启动hadoop
	     hadoop-daemon.sh start namenode
	3.5验证是否启动成功
		使用jps命令验证
		27408 NameNode
		28218 Jps
		
配置ssh免登陆
	#生成ssh免登陆密钥
	#进入到我的home目录
	cd ~/.ssh

	ssh-keygen -t rsa （四个回车）
	执行完这个命令后，会生成两个文件id_rsa（私钥）、id_rsa.pub（公钥）
	将公钥拷贝到要免密登陆的目标机器上
	ssh-copy-id localhost
	---------------------------
	ssh免登陆：
		生成key:
		ssh-keygen
		复制从A复制到B上:
		ssh-copy-id B
		验证：
		ssh localhost/exit，ps -e|grep ssh
		ssh A  #在B中执行
	
配置免密登录后启动hadoop命令
	 start-all.sh
停止命令：
     stop-dfs.sh

3.Hadoop Shell命令

hadoop fs -ls / 查看根目录文件
hadoop fs -put demo.txt / 将demo.txt复制到根目录
hadoop fs -cat /demo.txt 查看根目录下的demo.txt文件
hadoop fs -moveFromLocal /demo.txt   将本地的demo.txt剪切粘贴到hdfs
hadoop fs -copyToLocal /demo.txt    将hdfs的demo.txt复制粘贴到本地
hadoop fs -mkdir -p /wordcount/input  创建文件夹
hadoop jar hadoop-mapreduce-examples-2.6.4.jar wordcount /wordcount/input/ /wordcount/output 统计该文件夹下文件单词
hadoop fs -appendToFile b.txt /a.txt 将b.txt的内容添加到a.txt后
hadoop fs -chown hadoop:supergroup /a.txt 修改所属用户
hadoop fs -chmod 777 /a.txt 修改权限
hadoop fs -cp  /aaa/a.txt  /bbb/b.txt 在hdfs内部复制
hadoop fs -mv /aaa/a.txt  /bbb/b.txt 在hdfs内部移动
hadoop fs -getmerge  /*.txt merg.file  合并并下载到本地
hadoop fs -rm /a.txt 删除
df 统计可用空间信息
du 统计文件夹大小信息
hadoop fs -setrep 3 /b.txt 设置成3个副本，若超过机器的数量，则为文件数目，不是真实数目，增加机器后会自动添加到新机器上

4.HDFS概述

HDFS集群分为两大角色：NameNode、DataNode (Secondary NameNode)
NameNode负责管理整个文件系统的元数据
源码理解如下：
DataNode 负责管理用户的文件数据块
文件会按照固定的大小（blocksize）切成若干块后分布式存储在若干台DataNode上
每一个文件块可以有多个副本，并存放在不同的DataNode上
DataNode会定期向NameNode汇报自身所保存的文件block信息，而NameNode则会负责保持文件的副本数量
HDFS的内部工作机制对客户端保持透明，客户端请求访问HDFS都是通过向NameNode申请来进行

HDFS上传文件流程图：

从源码的角度分析：

HDFS下载文件流程图：

在源码的角度获取输出流(输出流中包含的block块的信息)

SecondaryNameNode工作机制：Image镜像文件的管理

seen_txid：

文件中记录的是edits滚动的序号，每次重启Namenode时候，NameNode就知道要对那些edits进行加载。

5.Hadoop API

注意点：Hadoop在本地运行要配置本地编译的Hadoop，在虚拟机上运行要指定用户为Hadoop，即客户端操作HDFS的时候，会有一个用户身份的。默认情况下会去VM中-DHADOOP_USER_NAME=hadoop的配置当成用户。

//第一种方法，要在vm中配置 -DHADOOP_USER_NAME=hadoop。
Configuration conf = new Configuration();
conf.set("fs.defaultFS", "hdfs://mini01:9000");

//第二种方法，直接指定URI和用户，在创建FS的时候传过去。
Configuration conf = new Configuration();
FileSystem fs = FileSystem.get(new URI("hdfs://mini01:9000"),conf,"hadoop");

API实现增删查改。

import java.net.URI;
import java.util.Iterator;
import java.util.Map.Entry;

import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.BlockLocation;
import org.apache.hadoop.fs.FileStatus;
import org.apache.hadoop.fs.FileSystem;
import org.apache.hadoop.fs.LocatedFileStatus;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.fs.RemoteIterator;
import org.junit.Before;
import org.junit.Test;
/**
 * 
 * 在使用api 编写hdfs时候，不做处理，默认用户是windows用户
 * 再默认情况下，hdfs客户端api会从jvm中获取一个参数来作为自己的用户身份：
 -DHADOOP_USER_NAME=hadoop
 * 也可以在构造客户端fs对象时，通过uri参数传递进去
 */
public class HdfsClientDemo {
	FileSystem fs;
	Configuration conf;
    @Before
    public void inin() throws Exception{
    	conf = new Configuration();
    	conf.set("fs.replication", "2");
    	//拿到一个文件系统的客户端实例对象
    	//可以直接传入uri和用户身份
    	fs = FileSystem.get(new URI("hdfs://mini02:9000"),conf,"hadoop");
    } 
    @Test
    public void testUpload()throws Exception{
    	fs.copyFromLocalFile(new Path("D:/data.txt"), new Path("/HotelPrice/input/data.txt"));
        fs.close();
    }
    @Test
    public void testConf() throws Exception{
    	Iterator> it = conf.iterator();
    	while(it.hasNext()){
    		Entry ent = it.next();
    		System.out.println(ent.getKey()+" "+ent.getValue());
    	}
    }
    @Test
    public void testDownload()throws Exception{
    	fs.copyToLocalFile(new Path("/HotelPrice/output/part-r-00000"), new Path("D:/Demo1.txt"));
        fs.close();
    }
    @Test
    public void testMkdir() throws Exception{
    	boolean flag = fs.mkdirs(new Path("/wordcount/input"));
    	System.out.println(flag);
    }
    @Test
    public void testDel() throws Exception{
    	boolean flag = fs.delete(new Path("/wordcount/input"), true);
    	//true是是否指定使用java本地的IO流系统
    	System.out.println(flag);
    }
    @Test
    public void testLs() throws Exception{
    	RemoteIterator listFiles = fs.listFiles(new Path("/"), true);
        while(listFiles.hasNext()){
        	LocatedFileStatus lf = listFiles.next();
        	System.out.println("filename:"+lf.getPath());
        	System.out.println("blocksize:"+lf.getBlockSize());
        	System.out.println("owner:"+lf.getOwner());
        	System.out.println("replication:"+lf.getReplication());
        	System.out.println("permission:"+lf.getPermission());
        	
        	BlockLocation[] blockLocations = lf.getBlockLocations();
        	for(BlockLocation b:blockLocations){
        		System.out.println("快起始偏移量：" +b.getOffset());
        		System.out.println("快长度："+b.getLength());
        		String[] hosts = b.getHosts();
        		for(String host :hosts){
        			System.out.println("datanode:" + host);
        		}
        	}
        	System.out.println("-------------------------------");
        }
    }
    @Test
    public void testLs2() throws Exception{
    	FileStatus[] listStatus = fs.listStatus(new Path("/"));
       for(FileStatus lf:listStatus){
        	System.out.println("filename:"+lf.getPath());
        	System.out.println("blocksize:"+lf.getBlockSize());
        	System.out.println("owner:"+lf.getOwner());
        	System.out.println("replication:"+lf.getReplication());
        	System.out.println("permission:"+lf.getPermission());
        	System.out.println("-------------------------------");
        	
        }
    }
}

使用流操作（在MapReduce中，要进行分片，每个分片拿到的数据不相同的，可能把一个大文件进行多个分片，所以不能够把一整个文件全都下载下来，就要下载一部分数据，所以要有流的操作）

package erchou;

import java.io.FileInputStream;
import java.io.FileOutputStream;
import java.net.URI;

import org.apache.commons.io.IOUtils;
import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.FSDataInputStream;
import org.apache.hadoop.fs.FSDataOutputStream;
import org.apache.hadoop.fs.FileSystem;
import org.apache.hadoop.fs.Path;
import org.junit.Before;
import org.junit.Test;

public class HdfsStreamAccess {
	Configuration conf;
	FileSystem fs;
    @Before
    public void init() throws Exception{
    	
    	/*
    	 第一种方法，要在vm中配置 -HADOOP_USER_NAME=hadoop
    	Configuration conf = new Configuration();
    	conf.set("fs.defaultFS", "hdfs://mini01:9000");
    	*/
    	
    	conf = new Configuration();
    	fs = FileSystem.get(new URI("hdfs://mini01:9000"),conf,"hadoop");
    }
    @Test
    public void testUpload() throws Exception{
    	FSDataOutputStream create = fs.create(new Path("/cxy.txt"),true);
        FileInputStream stream = new FileInputStream("C:/cxy.txt");
        IOUtils.copy(stream,create);
    }
    @Test
    public void testDownLoad() throws Exception{
    	FSDataInputStream open = fs.open(new Path("/cxy.txt"));
        FileOutputStream outputStream = new FileOutputStream("D:/cxy.txt");
        IOUtils.copy(open,outputStream);
    }
    @Test
    public void testRandomAcess() throws Exception{
    	FSDataInputStream open = fs.open(new Path("/cxy.txt"));
    	open.seek(5);
        FileOutputStream outputStream = new FileOutputStream("D:/cxy.part2.txt");
        IOUtils.copy(open,outputStream);
    }
    @Test
    public void testCat() throws Exception{
    	FSDataInputStream open = fs.open(new Path("/cxy.txt"));
    	IOUtils.copy(open,System.out);
    }
}

6. 官方文档查漏补缺

NameNode和DataNodes

HDFS具有主/从架构。HDFS集群由单个NameNode，一个管理文件系统命名空间的主服务器和管理客户端对文件的访问组成。此外，还有许多DataNode，通常是群集中每个节点一个，用于管理连接到它们运行的节点的存储。在内部，文件被分成一个或多个块，这些块存储在一组DataNode中。NameNode执行文件系统命名空间操作，如打开，关闭和重命名文件和目录。它还确定了块到DataNode的映射。DataNode负责提供来自文件系统客户端的读写请求。DataNodes还执行块创建，删除，

副本安置

复制品的放置对HDFS的可靠性和性能至关重要。

对于常见情况，当复制因子为3时，HDFS的放置策略是 writer位于datanode上时就将副本放在本地计算机上（就是提交上传任务的机器本身就是一个datanode），否则放在随机datanode上，在另一个（远程）机架上的节点上放置另一个副本，最后一个在同一个远程机架中的另一个节点上。如果复制因子大于3，则随机确定第4个及以下副本的放置，同时保持每个机架的副本数量低于上限（基本上（副本-1）/机架+ 2）。

副本选择

为了最大限度地减少全局带宽消耗和读取延迟，HDFS尝试满足最接近读取器的副本的读取请求。如果在与读取器节点相同的机架上存在副本，则该副本首选满足读取请求。如果HDFS群集跨越多个数据中心，则驻留在本地数据中心的副本优先于任何远程副本。

文件系统元数据的持久性

HDFS名称空间由NameNode存储。NameNode使用名为EditLog的事务日志来持久记录文件系统元数据发生的每个更改。在HDFS中创建新文件会导致NameNode将记录插入EditLog，更改文件的复制因子会导致将新记录插入EditLog。NameNode使用其本地主机OS文件系统中的文件来存储EditLog。整个文件系统命名空间存储在名为FsImage的文件中。FsImage也作为文件存储在NameNode的本地文件系统中。

稳健性

HDFS的主要目标是即使在出现故障时也能可靠地存储数据。三种常见的故障类型是NameNode故障，DataNode故障和网络分区。

数据磁盘故障，心跳和重新复制

每个DataNode定期向NameNode发送Heartbeat消息。NameNode通过缺少Heartbeat消息来检测此情况。NameNode将没有最近Heartbeats的DataNodes标记为已死，并且不会将任何新的IO请求转发给它们。NameNode不断跟踪需要复制的块，并在必要时启动复制。

标记DataNodes死机的超时是保守的长（默认情况下超过10分钟），以避免由DataNode状态抖动引起的复制风暴。
集群重新平衡

HDFS架构与数据重新平衡方案兼容。如果DataNode上的可用空间低于某个阈值，则方案可能会自动将数据从一个DataNode移动到另一个DataNode。
数据完整新

当客户端创建HDFS文件时，它会计算文件每个块的校验和，（对应的是上传图中的chunk）并将这些校验的和存储在同一HDFS命名空间中的单独隐藏文件中。当客户端检索文件内容时，它会验证从每个DataNode接收的数据是否与存储在关联的校验和文件中的校验和相匹配。如果没有，则客户端可以选择从具有该块的副本的另一个DataNode中检索该块。
元数据磁盘故障

增加故障恢复能力的另一个选择是使用多个NameNode 在NFS上使用共享存储或使用分布式编辑日志(称为Journal)来启用高可用性。

7.MapReduce

7.1 MapReduce是一个分布式运算程序的编程框架

MapReduce框架设计思想

MapReduce中MapTask和ReduceTask的产生和执行流程，Shuffle过程在下图中给出。

7.2序列化和自定义排序

如果在Map和Reduce之间传递自己定义的对象，需要把对象进行序列化，实现Writable接口，如果这个类要根据自己的定义排序，实现WritableComparable接口，具体练习在统计流量并并排序给出代码实现。

7.3 mapTask怎么切数据

客户端在做切片，即main方法在做切片。
默认大小就是block的大小。
一个切片就是一个mapTask

一般的切片过程，默认大小128M，如果小于，也算是一个切片，启动一个MapTask进程。

InputFormat切片过程。

7.4 Partitioner分区实现

通过设置不同的分区号，来决定有多少个reduceTask

  //设置partitioner子类
  job.setPartitionerClass(FlowPartitioner.class);
  job.setNumReduceTasks(2);

import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Partitioner;

public class FlowPartitioner extends Partitioner{

	@Override
	public int getPartition(FlowBean bean, Text phone, int numParitions) {
		Long allFlow = bean.getAllFlow();
		if(allFlow>2000){
			return 1;
		}
		return 0;
	}
}

其他代码在实例练习中给出。

7.5 shuffle

7.6 关于大量小文件的优化策略

默认情况下，TextFileInputFormat对任务的切片机制是按文件规划切片，不管文件多小，都会是一个切片，都会交给一个mapTask，这样，如果有大量小文件，就会产生大量的mapTask，效率极其低下。
优化策略
- 最好的办法：在数据处理系统最前端（预处理/采集），将小文件合并成大文件，再上传到HDFS做后续分析。
- 补救措施：如果已经是大量小文件再hdfs中，可以使用另一种InputFormat来做切片(CombineFileInputFormat)，他可以将多个小文件从逻辑上规则到一个切片中，多个小文件就可以交给一个mapTask

代码

      job.setInputFormatClass(CombineTextInputFormat.class);
	  CombineTextInputFormat.setMaxInputSplitSize(job, 4194304);
	  CombineTextInputFormat.setMinInputSplitSize(job, 2097152);

7.7 GroupingComparator

根据自己的比较规则，再shuffle过程中分到同一组。发给一个reduce进行操作。

public class ItemidGroupingComparator extends WritableComparator {

	protected ItemidGroupingComparator() {

		super(OrderBean.class, true);
	}

	@Override
	public int compare(WritableComparable a, WritableComparable b) {
		OrderBean abean = (OrderBean) a;
		OrderBean bbean = (OrderBean) b;
		
		//将item_id相同的bean都视为相同，从而聚合为一组
		return abean.getItemid().compareTo(bbean.getItemid());
	}
}

job.setGroupingComparatorClass(ItemidGroupingComparator.class);

7.8 官方文档查漏补缺

Mapper：

Mapper的输入是一个键值对，通过map方法进行转换，给定的输入可以转成多个输出，也可以不输出（就是一个map过程可以向reduce写出多条数据），而且输出的格式是自己指定的。

mapreduce为InputFormat生成的切片（InputSplit）生成一个map任务。

Mapper的实现是通过Job.setMapperClass(Class)方法传递给作业，然后对InputSplit中的每个键值对调用map方法。

对Mapper的输出进行排序，然后在根据Reducer进行分区，分区总数与作业的reducer的任务数目相同。用户可以通过自定义分区程序控制那些健转到那个Reducer，可以选择通过Job.setCombinerClass(Class)指定组合器，以执行中间输出的本地聚合，有助于减少从Mapper传输到Reducer的数据量。

map的正确并行度似乎是每个mapTask大约10-100个map

Reducer：

Reducer中所有的key值相同的value共享同一个key值，即在数据传输到reduce中的时候，只传递第一个key，和一个values数组。

Reducer的数目是通过SetNumReduceTasks设置的。

Reducer有3个主要阶段：shuffle，sort和reduce

注意：把shuffle划分到Reducer中实际上shuffle就是reduce通过http协议将mapper的输出下载并划分到reducer中的过程。

shuffle和sort一起并发，也就是一边下载，一边shuffle一边merge。

再通过指定的GroupingComparator进行二次排序。(如果要求对key进行分组的等价规则与在reduce之前对key默认的分组的规则不同，即自定义的类是使用地址。不定义这个又会通过地址打乱)

正确的reduce数目是所有的map的0.95倍或者1.75倍（使用0.95时，所有reduce都可以立即启动，使用1.75，更快的节点将完成第一轮reduce并启动第二波reduce，从而更好地实现负载平衡。）

增加reduce的数量会增加框架开销，但会增加负载平衡并降低故障成本。

如果不需要reduce，可以不写reduce。

Job

Job是用户向Hadoop框架描述MapReduce作业以执行的主要接口。

Job通常用于指定Mapper，combiner（如果有），Partitioner，Reducer，InputFormat，OutputFormat实现。

Job用于指定作业的其他高级方面，例如要使用的比较器，要放入DistributedCache的文件，是否要压缩中间和/或作业输出，每个任务的最大尝试次数

任务执行与环境

MRAppMaster执行Mapper/ Reducer任务作为一个单独的JVM子进程

用户/管理员还可以使用mapreduce {map | reduce} .memory.mb指定已启动的子任务的最大虚拟内存，并且该值必须大于或等于传递给JavaVM的-Xmx，否则JVM可能无法启动。

当序列化缓冲区或元数据超过阈值时，缓冲区的内容将在后台排序并写入磁盘，如果在溢出过程中任一缓冲区完全填满，则map线程将阻塞。

工作提交和监督

Job是用户作业与ResourceManager交互的主要接口。

工作提交流程包括：

检查作业的输入和输出规格。
计算作业的InputSplit值。最后一块（可以存在10%冗余）最大140.8M
如有必要，为作业的DistributedCache设置必需的记帐信息。
将作业的jar和配置复制到FileSystem上的MapReduce系统目录。
将作业提交到ResourceManager并可选择监视其状态。

Job.submit()集群并立即返回。
Job.waitForCompletion(boolean)：将作业提交到集群并等待它完成。

工作输入

MapReduce框架依赖于作业的InputFormat：

验证作业的输入规范。
将输入文件拆分为逻辑InputSplit实例，然后将每个实例分配给单个Mapper。最后一块（可以存在10%冗余）最大140.8M（默认128M）
提供RecordReader实现，用于从逻辑InputSplit收集输入记录以供Mapper处理。

InputFormat的默认是TextInputFormat。

工作输出

OutputFormat描述了MapReduce作业的输出规范。

MapReduce框架依赖于作业的OutputFormat：

验证作业的输出规范; 例如，检查输出目录是否尚不存在。
提供用于写入作业输出文件的RecordWriter实现。输出文件存储在FileSystem中。

TextOutputFormat是默认的OutputFormat。

8.YARN

Yarn提交任务的流程图
ResourceManager中有两个重要的组件，Scheduler和ApplicationsManager，Scheduler负责任务调度，ApplicationsManager负责启动ApplicationMaster

9.MapReduce实例练习

wordcount

package MR;

import java.io.IOException;

import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.io.IntWritable;
import org.apache.hadoop.io.LongWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Job;
import org.apache.hadoop.mapreduce.Mapper;
import org.apache.hadoop.mapreduce.Reducer;
import org.apache.hadoop.mapreduce.lib.input.FileInputFormat;
import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat;

public class WordCount {
    public static class WordCountMap extends Mapper<LongWritable,Text, Text,IntWritable>{
    	Text text = new Text();
    	IntWritable iw = new IntWritable();
    	protected void map(LongWritable key, Text value, Mapper<LongWritable, Text, Text, IntWritable>.Context context)
    			throws IOException, InterruptedException {
    		String line = value.toString();
    		String[] datas = line.split(" ");
    		for(String data:datas){
    			text.set(data);
    			iw.set(1);
    			context.write(text, iw);
    		}
    		
    	}
    }
    public static class WordCountReduce extends Reducer<Text,IntWritable, Text,IntWritable>{
    	Text text = new Text();
    	IntWritable iw = new IntWritable();
    	protected void reduce(Text line, Iterable<IntWritable> iter,
    			Reducer<Text, IntWritable, Text, IntWritable>.Context context) throws IOException, InterruptedException {
    		String value = line.toString();
    		int num = 0;
    		for(IntWritable iw:iter){
    			num+=iw.get();
    		}
    		text.set(value);
    		iw.set(num);
    		context.write(text, iw);
    	}
    }
    //指定用户
    //写内部类要使用static来进行修饰，否则反射的时候不能进行加载。
    public static void main(String[] args) throws Exception {
 	   Configuration conf = new Configuration();
 	   conf.set("mapreduce.framework.name", "local");
 	   conf.set("fs.defaultFS", "hdfs://mini02:9000");
 	   
 	   Job job = Job.getInstance(conf);
 	   job.setJarByClass(WordCount.class);
 	   //指定本业务job要使用的mapper业务类
 	   job.setMapperClass(WordCountMap.class);
 	   //指定本业务job要使用的reducer业务类
 	   job.setReducerClass(WordCountReduce.class);
 	   //指定map输出的类型是什么
 	   job.setMapOutputKeyClass(Text.class);
 	   job.setMapOutputValueClass(IntWritable.class);
 	   //指定最终输出数据的kv类型
 	   job.setOutputKeyClass(Text.class);
 	   job.setOutputValueClass(IntWritable.class);
	   //job输入文件所在目录
	   FileInputFormat.setInputPaths(job, new Path("/wc"));
       //job输出结果所在目录
	   FileOutputFormat.setOutputPath(job, new Path("/out6"));
	   //提交到yarn
	   boolean res = job.waitForCompletion(true);
	   System.exit(res?0:1);
	}
}

统计流量并并排序

package Flow;

import java.io.DataInput;
import java.io.DataOutput;
import java.io.IOException;

import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.io.LongWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.io.WritableComparable;
import org.apache.hadoop.mapreduce.Job;
import org.apache.hadoop.mapreduce.Mapper;
import org.apache.hadoop.mapreduce.Reducer;
import org.apache.hadoop.mapreduce.lib.input.FileInputFormat;
import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat;

public class FlowDriver {
   public static class FlowMapper extends Mapper<LongWritable, Text, FlowBean, Text>{
	Text text = new Text();
	protected void map(LongWritable key, Text value, Mapper<LongWritable, Text, FlowBean, Text>.Context context)
			throws IOException, InterruptedException {
		String line = value.toString();
		String[] datas = line.split("\t");
		String phone = datas[1];
		long upFlow = Long.parseLong(datas[7]);
		long downFlow = Long.parseLong(datas[8]);
		FlowBean bean = new FlowBean(upFlow, downFlow);
		text.set(phone);
		context.write(bean, text);
	}
   }
   public static class FlowReducer extends Reducer <FlowBean,Text,Text,FlowBean>{
	   	@Override
	   	protected void reduce(FlowBean bean, Iterable<Text> phones, Reducer<FlowBean,Text,Text,FlowBean>.Context context)
	   			throws IOException, InterruptedException {
	   		// TODO Auto-generated method stub
	   		context.write(phones.iterator().next(),bean);
	   	}
   }
   
   public static void main(String[] args) throws IOException, Exception, InterruptedException {
	  Configuration conf = new Configuration();
	  conf.set("fs.defaultFS", "hdfs://mini02:9000");
	  
	  Job job = Job.getInstance(conf);
	  //设定运行的jar
	  job.setJarByClass(FlowDriver.class);
	  //Mapper
	  job.setMapperClass(FlowMapper.class);
	  //Reducer
	  job.setReducerClass(FlowReducer.class);
	  //map输出类型
	  job.setMapOutputKeyClass(FlowBean.class);
	  job.setMapOutputValueClass(Text.class);
	  //reducer输出类型
	  job.setOutputKeyClass(Text.class);
	  job.setOutputValueClass(FlowBean.class);
	  
	  //设置输入路径
	  FileInputFormat.setInputPaths(job,new Path("/flow.log"));
	  //设置输出路径
	  FileOutputFormat.setOutputPath(job, new Path("/out2/out2"));
	  
	  boolean res = job.waitForCompletion(true);
	  System.exit(res?0:1);
   }
}
class FlowBean implements WritableComparable<FlowBean>{
	   private long upFlow;
	   private long downFlow;
	   private long allFlow;
	   
	   
	public FlowBean() {
		
	}
	public FlowBean(long upFlow, long downFlow) {
		this.upFlow = upFlow;
		this.downFlow = downFlow;
		this.allFlow = upFlow+downFlow;
	}
	public long getUpFlow() {
		return upFlow;
	}
	public void setUpFlow(long upFlow) {
		this.upFlow = upFlow;
	}
	public long getDownFlow() {
		return downFlow;
	}
	public void setDownFlow(long downFlow) {
		this.downFlow = downFlow;
	}
	public long getAllFlow() {
		return allFlow;
	}
	public void setAllFlow(int allFlow) {
		this.allFlow = allFlow;
	}
	@Override
	public void readFields(DataInput in) throws IOException {
		this.upFlow = in.readLong();
		this.downFlow = in.readLong();
		this.allFlow = in.readLong();
	}
	@Override
	public void write(DataOutput out) throws IOException {
		out.writeLong(this.upFlow);
		out.writeLong(this.downFlow);
		out.writeLong(this.allFlow);
	}
	@Override
	public int compareTo(FlowBean o) {
		return this.getAllFlow()>o.getAllFlow()?-1:1;
	}
	@Override
	public String toString() {
		return "FlowBean [upFlow=" + upFlow + ", downFlow=" + downFlow + ", allFlow=" + allFlow + "]";
	}
	}

找出共同好友

数据：

A:B,C,D,F,E,O
B:A,C,E,K
C:F,A,D,I
D:A,E,F,L
E:B,C,D,M,L
F:A,B,C,D,E,O,M
G:A,C,D,E,F
H:A,C,D,E,O
I:A,O
J:B,O
K:A,C,D
L:D,E,F
M:E,F,G
O:A,H,I,J

输入结果：

A-B	E,C,
A-C	D,F,
A-D	E,F,
A-E	D,B,C,
A-F	O,B,C,D,E,
A-G	F,E,C,D,
A-H	E,C,D,O,
A-I	O,
A-J	O,B,
A-K	D,C,
A-L	F,E,D,
A-M	E,F,
B-C	A,
B-D	A,E,
B-E	C,
B-F	E,A,C,
B-G	C,E,A,
B-H	A,E,C,
B-I	A,
B-K	C,A,
B-L	E,
B-M	E,
B-O	A,
C-D	A,F,
C-E	D,
C-F	D,A,
C-G	D,F,A,
C-H	D,A,
C-I	A,
C-K	A,D,
C-L	D,F,
C-M	F,
C-O	I,A,
D-E	L,
D-F	A,E,
D-G	E,A,F,
D-H	A,E,
D-I	A,
D-K	A,
D-L	E,F,
D-M	F,E,
D-O	A,
E-F	D,M,C,B,
E-G	C,D,
E-H	C,D,
E-J	B,
E-K	C,D,
E-L	D,
F-G	D,C,A,E,
F-H	A,D,O,E,C,
F-I	O,A,
F-J	B,O,
F-K	D,C,A,
F-L	E,D,
F-M	E,
F-O	A,
G-H	D,C,E,A,
G-I	A,
G-K	D,A,C,
G-L	D,F,E,
G-M	E,F,
G-O	A,
H-I	O,A,
H-J	O,
H-K	A,C,D,
H-L	D,E,
H-M	E,
H-O	A,
I-J	O,
I-K	A,
I-O	A,
K-L	D,
K-O	A,
L-M	E,F,

代码如下：

package Friend;

import java.io.IOException;
import java.util.Arrays;

import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.io.LongWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Job;
import org.apache.hadoop.mapreduce.Mapper;
import org.apache.hadoop.mapreduce.Reducer;
import org.apache.hadoop.mapreduce.lib.input.FileInputFormat;
import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat;

public class FriendDriver {
  public static class MapperOne extends Mapper<LongWritable, Text, Text, Text>{
	Text text1 = new Text();
	Text text2 = new Text();
	protected void map(LongWritable key, Text value, Mapper<LongWritable, Text, Text, Text>.Context context)
			throws IOException, InterruptedException {
          String line = value.toString();
          String[] datas = line.split(":");
          String person = datas[0];
          String[] friends = datas[1].split(",");
          for(String friend:friends){
        	  text1.set(person);
        	  text2.set(friend);
        	  context.write(text2, text1);
          }
	}
  }
  public static class ReduceOne extends Reducer<Text, Text, Text, Text>{
	Text text1 = new Text();
	Text text2 = new Text();
	protected void reduce(Text friend, Iterable<Text> persons, Reducer<Text, Text, Text, Text>.Context context)
			throws IOException, InterruptedException {
		String line = "";
		for(Text person:persons){
			String per = person.toString();
			line+=per+",";
		}
		text1.set(friend);
		text2.set(line);
		context.write(text1, text2);
	}
  }
  public static class MapperTwo extends Mapper<LongWritable, Text, Text, Text>{
	  Text text1 = new Text();
	  Text text2 = new Text();
	  protected void map(LongWritable key, Text value, Mapper<LongWritable, Text, Text, Text>.Context context)
			throws IOException, InterruptedException {
		String line = value.toString();
		System.out.println(line);
		String[] datas = line.split("\t");
		String friend = datas[0];
		
		String[] persons = datas[1].split(",");
		Arrays.sort(persons);
		for(int i = 0;i<persons.length;i++){
			for(int j = i+1;j<persons.length;j++){
				text1.set(persons[i]+"-"+persons[j]);
				text2.set(friend);
				context.write(text1, text2);
			}
		}
	}
}
  public static class ReduceTwo extends Reducer<Text, Text, Text, Text>{
	  Text text1 = new Text();
	  Text text2 = new Text();
	protected void reduce(Text perToPer, Iterable<Text> friends, Reducer<Text, Text, Text, Text>.Context context)
			throws IOException, InterruptedException {
		  String line = "";
			for(Text friend:friends){
				String per = friend.toString();
				line+=per+",";
		  }
			text1.set(perToPer);
			text2.set(line);
		 context.write(text1, text2);
	}
  }
  public static void main(String[] args) throws Exception {
		 
	      Configuration conf = new Configuration();
		  conf.set("fs.defaultFS", "hdfs://mini02:9000");
		  Job job = Job.getInstance(conf);
		  //设定运行的jar
		  job.setJarByClass(FriendDriver.class);
		  //此处可以用job串 串联起来
		  //Mapper
		  //job.setMapperClass(MapperOne.class);
		  job.setMapperClass(MapperTwo.class);
		  //Reducer
		 // job.setReducerClass(ReduceOne.class);
		  job.setReducerClass(ReduceTwo.class);
		  //map输出类型
		  job.setMapOutputKeyClass(Text.class);
		  job.setMapOutputValueClass(Text.class);
		  //reducer输出类型
		  job.setOutputKeyClass(Text.class);
		  job.setOutputValueClass(Text.class);
		  //设置输入路径
		  FileInputFormat.setInputPaths(job,new Path("/out/out4/part-r-00000"));
		  //设置输出路径
		  FileOutputFormat.setOutputPath(job, new Path("/out/out13"));
		  
		  boolean res = job.waitForCompletion(true);
		  System.exit(res?0:1);
}
}

你可能感兴趣的:(BigData-复习)

代码随想录算法训练营第八天| 344 反转字符串、541 反转字符串II Anjoubecoding 算法数据结构 c++c语言 leetcode
这两天开的是字符串专题，我准备在做题的时候用C++做一遍，再用C做一遍，因为一直刷leetcode用的都是C++，导致C的基础太薄弱了，之后工作中有可能用到C，相当于再复习复习一、Leetcode344反转字符串题目链接：Leetcode344反转字符串这道题很简单，这才是真正的简单题voidreverseString(char*s,intsSize){intleft=0,right=sSize-
考研英语二重要词汇整理 yangshuo1281 英语
考研英语二重要词汇整理词汇是考研英语复习的基础，即使是现阶段冲刺复习，仍有不少考生词汇还是老大难，凯程网考研频道希望这些考生能够抓紧复习，词汇大关必须要过，下面是整合的英语二核心词汇，大家捡着重要的背背。现在任何领域都要懂英语，多学无害，it行业的英语是最最必须学的。concerneda.有关的;关切的，担心的largelyad.大量地;主要地astronautn.宇航员unlikelya.未必可
数据结构复习笔记5.2：二叉树 SGCGYU_Tan 数据结构笔记数据结构笔记 c++
1.二叉树的概念⼆叉树是每个结点最多有两个⼦树的树结构。也就是说⼆叉树不允许存在度⼤于2的树。它有五种最基本的形态：⼆叉树可以是空集。根可以有空的左⼦树或者右⼦树；或者左右⼦树都是空。其中只有左⼦树或者右子树的叫做斜树。为何要重点研究每结点最多只有两个“叉”的树？二叉树的结构最简单，规律性最强；可以证明，所有树都能转为唯一对应的二叉树，不失一般性。普通树（多叉树）若不转化为二叉树，则运算很难实现。
python-flask复习(一) 胖虎是只mao python-web python函数 python python flask
一、Python现阶段三大主流Web框架Django、Tornado、Flask对比Django主要特点是大而全，集成了很多组件（例如Models、Admin、Form等等）,不管你用得到用不到，反正它全都有，属于全能型框架，通常用于大型Web应用，由于内置组件足够强大所以使用Django开发可以一气呵成，优点是大而全，缺点也就暴露出来了，这么多的资源一次性全部加载，肯定会造成一部分的资源浪费；T
谈高考真题的使用（数学） weixin_34116110 python 测试
2019独角兽企业重金招聘Python工程师标准>>>在高三数学复习中，大家常说“以本为本，以纲为纲，高考真题当主粮”，就是以教材内容为根本，以“考试大纲”为准绳，以高考真题的训练为主线；抓住了本，把握了纲，训练有的放矢，我们的复习就会事半功倍。高考数学试题难度相对稳定，考查形式的变化却是异彩纷呈，而变化中又有着一定的规律：全国试题与各省市试题的考试要求基本一致；题型除上海和江苏外，全国和其他各省
力扣SQL题记录（持续） Dxecozy leetcode sql
此贴用于个人写SQL题记录，主要是用于记录新的知识和一些个人觉得的难题思路，便于复习目录Leetcode高频SQL50题基本题基本条件筛选多表连接新知识CHAR_LENGTH()函数的使用，用于计算字符长度Leetcode高频SQL50题基本题基本条件筛选1757.可回收且低脂的产品584.寻找用户推荐人595.大的国家1148.文章浏览I多表连接1378.使用唯一标识码替换员工ID新知识CHAR
《炫动漫》杂志社炫动漫杂志社炫动漫编辑部2024年第1期目录 QQ296078736 python
理论新知探究中职班主任德育能力提升策略(1)叶荣琳基于核心素养下以问题为驱动的高中数学教学评一体化的课堂教学探究(4)鹿园园农村初中英语作业设计与批阅方式的创新使用(7)侯成英新课改背景下初中物理教学方法创新策略探究(10)李传荣“双减”背景下构建初中数学高效课堂的策略(13)陈苏婷精神医学本科生参加心理剧团体课程的教学效果研究(16)查莉珺;王语含;陈虹;屈远;胡华提质增效：《机械识图》高职复习
707. 设计链表链表的知识复习 U_p_ 力扣 c++基础知识 C++链表数据结构
707.设计链表classMyLinkedList{public:structLinkedNode{intval;LinkedNode*next;LinkedNode(intval):val(val),next(nullptr){}};MyLinkedList(){dummyhead=newLinkedNode(0);size=0;}intget(intindex){if(index=size){
计算机网络——绪论 systemyff 计算机网络网络
6个章节，外加实验和复习课时。题目来自于题库，重在理解+翻译。概述物理层链路层网络层传输层应用层复习课实验课一、计算机网络的基本概念•21世纪的一些重要特征就是数字化、网络化和信息化，是一个以网络为核心的信息时代。•网络现已成为信息社会的命脉和发展知识经济的重要基础。发展最快的并起到核心作用的是计算机网络Ø第一代以主机为中心Ø第二代以通信子网为中心Ø第三代ISO/OSI-RM、InternetØ第
2023计算机组成原理考研知识点：哈佛结构计算机考研考研资料计算机网络哈佛结构数据结构
2023年计算机考研初试科目一般分四门，基本都考政治、英语一、数学一和计算机基础(计算机综合)，报考院校不同专业课考试内容一般不同，建议考生下正式备考2023年研考时先确认报考院校计算机研招科目内容，避免无效备考。计算机组成原理：哈佛结构将指令和数据放在两个独立的存储器，允许在一个机器周期内同时获得指令和操作数，提高了执行速度。2023年计算机组成原理复习题示例(来源于网络，如有侵权，请联系删除)
嵌入式知识笔记1——C++面试复习（3） Yuanyingbian 嵌入式学习资料笔记 c++算法
四、关键字库函数4.1sizeof和strlen的区别strlen是头文件中的函数，sizeof是C++中的运算符。strlen测量的是字符串的实际长度（其源代码如下），以\0结束。而sizeof测量的是字符数组的分配大小。strlen本身是库函数，因此在程序运行过程中，计算长度；而sizeof在编译时，计算长度；sizeof的参数可以是类型，也可以是变量；strlen的参数必须是char*类型的
Python零基础通关教程（二）：列表、字典与函数详解（附生活化案例）中意可口可乐 python 开发语言 windows python列表
一、前情回顾与学习路线第一篇重点复习：✅变量与数据类型✅条件判断✅循环结构本篇新知识地图：graphLRA[基础语法]-->B[列表]A-->C[字典]B-->D[函数进阶]C-->D二、列表(List)：你的数据收纳盒1.列表是什么？现实比喻：像超市购物车，可以随时添加/取出商品代码定义：用方括号[]包裹，元素用逗号分隔#创建购物车列表cart=["苹果","牛奶","面包"]print("购物
《我的Python觉醒之路》之转型Python（十五）——控制流 Python破壁人手记 python 服务器网络开发语言 java
[今天是2025年3月17日，继续复习第一章节、第二章节的内容]《我的Python觉醒之路》之转型Python（十四）——控制流
Spring Boot + Spring-Security实现前后端分离双重身份认证初学者指南（手机号密码JWT + 短信验证码） Iceroki Spring Boot spring spring boot java
折（mo）腾（yu）了好几天，终于把双重身份认证实现了。（账号密码jwt+短信验证码）看了很多视频，照葫芦画瓢敲了两三次，遇到各种各样的bug，比如循环依赖（通过@PostConstructor+setter解决）、框架报错等，翻了上百次csdn才逐渐摸清。总算对spring-security有了一个大概的认识，写一点学习心得，希望能帮到初学者，同时以备自己未来复习。spring-security
Secs/Gem第一讲 · 总结精华版(基于secs4net项目的ChatGpt介绍) 好学近乎知o secs/gem 面试 secs4net
好的！这就是《第一讲·总结精华版》——为背诵准备的口述速成稿，适合面试前复习+答题用。我们会分为两个部分：第一部分：一整段口述稿，可以当成面试时开口自我介绍用；第二部分：要点清单+关键词串讲，方便你临阵复盘，条理更清晰。【第一部分】通用口述稿（面试时可复读）“我们在对接设备时主要使用SECS/GEM通信协议，它是半导体行业里的一个国际标准，基于SECS-II报文格式和HSMS或SECS-I物理层。
西安电子科技大学考研833计算机专业基础综合初试备考经验西电研梦考研
本人21考研，报考西安电子科技大学。初试分数345。本科211机电专业，去年毕业出国受阻因此6月决定跨考西电计算机学硕833。回想自己备考的经历，有一些经验与不足之处，在这里分享给大家，尤其是一些跨考的同学。本次分别介绍数学、英语、政治、专业课、复试经历五部分。数学:数学和专业课是初试四门中最为重要的两门，决定能不能考上研基本就看这两门的复习情况!因为西电专硕学硕都是考察数学一，所以不需要考虑是否
CSS文本样式 css前端
文本text属性写在前面：上午我在做计组实验就没有去写博客，现在赶紧补上，还有五门期末考试要复习，加油。注意区分text和font，text是是对文本的整体结构排版的调整，而font的对文字本身的一个效果。属性说明text-indent首行缩进text-align水平对齐text-decoration文本修饰text-transform大小写转换line-height行高letter-spacin
GDPU unity游戏开发一天速成孑么 #三维游戏开发 unity 游戏引擎 c#动画图形渲染技术美术游戏程序
目录复习提纲拿住一．游戏引擎入门二．引擎基础知识三．界面交互设计四．物理引擎五．光照材质地形系统六．音视频动画特效系统七．寻路系统小题简答题名词解释程序填空“我游戏都玩不明白，还让我做游戏o(≧口≦)o”还在为课程烦恼嘛，本文重点在于，一学期摸鱼必过指南。复习提纲拿住注：该栏目转载请写明出处。温馨提示：代码题gameObject类跟transform类是内置的，其它实例调用均需初始化操作。然后一定
多线程到底重不重要？ Vic2334 JAVA java 开发语言
我们先说一下为什么要讲多线程和高并发？原因是，你想拿到一个更高的薪水，在面试的时候呈现出了两个方向的现象：第一个是上天项目经验高并发缓存大流量大数据量的架构设计第二个是入地各种基础算法，各种基础的数据结构JVMOS线程IO等内容多线程和高并发，就是入地里面的内容。基本概念我们先从线程的基本概念开始，给大家复习一下，不知道有多少同学是基础不太好，说什么是线程都不知道的，如果这样的话，花时间去补初级内
NLP复习3，手撕多头attention 地大停车第二帅 NLP学习自然语言处理人工智能
importmathimporttorchimportcollectionsimportnumpyasnpimporttorch.nnasnnclassMultiHeadAttention(nn.Module):def__init__(self,heads,d_model,dropout=0.1):super().__init__()#输入的特征维度self.d_model=d_model#每个头
数据结构与算法——数据结构4 写代码写到手抽筋数据结构与算法数据结构
程序员没有稳定一说，目前学习数据结构，其实不难，最近在学习，系统性的总结下，便于后续复习和使用。主要是把线性表，全名为线性存储结构。使用线性表存储数据的方式可以这样理解，即“把所有数据用一根线儿串起来，再存储到物理空间中”。分为顺序表和单链表。顺序表单链表同时还要知道顺序表和链表的优缺点【待补充】还要知道链表反转，知道迭代法和递归法就可以【】还需要知道单链表相交的思路【】后边了解静态链表的原理静态
离散数学-万字课堂笔记-期末考试-考研复习-北航离散数学1 桃木山人考研数学离散数学期末
第一章逻辑语言1.1逻辑运算1.2命题逻辑合式公式1.3谓词逻辑合式公式1.4自然语言命题第二章命题逻辑语义2.1命题合式公式语义2.2推论式与等价式的语义2.3变换合式公式的语义2.4命题公式范式2.5等式演算2.6完全集第三章谓词逻辑语义3.1谓词合式公式语义3.2推论关系和相等关系3.3前束范式与斯科伦范式3.4一阶理论语言3.5论域、结构与模型第四章逻辑公理系统4.1形式系统4.2命题逻辑
计算机科学与技术python方向_合肥师范学院计算机科学与技术python复习 weixin_39710106
1.计算机是根据指令操作数据的设备，具备功能性和可编程性两个基本特性2.程序设计语言的执行方式有编译执行和解释执行3.语言特点：与平台无关、粘性扩展、开源理念、支持中文、类库丰富4.IPO程序编写方法：input、process、output5.2.x与3.x的区别：(1)修改编码：3.x系列默认采用UTF-8编码；(2)去掉长整数类型：3.x系列不再区分整数和长整数类型，只有int类型，int类
百度官方！打造「大模型全开发周期系列课程」，AI应用开发入门课率先发布！（内含英雄帖）
在这个大模型技术日新月异的时代，AI的潜力正被无限释放，改变着我们的工作和生活方式。你是否渴望成为这场变革的参与者？你是否也想在这个大模型时代中抢占先机？那“学习AI”、“使用AI”、“入局AI”我们真的可以受益吗？学习辅助：将AI使用融入学习当中，依据当前学习情况，整理重点难点，让复习有的放矢，更高效掌握知识点。效率提升：帮助处理繁琐重复的工具，如数据分析师使用AI识别数据中的关键信息，自动整理
伍德里奇计量经济学第四章计算机答案,计量经济学中文答案伍德里奇 weixin_39950470
第1章计置经济学的性质与经济数据1.1复习笔记一、计量经济学由于计量经济学主要考虑在搜集和分析非实验经济数据时的固有问题，计量经济学己从数理统计分离出来并演化成一门独立学科。1.非实验数据是指并非从对个人、企业或经济系统中的某些部分的控制实验而得来的数据。非实验数据有时被称为观测数据或回顾数据，以强调研宄者只是被动的数据搜集者这一事实。2.实验数据通常是在实验环境中获得的，但在社会科学中要得到这些
【图论】——理论基础总结 weixin_47868976 图论
图论这一章尤其需要图例进行说明，方便理解，对于作者来说很费时间，本文主要为自己复习方便，所以并不会写的非常详细，见谅。图论图的基本概念基本要素：边节点两点连成线，多个点连成的线称为图。当然也可以就一个节点，或者啥也没有（空图）。图的种类方向的概念根据边有无方向划分为：无向图有向图权重的概念边可以有权重，根据有无权重和方向：加权有向图加权无向图度的概念针对无向图，对于某节点，有几条边连着该节点，就称
动态边界冒泡排序优化 Cybernetic Sage 算法排序算法
下午在复习排序算法时，突发奇想自己按照鸡尾酒排序算法思路写一遍，然后动态边界冒泡排序（DynamicBoundaryBoubbleSort）就这么诞生了。它的思路与鸡尾酒排序不同的是：每次扫描后根据最后一次交换的位置动态调整边界减少无效比较，在数组部分有序的情况下，效率应该比鸡尾酒排序更高。代码如下：#includeusingnamespacestd;constintN=1005;inta[N];
字典树(Trie) 理论知识复习及精选例题解析 BrainWen1 算法 java c++数据结构 python leetcode vscode
字典树理论知识复习及精选例题解析一、字典树理论知识二、精选例题解析例题1.P8306【模板】字典树例题2.P2580于是他错误的点名开始了例题3.P10471最大异或对TheXORLargestPair三、字典树的使用思路和细节使用思路细节注意四、总结一、字典树理论知识1.定义字典树（Trie）字典树（Trie）字典树（Trie），又称前缀树，是一种树形数据结构，用于高效地存储和检索字符串集合。它
前部分知识复习01 太妃糖耶 unity
一、关于变体1.#pragmamulti_compileA2.#pragmashader_featureAUnity提供了两个关键字来定义宏multi_compile和shader_feature，Unity会根据宏定义来生成不同种类的shader，这些不同种类的shader就是所谓的变体。multi_compile的特点如下：1、会组合爆炸#pragmamulti_compileAB#pragm
【Go沉思录】朝花夕拾：探究 Go 接口型函数 Golinie #Go沉思录 golang 接口型函数函数式编程
本文目录序1.接口型函数案例方式1GetterFunc类型的函数作为参数方式2实现了Getter接口的结构体作为参数价值2.net/http包中的使用场景序之前写Geecache的时候，遇到了接口型函数，当时没有搞懂，现在重新回过头研究复习Geecache的时候，发现看得懂一些了，刚好能梳理下。什么是接口型函数？比如下面这个。1.接口型函数typeGetterinterface{Get(keyst
JVM StackMapTable 属性的作用及理解 lijingyao8206 jvm 字节码 Class文件 StackMapTable
在Java 6版本之后JVM引入了栈图(Stack Map Table)概念。为了提高验证过程的效率，在字节码规范中添加了Stack Map Table属性，以下简称栈图，其方法的code属性中存储了局部变量和操作数的类型验证以及字节码的偏移量。也就是一个method需要且仅对应一个Stack Map Table。在Java 7版
回调函数调用方法百合不是茶 java
最近在看大神写的代码时,.发现其中使用了很多的回调 ,以前只是在学习的时候经常用到 ,现在写个笔记记录一下代码很简单: MainDemo :调用方法得到方法的返回结果
[时间机器]制造时间机器需要一些材料 comsci 制造
根据我的计算和推测,要完全实现制造一台时间机器,需要某些我们这个世界不存在的物质和材料... 甚至可以这样说,这种材料和物质,我们在反应堆中也无法获得......
开口埋怨不如闭口做事邓集海邓集海做人做事工作
“开口埋怨，不如闭口做事。”不是名人名言，而是一个普通父亲对儿子的训导。但是，因为这句训导，这位普通父亲却造就了一个名人儿子。这位普通父亲造就的名人儿子，叫张明正。　　　　张明正出身贫寒，读书时成绩差，常挨老师批评。高中毕业，张明正连普通大学的分数线都没上。高考成绩出来后，平时开口怨这怨那的张明正，不从自身找原因，而是不停地埋怨自己家庭条件不好、埋怨父母没有给他创造良好的学习环境。　　　　
jQuery插件开发全解析，类级别与对象级别开发 IT独行者 jquery 开发插件　函数
jQuery插件的开发包括两种：一种是类级别的插件开发，即给 jQuery添加新的全局函数，相当于给 jQuery类本身添加方法。 jQuery的全局函数就是属于 jQuery命名空间的函数，另一种是对象级别的插件开发，即给 jQuery对象添加方法。下面就两种函数的开发做详细的说明。 1 、类级别的插件开发类级别的插件开发最直接的理解就是给jQuer
Rome解析Rss 413277409 Rome解析Rss
import java.net.URL; import java.util.List; import org.junit.Test; import com.sun.syndication.feed.synd.SyndCategory; import com.sun.syndication.feed.synd.S
RSA加密解密无量加密解密 rsa
RSA加密解密代码代码有待整理 package com.tongbanjie.commons.util; import java.security.Key; import java.security.KeyFactory; import java.security.KeyPair; import java.security.KeyPairGenerat
linux 软件安装遇到的问题 aichenglong linux 遇到的问题 ftp
1 ftp配置中遇到的问题 500 OOPS: cannot change directory 出现该问题的原因:是SELinux安装机制的问题.只要disable SELinux就可以了修改方法:1 修改/etc/selinux/config 中SELINUX=disabled 2 source /etc
面试心得 alafqq 面试
最近面试了好几家公司。记录下；支付宝，面试我的人胖胖的，看着人挺好的；博彦外包的职位，面试失败；阿里金融，面试官人也挺和善，只不过我让他吐血了。。。由于印象比较深，记录下； 1，自我介绍 2，说下八种基本类型；（算上string。楼主才答了3种，哈哈，string其实不是基本类型，是引用类型） 3，什么是包装类，包装类的优点； 4，平时看过什么书？NND，什么书都没看过。。照样
java的多态性探讨百合不是茶 java
java的多态性是指main方法在调用属性的时候类可以对这一属性做出反应的情况 //package 1; class A{ public void test(){ System.out.println("A"); } } class D extends A{ public void test(){ S
网络编程基础篇之JavaScript-学习笔记 bijian1013 JavaScript
1.documentWrite <html> <head> <script language="JavaScript"> document.write("这是电脑网络学校"); document.close(); </script> </h
探索JUnit4扩展：深入Rule bijian1013 JUnit Rule 单元测试
本文将进一步探究Rule的应用，展示如何使用Rule来替代@BeforeClass，@AfterClass，@Before和@After的功能。在上一篇中提到，可以使用Rule替代现有的大部分Runner扩展，而且也不提倡对Runner中的withBefores()，withAfte
[CSS]CSS浮动十五条规则 bit1129 css
这些浮动规则，主要是参考CSS权威指南关于浮动规则的总结，然后添加一些简单的例子以验证和理解这些规则。 1. 所有的页面元素都可以浮动 2. 一个元素浮动后，会成为块级元素，比如<span>,a, strong等都会变成块级元素 3.一个元素左浮动，会向最近的块级父元素的左上角移动，直到浮动元素的左外边界碰到块级父元素的左内边界；如果这个块级父元素已经有浮动元素停靠了
【Kafka六】Kafka Producer和Consumer多Broker、多Partition场景 bit1129 partition
0.Kafka服务器配置 3个broker 1个topic，6个partition，副本因子是2 2个consumer，每个consumer三个线程并发读取 1. Producer package kafka.examples.multibrokers.producers; import java.util.Properties; import java.util.
zabbix_agentd.conf配置文件详解 ronin47 zabbix 配置文件
Aliaskey的别名，例如 Alias=ttlsa.userid:vfs.file.regexp[/etc/passwd,^ttlsa:.:([0-9]+),,,,\1]，或者ttlsa的用户ID。你可以使用key：vfs.file.regexp[/etc/passwd,^ttlsa:.: ([0-9]+),,,,\1]，也可以使用ttlsa.userid。备注: 别名不能重复，但是可以有多个
java--19.用矩阵求Fibonacci数列的第N项 bylijinnan fibonacci
参考了网上的思路，写了个Java版的： public class Fibonacci { final static int[] A={1,1,1,0}; public static void main(String[] args) { int n=7; for(int i=0;i<=n;i++){ int f=fibonac
Netty源码学习-LengthFieldBasedFrameDecoder bylijinnan java netty
先看看LengthFieldBasedFrameDecoder的官方API http://docs.jboss.org/netty/3.1/api/org/jboss/netty/handler/codec/frame/LengthFieldBasedFrameDecoder.html API举例说明了LengthFieldBasedFrameDecoder的解析机制，如下：实
AES加密解密 chicony 加密解密
AES加解密算法，使用Base64做转码以及辅助加密： package com.wintv.common; import javax.crypto.Cipher; import javax.crypto.spec.IvParameterSpec; import javax.crypto.spec.SecretKeySpec; import sun.misc.BASE64Decod
文件编码格式转换 ctrain 编码格式
package com.test; import java.io.File; import java.io.FileInputStream; import java.io.FileOutputStream; import java.io.IOException; import java.io.InputStream; import java.io.OutputStream;
mysql 在linux客户端插入数据中文乱码 daizj mysql 中文乱码
1、查看系统客户端，数据库，连接层的编码查看方法： http://daizj.iteye.com/blog/2174993 进入mysql，通过如下命令查看数据库编码方式： mysql> show variables like 'character_set_%'; +--------------------------+------
好代码是廉价的代码 dcj3sjt126com 程序员读书
长久以来我一直主张：好代码是廉价的代码。当我跟做开发的同事说出这话时，他们的第一反应是一种惊愕，然后是将近一个星期的嘲笑，把它当作一个笑话来讲。当他们走近看我的表情、知道我是认真的时，才收敛一点。当最初的惊愕消退后，他们会用一些这样的话来反驳： “好代码不廉价，好代码是采用经过数十年计算机科学研究和积累得出的最佳实践设计模式和方法论建立起来的精心制作的程序代码。” 我只
Android网络请求库——android-async-http dcj3sjt126com android
在iOS开发中有大名鼎鼎的ASIHttpRequest库，用来处理网络请求操作，今天要介绍的是一个在Android上同样强大的网络请求库android-async-http，目前非常火的应用Instagram和Pinterest的Android版就是用的这个网络请求库。这个网络请求库是基于Apache HttpClient库之上的一个异步网络请求处理库，网络处理均基于Android的非UI线程，通
ORACLE 复习笔记之SQL语句的优化 eksliang SQL优化 Oracle sql语句优化 SQL语句的优化
转载请出自出处：http://eksliang.iteye.com/blog/2097999 SQL语句的优化总结如下 sql语句的优化可以按照如下六个步骤进行：合理使用索引避免或者简化排序消除对大表的扫描避免复杂的通配符匹配调整子查询的性能 EXISTS和IN运算符下面我就按照上面这六个步骤分别进行总结：
浅析：Android 嵌套滑动机制（NestedScrolling） gg163 android 移动开发滑动机制嵌套
谷歌在发布安卓 Lollipop版本之后，为了更好的用户体验，Google为Android的滑动机制提供了NestedScrolling特性 NestedScrolling的特性可以体现在哪里呢？ 比如你使用了Toolbar，下面一个ScrollView，向上滚
使用hovertree菜单作为后台导航 hvt JavaScript jquery .net hovertree asp.net
hovertree是一个jquery菜单插件，官方网址：http://keleyi.com/jq/hovertree/ ，可以登录该网址体验效果。 0.1.3版本：http://keleyi.com/jq/hovertree/demo/demo.0.1.3.htm hovertree插件包含文件： http://keleyi.com/jq/hovertree/css
SVG 教程（二）矩形天梯梦 svg
SVG <rect> SVG Shapes SVG有一些预定义的形状元素，可被开发者使用和操作：矩形 <rect> 圆形 <circle> 椭圆 <ellipse> 线 <line> 折线 <polyline> 多边形 <polygon> 路径 <path>
一个简单的队列 luyulong java 数据结构队列
public class MyQueue { private long[] arr; private int front; private int end; // 有效数据的大小 private int elements; public MyQueue() { arr = new long[10]; elements = 0; front
基础数据结构和算法九：Binary Search Tree sunwinner Algorithm
A binary search tree (BST) is a binary tree where each node has a Comparable key (and an associated value) and satisfies the restriction that the key in any node is larger than the keys in all
项目出现的一些问题和体会 Steven-Walker DAO Web servlet
第一篇博客不知道要写点什么，就先来点近阶段的感悟吧。这几天学了servlet和数据库等知识，就参照老方的视频写了一个简单的增删改查的，完成了最简单的一些功能，使用了三层架构。 dao层完成的是对数据库具体的功能实现，service层调用了dao层的实现方法，具体对servlet提供支持。 &
高手问答：Java老A带你全面提升Java单兵作战能力！ ITeye管理员 java
本期特邀《Java特种兵》作者：谢宇，CSDN论坛ID: xieyuooo 针对JAVA问题给予大家解答，欢迎网友积极提问，与专家一起讨论! 作者简介：淘宝网资深Java工程师，CSDN超人气博主，人称“胖哥”。 CSDN博客地址： http://blog.csdn.net/xieyuooo 作者在进入大学前是一个不折不扣的计算机白痴，曾经被人笑话过不懂鼠标是什么，