海量日志数据提取某日访问百度次数最多的那个IP的Java实现

海量日志数据提取某日访问百度次数最多的那个IP的Java实现

前几天在网上看到july的一篇文章《教你如何迅速秒杀掉：99%的海量数据处理面试题》,里面说到百度的一个面试题目，题目如下：

海量日志数据，提取出某日访问百度次数最多的那个IP。

july里面的分析如下。

1、分而治之/hash映射：针对数据太大，内存受限，只能是：把大文件化成(取模映射)小文件，即16字方针：大而化小，各个击破，缩小规模，逐个解决

2、 hash统计：当大文件转化了小文件，那么我们便可以采用常规的hash_map(ip，value)来进行频率统计。

3、堆/快速排序：统计完了之后，便进行排序(可采取堆排序)，得到次数最多的IP。

我的分析：

1、见july的1st.

2、见july的2nd.

3、不用排序，直接在统计的时候，计算出次数最多的IP：在第2步的时候，求出ip的次数，实际上呢，次数最大的那个只可能是一个值，因此在计算每个IP次数的时候，与这个最大值作比较，计算完即可知道最大值的IP是….

1 机器配置：

CPU:I3-2330M 2.20GHZ

MEM:4G(3.16G可用)

OS:win7 32位

2 生成海量数据的大文件：

2.1 总数据为1亿个IP数据，生成规则：以10.开头，其他是0-255的随机数。

/**

	 * 生成大文件

	 * @param ipFile

	 * @param numberOfLine

	 */

	public void gernBigFile(File ipFile,long numberOfLine){

		BufferedWriter bw = null;

		FileWriter fw = null;

		long startTime = System.currentTimeMillis();

		try{

			fw = new FileWriter(ipFile,true);

			bw = new BufferedWriter(fw);

			

			SecureRandom random = new SecureRandom();

			for (int i = 0; i < numberOfLine; i++) {

				bw.write("10."+random.nextInt(255)+"."+random.nextInt(255)+"."+random.nextInt(255)+"\n");

				if((i+1) % 1000 == 0){

					bw.flush();

				}

			}

			bw.flush();

			

			long endTime = System.currentTimeMillis();

			System.err.println(DateUtil.convertMillsToTime(endTime - startTime));

		}catch (Exception e) {

			e.printStackTrace();

		}finally{

			try{

				if(fw != null){

					fw.close();

				}

			}catch (Exception e) {

				e.printStackTrace();

			}

			try{

				if(bw != null){

					bw.close();

				}

			}catch (Exception e) {

				e.printStackTrace();

			}

		}

	}

/*

		 * 1、第一次生成1亿(实际上最多为16581375)的ip地址，需要时间为3分多钟不到4分钟。

		 */

		TooMuchIpFile tooMuchIpFile = new TooMuchIpFile();

		File ipFile = new File("e:/ipAddr.txt");

		try {

			ipFile.createNewFile();

		} catch (IOException e) {

			e.printStackTrace();

		}

		tooMuchIpFile.gernBigFile(ipFile, 100000000);

2.2 运行结果：

生成1亿行的Ip地址，大约耗时：3分多钟，大小1.27 GB (1,370,587,382字节)

3 分割大文件，

根据july的分析，取每个IP的hashCode，与1000取模，把IP散列到不同的文件中去。

3.1 第一种方法：

一边取每个IP的散列值，再模1000，得到一个值，然后写到此值对应的文件中去。大约耗时超过2个多小时，实在是太慢了，没跑完就直接断掉了。

/**

	 * 大文件分割为小文件

	 * @param ipFile

	 * @param numberOfFile

	 */

	public void splitFile(File ipFile,int numberOfFile){

		BufferedReader br = null;

		FileReader fr = null;

		BufferedWriter bw = null;

		FileWriter fw = null;

		long startTime = System.currentTimeMillis();

		try{

			fr = new FileReader(ipFile);

			br = new BufferedReader(fr);

			String ipLine = br.readLine();

			while(ipLine != null){

				int hashCode = ipLine.hashCode();

				hashCode = hashCode < 0 ? -hashCode : hashCode;

				int fileNum = hashCode % numberOfFile;

				File file = new File("e:/tmp/ip/"+ fileNum + ".txt");

				if(!file.exists()){

					file.createNewFile();

				}

				fw = new FileWriter(file,true);

				bw = new BufferedWriter(fw);

				bw.write(ipLine + "\n");

				bw.flush();

				fw.close();

				bw.close();

				ipLine = br.readLine();

			}

			

			long endTime = System.currentTimeMillis();

			System.err.println(DateUtil.convertMillsToTime(endTime - startTime));

		}catch (Exception e) {

			e.printStackTrace();

		}finally{

			try{

				if(fr != null){

					fr.close();

				}

			}catch (Exception e) {

				e.printStackTrace();

			}

			try{

				if(br != null){

					br.close();

				}

			}catch (Exception e) {

				e.printStackTrace();

			}

			try{

				if(fw != null){

					fw.close();

				}

			}catch (Exception e) {

				e.printStackTrace();

			}

			try{

				if(bw != null){

					bw.close();

				}

			}catch (Exception e) {

				e.printStackTrace();

			}

		}

	}

3.2 第二种方法：

与第一次方法基本相同，不同的是减少流对象的创建，只是创建文件时，创建流对象，但还是需要每次都要判断文件存在与否。大约耗时超过1个多小时，也实在是慢呀，没等它运行完就断了。

/**

	 * 大文件分割为小文件

	 * @param ipFile

	 * @param numberOfFile

	 */

	public void splitFile2(File ipFile,int numberOfFile){

		BufferedReader br = null;

		FileReader fr = null;

		BufferedWriter bw = null;

		FileWriter fw = null;

		long startTime = System.currentTimeMillis();

		try{

			fr = new FileReader(ipFile);

			br = new BufferedReader(fr);

			String ipLine = br.readLine();

			while(ipLine != null){

				int hashCode = ipLine.hashCode();

				hashCode = hashCode < 0 ? -hashCode : hashCode;

				int fileNum = hashCode % numberOfFile;

				File file = new File("e:/tmp/ip/"+ fileNum + ".txt");

				if(!file.exists()){

					file.createNewFile();

					fw = new FileWriter(file,true);

					bw = new BufferedWriter(fw);

					bwMap.put(fileNum, bw);

				}else{

					bw = bwMap.get(fileNum);

				}

				bw.write(ipLine + "\n");

				bw.flush();

				ipLine = br.readLine();

			}

			for(int fn : bwMap.keySet()){

				bwMap.get(fn).close();

			}

			bwMap.clear();

			long endTime = System.currentTimeMillis();

			System.err.println(DateUtil.convertMillsToTime(endTime - startTime));

		}catch (Exception e) {

			e.printStackTrace();

		}finally{

			try{

				if(fr != null){

					fr.close();

				}

			}catch (Exception e) {

				e.printStackTrace();

			}

			try{

				if(br != null){

					br.close();

				}

			}catch (Exception e) {

				e.printStackTrace();

			}

			try{

				if(fw != null){

					fw.close();

				}

			}catch (Exception e) {

				e.printStackTrace();

			}

			try{

				if(bw != null){

					bw.close();

				}

			}catch (Exception e) {

				e.printStackTrace();

			}

		}

	}

3.3 第三种方法：

与第二种方法基本相同，在此基础上，优化一边取值，一边写文件的过程，而是先写到内存中，当达到1000后，再一起写入文件中。大约耗时52多分钟，这个是实际运行完的，在中午去吃饭的时候让它自己跑完的。

/**

	 * 大文件分割为小文件

	 * @param ipFile

	 * @param numberOfFile

	 */

	public void splitFile3(File ipFile,int numberOfFile){

		BufferedReader br = null;

		FileReader fr = null;

		BufferedWriter bw = null;

		FileWriter fw = null;

		long startTime = System.currentTimeMillis();

		try{

			fr = new FileReader(ipFile);

			br = new BufferedReader(fr);

			String ipLine = br.readLine();

			while(ipLine != null){

				int hashCode = ipLine.hashCode();

				hashCode = hashCode < 0 ? -hashCode : hashCode;

				int fileNum = hashCode % numberOfFile;

				File file = new File("e:/tmp/ip/"+ fileNum + ".txt");

				if(!file.exists()){

					file.createNewFile();

					fw = new FileWriter(file,true);

					bw = new BufferedWriter(fw);

					bwMap.put(fileNum, bw);

					dataMap.put(fileNum, new LinkedList<String>());

				}else{

					List<String> list = dataMap.get(fileNum);

					list.add(ipLine + "\n");

					if(list.size() % 1000 == 0){

						BufferedWriter writer = bwMap.get(fileNum);

						for(String line : list){

							writer.write(line);

						}

						writer.flush();

						list.clear();

					}

				}

				ipLine = br.readLine();

			}

			for(int fn : bwMap.keySet()){

				List<String> list = dataMap.get(fn);

				BufferedWriter writer = bwMap.get(fn);

				for(String line : list){

					writer.write(line);

				}

				list.clear();

				writer.flush();

				writer.close();

			}

			bwMap.clear();

			long endTime = System.currentTimeMillis();

			System.err.println(DateUtil.convertMillsToTime(endTime - startTime));

		}catch (Exception e) {

			e.printStackTrace();

		}finally{

			try{

				if(fr != null){

					fr.close();

				}

			}catch (Exception e) {

				e.printStackTrace();

			}

			try{

				if(br != null){

					br.close();

				}

			}catch (Exception e) {

				e.printStackTrace();

			}

			try{

				if(fw != null){

					fw.close();

				}

			}catch (Exception e) {

				e.printStackTrace();

			}

			try{

				if(bw != null){

					bw.close();

				}

			}catch (Exception e) {

				e.printStackTrace();

			}

		}

	}

3.4 第四种方法：

在第三种方法基础上作进一步优化，不同的是，把创建1000个流对象放到循环外面。大约耗时13分钟35秒。这个方法实在比第三种方法快了4倍左右，但在我觉得，这时间还是有点说不过去呀。

/**

	 * 大文件分割为小文件

	 * @param ipFile

	 * @param numberOfFile

	 */

	public void splitFile4(File ipFile,int numberOfFile){

		BufferedReader br = null;

		FileReader fr = null;

		BufferedWriter bw = null;

		FileWriter fw = null;

		long startTime = System.currentTimeMillis();

		try{

			fr = new FileReader(ipFile);

			br = new BufferedReader(fr);

			String ipLine = br.readLine();

			//先创建文件及流对象方便使用

			for(int i=0;i<numberOfFile;i++){

				File file = new File("e:/tmp/ip1/"+ i + ".txt");

				bwMap.put(i, new BufferedWriter(new FileWriter(file,true)));

				dataMap.put(i, new LinkedList<String>());

			}

			while(ipLine != null){

				int hashCode = ipLine.hashCode();

				hashCode = hashCode < 0 ? -hashCode : hashCode;

				int fileNum = hashCode % numberOfFile;

				List<String> list = dataMap.get(fileNum);

				list.add(ipLine + "\n");

				if(list.size() % 1000 == 0){

					BufferedWriter writer = bwMap.get(fileNum);

					for(String line : list){

						writer.write(line);

					}

					writer.flush();

					list.clear();

				}

				ipLine = br.readLine();

			}

			for(int fn : bwMap.keySet()){

				List<String> list = dataMap.get(fn);

				BufferedWriter writer = bwMap.get(fn);

				for(String line : list){

					writer.write(line);

				}

				list.clear();

				writer.flush();

				writer.close();

			}

			bwMap.clear();

			long endTime = System.currentTimeMillis();

			System.err.println(DateUtil.convertMillsToTime(endTime - startTime));

		}catch (Exception e) {

			e.printStackTrace();

		}finally{

			try{

				if(fr != null){

					fr.close();

				}

			}catch (Exception e) {

				e.printStackTrace();

			}

			try{

				if(br != null){

					br.close();

				}

			}catch (Exception e) {

				e.printStackTrace();

			}

			try{

				if(fw != null){

					fw.close();

				}

			}catch (Exception e) {

				e.printStackTrace();

			}

			try{

				if(bw != null){

					bw.close();

				}

			}catch (Exception e) {

				e.printStackTrace();

			}

		}

	}

3.5 第五种方法：

使用多线程，未成功实现优化。只是给出思路如下：读取1亿数据的文件，循环读取每个IP，计算其散列值，取模1000，之后把其放到对应的队列中，当其队列超过1000时，启动一个服务线程把数据写入文件中。（也即主线程只负责计算，由其他线程负责写）

3.6 运行结果：

1、第一次分割1亿数据的大文件，实在是太慢，运行差不多一小时，才分割出300W数据，耗时超过2个钟头

2、第二次分割1亿数据的大文件，经过优化后，虽然比第一次有提升，但是还是很慢，耗时超过1个钟头.

3、第三次分割1亿数据的大文件，经过优化后，虽然比第二次有提升，但是还是很慢,需耗时52.0分3.6秒

4、第四次分割1亿数据的大文件，经过优化后，耗时13.0分35.10400000000004秒

4 统计

各个文件中出现次数最多的IP（可能有多个）:

采用的方法是一边统计各个IP出现的次数，一边算次数出现最大那个IP。

/**

	 * 统计，找出次数最多的IP

	 * @param ipFile

	 */

	public void read(File ipFile){

		BufferedReader br = null;

		FileReader fr = null;

		long startTime = System.currentTimeMillis();

		try{

			fr = new FileReader(ipFile);

			br = new BufferedReader(fr);

			String ipLine = br.readLine();

			while(ipLine != null){

				ipLine = ipLine.trim();

				Integer count = ipNumMap.get(ipLine);

				if(count == null){

					count = 0;

				}

				count ++;

				ipNumMap.put(ipLine, count);

				

				if(count >= ipMaxNum){

					if(count > ipMaxNum){

						keyList.clear();

					}

					keyList.add(ipLine);

					ipMaxNum = count;

				}

				ipLine = br.readLine();

			}

			long endTime = System.currentTimeMillis();

			System.err.println(ipFile.getName()+":"+DateUtil.convertMillsToTime(endTime - startTime));

			totalTime += (endTime - startTime);

		}catch (Exception e) {

			e.printStackTrace();

		}finally{

			try{

				if(fr != null){

					fr.close();

				}

			}catch (Exception e) {

				e.printStackTrace();

			}

			try{

				if(br != null){

					br.close();

				}

			}catch (Exception e) {

				e.printStackTrace();

			}

		}

	}

4.1 运行结果：

1、从1000个文件中查询Ip次数最多的Ip，10.164.143.57:24,3.0分18.748999999999995秒

2、从1000个文件中查询Ip次数最多的Ip，10.164.143.57:24,3.0分27.366000000000014秒

3、从1000个文件中查询Ip次数最多的Ip，10.164.143.57:24,2.0分42.781000000000006秒

5 以上代码的公共变量

public final Map<Integer,BufferedWriter> bwMap = new HashMap<Integer,BufferedWriter>();//保存每个文件的流对象

public final Map<Integer,List<String>> dataMap = new HashMap<Integer,List<String>>();//分隔文件用

private Map<String,Integer> ipNumMap = new HashMap<String, Integer>();//保存每个文件中的每个IP出现的次数

	private List<String> keyList = new LinkedList<String>();//保存次数出现最多的IP

	private int ipMaxNum = 0;//次数出现最多的值

	private long totalTime = 0;//计算统计所耗的时间

6 Main

public static void main(String[] args) {

/*

	 * 1、第一次生成1亿(实际上最多为16581375)的ip地址，需要时间为3分多钟不到4分钟。

	 */

		/*TooMuchIpFile tooMuchIpFile = new TooMuchIpFile();

		File ipFile = new File("e:/ipAddr.txt");

		try {

			ipFile.createNewFile();

		} catch (IOException e) {

			e.printStackTrace();

		}

		tooMuchIpFile.gernBigFile(ipFile, 100000000);*/



	

//		System.err.println("128.128.80.226".hashCode()%1000);

//		System.err.println("128.128.80.227".hashCode());

//		System.err.println("10.128.80.227".hashCode());

//		System.err.println("10.0.80.227".hashCode());

		

		

		/*

		 * 1、第一次分割1亿数据的大文件，实在是太慢，运行差不多一小时，才分割出300W数据，耗时超过2个钟头

		 * 2、第二次分割1亿数据的大文件，经过优化后，虽然比第一次有提升，但是还是很慢，耗时超过1个钟头.

		 * 3、第三次分割1亿数据的大文件，经过优化后，虽然比第二次有提升，但是还是很慢,需耗时52.0分3.6秒

		 * 4、第四次分割1亿数据的大文件，经过优化后，耗时13.0分35.10400000000004秒

	 */

		TooMuchIpFile tooMuchIpFile = new TooMuchIpFile();

		File ipFile = new File("e:/ipAddr.txt");

		tooMuchIpFile.splitFile4(ipFile, 1000);

		

		

		/*

		 * 1、从1000个文件中查询Ip次数最多的Ip，10.164.143.57:24,3.0分18.748999999999995秒

		 * 2、从1000个文件中查询Ip次数最多的Ip，10.164.143.57:24,3.0分27.366000000000014秒

		 * 3、从1000个文件中查询Ip次数最多的Ip，10.164.143.57:24,2.0分42.781000000000006秒

		 */

//		TooMuchIpFile tooMuchIpFile = new TooMuchIpFile();

//		File ipFiles = new File("e:/tmp/ip1/");

//		for (File ipFile : ipFiles.listFiles()) {

//			tooMuchIpFile.read(ipFile);

//			tooMuchIpFile.ipNumMap.clear();

//		}

//		System.err.println("======================出现次数最多的IP==================");

//		for(String key: tooMuchIpFile.keyList){

//			System.err.println(key + ":" + tooMuchIpFile.ipMaxNum);

//		}

//		System.err.println(DateUtil.convertMillsToTime(tooMuchIpFile.totalTime));

	}

Java开发者的春节之旅：编程与传统文化的交融 egzosn java 开发语言
在这个辞旧迎新的美好时刻，春节不仅仅是一个家庭的团聚、美食的盛宴，更是我们深刻体验和传承中华传统文化的重要契机。作为一名Java开发者，如何在忙碌的编码之余，将这份对技术的热爱融入到传统节日的氛围中呢？今天，就让我们一起探索如何用Java技术为春节增添一份独特的科技色彩。一、春节倒计时——用Java实现春节前的那段日子，最让人期待的就是那不断减少的倒计时数字。我们可以用Java编写一个简单的倒计时
NLP 中文拼写检测纠正论文 Automatic-Corpus-Generation 代码后端java
拼写纠正系列NLP中文拼写检测实现思路NLP中文拼写检测纠正算法整理NLP英文拼写算法，如果提升100W倍的性能？NLP中文拼写检测纠正Paperjava实现中英文拼写检查和错误纠正？可我只会写CRUD啊！一个提升英文单词拼写检测性能1000倍的算法？单词拼写纠正-03-leetcodeedit-distance72.力扣编辑距离NLP开源项目nlp-hanzi-similar汉字相似度word-
用java 实现 Add Two Numbers 两数相加（LeetCode算法）用心去追梦算法 java leetcode
LeetCode上的“AddTwoNumbers”问题要求我们实现一个函数，该函数接收两个非空链表作为输入，每个链表表示一个非负整数的逆序表示（即个位在链表头），链表中的每个节点包含一个数字（0-9）。任务是将这两个数相加，并以同样的链表格式返回和。下面是用Java实现这个算法的方法：classListNode{intval;ListNodenext;ListNode(intx){val=x;}}
Java学习，List移动元素五味香 java 学习 list python 开发语言 android kotlin
Java实现List中元素的循环移动（即将列表中的元素向右或向左移动指定数量的位置），可以使用多种方法。List元素移动指定位置：importjava.util.ArrayList;importjava.util.Collections;importjava.util.List;publicclassRotateList{publicstaticvoidmain(String[]args){Lis
用java 实现 Zigzag Conversion Z 字形变换（leetCode 算法）用心去追梦算法 java leetcode
Z字形变换（ZigzagConversion）是LeetCode上一个有趣的字符串操作问题。题目要求我们把给定的字符串按照Z字形排列，并且按行读取这些字符，最后返回重新排列后的字符串。例如，输入字符串“PAYPALISHIRING”和行数numRows=3时，Z字形排列如下：PAHNAPLSIIGYIR然后按行读取得到的结果字符串为“PAHNAPLSIIGYIR”。下面是用Java实现这个算法的方
用java 实现 Longest Substring Without Repeating Characters 无重复字符的最长子串（leetCode 算法）用心去追梦算法 java leetcode
无重复字符的最长子串（LongestSubstringWithoutRepeatingCharacters）是LeetCode上一个非常经典的滑动窗口问题。这个问题要求我们找到给定字符串中没有重复字符的最长子串的长度。下面是一个使用Java实现的解决方案，它使用了滑动窗口和哈希集合来跟踪当前窗口内的字符：importjava.util.HashSet;importjava.util.Set;pub
用java 实现 Longest Palindromic Substring 最长回文子串（leetCode 算法）用心去追梦算法 java leetcode
最长回文子串（LongestPalindromicSubstring）是LeetCode上一个经典的问题，它要求我们找到给定字符串中最长的回文子串。这个问题可以通过多种方法来解决，其中一种高效的方法是中心扩展法。该算法的基本思想是遍历每个字符，并以该字符为中心尝试向两边扩展，寻找最长的回文子串。下面是用Java实现这个算法的方法：publicclassLongestPalindromicSubst
NLP 中文拼写检测纠正论文-07-NLPTEA-2020中文语法错误诊断共享任务概述后端java
拼写纠正系列NLP中文拼写检测实现思路NLP中文拼写检测纠正算法整理NLP英文拼写算法，如果提升100W倍的性能？NLP中文拼写检测纠正Paperjava实现中英文拼写检查和错误纠正？可我只会写CRUD啊！一个提升英文单词拼写检测性能1000倍的算法？单词拼写纠正-03-leetcodeedit-distance72.力扣编辑距离NLP开源项目nlp-hanzi-similar汉字相似度word-
NLP 中文拼写检测纠正论文-04-Learning from the Dictionary 后端java
拼写纠正系列NLP中文拼写检测实现思路NLP中文拼写检测纠正算法整理NLP英文拼写算法，如果提升100W倍的性能？NLP中文拼写检测纠正Paperjava实现中英文拼写检查和错误纠正？可我只会写CRUD啊！一个提升英文单词拼写检测性能1000倍的算法？单词拼写纠正-03-leetcodeedit-distance72.力扣编辑距离NLP开源项目nlp-hanzi-similar汉字相似度word-
NLP 中文拼写检测纠正论文-01-介绍了SIGHAN 2015 包括任务描述，数据准备，绩效指标和评估结果后端java
拼写纠正系列NLP中文拼写检测实现思路NLP中文拼写检测纠正算法整理NLP英文拼写算法，如果提升100W倍的性能？NLP中文拼写检测纠正Paperjava实现中英文拼写检查和错误纠正？可我只会写CRUD啊！一个提升英文单词拼写检测性能1000倍的算法？单词拼写纠正-03-leetcodeedit-distance72.力扣编辑距离NLP开源项目nlp-hanzi-similar汉字相似度word-
Java实现归并排序算法详解及优化捕风捉你从0开始学算法 java 排序算法算法
引言归并排序（MergeSort）是一种有效、稳定且常用的排序算法，尤其在处理大规模数据时表现良好。本文将详细讲解如何使用Java实现归并排序算法，并结合图解和实例代码，帮助您全面理解这一高级排序算法。同时，我们还将探讨归并排序的优化方法，以进一步提高其性能。归并排序算法的原理归并排序是一种分治算法，它将数组分成两个子数组，分别对两个子数组进行排序，然后将排好序的子数组合并成一个有序数组。算法步骤
用java 实现生成二维码同意授权给公众号访问其信息。这通常通过将用户重定向到一个由微信提供的授权页面完成。用心去追梦 java 微信 python
要使用Java实现生成二维码以同意授权给微信公众号访问用户信息，你可以结合OAuth2.0网页授权流程与微信提供的二维码生成接口。具体来说，你需要创建一个带有授权链接的二维码，当用户扫描并同意授权后，可以重定向到指定页面。步骤1:构建授权URL首先，根据之前的指导构建授权URL。这个URL将用于生成二维码，使得用户在扫描二维码时被重定向到微信的授权页面。步骤2:使用微信API生成二维码微信提供了两
海康威视摄像头ISUP(原EHOME协议) 摄像头实时预览springboot 版本java实现，并可以在浏览器vue前端播放(附带源码) web14786210723 java 前端 spring boot
1.首先说了一下为什么要用ISUP协议来取流ISUP主要就是用来解决摄像头没有公网ip的情况,如果摄像头或者所在局域网的路由器有公网ip的话，其实采用rtsp直接取流是最方便也是性能最好的，但是项目的摄像头没有公网IP所以被迫使用ISUP，ISUP是海康自己的协议，海康官网是有对应的DEMO，我主要根据他们的java版本的demo进行改造海康DEMO地址，2.具体实现首先得设置摄像头编码格式H.2
java实现word转html（支持docx及doc文件） WAZYY0619 java word html word转html docx转html doc转html
privatefinalstaticStringtempPath="C:\\Users\\xxx\\Desktop\\Word2Html\\src\\test\\";//图片及相关文件保存的路径publicstaticvoidmain(Stringargv[]){try{JFileChooserfileChooser=newJFileChooser();fileChooser.setDialogT
Java实现简易的学生管理系统杰仔正在努力 Java java idea
Java实现简易的学生管理系统文章目录Java实现简易的学生管理系统前言一、如何实现二、实现的方法（示意图）三、开始实现3.1定义类3.2定义主界面3.3实现添加功能3.4实现查询功能3.5实现删除功能3.6实现修改功能四、完整代码五、总结前言该项目主要是作为新手快速上手实操，围绕面向对象所学知识实现学生管理系统的增删改查功能，所使用的知识点主要是面向对象的三大特征使用的方法、判断语句、构造方法等
天天酷跑电脑版代码C语言,Java实现天天酷跑小游戏完整代码(附源码).pdf 小麦的天空天天酷跑电脑版代码C语言
Java实实现现天天天天酷酷跑跑小小游游戏戏完完整整代代码码(附附源源码码)首首先先，，写写一一个个需需求求文文档档：：一、项目名称：《天天酷跑》(RunDay)二、功能介绍：闯类游戏，玩家登录后，选择进入游戏，通过键盘控制玩家的上下左右移动，来躲避障碍物和吃金币，玩家躲避的障碍物越多跑酷距离越远，玩家吃的金币越多，得分越高。三、功能模块：1、登录界面用户名(输入框，明文)密码(输入框，密文)登录
数据结构与算法-搜索平衡二叉树--红黑树 TianLiaoFeiJue 编程基础计算机编程基础数据结构与算法红黑树树
数据结构与算法-搜索平衡二叉树--红黑树红黑树的规则数据结构和算法的基本概念java实现的demo红黑树的规则数据结构和算法的基本概念[参考]java实现的demo
Java：爬虫框架 dingcho Java java 爬虫
一、ApacheNutch2【参考地址】Nutch是一个开源Java实现的搜索引擎。它提供了我们运行自己的搜索引擎所需的全部工具。包括全文搜索和Web爬虫。Nutch致力于让每个人能很容易,同时花费很少就可以配置世界一流的Web搜索引擎.为了完成这一宏伟的目标,Nutch必须能够做到:每个月取几十亿网页为这些网页维护一个索引对索引文件进行每秒上千次的搜索提供高质量的搜索结果简单来说Nutch支持分
设计模式】Listener模式和Visitor模式的区别不爱洗脚的小滕设计模式访问者模式 java golang
文章目录前言一、介绍Listener模式Visitor模式二、代码实现2.1Listener模式的Java实现2.2Listener模式的Go实现2.3Visitor模式的Java实现2.4Visitor模式的Go实现三、总结前言在软件设计中，设计模式是解决特定问题的通用解决方案。Listener模式和Visitor模式是两种常见的行为设计模式，它们在不同的场景下提供了解决问题的有效方法。本文将详
上传文件到钉盘流程详解 jspyth 开发场景案例分析开发语言 java 后端
文章目录前言准备工作实现过程Maven依赖封装一个工具类获取文件上传信息unionId获取钉盘目录spaceId创建上传到钉盘前言本文详解如何通过钉钉的API实现上传文件到钉盘目录，代码通过JAVA实现。准备工作1、在钉钉开发者后台创建一个钉钉企业内部应用；2、创建并保存好应用的appKey和appSecret，后面用于获取调用API的请求token；3、应用中配置好所需权限：企业存储文件上传
Java的多态性 zaneily JAVA java 开发语言
Java的多态性多态性是面向对象编程的一个重要特征，是指在父类中定义的属性和方法被子类继承之后，可以具有不同的数据类型或表现出不同的行为，这使得同一个属性或方法在父类及其各个子类中具有不同的涵义。可以理解为一个事务的多种形态。Java实现多态有三个条件：继承，重写和向上转型。继承：在多态中必须存在有继承关系的子类和父类。重写：子类对父类中某些方法进行重新定义，在调用这些方法时就会调用重写的子类方法
ArcGIS地图切片原理与算法数智侠 GIS
ArcGIS地图切图系列之（一）切片原理解析点击打开链接ArcGIS地图切图系列之（二）JAVA实现点击打开链接ArcGIS地图切图系列之（三）MapReduce实现点击打开链接
java实现将数据生成图表至excel导出 AdoredU
1.目的根据已有数据，手动（java后台）生成图表至excel并导出。用于后台查询到数据后直接创建图表，可以代替直接使用图表信息字符串。2.说明使用jfree图表绘制类库绘制图表，并生成到本地或读取至输出流用于在excel中生成；使用poi操作excel；3.使用jar包使用maven管理jar包，主要包含poi和jfree：3.11org.apache.poipoi${poi-version}o
基于Java实现的扫雷游戏 Java小诚 Java java
基于Java实现扫雷游戏扫雷游戏是一款经典的智力游戏。具体要求如下:扫雷游戏分为初级、中级和高级3个级别，扫雷英雄榜存储每个级别的最好成绩，即挖出全部的地雷且用时最少者。单击游戏菜单可以选择初级、中级或高级查看英雄榜。选择级别后将出现相应级别的扫雷区域，这时用户单击雷区中的任何一个方块便启动计时器。用户要揭开某个方块，可单击它。若所揭方块是雷，用户便输了这一局程序发出爆炸的声音。若所揭方块不是雷，
常见数学应用计算的java实现星月梦瑾 code java 算法数据结构
1、判断是否素数publicstaticbooleanisPrime(intnum){if(num1;if(num%6!=1&&num%6!=5)returnfalse;for(inti=5;i<=Math.sqrt(num);i+=6){if(num%i==0||num%(i+2)==0){returnfalse;}}returntrue;}
KMP模式匹配的java实现星月梦瑾 code java 算法开发语言
importjava.util.Scanner;publicclassMain{publicstaticvoidmain(String[]args){try(Scanners=newScanner(System.in)){Stringt=s.nextLine();Stringp=s.nextLine();solveMethod(t,p);}}privatestaticvoidsolveMethod
JVM是什么？ .suki... JVM 1024程序员节
JVM是java虚拟机栈，用于运行java执行字节码文件的。是java实现跨平台的核心机制，因为它的目的是使用相同的字节码文件，在不同的操作系统运行的结果相同。一、java内存模型在JDK1.8之前，它是分为线程共享和线程私有的，在线程共享的部分分为堆区和方法区；在线程私有的部分分为jvm虚拟机栈、程序计数器、本地方法栈。在1.8之后，它是将方法区换为元空间。jvm虚拟机栈：是由一个个的栈帧组成，
选择排序（java实现）歌颂者_ 算法 java 算法数据结构
核心思想选择排序的核心思想是：从左往右遍历待排序数组，每次保存其中最小值的索引，将最小值与待排序数组的开头交换，再进行下一次遍历，直到待排序序列的长度为1。代码选择排序(遍历数组，每次从待排序列中选取最小值，放到数组的开头)publicstaticvoidSelectsort(int[]arr){intl=0,r=arr.length-1;while(larr[max]){max=i;}}swap
java实现es分页查询_elasticsearch high level rest api分页查询数据 weixin_42565971 java实现es分页查询
Transport方式查询数据，在今后的elasticsearch中将不在维护，官方推荐用用highlevelrestapi或者lowerlevelapi去操作elasticsearch中的数据。在elasticsearch的增删改查操作中，其实最复杂的也就是分页查询了，根据elasticsearch官方资料，做个简单的笔记.1.准备jar包,我用的elasticsearch7.3版本,各版本需要
Java实现建造者模式和源码中的应用 coffee_baby JAVA实现设计模式 java 建造者模式开发语言
Java实现建造者模式（BuilderPattern）文章目录Java实现建造者模式（BuilderPattern）案例：汉堡制作建造者模式的核心角色代码实现：汉堡制作内部类实现：Step1：产品类BurgerStep2：指挥者DirectorStep3：客户端代码结果总结抽象类实现Step1：产品类BurgerStep2：抽象的Builder类Step3：具体的Builder类Step4：指挥者
SQL的各种连接查询 xieke90 UNION ALL UNION 外连接内连接 JOIN
一、内连接概念：内连接就是使用比较运算符根据每个表共有的列的值匹配两个表中的行。内连接（join 或者inner join ） SQL语法： select * fron
java编程思想--复用类百合不是茶 java 继承代理组合 final类
复用类看着标题都不知道是什么,再加上java编程思想翻译的比价难懂,所以知道现在才看这本软件界的奇书一:组合语法:就是将对象的引用放到新类中即可代码: package com.wj.reuse; /** * * @author Administrator 组
[开源与生态系统]国产CPU的生态系统 comsci cpu
计算机要从娃娃抓起...而孩子最喜欢玩游戏.... 要让国产CPU在国内市场形成自己的生态系统和产业链,国家和企业就不能够忘记游戏这个非常关键的环节.... 投入一些资金和资源,人力和政策,让游
JVM内存区域划分Eden Space、Survivor Space、Tenured Gen，Perm Gen解释商人shang jvm内存
jvm区域总体分两类，heap区和非heap区。heap区又分：Eden Space（伊甸园）、Survivor Space(幸存者区)、Tenured Gen（老年代-养老区）。非heap区又分：Code Cache(代码缓存区)、Perm Gen（永久代）、Jvm Stack(java虚拟机栈)、Local Method Statck(本地方法栈)。 HotSpot虚拟机GC算法采用分代收
页面上调用 QQ oloz qq
<A href="tencent://message/?uin=707321921&Site=有事Q我&Menu=yes"> <img style="border:0px;" src=http://wpa.qq.com/pa?p=1:707321921:1></a>
一些问题文强chu 问题
1.eclipse 导出 doc 出现“The Javadoc command does not exist.” javadoc command 选择 jdk/bin/javadoc.exe 2.tomcate 配置 web 项目 ..... SQL:3.mysql * 必须得放前面否则 select&nbs
生活没有安全感小桔子生活孤独安全感
圈子好小，身边朋友没几个，交心的更是少之又少。在深圳，除了男朋友，没几个亲密的人。不知不觉男朋友成了唯一的依靠，毫不夸张的说，业余生活的全部。现在感情好，也很幸福的。但是说不准难免人心会变嘛，不发生什么大家都乐融融，发生什么很难处理。我想说如果不幸被分手(无论原因如何)，生活难免变化很大，在深圳，我没交心的朋友。明
php 基础语法 aichenglong php 基本语法
1 .1 php变量必须以$开头 <?php $a=” b”; echo ?> 1 .2 php基本数据库类型 Integer float/double Boolean string 1 .3 复合数据类型数组array和对象 object 1 .4 特殊数据类型 null 资源类型(resource) $co
mybatis tools 配置详解 AILIKES mybatis
MyBatis Generator中文文档 MyBatis Generator中文文档地址： http://generator.sturgeon.mopaas.com/ 该中文文档由于尽可能和原文内容一致，所以有些地方如果不熟悉，看中文版的文档的也会有一定的障碍，所以本章根据该中文文档以及实际应用，使用通俗的语言来讲解详细的配置。本文使用Markdown进行编辑，但是博客显示效
继承与多态的探讨百合不是茶 JAVA面向对象继承对象
继承 extends 多态继承是面向对象最经常使用的特征之一：继承语法是通过继承发、基类的域和方法 //继承就是从现有的类中生成一个新的类，这个新类拥有现有类的所有extends是使用继承的关键字：在A类中定义属性和方法； class A{ //定义属性 int age； //定义方法 public void go
JS的undefined与null的实例 bijian1013 JavaScript JavaScript
<form name="theform" id="theform"> </form> <script language="javascript"> var a alert(typeof(b)); //这里提示undefined if(theform.datas
TDD实践（一） bijian1013 java 敏捷 TDD
一.TDD概述 TDD：测试驱动开发，它的基本思想就是在开发功能代码之前，先编写测试代码。也就是说在明确要开发某个功能后，首先思考如何对这个功能进行测试，并完成测试代码的编写，然后编写相关的代码满足这些测试用例。然后循环进行添加其他功能，直到完全部功能的开发。
[Maven学习笔记十]Maven Profile与资源文件过滤器 bit1129 maven
什么是Maven Profile Maven Profile的含义是针对编译打包环境和编译打包目的配置定制，可以在不同的环境上选择相应的配置，例如DB信息，可以根据是为开发环境编译打包，还是为生产环境编译打包，动态的选择正确的DB配置信息 Profile的激活机制 1.Profile可以手工激活，比如在Intellij Idea的Maven Project视图中可以选择一个P
【Hive八】Hive用户自定义生成表函数(UDTF) bit1129 hive
1. 什么是UDTF UDTF，是User Defined Table-Generating Functions，一眼看上去，貌似是用户自定义生成表函数，这个生成表不应该理解为生成了一个HQL Table，貌似更应该理解为生成了类似关系表的二维行数据集 2. 如何实现UDTF 继承org.apache.hadoop.hive.ql.udf.generic
tfs restful api 加auth 2.0认计 ronin47
　　目前思考如何给tfs的ngx-tfs api增加安全性。有如下两点：　　一是基于客户端的ip设置。这个比较容易实现。　　二是基于OAuth2.0认证，这个需要lua，实现起来相对于一来说，有些难度。　　现在重点介绍第二种方法实现思路。　　前言：我们使用Nginx的Lua中间件建立了OAuth2认证和授权层。如果你也有此打算，阅读下面的文档，实现自动化并获得收益。SeatGe
jdk环境变量配置 byalias java jdk
进行java开发，首先要安装jdk，安装了jdk后还要进行环境变量配置： 1、下载jdk（http://java.sun.com/javase/downloads/index.jsp），我下载的版本是：jdk-7u79-windows-x64.exe 2、安装jdk-7u79-windows-x64.exe 3、配置环境变量：右击"计算机"-->&quo
《代码大全》表驱动法-Table Driven Approach-2 bylijinnan java
package com.ljn.base; import java.io.BufferedReader; import java.io.FileInputStream; import java.io.InputStreamReader; import java.util.ArrayList; import java.util.Collections; import java.uti
SQL 数值四舍五入小数点后保留2位 chicony 四舍五入
1.round() 函数是四舍五入用，第一个参数是我们要被操作的数据，第二个参数是设置我们四舍五入之后小数点后显示几位。 2.numeric 函数的2个参数，第一个表示数据长度，第二个参数表示小数点后位数。例如：　　select cast(round(12.5,2) as numeric(5,2))
c++运算符重载 CrazyMizzz C++
一、加+，减-，乘*，除/ 的运算符重载 Rational operator*(const Rational &x) const{ return Rational(x.a * this->a); } 在这里只写乘法的，加减除的写法类似二、<<输出,>>输入的运算符重载 &nb
hive DDL语法汇总 daizj hive 修改列 DDL 修改表
hive DDL语法汇总１、对表重命名 hive> ALTER TABLE table_name RENAME TO new_table_name; 2、修改表备注 hive> ALTER TABLE table_name SET TBLPROPERTIES ('comment' = new_comm
jbox使用说明 dcj3sjt126com Web
参考网址：http://www.kudystudio.com/jbox/jbox-demo.html jBox v2.3 beta [ 点击下载] 技术交流QQGroup：172543951 100521167 [2011-11-11] jBox v2.3 正式版 - [调整&修复] IE6下有iframe或页面有active、applet控件
UISegmentedControl 开发笔记 dcj3sjt126com
// typedef NS_ENUM(NSInteger, UISegmentedControlStyle) { // UISegmentedControlStylePlain, // large plain &
Slick生成表映射文件 ekian scala
Scala添加SLICK进行数据库操作，需在sbt文件上添加slick-codegen包 "com.typesafe.slick" %% "slick-codegen" % slickVersion 因为我是连接SQL Server数据库，还需添加slick-extensions，jtds包 "com.typesa
ES-TEST gengzg test
package com.MarkNum; import java.io.IOException; import java.util.Date; import java.util.HashMap; import java.util.Map; import javax.servlet.ServletException; import javax.servlet.annotation
为何外键不再推荐使用 hugh.wang mysql DB
表的关联，是一种逻辑关系，并不需要进行物理上的“硬关联”，而且你所期望的关联，其实只是其数据上存在一定的联系而已，而这种联系实际上是在设计之初就定义好的固有逻辑。在业务代码中实现的时候，只要按照设计之初的这种固有关联逻辑来处理数据即可，并不需要在数据库层面进行“硬关联”，因为在数据库层面通过使用外键的方式进行“硬关联”，会带来很多额外的资源消耗来进行一致性和完整性校验，即使很多时候我们并不
领域驱动设计 julyflame VO DAO 设计模式 DTO po
概念： VO（View Object）：视图对象，用于展示层，它的作用是把某个指定页面（或组件）的所有数据封装起来。 DTO（Data Transfer Object）：数据传输对象，这个概念来源于J2EE的设计模式，原来的目的是为了EJB的分布式应用提供粗粒度的数据实体，以减少分布式调用的次数，从而提高分布式调用的性能和降低网络负载，但在这里，我泛指用于展示层与服务层之间的数据传输对
单例设计模式 hm4123660 java Singleton 单例设计模式懒汉式饿汉式
单例模式是一种常用的软件设计模式。在它的核心结构中只包含一个被称为单例类的特殊类。通过单例模式可以保证系统中一个类只有一个实例而且该实例易于外界访问，从而方便对实例个数的控制并节约系统源。如果希望在系统中某个类的对象只能存在一个，单例模式是最好的解决方案。 &nb
logback zhb8015 log logback
一、logback的介绍 Logback是由log4j创始人设计的又一个开源日志组件。logback当前分成三个模块：logback-core,logback- classic和logback-access。logback-core是其它两个模块的基础模块。logback-classic是log4j的一个改良版本。此外logback-class
整合Kafka到Spark Streaming——代码示例和挑战 Stark_Summer spark storm zookeeper PARALLELISM processing
作者Michael G. Noll是瑞士的一位工程师和研究员，效力于Verisign，是Verisign实验室的大规模数据分析基础设施（基础Hadoop）的技术主管。本文，Michael详细的演示了如何将Kafka整合到Spark Streaming中。期间， Michael还提到了将Kafka整合到 Spark Streaming中的一些现状，非常值得阅读，虽然有一些信息在Spark 1.2版
spring-master-slave-commondao 王新春 DAO spring dataSource slave master
互联网的web项目，都有个特点：请求的并发量高，其中请求最耗时的db操作，又是系统优化的重中之重。为此，往往搭建 db的一主多从库的数据库架构。作为web的DAO层，要保证针对主库进行写操作，对多个从库进行读操作。当然在一些请求中，为了避免主从复制的延迟导致的数据不一致性，部分的读操作也要到主库上。（这种需求一般通过业务垂直分开，比如下单业务的代码所部署的机器，读去应该也要从主库读取数