郝伟老师（安徽理工大学）

一个对文本信息统计的熵增验证程序

文章目录

简介
熵的数学定义
验证原理
结论
附：源代码

简介

熵增定律是基于第二热力学定律的著名定律，描述了任何一个系统，包括宇宙本身的熵都是不断增加的定律。本文通过对TXT格式的文章进行测试，以验证为熵增定律。

熵的数学定义

给定一离散分布变量 $X$ ，其可能值为 $x_1, x_2, ..., x_n$ ，每个值出现的对应概率为 $P(x_1), P(x_2), ..., P(x_i)$ ，那么系统 $H$ 关于 $X$ 的信息熵可以定义为： $H(X)=-\sum_{i=1}^{n} P(x_i) logP(x_i)$ 这个公式及其类似的变形很多地方都有定义，但是它到底表达了什么，本文以实例进行解释。

验证原理

根据公式，我们对文本文件中所有的字符进行统计，计算其熵。根据原理，越是有序的内容其熵应该越低，越是无序自然越高。笔者随机对一些文本进行了统计（源代码见末尾），结果如下所示：

----------- c:\Data\102个无聊网站.txt ------------
Length: 9.02 KB
Entropy = 4.7158

----------- c:\Data\18条忠告.txt ------------
Length: 5.41 KB
Entropy = 2.7741

----------- c:\Data\7件事说明成功.txt ------------
Length: 8.13 KB
Entropy = 3.0377

----------- c:\Data\C#开发DirectX.txt ------------
Length: 24.81 KB
Entropy = 4.9619

----------- c:\Data\entities1.txt ------------
Length: 20.92 KB
Entropy = 5.2982

----------- c:\Data\hlm.txt ------------
Length: 2464.21 KB
Entropy = 8.6316

----------- c:\Data\hlm1.txt ------------
Length: 7392.63 KB
Entropy = 8.6316

----------- c:\Data\input.txt ------------
Length: 19399.94 KB
Entropy = 7.7636

----------- c:\Data\List.txt ------------
Length: 1.07 KB
Entropy = 5.0984

----------- c:\Data\MOP顶极宅男恋爱史.txt ------------
Length: 58.16 KB
Entropy = 3.0086

----------- c:\Data\output.txt ------------
Length: 118.73 KB
Entropy = 4.0673

----------- c:\Data\res.txt ------------
Length: 3.93 KB
Entropy = 3.1446

----------- c:\Data\sample.txt ------------
Length: 196.25 KB
Entropy = 7.7117

----------- c:\Data\unicode.txt ------------
Length: 0.87 KB
Entropy = 6.7460

----------- c:\Data\不以物喜，不以己悲.txt ------------
Length: 3.50 KB
Entropy = 2.6829

----------- c:\Data\主导与影响世界的100个管理定律.txt ------------
Length: 5.77 KB
Entropy = 3.2032

----------- c:\Data\人人都需要掌握的18个世故人情.txt ------------
Length: 3.36 KB
Entropy = 2.5972

----------- c:\Data\以后的发展.txt ------------
Length: 2.70 KB
Entropy = 3.2418

----------- c:\Data\伪丢手机事件.txt ------------
Length: 0.67 KB
Entropy = 2.4646

----------- c:\Data\共享软件如何进军海外 .txt ------------
Length: 6.72 KB
Entropy = 3.6789

----------- c:\Data\决定一生的99个简单法则 .txt ------------
Length: 3.74 KB
Entropy = 2.8412

----------- c:\Data\十不要等.txt ------------
Length: 1.61 KB
Entropy = 2.4100

----------- c:\Data\单词2100强记忆法.txt ------------
Length: 43.98 KB
Entropy = 2.8009

----------- c:\Data\厚黑学.TXT ------------
Length: 393.48 KB
Entropy = 2.5912

----------- c:\Data\四级六和学位的重要性.txt ------------
Length: 3.78 KB
Entropy = 3.2485

----------- c:\Data\女人和短信.txt ------------
Length: 15.61 KB
Entropy = 3.7250

----------- c:\Data\小沈阳 废话集！！！ 108条.txt ------------
Length: 6.74 KB
Entropy = 3.1106

----------- c:\Data\教你十条成为成熟男人的黄金法则.txt ------------
Length: 1.95 KB
Entropy = 2.4999

----------- c:\Data\新建 文本文档.txt ------------
Length: 3.42 KB
Entropy = 2.7682

----------- c:\Data\流氓就是流氓，不要拿“爱国”来说事！.txt ------------
Length: 2.14 KB
Entropy = 2.7445

----------- c:\Data\爱迪生的故事.txt ------------
Length: 9.18 KB
Entropy = 2.4569

----------- c:\Data\男人100条.txt ------------
Length: 10.47 KB
Entropy = 2.8571

----------- c:\Data\盖茨十大建议.txt ------------
Length: 1.34 KB
Entropy = 2.6005

----------- c:\Data\社会生存72条法则（推荐）.txt ------------
Length: 4.69 KB
Entropy = 2.5794

----------- c:\Data\红楼梦.txt ------------
Length: 2464.17 KB
Entropy = 8.6313

----------- c:\Data\羊和狮子的故事.txt ------------
Length: 2.49 KB
Entropy = 2.5704

----------- c:\Data\血型与性格.txt ------------
Length: 0.68 KB
Entropy = 3.1348

----------- c:\Data\送给那些不懂女人的男人    1234 下页 末页 [只看楼主] [阅读全部] .txt ------------
Length: 2.29 KB
Entropy = 2.3640

----------- c:\Data\遥远的距离.txt ------------
Length: 3.08 KB
Entropy = 2.7832

----------- c:\Data\险被车撞事件.txt ------------
Length: 0.33 KB
Entropy = 2.3530

这些文件的结果我们可以看出一个重要的结论：越是小文件越是有序，所以熵值越小。由于这个文字都是写出来的文章，所以符合语法规则，具有一定的有序性。如果我们随机生成代码会怎么呢？于是笔者又用Java写了一个随机程序（见附录）用于统计随机值的熵，结果如下：

entropy = 13.86378601494719
entropy = 13.863806257137101
entropy = 13.864030595858974
entropy = 13.863822726347344
entropy = 13.863931775438516
entropy = 13.863801186344219
entropy = 13.863702885807156
entropy = 13.863861376780758
entropy = 13.863823648506052
entropy = 13.863946588612857

可见随机生成的内容，熵达到了13.86.

结论

根据本实验我们可以得出以下结论：

内容越短，熵相对越小，因为越容易产生有序的信息
文章的熵小于随机生成的文本的熵，因为随机值是无序的，所以熵应该最高。

附：源代码

C#代码，用于统计文本内容

using System;
using System.Collections.Generic;
using System.IO;
using System.Text;

namespace ConsoleApp1
{
     
	class Program
	{
     
		static void Main(string[] args)
		{
     
			foreach (var file in Directory.GetFiles("c:\\Data"))
			{
     
				if (file.ToLower().EndsWith("txt"))
				{
     
					var info = new FileInfo(file);
					if (info.Length > 0)
					{
     
						var entropy = GetEntropy(file);
						Console.WriteLine($"----------- {file} ------------\nLength: {info.Length / 1024.0:0.00} KB\nEntropy = {entropy:0.0000}\n\n");
					}
				}
			}
		}

		/// 
		/// compute the entropy of an article stored in a text file.
		/// 
		/// Text file to be open.
		/// The encoding of input file.
		/// 
		public static double GetEntropy(string file, string encoding = "utf-8")
		{
     
			double entropy = 0;
			string text = File.ReadAllText(file, encoding == "utf-8" ? Encoding.UTF8 : Encoding.Default);
			if (string.IsNullOrEmpty(text))
				return entropy;

			// count the occurence of each character
			int[] chs = new int[65536];
			foreach (var item in text)
				chs[(int)item]++;

			// compute the odd of each character
			double[] odds = new double[chs.Length];
			for (int i = 0; i < chs.Length; i++)
				odds[i] = 1.0 * chs[i] / text.Length;

			// compute entropy of variable that greater than 0.
			foreach (var odd in odds)
				if (odd > 0)
					entropy += -odd * Math.Log2(odd);

			return entropy;
		}

		private static void Analyze(string text, int[] chs)
		{
     
			Dictionary<char, double> dic = new Dictionary<char, double>();
			StringBuilder sb = new StringBuilder();
			sb.AppendLine("Total Length: " + text.Length);
			for (int i = 0; i < chs.Length; i++)
			{
     
				if (chs[i] > 0)
				{
     
					double odd = 1.0 * chs[i] / text.Length;
					sb.AppendLine($"{i:00000}\t{(char)i}\t{chs[i]}\t{odd:0.0000000000}");
					dic.Add((char)i, chs[i] / text.Length);
				}
			}
			File.WriteAllText(@"C:\data\output.txt", sb.ToString());
		}
	}
}

Java代码用于统计随机生成的数据的熵

import java.util.Random;

public class EntropyTest {
     

	public static void main(String[] args) {
     
		for(int i = 0 ; i < 10; i ++)
			test();
	}
	
	static void test() {
     
		int runTimes = 1200*1024; // 
		int[] data = new int[15000];
		Random rand = new Random();
		for (int i = 0; i < runTimes; i++)
			data[rand.nextInt(data.length)]++;

		// System.out.println(Arrays.toString(data));

		double e = 0;
		double log2 = Math.log(2);
		for (int i = 0; i < data.length; i++) {
     
			if (data[i] > 0) {
     
				double odd = 1.0 * data[i] / runTimes;
				e += -odd * Math.log(odd) / log2;
			}
		}

		System.out.println("entropy = " + e);
	}
}

你可能感兴趣的:(C#语言详解,算法设计与分析,Java程序设计,熵增实验,随机文本测试)

8、Python 字符串处理与正则表达式实战指南 wolf犭良 python python 正则表达式
Python字符串处理与正则表达式实战指南文章概述本文深入探讨Python字符串处理核心方法与正则表达式实战技巧，涵盖字符串编码转换、分割替换、正则表达式语法精髓，并通过日志解析、数据清洗等真实场景案例展示高阶应用。最后提供10道阶梯式练习题（附完整答案代码），助你从基础到进阶全面掌握文本处理技能。一、字符串处理核心三剑客1.1编码转换（encode/decode）text="中文文本"utf8_
deepseek api参数详解孽小倩大语言模型 python java 前端人工智能 deepseek
deepseek的参数与openai保持兼容，所以openai能用的参数deepseek都可以使用，以下是常用的参数介绍。在使用Deepseek/OpenAI的PythonAPI时，最常用的API端点是chat/completions，用于调用deepseek生成文本对话内容。以下是openai.ChatCompletion.create()方法的主要参数及其作用：1.model作用：指定使用的模
自学网络安全（黑客技术）2025年 —三个月学习计划 csbDD web安全学习安全网络 python
基于入门网络安全/黑客打造的：黑客&网络安全入门&进阶学习资源包前言什么是网络安全网络安全可以基于攻击和防御视角来分类，我们经常听到的“红队”、“渗透测试”等就是研究攻击技术，而“蓝队”、“安全运营”、“安全运维”则研究防御技术。如何成为一名黑客很多朋友在学习安全方面都会半路转行，因为不知如何去学，在这里，我将这个整份答案分为黑客（网络安全）入门必备、黑客（网络安全）职业指南、黑客（网络安全）学习
CAN协议简介：从基础到高级应用 New_Teen 嵌入式硬件学习笔记嵌入式硬件物联网
文章目录引言一、CAN协议概述1.1基本特性1.2典型应用场景二、物理层解析2.1信号规范2.2网络拓扑三、数据链路层机制3.1帧类型对比3.2非破坏性仲裁3.3错误处理机制四、帧结构详解4.1标准数据帧结构4.2扩展帧结构五、高级特性5.1CANFD协议增强5.2报文过滤机制六、同步与定时6.1位时间组成6.2同步规则七、开发实践要点结语引言在现代工业控制和汽车电子领域，CAN（Controll
【C++】动态规划从入门到精通諰. 动态规划 c++
一、动态规划基础概念详解什么是动态规划动态规划（DynamicProgramming，DP）是一种通过将复杂问题分解为重叠子问题，并存储子问题解以避免重复计算的优化算法。它适用于具有以下两个关键性质的问题：最优子结构：问题的最优解包含子问题的最优解重叠子问题：不同决策序列会重复求解相同的子问题下面用一些例子（由浅入深）了解动态规划1.1斐波那契数列递归实现解析intfib(intn){if(n>d
rag-给一篇几百页的pdf，如何从中找到关键信息并汇总出关系图蒸土豆的技术细节人工智能
小思考对pdf肯定要做模糊chunk，能用模型切分就用模型切分，不能用模型就用规则，规则要尽可能保存连续文本，特殊数据格式（图、表格）必须完整保存，必须能被捕捉到。这些独立的表格or图数据，也要单独做embedding，以其中的title和行列title信息作embedding材料。也不能忘了传统搜索方法，基于搜索的、基于传统词频的、基于关键字的。。。假设已经找到了信息所在的目标，如果它是个表格，
Docker Compose 和 Kubernetes（K8s）对比孽小倩 docker 容器 docker k8s kubernetes
DockerCompose和Kubernetes（K8s）在某些方面有相似的功能，但它们的核心用途和适用场景不同。以下是它们的主要区别和联系：1.DockerCompose和Kubernetes的区别对比项DockerComposeKubernetes（K8s）核心作用管理多个Docker容器管理容器编排（大规模应用）适用环境本地开发、测试环境生产环境、大规模集群容器编排能力基础编排（启动多个容器
【C语言】动态内存管理用realloc管理更灵活 xiaofann_ C c语言算法
realloc——动态内存空间管理更灵活为了合理使用内存，我们会对内存的大小做灵活的调整。那realloc函数就可以做到对动态开辟内存大小的调整。头文件：#includevoid*realloc(要调整的内存地址,调整之后新大小)void*realloc(void*ptr,size_tsize)注意：返回值为调整之后的内存起始位置。这个函数调整原内存空间大小的基础上，还会将原来内存中的数据移动到新
机器学习课堂4线性回归模型+特征缩放木尘152132 机器学习线性回归 python
一、实验2-2，线性回归模型，计算模型在训练数据集和测试数据集上的均方根误差代码：#2-2线性回归模型importpandasaspdimportnumpyasnpimportmatplotlib.pyplotasplt#参数设置iterations=3000#迭代次数learning_rate=0.0001#学习率m_train=3000#训练样本的数量flag_plot_lines=False
Python用Pyqt5制作音乐播放器 Aix959 python 开发语言
具体效果如下需要实现的功能主要的几个有：1、搜索结果更新至当前音乐的列表，这样播放下一首是搜素结果的下一首2、自动播放3、滚动音乐文本4、音乐进度条5、根据实际情况生成音乐列表。我这里的是下面的情况，音乐文件的格式是歌名_歌手.mp3所以根据需求修改find_mp3_files方法，我这里返回的是[{"path":音乐文件路径,"music":歌名,"singer":歌手},{"path":音乐文
连续子数组最大乘积（C语言） Charon424 c语言
代码如下：#includeintmaxn(int*num,intsizenum){if(sizenum==0){return0;}int*maxnum=(int*)malloc(sizeof(int)*sizenum);int*minnum=(int*)malloc(sizeof(int)*sizenum);maxnum[0]=minnum[0]=num[0];intmaxproduct=maxn
验证哥德巴赫猜想（C语言） Charon424 c语言
哥德巴赫猜想：任一大于2的偶数都可写成两个质数之和。（——欧拉提出的观点）代码如下：#include#include#includeboolisprime(intn){if(n<2)returnfalse;for(inti=2;i<=sqrt(n);i++){if(n%i==0){returnfalse;}}returntrue;}boolgoldbach(intnum){if(num<=2)re
移除元素（C语言） Charon424 leetcode简单题 c语言算法数据结构
题目：给你一个数组nums和一个值val，你需要原地移除所有数值等于val的元素。元素的顺序可能发生改变。然后返回nums中与val不同的元素的数量。假设nums中不等于val的元素数量为k，要通过此题，您需要执行以下操作：更改nums数组，使nums的前k个元素包含不等于val的元素。nums的其余元素和nums的大小并不重要。返回k。用户评测：评测机将使用以下代码测试您的解决方案：int[]n
jieba库词频统计_jieba分词器（应用及字典的补充）及文档高频词提取实战袁圆园建建 jieba库词频统计
jieba分词器是Python中最好的中文分词组件，本文讲解一下jieba分词器及其应用。1、jieba分词器的分词模式jieba分词器提供了三种常用的分词模式1、精确模式：将句子按照最精确的方法进行切分，适合用于进行文本分析；2、全模式：将句子当中所有可以成词的词语都扫描出来，分词速度很快但容易产生歧义；3、搜索引擎模式：在精确模式分词的基础上，将长的句子再次进行切分，提高召回率，适用于搜索引擎
风控算法（一）——数据测试月亮月亮要去太阳机器学习人工智能
下面的内容都是针对数据源测试的一些可能得问题：1、请描述你在开发和执行数据测试流程时的具体步骤。确定样本（对齐样本与时间，去除假样本）——确定特征（确认目前特征）——数据信息（返回的数据字典、收费方式、底层数据：特征、分数）——数据清洗（缺失值替换）——数据训练形成报告。2、如何确定数据产品在风险模型中的潜在价值和适用性的？AUC、IV、相关性、性价比、数据产品背景和领域3、请详细描述你负责的10
智见未来：多大模型协同的数据分析新范式一ge科研小菜菜人工智能大数据人工智能大数据
个人主页：一ge科研小菜鸡-CSDN博客期待您的关注1.引言随着大语言模型（LLM）的快速发展，ChatGPT、DeepSeek、Grok等AI模型在数据分析和洞察生成方面展现出巨大潜力。利用多个LLM的协同能力，可以增强数据分析的多角度解读、减少单一模型的偏差，并优化洞察生成的深度和精准度。本文探讨如何结合多个LLM，在数据分析领域实现更可靠的洞察生成，并提供具体的策略、方法和应用场景。2.主要
如何评估大语言模型生成文本的质量？ gs80140 AI 语言模型人工智能自然语言处理
目录如何评估大语言模型生成文本的质量？1.评估指标概览自动评估指标（AutomaticMetrics）人工评估方法（HumanEvaluation）2.自动评估方法示例（1）计算BLEU分数（2）计算ROUGE分数（3）计算BERTScore（4）使用GPT-4进行评分3.人工评估方法（1）流畅性（Fluency）检查（2）连贯性（Coherence）检查（3）事实准确性（FactualAccur
Pollinations AI文生图html源码酷爱码 html HTML
源码介绍用deepseek辅助制作了一个电脑端文生图小程序，html语言的，接口使用的是Pollinations，上传服务器访问首页即可一次生成4张，提示词最好用英文，点击小图可以预览大图，也可以点击下载按钮直接下载截图预览源码免费获取PollinationsAI文生图html源码
Adam-mini：深度学习内存效率新突破 XianxinMao 人工智能深度学习人工智能
标题：Adam-mini：深度学习内存效率新突破文章信息摘要：Adam-mini优化器在深度学习领域展现出突破性潜力，尤其在内存效率和计算性能上表现卓越。相比AdamW，Adam-mini将内存效率提升了一倍，并通过减少学习率数量显著降低了内存消耗，同时保持了与AdamW相当甚至更好的性能。在训练十亿参数级别的大语言模型（LLM）时，Adam-mini实现了49.6%的吞吐量提升，并减少了33%的
【机器学习】模型拟合 CH3_CH2_CHO 什么？！是机器学习！！机器学习人工智能欠拟合过拟合
1、欠拟合1.1现象欠拟合是机器学习和统计建模中的一种常见问题，表现为模型无法充分捕捉数据中的潜在规律和模式。无论是训练数据还是测试数据，模型的预测误差都居高不下。在实际应用中，欠拟合的模型往往显得过于简单和粗糙，无法对数据进行有效的拟合和描述。1.2原因模型过于简单是导致欠拟合的主要原因：例如，使用直线去拟合具有明显曲线趋势的数据，或者使用低阶多项式去拟合高阶的复杂函数关系。这种情况下，模型的表
GOT-OCR2.0：突破性端到端架构与高精度文本识别的技术创新 XianxinMao 人工智能深度学习
GOT-OCR2.0在技术上的突破与优势GOT-OCR2.0在技术上实现了对传统OCR系统的显著超越，主要体现在其采用了统一的端到端（End-to-End）架构。这一架构的创新性设计带来了多方面的提升，具体包括以下几个关键方面：1.统一的端到端架构传统OCR系统的局限：传统的OCR流程通常由多个独立的模块组成，如图像预处理、字符分割、特征提取、分类识别等。这种多步处理方式不仅增加了系统的复杂性，还
springboot整合Thymeleaf详解 weiha666 spring boot
Thymeleaf介绍简单说，Thymeleaf是一个跟Velocity、FreeMarker类似的模板引擎，它可以完全替代JSP。相较与其他的模板引擎，它有如下三个极吸引人的特点：Thymeleaf在有网络和无网络的环境下皆可运行，即它可以让美工在浏览器查看页面的静态效果，也可以让程序员在服务器查看带数据的动态页面效果。这是由于它支持html原型，然后在html标签里增加额外的属性来达到模板+数
深入理解正则表达式：语法全解析谢兴豪
本文还有配套的精品资源，点击获取简介：正则表达式是一种用于文本匹配的模式，广泛应用在文本处理、数据验证等领域。本文将全面探讨正则表达式的语法细节，包括字符匹配、元字符、字符类、量词、分组与反向引用、选择与否定、位置锚点、预定义字符集、模式修饰符、回溯控制以及正向先行断言和正向后行断言。掌握这些知识有助于提高编程效率和代码质量。1.正则表达式简介正则表达式是IT行业中的“瑞士军刀”，它们在文本处理、
Pytest的数据驱动DDT 活跃家族 pytest 服务器运维
1、ddt的语法：@pytest.mark.parametrize(“case”,case_all)是个装饰器，里面两个数据：case和cases_all意思就是：将cases_all里每个成员依次传递给case这个变量；cace注意要加引号，虽然是个变量但是要加引号后面的用例方法里的参数case都是必须要要跟这个装饰器里的case名字一致。运行结果：几条用例数据就运行几条测试用例就算前面的断言失
Pytest的夹具活跃家族 pytest
1、pytest的前置后置夹具fixture有些内容是在每个用例执行之前都要运行操作：--用例前置接口：购物车模块先登录--登录结果【token鉴权】UI：每次用例打开浏览器--driver有些内容在每个用例之后都要运行操作：–用例后置接口：数据清除UI：关闭浏览器叫做用例的前置和后置。pytest测试框架中统一叫做夹具。fixture。前置：setup后置：teardown2、夹具2.1、定义夹
使用提示词进行信息抽取的实用方法 scaFHIO windows python
在大规模语言模型（LLM）中进行信息抽取时，我们不一定需要工具调用功能。通过精心设计的提示词（prompt）可以指导模型输出特定格式的信息，然后对其进行解析以生成结构化数据。这种方法依赖于创建良好的提示词，并将LLM的输出解析为所需的Python对象。技术背景介绍大规模语言模型可以根据提示词生成特定格式的文本。例如，我们可以要求模型以JSON格式输出所需的信息。在信息抽取的场景中，设计良好的提示词
JavaScript 模块化语法 import、export详解 qq39138814 javascript 开发语言 ecmascript
JavaScript模块化语法import、export详解1.为什么需要模块化？在JavaScript早期，所有代码都是写在一个全局作用域中，这样做的问题是：变量污染：所有变量、函数都是全局的，容易互相干扰。文件依赖管理困难：多个JS文件之间的依赖关系混乱，难以维护。代码复用困难：无法方便地拆分和复用代码。为了解决这些问题，模块化方案应运而生。2.JavaScript模块化的发展2.1早期的模块
SpringMVC系列之整合Thymeleaf【Thymeleaf整合springmvc介绍及Thymeleaf基础概念、使用语法详解】吕鑫洋 SpringMVC系列 java html js spring mvc
Thymeleaf是java的模板引擎，可以将动态页面静态化；目前使用较多的模板引擎：Velocity、Freemarker、Thymeleaf一、Maven依赖Thymeleaf整合springmvc共需要两个jar：1.thymeleaf2.thymeleaf-spring5org.thymeleafthymeleaf3.0.9.RELEASEorg.thymeleafthymeleaf-sp
使用EMQX 安装、部署MQTT 服务器详解 Adunn MQTT 安装 EMQX 服务器 MQTT EMQX Linux 安装
使用EMQX安装、部署MQTT服务器详解关于Linux下使用EMQX安装、部署MQTT服务器详解本文从如下几个方面进行详细说明：EMQX整体说明安装EQMX（MQTT服务器）EMQX常用命令登录EMQX（MQTT服务器）通过mqttbox工具，进行MQTT消息的订阅、发布测试通过MQTTX工具，进行MQTT消息的订阅、发布测试1.EMQX整体说明1.1.EMQX产品概览EMQX(Erlang/En
正则表达式：编程中的瑞士军刀，如何借助智能工具实现高效开发 inscode_039
最新接入DeepSeek-V3模型，点击下载最新版本InsCodeAIIDE正则表达式：编程中的瑞士军刀，如何借助智能工具实现高效开发正则表达式（RegularExpression，简称regex或regexp）是一种用于匹配字符串的模式描述语言。它广泛应用于文本处理、数据验证、搜索和替换等场景中。然而，正则表达式的复杂性和晦涩性常常让编程初学者望而却步。幸运的是，随着AI技术的进步，像InsCo
戴尔笔记本win8系统改装win7系统 sophia天雪 win7 戴尔改装系统 win8
戴尔win8 系统改装win7 系统详述第一步：使用U盘制作虚拟光驱： 1）下载安装UltraISO：注册码可以在网上搜索。 2）启动UltraISO，点击“文件”—》“打开”按钮，打开已经准备好的ISO镜像文
BeanUtils.copyProperties使用笔记 bylijinnan java
BeanUtils.copyProperties VS PropertyUtils.copyProperties 两者最大的区别是： BeanUtils.copyProperties会进行类型转换，而PropertyUtils.copyProperties不会。既然进行了类型转换，那BeanUtils.copyProperties的速度比不上PropertyUtils.copyProp
MyEclipse中文乱码问题 0624chenhong MyEclipse
一、设置新建常见文件的默认编码格式，也就是文件保存的格式。在不对MyEclipse进行设置的时候，默认保存文件的编码，一般跟简体中文操作系统（如windows2000，windowsXP）的编码一致，即GBK。在简体中文系统下，ANSI 编码代表 GBK编码;在日文操作系统下，ANSI 编码代表 JIS 编码。 Window-->Preferences-->General -
发送邮件不懂事的小屁孩 send email
import org.apache.commons.mail.EmailAttachment; import org.apache.commons.mail.EmailException; import org.apache.commons.mail.HtmlEmail; import org.apache.commons.mail.MultiPartEmail;
动画合集换个号韩国红果果 html css
动画指一种样式变为另一种样式 keyframes应当始终定义0 100 过程 1 transition 制作鼠标滑过图片时的放大效果 css .wrap{ width: 340px;height: 340px; position: absolute; top: 30%; left: 20%; overflow: hidden; bor
网络最常见的攻击方式竟然是SQL注入蓝儿唯美 sql注入
NTT研究表明，尽管SQL注入（SQLi）型攻击记录详尽且为人熟知，但目前网络应用程序仍然是SQLi攻击的重灾区。信息安全和风险管理公司NTTCom Security发布的《2015全球智能威胁风险报告》表明，目前黑客攻击网络应用程序方式中最流行的，要数SQLi攻击。报告对去年发生的60亿攻击行为进行分析，指出SQLi攻击是最常见的网络应用程序攻击方式。全球网络应用程序攻击中，SQLi攻击占
java笔记2 a-john java
类的封装： 1，java中，对象就是一个封装体。封装是把对象的属性和服务结合成一个独立的的单位。并尽可能隐藏对象的内部细节（尤其是私有数据） 2，目的：使对象以外的部分不能随意存取对象的内部数据（如属性），从而使软件错误能够局部化，减少差错和排错的难度。 3，简单来说，“隐藏属性、方法或实现细节的过程”称为——封装。 4，封装的特性： 4.1设置
[Andengine]Error：can't creat bitmap form path “gfx/xxx.xxx” aijuans 学习Android遇到的错误
最开始遇到这个错误是很早以前了，以前也没注意，只当是一个不理解的bug，因为所有的texture，textureregion都没有问题，但是就是提示错误。昨天和美工要图片，本来是要背景透明的png格式，可是她却给了我一个jpg的。说明了之后她说没法改，因为没有png这个保存选项。我就看了一下，和她要了psd的文件，还好我有一点
自己写的一个繁体到简体的转换程序 asialee java 转换繁体 filter 简体
今天调研一个任务，基于java的filter实现繁体到简体的转换，于是写了一个demo，给各位博友奉上，欢迎批评指正。实现的思路是重载request的调取参数的几个方法，然后做下转换。
android意图和意图监听器技术百合不是茶 android 显示意图隐式意图意图监听器
Intent是在activity之间传递数据;Intent的传递分为显示传递和隐式传递显式意图：调用Intent.setComponent() 或 Intent.setClassName() 或 Intent.setClass()方法明确指定了组件名的Intent为显式意图，显式意图明确指定了Intent应该传递给哪个组件。隐式意图;不指明调用的名称,根据设
spring3中新增的@value注解 bijian1013 java spring @Value
在spring 3.0中，可以通过使用@value，对一些如xxx.properties文件中的文件，进行键值对的注入，例子如下： 1.首先在applicationContext.xml中加入： <beans xmlns="http://www.springframework.
Jboss启用CXF日志 sunjing log jboss CXF
1. 在standalone.xml配置文件中添加system-properties： <system-properties> <property name="org.apache.cxf.logging.enabled" value=&
【Hadoop三】Centos7_x86_64部署Hadoop集群之编译Hadoop源代码 bit1129 centos
编译必需的软件 Firebugs3.0.0 Maven3.2.3 Ant JDK1.7.0_67 protobuf-2.5.0 Hadoop 2.5.2源码包 Firebugs3.0.0 http://sourceforge.jp/projects/sfnet_findbug
struts2验证框架的使用和扩展白糖_ 框架 xml bean struts 正则表达式
struts2能够对前台提交的表单数据进行输入有效性校验，通常有两种方式： 1、在Action类中通过validatexx方法验证，这种方式很简单，在此不再赘述； 2、通过编写xx-validation.xml文件执行表单验证，当用户提交表单请求后，struts会优先执行xml文件，如果校验不通过是不会让请求访问指定action的。本文介绍一下struts2通过xml文件进行校验的方法并说
记录-感悟 braveCS 感悟
再翻翻以前写的感悟，有时会发现自己很幼稚，也会让自己找回初心。 2015-1-11 1. 能在工作之余学习感兴趣的东西已经很幸福了； 2. 要改变自己，不能这样一直在原来区域，要突破安全区舒适区，才能提高自己，往好的方面发展； 3. 多反省多思考；要会用工具，而不是变成工具的奴隶； 4. 一天内集中一个定长时间段看最新资讯和偏流式博
编程之美-数组中最长递增子序列 bylijinnan 编程之美
import java.util.Arrays; import java.util.Random; public class LongestAccendingSubSequence { /** * 编程之美数组中最长递增子序列 * 书上的解法容易理解 * 另一方法书上没有提到的是，可以将数组排序（由小到大）得到新的数组， * 然后求排序后的数组与原数
读书笔记5 chengxuyuancsdn 重复提交 struts2的token验证
1、重复提交 2、struts2的token验证 3、用response返回xml时的注意 1、重复提交 (1)应用场景 (1-1)点击提交按钮两次。 (1-2)使用浏览器后退按钮重复之前的操作，导致重复提交表单。 (1-3)刷新页面 (1-4)使用浏览器历史记录重复提交表单。 (1-5)浏览器重复的 HTTP 请求。 (2)解决方法 (2-1)禁掉提交按钮 (2-2)
[时空与探索]全球联合进行第二次费城实验的可能性 comsci
二次世界大战前后,由爱因斯坦参加的一次在海军舰艇上进行的物理学实验 -费城实验至今给我们大家留下很多迷团..... 关于费城实验的详细过程,大家可以在网络上搜索一下,我这里就不详细描述了在这里,我的意思是,现在
easy connect 之 ORA-12154: TNS: 无法解析指定的连接标识符 daizj oracle ORA-12154
用easy connect连接出现“tns无法解析指定的连接标示符”的错误，如下： C:\Users\Administrator>sqlplus username/[email protected]:1521/orcl SQL*Plus: Release 10.2.0.1.0 – Production on 星期一 5月 21 18:16:20 2012 Copyright (c) 198
简单排序:归并排序 dieslrae 归并排序
public void mergeSort(int[] array){ int temp = array.length/2; if(temp == 0){ return; } int[] a = new int[temp]; int
C语言中字符串的\0和空格 dcj3sjt126com c
\0 为字符串结束符，比如说： abcd (空格)cdefg；存入数组时，空格作为一个字符占有一个字节的空间，我们
解决Composer国内速度慢的办法 dcj3sjt126com Composer
用法：有两种方式启用本镜像服务： 1 将以下配置信息添加到 Composer 的配置文件 config.json 中（系统全局配置）。见“例1” 2 将以下配置信息添加到你的项目的 composer.json 文件中（针对单个项目配置）。见“例2” 为了避免安装包的时候都要执行两次查询，切记要添加禁用 packagist 的设置，如下 1 2 3 4 5
高效可伸缩的结果缓存 shuizhaosi888 高效可伸缩的结果缓存
/** * 要执行的算法，返回结果v */ public interface Computable<A, V> { public V comput(final A arg); } /** * 用于缓存数据 */ public class Memoizer<A, V> implements Computable<A,
三点定位的算法 haoningabc c 算法
三点定位，已知a,b,c三个顶点的x,y坐标和三个点都z坐标的距离，la，lb,lc 求z点的坐标原理就是围绕a,b,c 三个点画圆，三个圆焦点的部分就是所求但是，由于三个点的距离可能不准，不一定会有结果，所以是三个圆环的焦点，环的宽度开始为0，没有取到则加1 运行 gcc -lm test.c test.c代码如下 #include "stdi
epoll使用详解 jimmee c linux 服务端编程 epoll
epoll - I/O event notification facility在linux的网络编程中，很长的时间都在使用select来做事件触发。在linux新的内核中，有了一种替换它的机制，就是epoll。相比于select，epoll最大的好处在于它不会随着监听fd数目的增长而降低效率。因为在内核中的select实现中，它是采用轮询来处理的，轮询的fd数目越多，自然耗时越多。并且，在linu
Hibernate对Enum的映射的基本使用方法 linzx0212 enum Hibernate
枚举 /** * 性别枚举 */ public enum Gender { MALE(0), FEMALE(1), OTHER(2); private Gender(int i) { this.i = i; } private int i; public int getI
第10章高级事件（下） onestopweb 事件
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
孙子兵法 roadrunners 孙子兵法
始计第一孙子曰：兵者，国之大事，死生之地，存亡之道，不可不察也。故经之以五事，校之以计，而索其情：一曰道，二曰天，三曰地，四曰将，五曰法。道者，令民于上同意，可与之死，可与之生，而不危也；天者，阴阳、寒暑、时制也；地者，远近、险易、广狭、死生也；将者，智、信、仁、勇、严也；法者，曲制、官道、主用也。凡此五者，将莫不闻，知之者胜，不知之者不胜。故校之以计，而索其情，曰
MySQL双向复制 tomcat_oracle mysql
本文包括: 主机配置从机配置建立主-从复制建立双向复制背景按照以下简单的步骤: 参考一下：在机器A配置主机(192.168.1.30) 在机器B配置从机(192.168.1.29) 我们可以使用下面的步骤来实现这一点步骤1：机器A设置主机在主机中打开配置文件 ,
zoj 3822 Domination(dp) 阿尔萨斯 Mina
题目链接：zoj 3822 Domination 题目大意：给定一个N∗M的棋盘，每次任选一个位置放置一枚棋子，直到每行每列上都至少有一枚棋子，问放置棋子个数的期望。解题思路：大白书上概率那一张有一道类似的题目，但是因为时间比较久了，还是稍微想了一下。dp[i][j][k]表示i行j列上均有至少一枚棋子，并且消耗k步的概率（k≤i∗j）,因为放置在i+1~n上等价与放在i+1行上，同理

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他