leoleocmm

余弦定理的应用：基于文字的文本相似度计算

最近由于工作项目，需要判断两个txt文本是否相似，于是开始在网上找资料研究，因为在程序中会把文本转换成String再做比较，所以最开始找到了这篇关于距离编辑算法 Blog写的非常好，受益匪浅。

于是我决定把它用到项目中，来判断两个文本的相似度。但后来实际操作发现有一些问题：直接说就是查询一本书中的相似章节花了我7、8分钟；这是我不能接受……

于是停下来仔细分析发现，这种算法在此项目中不是特别适用，由于要判断一本书中是否有相同章节，所以每两个章节之间都要比较，若一本书书有x章的话，这里需对比x(x-1)/2次；而此算法采用矩阵的方式，计算两个字符串之间的变化步骤，会遍历两个文本中的每一个字符两两比较，可以推断出时间复杂度至少为document1.length × document2.length，我所比较的章节字数平均在几千～一万字；这样计算实在要了老命。

想到Lucene中的评分机制，也是算一个相似度的问题，不过它采用的是计算向量间的夹角（余弦公式），在google黑板报中的：数学之美（余弦定理和新闻分类）也有说明，可以通过余弦定理来判断相似度；于是决定自己动手试试。

首相选择向量的模型：在以字为向量还是以词为向量的问题上，纠结了一会；后来还是觉得用字，虽然词更为准确，但分词却需要增加额外的复杂度，并且此项目要求速度，准确率可以放低，于是还是选择字为向量。

然后每个字在章节中出现的次数，便是以此字向量的值。现在我们假设：

章节1中出现的字为：Z1c1,Z1c2,Z1c3,Z1c4……Z1cn；它们在章节中的个数为：Z1n1,Z1n2,Z1n3……Z1nm；

章节2中出现的字为：Z2c1,Z2c2,Z2c3,Z2c4……Z2cn；它们在章节中的个数为：Z2n1,Z2n2,Z2n3……Z2nm；

其中，Z1c1和Z2c1表示两个文本中同一个字，Z1n1和Z2n1是它们分别对应的个数，

最后我们的相似度可以这么计算：

程序实现如下：（若有可优化或更好的实现请不吝赐教）

      view source 
      
 print ? 
    
         001 
         import java.io.UnsupportedEncodingException; 
       
         002 
         import java.util.HashMap; 
       
         003 
         import java.util.Iterator; 
       
         004 
         import java.util.Map; 
       
         005 
           
         006 
           
         007 
         public class CosineSimilarAlgorithm { 
       
         008 
             public static double getSimilarity(String doc1, String doc2) { 
       
         009 
                 if (doc1 != null && doc1.trim().length() > 0 && doc2 != null 
       
         010 
                         && doc2.trim().length() > 0) { 
       
         011 
                       
         012 
                     Map<Integer, int[]> AlgorithmMap = new HashMap<Integer, int[]>(); 
       
         013 
                       
         014 
                     //将两个字符串中的中文字符以及出现的总数封装到，AlgorithmMap中 
       
         015 
                     for (int i = 0; i < doc1.length(); i++) { 
       
         016 
                         char d1 = doc1.charAt(i); 
       
         017 
                         if(isHanZi(d1)){ 
       
         018 
                             int charIndex = getGB2312Id(d1); 
       
         019 
                             if(charIndex != -1){ 
       
         020 
                                 int[] fq = AlgorithmMap.get(charIndex); 
       
         021 
                                 if(fq != null && fq.length == 2){ 
       
         022 
                                     fq[0]++; 
       
         023 
                                 }else { 
       
         024 
                                     fq = new int[2]; 
       
         025 
                                     fq[0] = 1; 
       
         026 
                                     fq[1] = 0; 
       
         027 
                                     AlgorithmMap.put(charIndex, fq); 
       
         028 
                                 } 
       
         029 
                             } 
       
         030 
                         } 
       
         031 
                     } 
       
         032 
           
         033 
                     for (int i = 0; i < doc2.length(); i++) { 
       
         034 
                         char d2 = doc2.charAt(i); 
       
         035 
                         if(isHanZi(d2)){ 
       
         036 
                             int charIndex = getGB2312Id(d2); 
       
         037 
                             if(charIndex != -1){ 
       
         038 
                                 int[] fq = AlgorithmMap.get(charIndex); 
       
         039 
                                 if(fq != null && fq.length == 2){ 
       
         040 
                                     fq[1]++; 
       
         041 
                                 }else { 
       
         042 
                                     fq = new int[2]; 
       
         043 
                                     fq[0] = 0; 
       
         044 
                                     fq[1] = 1; 
       
         045 
                                     AlgorithmMap.put(charIndex, fq); 
       
         046 
                                 } 
       
         047 
                             } 
       
         048 
                         } 
       
         049 
                     } 
       
         050 
                       
         051 
                     Iterator<Integer> iterator = AlgorithmMap.keySet().iterator(); 
       
         052 
                     double sqdoc1 = 0; 
       
         053 
                     double sqdoc2 = 0; 
       
         054 
                     double denominator = 0; 
       
         055 
                     while(iterator.hasNext()){ 
       
         056 
                         int[] c = AlgorithmMap.get(iterator.next()); 
       
         057 
                         denominator += c[0]*c[1]; 
       
         058 
                         sqdoc1 += c[0]*c[0]; 
       
         059 
                         sqdoc2 += c[1]*c[1]; 
       
         060 
                     } 
       
         061 
                       
         062 
                     return denominator / Math.sqrt(sqdoc1*sqdoc2); 
       
         063 
                 } else { 
       
         064 
                     throw new NullPointerException( 
       
         065 
                             " the Document is null or have not cahrs!!"); 
       
         066 
                 } 
       
         067 
             } 
       
         068 
           
         069 
             public static boolean isHanZi(char ch) { 
       
         070 
                 // 判断是否汉字 
       
         071 
                 return (ch >= 0x4E00 && ch <= 0x9FA5); 
       
         072 
           
         073 
             } 
       
         074 
           
         075 
             /** 
       
         076 
              * 根据输入的Unicode字符，获取它的GB2312编码或者ascii编码， 
       
         077 
              * 
       
         078 
              * @param ch 
       
         079 
              *            输入的GB2312中文字符或者ASCII字符(128个) 
       
         080 
              * @return ch在GB2312中的位置，-1表示该字符不认识 
       
         081 
              */ 
       
         082 
             public static short getGB2312Id(char ch) { 
       
         083 
                 try { 
       
         084 
                     byte[] buffer = Character.toString(ch).getBytes("GB2312"); 
       
         085 
                     if (buffer.length != 2) { 
       
         086 
                         // 正常情况下buffer应该是两个字节，否则说明ch不属于GB2312编码，故返回'?'，此时说明不认识该字符 
       
         087 
                         return -1; 
       
         088 
                     } 
       
         089 
                     int b0 = (int) (buffer[0] & 0x0FF) - 161; // 编码从A1开始，因此减去0xA1=161 
       
         090 
                     int b1 = (int) (buffer[1] & 0x0FF) - 161; // 第一个字符和最后一个字符没有汉字，因此每个区只收16*6-2=94个汉字 
       
         091 
                     return (short) (b0 * 94 + b1); 
       
         092 
                 } catch (UnsupportedEncodingException e) { 
       
         093 
                     e.printStackTrace(); 
       
         094 
                 } 
       
         095 
                 return -1; 
       
         096 
             } 
       
         097 
               
         098 
             public static void main(String[] args) { 
       
         099 
                 System.out.println(getSimilarity("我喜欢看电视，不喜欢看电影。", "我不喜欢看电视，也不喜欢看电影。")); 
       
         100 
             } 
       
         101 
         }

你可能感兴趣的:(余弦定理的应用：基于文字的文本相似度计算)

Python网安-ftp服务暴力破解（仅供学习） Whoisshutiao python 网络安全开发语言
目录源码在这里需要导入的模块连接ftp，并设置密码本和线程核心代码设置线程源码在这里https://github.com/Wist-fully/Attack/tree/cracker需要导入的模块importftplibfromthreadingimportThreadimportqueue连接ftp，并设置密码本和线程host="192.168.6.6"user="student"port=21
Python爬虫网安-request+示例 Whoisshutiao python爬虫网安 python 爬虫开发语言网络安全
目录get&post自定义请求头文件上传添加cookie获取网页使用cookiejarsessionssl证书校验超时身份认证（httpbasicAuth）代理配置get&post#！/usr/bin/envpythonimportrequests#get#r=requests.get('http://httpbin.org/get')#print(r.text)#添加参数的get请求data={
流量压测，CDN跑量 JAVA拾贝 ddos 压测攻击网络攻击模型
这里写自定义目录标题背景灵机一动平台部署总结背景自己经营了个网站，有一点收益，经常被竞争对手DDOS,客户流失，无奈只能上防御平台,气不过也找人去DDOS对方(不建议，费钱且违法)，对方也上了高防CDN,于是一直陷入伤敌一千自损八百的循环～灵机一动常规的CDN套餐除了时间还有请求数和流量的限制，那如果可以一直刷对方流量岂不是，可以间接掏空对方钱包了？如是赶紧找了下有没有类似的平台～平台官网：Img
FTTR（Fiber to the Room）一主一从
FTTR（FibertotheRoom）一主一从是家庭或企业光纤组网中的一种设备配置方式，具体含义如下：1.基本概念FTTR：指光纤直接延伸到每个房间（替代传统网线），实现全屋千兆/万兆覆盖。一主一从：由一台主光猫（主网关）和一台从光猫（从网关）组成的网络架构，通过光纤连接，形成主从协作的网络系统。2.主设备和从设备的作用主光猫（主网关）直接连接运营商的光纤入户线路，负责拨号、路由、Wi-Fi覆盖
Charles中文版抓包工具：如何加速API调试与网络优化 2501_91592143 http udp https websocket 网络安全网络协议 tcp/ip
在软件开发的过程中，网络请求和API接口的调试与优化是最常见的挑战之一。无论是Web开发、移动应用调试，还是后端API性能优化，开发者都需要一个高效的工具来帮助诊断和解决网络流量中的潜在问题。Charles抓包工具作为一款行业领先的网络调试软件，凭借其强大的功能和简便的操作，帮助开发者提升开发效率、优化网络请求。本文将探讨如何通过Charles中文版抓包工具加速API调试与网络优化，确保开发过程中
iOS 抓包实战：时间戳偏差导致的数据同步异常排查记录 00后程序员张 http udp https websocket 网络安全网络协议 tcp/ip
“这条数据不是我填的”“我的更新被覆盖了”“两个设备显示不一致”——这些是产品上线后最令人头疼的反馈。最近我们在一次用户同步问题排查中，发现表面是“数据丢失”问题，实则是多端数据提交时间戳处理不一致，导致后台认为老数据为新，覆盖了正确内容。这类问题通常日志无法直接反映，需要从网络请求行为层级来全面还原。本文是一次跨平台同步数据错乱排查的抓包实录，目标是展示如何用多工具组合方式，精确还原并定位导致数
iOS 应用安全加固指南：通过 IPA 混淆与防破解技术实现全面防护 00后程序员张 http udp https websocket 网络安全网络协议 tcp/ip
在现代移动应用开发中，安全性已不再是一个可以忽视的领域。随着黑客技术的日益成熟以及用户对隐私保护的重视，开发者必须将安全性嵌入到应用的每一个开发环节中，而不仅仅是在开发的后期进行加固。尤其是对于那些涉及用户数据、支付信息等敏感内容的应用，确保应用的安全性是至关重要的。本文将介绍iOS应用开发中的安全实践，并结合具体的安全加固技术，如使用IpaGuard、Obfuscator-LLVM，从应用的设计
网安知识“大乱炖“ Lovely_18 网安知识积累
网安知识"大乱炖"Windows安全事件日志常用EventID：EventID含义说明4624登录成功表示用户成功登录系统4625登录失败✅表示登录尝试失败，是暴力破解最关键的日志标志4672特权登录表示具有管理员权限的账户登录（用于检测高权限账户活动）4648显式凭证登录用户在使用runas或远程方式提供用户名/密码登录暴力破解相关日志特征：连续触发大量4625登录失败来自同一个IP或多个IP的
多个 Job 并发运行时共享配置文件导致上下文污染，固化 Jenkins Job 上下文要站在顶端 Jenkins jenkins servlet 运维
基于context.py固化JenkinsJob上下文的完整方案，适用于你当前的工作流（Python+JenkinsPipeline），解决：多个Job并发运行时共享配置文件导致上下文污染；读取环境变量或JSON文件时被其他Job修改的问题；后续阶段（如发送通知）读取错误上下文的问题；✅目标在每个JenkinsJob开始时，将关键变量一次性固化到内存中，并在整个Job生命周期内始终使用这些值。整体
DOP数据开放平台(真实线上项目) JAVA拾贝 java 数据开放平台接口开放平台监控限流接口过滤自动文档
什么是数据开放平台？数据开放平台是一种通过公开应用程序编程接口（API）或结构化数据，允许第三方开发者或机构访问、使用和共享数据的平台‌，旨在促进数据流通、打破信息孤岛并激发创新应用。DOP数据开放平台简单演示DOP数据开放平台(JAVA语言)DOP数据开放平台优势网址：DOP数据开放平台商户可自行注册，管理员开放权限访问接口向下兼容，方便版本迭代响应报文过滤，数据更安全支持监控限流，服务更稳定自
Docker 入门教程（七）：容器数据卷千233 Docker（for科研er）docker java eureka
文章目录Docker入门教程（七）：容器数据卷一、为什么需要数据卷？二、三种挂载方式示例：MySQL数据持久化三、数据卷容器模式（旧式技术）Docker入门教程（七）：容器数据卷一、为什么需要数据卷？容器默认的写层具有两个关键缺点：不持久：容器一旦被删除，数据也随之丢失不可共享：每个容器的数据互相隔离为了解决这个问题，Docker提供了数据卷（Volume）机制，将数据从容器中解耦出来，形成独立、
CentOS DHCP服务器部署指南
title:DHCP服务器部署以及配置search:2024-03-21tags:“#DHCP服务器部署以及配置”CentOSDHCP服务器部署指南背景：因上了Linux的实验课程，在课程中，老师要求我们自己搭建DHCP服务器构建局域网，在构建的时候问题百出，不过也极其有意思一、补充网络基本概念（了解的可以直接跳过）IP地址：通俗来讲，我认为IP就是相当于在互联网的身份证，是用来标识自己在互联网上
数据标注工具详解 Sally璐璐 ai 大数据
数据标注工具是构建高质量AI训练数据集的核心基础设施，其功能覆盖图像、文本、视频、音频、3D点云等多模态数据的标注与管理。以下从工具类型、核心功能、行业应用及技术趋势等方面进行系统介绍：一、主流数据标注工具分类与特性1.通用型标注平台LabelStudio由Heartex开发的开源工具，支持文本、图像、视频、音频及时间序列数据标注，可通过YAML自定义标注界面19。其内置质量控制机制（如标注审核、
Joda-Time 日期时间库介绍 hweiyu00 技术栈杂谈开发语言 java
一、Joda-Time是什么？Joda-Time是由StephenColebourne开发的开源日期时间库，用于替代Java标准库中的java.util.Date和java.util.Calendar。它因设计更合理、使用更便捷，曾是Java开发中处理日期时间的主流选择，尤其在Java8推出新的日期时间API（java.time包）之前被广泛使用。二、Joda-Time解决了Java标准库的哪些问
MyBatis 简介 hweiyu00 技术栈杂谈 mybatis
MyBatis简介MyBatis是一款优秀的持久层框架，它支持定制化SQL、存储过程以及高级映射，能够帮助开发者将Java对象与数据库表进行灵活映射，简化数据持久化操作。以下从多个维度详细介绍MyBatis：一、核心定位与优势轻量级框架：相比Hibernate等全自动ORM框架，MyBatis更“轻”，开发者需手动编写SQL语句，灵活性更高，便于优化性能。ORM映射功能：通过XML或注解方式，将J
Go 语言高效连接 SQL Server（MSSQL）数据库实战指南程序员爱钓鱼数据库 golang sqlserver
在Go语言的开发过程中，与MicrosoftSQLServer(MSSQL)数据库的交互是常见需求之一。本文将详细介绍如何使用Go语言高效、安全地连接SQLServer，并进行基本的CRUD（增删改查）操作。1.安装MSSQL驱动Go语言使用github.com/denisenkom/go-mssqldb作为SQLServer驱动，首先需要安装它：goget-ugithub.com/denisen
Spring AI 结合 MCP MySQL 实现对话式数据库查询没刮胡子软件开发技术实战专栏人工智能AI Spring 数据库 spring 人工智能 spring-ai mcp-server mysql
在现代应用开发中，将人工智能与数据库查询结合可以创造更自然、更智能的用户交互方式。下面我将详细介绍如何使用SpringAI框架结合MCP（可能指MySQL连接池或相关组件）实现对话中的数据库查询功能。什么是SpringAI和MCPMySQLSpringAI框架概述SpringAI是基于Spring生态的人工智能集成框架，它提供了：与大型语言模型(LLM)的集成能力对话管理和自然语言处理功能业务逻辑
AingDesk开源免费的本地 AI 模型管理工具(搭建和调用MCP) 没刮胡子 Linux服务器技术软件开发技术实战专栏人工智能AI 开源人工智能 AI助手 mcp sse 知识库智能体
说明AingDesk是一款开源免费的本地AI模型管理工具，旨在简化AI模型部署流程并提升用户体验。AingDesk支持本地AI模型及API+知识库搭建。支持知识库、模型API、分享、联网搜索、智能体。✨产品亮点跨平台支持客户端支持Windows、macOS，服务端可通过Docker部署高效下载与网络优化自动选择最优下载线路，支持断点续传，提升大模型部署速度兼容OpenAIAPI格式，方便第三方模型
【Docker基础】Docker容器管理：docker stats及其参数详解 IT成长日记容器技术深度解析与实践 docker 容器运维 docker stats
目录1Docker监控概述2dockerstats基本用法2.1基本命令格式2.2常用操作示例3dockerstats参数详解3.1常用参数说明3.2输出字段解析3.3格式化输出示例4dockerstats工作原理4.1监控数据采集流程4.2数据源解析5常见问题解答5.1为什么CPU使用率会超过100%？5.2内存统计中的cache/buffer包含在哪里？5.3如何监控已停止的容器？6总结1Do
sqlserver 中的go的作用 NaiQai SqlServer
如果只是执行一条语句，有没有go都一样，如果多条语句之间用go分隔开就不一样了，每个被go分隔的语句都是一个单独的事务，一个语句执行失败不会影响其他语句执行。例如:首先同时执行下边的语句select*fromsysobjectswhereid=aselectgetdate()你会发现会报错，并且不会显示任何结果集而你再执行select*fromsysobjectswhereid=agoselect
MiniMax - M1：开源大模型的革命性突破
开源大模型MiniMax-M1研究报告一、引言在人工智能技术飞速发展的当下，大模型领域的竞争愈发激烈。开源大模型以其开放性、可定制性和社区协作的优势，逐渐成为推动人工智能技术进步的重要力量。MiniMax-M1作为全球首个开源大规模混合架构的推理模型，一经发布便引起了广泛关注。它在长上下文处理、推理效率和成本控制等方面展现出了卓越的性能，为人工智能的发展带来了新的思路和方向。本文将对MiniMax
Flutter基础（UI监听） aaiier flutter 前端
文本按钮（TextButton）文本按钮是没有边框的按钮，当点击时会有涟漪效果。TextButton(onPressed:(){//点击按钮后要执行的代码print('文本按钮被点击了');},child:Text('点击我'),)手势检测器（GestureDetector）GestureDetector能够检测多种手势，不只是点击，还包括滑动、长按等。GestureDetector(onTap:
Flutter基础（项目创建） aaiier flutter
一、使用命令行创建项目1.确认Flutter环境正常要保证FlutterSDK已经正确安装，并且环境变量配置无误。可以通过执行以下命令来验证：flutterdoctor要保证所有检查项都显示绿色对勾，要是有问题，可按照提示进行修复。2.创建新项目打开终端，执行下面的命令来创建一个新的Flutter应用：fluttercreatemy_flutter_appcdmy_flutter_app这里的my
print(str(3+5))的结果是什么？为什么？ Lauren_Lu python
✅语句：print(str(3+5))✅执行顺序与含义：括号优先：先计算3+5+是加法运算符3+5是一个表达式，结果为整数8使用str()函数将结果转换为字符串str(8)返回字符串'8'使用print()打印这个字符串print('8')的输出就是：8✅为什么要运算？因为：Python遇到表达式3+5时，必须先计算出结果；str()需要一个值作为参数，而不是一个没计算的表达式；这是Python表
CentOS 入门必备基础知识与操作指南码上有潜 linux centos linux 运维
标题：CentOS入门必备基础知识与操作指南简介CentOS是基于RedHatEnterpriseLinux(RHEL)的社区版本，适合企业级服务器的稳定性和安全性要求。本文将带领你了解CentOS的基础知识、安装过程、常用命令以及一些常见的运维操作。1.什么是CentOS？定义：CentOS是一个开放源代码的企业级操作系统，免费提供，但与RHEL完全兼容。优势：稳定、安全、适合长时间运行的服务器
CentOS网络配置与管理完全指南 Sally璐璐运维运维 centos
1.网络状态查看与诊断1.1ifconfig命令（传统方式）#安装net-tools（CentOS7/8默认可能未安装）sudoyuminstallnet-tools-y#基础查看命令ifconfig#显示所有接口的IP、MAC、收发包统计等完整信息ifconfigeth0#查看eth0网卡的详细状态，包括：#-RX/TXpackets：收发包数量#-errors/dropped：错误和丢包统计#
SQL Server 中 GO 的作用 Lauren_Lu golang 数据库 oracle
CREATEDATABASEMyDatabase;USEMyDatabase;GO--定义局部变量DECLARE@s_novarchar(8),@s_avgradenumeric(4,1);--对局部变量赋值SETs_no='20170208';SET@s_avgrade=95.0;--使用局部变量UPDATEstudentSETs_avgrade=@s_avgradeWHEREs_no=@s_n
Flutter基础（对接 API） aaiier flutter
1.添加依赖首先在pubspec.yaml中添加http包：dependencies:flutter:sdk:flutterhttp:^1.1.0#网络请求库然后运行flutterpubget来获取依赖包。2.创建API服务类创建一个专门的类来处理所有API请求，方便统一管理。import'dart:convert';//用于JSON编解码import'package:http/http.dart
RNN循环神经网络原理解读 zhishidi ai笔记 rnn 人工智能深度学习
我们把循环神经网络想象成一个有记忆的助手，特别擅长处理按顺序出现的信息，比如句子、语音、股票价格、音乐旋律等。核心思想：记住过去的信息，帮助理解现在。普通神经网络的局限（没有记忆）想象一个普通的神经网络（比如用于识别图片的）：输入：你给它一张图片。处理：它分析这张图片的像素。输出：告诉你图片里是“猫”还是“狗”。问题：它每次只看一个独立的输入（一张图片），输入之间没有联系。给它看一个视频（连续很多
信息抽取领域关键Benchmark方法：分类体系
信息抽取领域关键Benchmark方法：分类体系摘要信息抽取（InformationExtraction,IE）作为自然语言处理的核心任务之一，旨在从非结构化文本中识别并结构化关键信息（如实体、关系、事件等），广泛应用于知识图谱构建、智能问答和数据分析等领域。近年来，随着深度学习技术的快速发展，信息抽取方法在性能和应用范围上取得了显著进步，但同时也面临着任务多样性、跨领域泛化性以及低资源场景下的适
java线程Thread和Runnable区别和联系 zx_code java jvm thread 多线程 Runnable
我们都晓得java实现线程2种方式，一个是继承Thread，另一个是实现Runnable。模拟窗口买票，第一例子继承thread，代码如下 package thread; public class ThreadTest { public static void main(String[] args) { Thread1 t1 = new Thread1(
【转】JSON与XML的区别比较丁_新 json xml
1.定义介绍 (1).XML定义扩展标记语言 (Extensible Markup Language, XML) ，用于标记电子文件使其具有结构性的标记语言，可以用来标记数据、定义数据类型，是一种允许用户对自己的标记语言进行定义的源语言。 XML使用DTD(document type definition)文档类型定义来组织数据;格式统一，跨平台和语言，早已成为业界公认的标准。 XML是标
c++ 实现五种基础的排序算法 CrazyMizzz C++c 算法
#include<iostream> using namespace std; //辅助函数，交换两数之值 template<class T> void mySwap(T &x, T &y){ T temp = x; x = y; y = temp; } const int size = 10; //一、用直接插入排
我的软件麦田的设计者我的软件音乐类娱乐放松
这是我写的一款app软件，耗时三个月，是一个根据央视节目开门大吉改变的，提供音调，猜歌曲名。1、手机拥有者在android手机市场下载本APP，同意权限，安装到手机上。2、游客初次进入时会有引导页面提醒用户注册。（同时软件自动播放背景音乐）。3、用户登录到主页后，会有五个模块。a、点击不胫而走，用户得到开门大吉首页部分新闻，点击进入有新闻详情。b、
linux awk命令详解被触发 linux awk
awk是行处理器: 相比较屏幕处理的优点，在处理庞大文件时不会出现内存溢出或是处理缓慢的问题，通常用来格式化文本信息 awk处理过程: 依次对每一行进行处理，然后输出 awk命令形式: awk [-F|-f|-v] ‘BEGIN{} //{command1; command2} END{}’ file [-F|-f|-v]大参数，-F指定分隔符，-f调用脚本，-v定义变量 var=val
各种语言比较 _wy_ 编程语言
Java Ruby PHP 擅长领域
oracle 中数据类型为clob的编辑知了ing oracle clob
public void updateKpiStatus(String kpiStatus,String taskId){ Connection dbc=null; Statement stmt=null; PreparedStatement ps=null; try { dbc = new DBConn().getNewConnection(); //stmt = db
分布式服务框架 Zookeeper -- 管理分布式环境中的数据矮蛋蛋 zookeeper
原文地址： http://www.ibm.com/developerworks/cn/opensource/os-cn-zookeeper/ 安装和配置详解本文介绍的 Zookeeper 是以 3.2.2 这个稳定版本为基础，最新的版本可以通过官网 http://hadoop.apache.org/zookeeper/来获取，Zookeeper 的安装非常简单，下面将从单机模式和集群模式两
tomcat数据源 alafqq tomcat
数据库 JNDI(Java Naming and Directory Interface，Java命名和目录接口)是一组在Java应用中访问命名和目录服务的API。没有使用JNDI时我用要这样连接数据库： 03. Class.forName("com.mysql.jdbc.Driver"); 04. conn
遍历的方法百合不是茶遍历
遍历在java的泛
linux查看硬件信息的命令 bijian1013 linux
linux查看硬件信息的命令一.查看CPU： cat /proc/cpuinfo 二.查看内存： free 三.查看硬盘： df linux下查看硬件信息 1、lspci 列出所有PCI 设备； lspci - list all PCI devices:列出机器中的PCI设备（声卡、显卡、Modem、网卡、USB、主板集成设备也能
java常见的ClassNotFoundException bijian1013 java
1.java.lang.ClassNotFoundException: org.apache.commons.logging.LogFactory 添加包common-logging.jar2.java.lang.ClassNotFoundException: javax.transaction.Synchronization
【Gson五】日期对象的序列化和反序列化 bit1129 反序列化
对日期类型的数据进行序列化和反序列化时，需要考虑如下问题： 1. 序列化时，Date对象序列化的字符串日期格式如何 2. 反序列化时，把日期字符串序列化为Date对象，也需要考虑日期格式问题 3. Date A -> str -> Date B,A和B对象是否equals 默认序列化和反序列化 import com
【Spark八十六】Spark Streaming之DStream vs. InputDStream bit1129 Stream
1. DStream的类说明文档： /** * A Discretized Stream (DStream), the basic abstraction in Spark Streaming, is a continuous * sequence of RDDs (of the same type) representing a continuous st
通过nginx获取header信息 ronin47 nginx header
1. 提取整个的Cookies内容到一个变量，然后可以在需要时引用，比如记录到日志里面， if ( $http_cookie ~* "(.*)$") { set $all_cookie $1; } 变量$all_cookie就获得了cookie的值，可以用于运算了
java-65.输入数字n，按顺序输出从1最大的n位10进制数。比如输入3，则输出1、2、3一直到最大的3位数即999 bylijinnan java
参考了网上的http://blog.csdn.net/peasking_dd/article/details/6342984 写了个java版的： public class Print_1_To_NDigit { /** * Q65.输入数字n，按顺序输出从1最大的n位10进制数。比如输入3，则输出1、2、3一直到最大的3位数即999 * 1.使用字符串
Netty源码学习-ReplayingDecoder bylijinnan java netty
ReplayingDecoder是FrameDecoder的子类，不熟悉FrameDecoder的，可以先看看 http://bylijinnan.iteye.com/blog/1982618 API说，ReplayingDecoder简化了操作，比如： FrameDecoder在decode时，需要判断数据是否接收完全： public class IntegerH
js特殊字符过滤 cngolon js特殊字符 js特殊字符过滤
1.js中用正则表达式过滤特殊字符, 校验所有输入域是否含有特殊符号function stripscript(s) { var pattern = new RegExp("[`~!@#$^&*()=|{}':;',\\[\\].<>/?~！@#￥……&*（）——|{}【】‘；：”“'。，、？]"
hibernate使用sql查询 ctrain Hibernate
import java.util.Iterator; import java.util.List; import java.util.Map; import org.hibernate.Hibernate; import org.hibernate.SQLQuery; import org.hibernate.Session; import org.hibernate.Transa
linux shell脚本中切换用户执行命令方法 daizj linux shell 命令切换用户
经常在写shell脚本时，会碰到要以另外一个用户来执行相关命令，其方法简单记下： 1、执行单个命令：su - user -c "command" 如：下面命令是以test用户在/data目录下创建test123目录 [root@slave19 /data]# su - test -c "mkdir /data/test123"
好的代码里只要一个 return 语句 dcj3sjt126com return
别再这样写了：public boolean foo() { if (true) { return true; } else { return false;
Android动画效果学习 dcj3sjt126com android
1、透明动画效果方法一：代码实现 public View onCreateView(LayoutInflater inflater, ViewGroup container, Bundle savedInstanceState) { View rootView = inflater.inflate(R.layout.fragment_main, container, fals
linux复习笔记之bash shell (4)管道命令 eksliang linux管道命令汇总 linux管道命令 linux常用管道命令
转载请出自出处： http://eksliang.iteye.com/blog/2105461 bash命令执行的完毕以后，通常这个命令都会有返回结果，怎么对这个返回的结果做一些操作呢？那就得用管道命令‘|’。上面那段话，简单说了下管道命令的作用，那什么事管道命令呢？答：非常的经典的一句话，记住了，何为管
Android系统中自定义按键的短按、双击、长按事件 gqdy365 android
在项目中碰到这样的问题：由于系统中的按键在底层做了重新定义或者新增了按键，此时需要在APP层对按键事件（keyevent）做分解处理，模拟Android系统做法，把keyevent分解成： 1、单击事件：就是普通key的单击； 2、双击事件：500ms内同一按键单击两次； 3、长按事件：同一按键长按超过1000ms（系统中长按事件为500ms）； 4、组合按键：两个以上按键同时按住；
asp.net获取站点根目录下子目录的名称 hvt .net C#asp.net hovertree Web Forms
使用Visual Studio建立一个.aspx文件(Web Forms)，例如hovertree.aspx,在页面上加入一个ListBox代码如下： <asp:ListBox runat="server" ID="lbKeleyiFolder" /> 那么在页面上显示根目录子文件夹的代码如下： string[] m_sub
Eclipse程序员要掌握的常用快捷键 justjavac java eclipse 快捷键 ide
判断一个人的编程水平，就看他用键盘多，还是鼠标多。用键盘一是为了输入代码（当然了，也包括注释），再有就是熟练使用快捷键。曾有人在豆瓣评《卓有成效的程序员》：“人有多大懒，才有多大闲”。之前我整理了一个程序员图书列表，目的也就是通过读书，让程序员变懒。写道程序员作为特殊的群体，有的人可以这么懒，懒到事情都交给机器去做，而有的人又可
c++编程随记 lx.asymmetric C++笔记
为了字体更好看，改变了格式…… &&运算符： #include<iostream> using namespace std; int main(){ int a=-1,b=4,k; k=(++a<0)&&!(b--
linux标准IO缓冲机制研究音频数据 linux
一、什么是缓存I/O(Buffered I/O)缓存I/O又被称作标准I/O,大多数文件系统默认I/O操作都是缓存I/O。在Linux的缓存I/O机制中，操作系统会将I/O的数据缓存在文件系统的页缓存(page cache)中，也就是说，数据会先被拷贝到操作系统内核的缓冲区中，然后才会从操作系统内核的缓冲区拷贝到应用程序的地址空间。1.缓存I/O有以下优点:A.缓存I/O使用了操作系统内核缓冲区，
随想生活暗黑小菠萝生活
其实账户之前就申请了，但是决定要自己更新一些东西看也是最近。从毕业到现在已经一年了。没有进步是假的，但是有多大的进步可能只有我自己知道。毕业的时候班里12个女生，真正最后做到软件开发的只要两个包括我，PS：我不是说测试不好。当时因为考研完全放弃找工作，考研失败，我想这只是我的借口。那个时候才想到为什么大学的时候不能好好的学习技术，增强自己的实战能力，以至于后来找工作比较费劲。我
我认为POJO是一个错误的概念 windshome java POJO 编程 J2EE 设计
这篇内容其实没有经过太多的深思熟虑，只是个人一时的感觉。从个人风格上来讲，我倾向简单质朴的设计开发理念；从方法论上，我更加倾向自顶向下的设计；从做事情的目标上来看，我追求质量优先，更愿意使用较为保守和稳妥的理念和方法。 &

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他