- 使用BLSTM自动评估句子级构音障碍的可理解性
帅小柏
声音的未来:语音识别文献解读深度学习人工智能分类
使用BLSTM自动评估句子级构音障碍的可理解性原文:AutomaticAssessmentofSentence-LevelDysarthriaIntelligibilityUsingBLSTM引言构音障碍简介构音障碍的定义与特征构音障碍是一种由神经原因引起的运动性言语障碍表现为肌肉无力、瘫痪或协调不良,导致言语清晰度下降可理解性的重要性可理解性是衡量言语障碍严重程度的重要指标自动评估可帮助语言病理
- jieba库词频统计_jieba分词器(应用及字典的补充)及文档高频词提取实战
袁圆园建建
jieba库词频统计
jieba分词器是Python中最好的中文分词组件,本文讲解一下jieba分词器及其应用。1、jieba分词器的分词模式jieba分词器提供了三种常用的分词模式1、精确模式:将句子按照最精确的方法进行切分,适合用于进行文本分析;2、全模式:将句子当中所有可以成词的词语都扫描出来,分词速度很快但容易产生歧义;3、搜索引擎模式:在精确模式分词的基础上,将长的句子再次进行切分,提高召回率,适用于搜索引擎
- NLU-预训练模型-2018:Bert(二)【“Masked LM”缺点:①预训练与微调不一致;②忽略了掩码位置间的依赖关系】【复杂度:O(n^2·d);n:输入序列长度(规定最长512)】
u013250861
#NLP/词向量_预训练模型bert人工智能深度学习
五、BERT中的词嵌入1、为什么要使用BERT的嵌入使用BERT从文本数据中提取特征,即单词和句子的嵌入向量。我们可以用这些词和句子的嵌入向量做什么?首先,这些嵌入对于关键字/搜索扩展、语义搜索和信息检索非常有用。例如,如果你希望将客户的问题或搜索与已经回答的问题或文档化的搜索相匹配,这些表示将帮助准确的检索匹配客户意图和上下文含义的结果,即使没有关键字或短语重叠。其次,或许更重要的是,这些向量被
- 【DeepSeek干货总结】对不同类型学术内容进行润色的顶级提示词汇总!
AIWritePaper官方账号
DeepSeekPromptAIWritePaperAIWritePaperdeepseek深度学习人工智能AIGC论文润色
目录1.英文润色2.中文润色3.SCI润色4.润色Prompt汇总连贯性与句子逻辑提示词多参考版本提示词语法矫正提示词润色内容定位提示词修改建议提示词大家好这里是AIWritePaper官方账号!AIWritePaper官网AIWritePaper宝子们在写学术论文的过程中要想让DeepSeek发挥出最佳效能,尤其在进行文本润色时,精确和具体的提示词至关重要。很多宝子们在请求DeepSeek文本润
- Dify知识库构建流程及示例
cqbelt
ai笔记AI应用
总体流程1.数据预处理清洗:去除噪声、特殊字符、标准化格式。分词/标记化:拆分文本为单词或子词单元(如使用Tokenizer)。元数据关联:附加来源、时间戳等信息,支持多维度检索。2.文本分块固定长度分块:按字符或Token数切分,简单高效。语义分块:基于句子边界或主题分割(如NLP模型识别段落主旨)。重叠策略:相邻块间部分重叠,避免上下文断裂。3.向量化(Embedding)嵌入模型:调用预训练
- 【Image captioning-RS】论文12 Prior Knowledge-Guided Transformer for Remote Sensing Image Captioning
CV视界
Imagecaptioning学习transformer深度学习人工智能
1.摘要遥感图像(RSI)字幕生成旨在为遥感图像生成有意义且语法正确的句子描述。然而,相比于自然图像字幕,RSI字幕生成面临着由于RSI特性而产生的额外挑战。第一个挑战源于这些图像中存在大量物体。随着物体数量的增加,确定描述的主要焦点变得越来越困难。此外,RSI中的物体通常外观相似,进一步复杂化了准确描述的生成。为克服这些挑战,我们提出了一种基于先验知识的transformer(PKG-Trans
- 处理文本的原则
the only KIrsTEN
语音和文本处理(Python)
没有字符编码方案本身就是目的:它是一种启用计算机上有用的文本处理。•计算机预期支持的基本低级文本处理包括:使字符可见(包括连字、上下文形式等)渲染时断线(包括断字)修改外观,例如点大小、字距、下划线、倾斜和重量(轻,半,粗体等)确定“单词”和“句子”等单位在选择和突出显示文本等过程中与用户交互通过插入和删除接受键盘输入和编辑存储的文本比较操作中的文本,例如排序或确定排序顺序两串分析文本内容,例如拼
- Elasticsearch:为推理端点配置分块设置
Elastic 中国社区官方博客
ElasticsearchAIElasticelasticsearch大数据搜索引擎人工智能全文检索数据库ai
推理端点对一次可处理的文本量有限,具体取决于模型的输入容量。分块(Chunking)是指将输入文本拆分成符合这些限制的小块的过程,在将文档摄取到semantic_text字段时会进行分块。分块不仅有助于保持输入文本在可处理范围内,还能使内容更加易读。相比返回一整篇长文档,在搜索结果中提供最相关的文本片段更有价值。每个分块都会包含文本片段以及从中生成的对应嵌入。默认情况下,文档会被拆分为句子(sen
- Python个人学习笔记(2):编程入门知识与基础语法介绍
NEET_LH
樵夫老师Python零基础课程个人学习笔记python学习笔记
一、注释(一)作用1.对代码进行解释和说明避免自己忘了写的代码是做什么的——写给人看的,机器不运行不要去注释你代码做了什么,而要去注释我的代码为什么要这么做。用于记录思路、实现方法、代码功能注释很重要,大厂很重视,尤其日企2.调试代码报错的一篇代码,从下到上一句一句加#,依次运行,如果某行代码加了#后,程序运行成功,那么就是这行有问题,但这个方法不好。(二)注释方法1.单行注释==句子前加#快捷键
- 大模型工程师学习日记(十四):检索增强生成(RAG)
MMMMMMMay Love Code
学习langchain深度学习人工智能开发语言
如何递归分割文本递归分割(recursively),这个文本分割器是用于通用文本的推荐工具。它接受一个字符列表作为参数。它会按顺序尝试在这些字符上进行分割,直到块足够小。默认的字符列表是["\n\n","\n","",""]。这样做的效果是尽可能保持所有段落(然后是句子,再然后是单词)在一起,因为这些通常看起来是语义上相关的文本块。文本如何分割:根据字符列表。块大小如何衡量:根据字符数量。下面我们
- 多分类—微调DistilBERT对生物医学文本进行实验方法多分类:Automated Text Mining of Experimental Methodologies from Biomedical
小小帅AIGC
informationextraction人工智能自然语言处理语言模型多分类学术领域生物医学
AutomatedTextMiningofExperimentalMethodologiesfromBiomedicalLiterature从生物医学文献中自动挖掘实验方法文本paper:https://arxiv.org/abs/2404.13779github:本文做的就是微调DistilBERT去做多分类任务,训练自己的数据集,分类每个句子对应的实验方法。没有什么讲的。文章目录~1.背景动机
- 毕业论文AIGC高?5个方法有效降低AI率,消除AI痕迹!
我是宝库
AIGC人工智能经验分享论文抽检毕业论文AIGC检测学习方法
现在很多学校要求毕业论文基本都要检测AIGC了。AIGC是指人工智能生成的内容,现在无论是毕业论文还是期刊投稿,都会检测论文是否由AI生成的,比如知网、维普、万方、Turnitin、MasterAI率检测等。如果你的论文使用了AI工具辅助写作,自己提前进行AIGC检测,必要时降低AIGC率是很有必要的,那么,如何降低AIGC率呢?分享5种方法:1、改写句子结构。AI生成的句子通常比较长,句子结构僵
- 论文摘要生成器:用TextRank算法实现文献关键信息提取
Atlas Shepherd
python算法自然语言处理python信息可视化
我们基于python代码,使用PyQt5创建图形用户界面(GUI),同时支持中英文两种语言的文本论文文献关键信息提取。PyQt5:用于创建GUI应用程序。jieba:中文分词库,用于中文文本的处理。re:正则表达式模块,用于文本清理和句子分割。numpy:提供数值计算能力,如数组操作、矩阵运算等,主要用于TextRank算法的实现。importsysimportreimportjiebaimpor
- 句子改写器在线转换的原创性提升策略
hjehheje
算法人工智能python
在文本处理领域,"句子改写器在线转换"的原创性提升并非单纯依赖工具升级,而是需要融合算法优化、人工干预与策略设计的系统工程。以下从技术底层到应用层拆解核心方法,辅以实验数据验证其可行性:一、语义拓扑重构技术(SemanticTopologyReconstruction)原理突破传统同义词替换仅影响表层词汇(LexicalLevel),而STR技术通过依存句法分析,构建句子的语义网络拓扑图,对主谓宾
- DeepSeek源码解析(2)
白鹭凡
deepseekai
Tensor(张量)的介绍在计算机科学和机器学习领域,“张量”(Tensor)是一个数学概念,它被用来表示多维数组。在大模型(如深度学习模型)中,张量扮演着核心角色,具体来说:数据表示:张量用于表示输入数据、模型参数和中间计算结果。例如,在图像处理中,一张图片可以被表示为一个三维张量(高度、宽度、颜色通道数),而在自然语言处理中,一段文本可以被编码为一系列词向量组成的二维张量(句子长度、词向量维度
- ——当机器开始"思考",人类终于读懂了自己的大脑
人工智能机器学习
第一层突破:AI让我们看见"思维的源代码"想象一下,你正在教ChatGPT写诗——当它从"枯藤老树昏鸦"的堆砌,突然产出"月光在二进制河流里流淌"的句子时,这不仅是算法的胜利,更是一面照向人类思维的魔镜。科学家发现,AI学习语言的方式竟与婴儿惊人相似:✅模式捕捉:像人类从环境声音中提取词汇✅联想迭代:用已知概念嫁接新知识(比如用"电"理解"闪电网络")✅创造性错误:AI的"幻觉"对应人脑的直觉跳跃
- python基础题目练习19
码卡巴卡bug
python算法数据结构
说反话-加强版给定一句英语,要求你编写程序,将句中所有单词的顺序颠倒输出。输入格式:测试输入包含一个测试用例,在一行内给出总长度不超过500000的字符串。字符串由若干单词和若干空格组成,其中单词是由英文字母(大小写有区分)组成的字符串,单词之间用若干个空格分开。输出格式:每个测试用例的输出占一行,输出倒序后的句子,并且保证单词间只有1个空格。输入样例:HelloWorldHereICome输出样
- 关于自然语言处理(三)深度学习中的文字序列数据的分词操作
MatrixSparse
大模型人工智能自然语言处理深度学习人工智能
深度学习中的文字序列数据二维文字序列在文字数据中,样本与样本之间的联系是语义的联系,语义的联系即是词与词之间、字与字之间的联系,因此在文字序列中每个样本是一个单词或一个字(对英文来说大部分时候是一个单词,偶尔也可以是更小的语言单位,如字母或半词),故而在中文文字数据中,一张二维表往往是一个句子或一段话,而单个样本则表示单词或字。此时,不能够打乱顺序的维度是vocab_size,它代表了一个句子/一
- 【设计模式】——解释器模式(Interpreter Pattern)
J^T
设计模式C/C++解释器模式设计模式c++系统架构
目录引言一、解析器模式的基本概念核心思想解析器模式结构UML图应用场景二、解析器模式的优点与缺点优点缺点三、C++实现算术表达式解释器1.定义抽象表达式2.实现终结符表达式3.实现非终结符表达式4.构建和解释表达式四、总结引言在软件开发中,设计模式是解决常见软件设计问题的一种成熟方案。解释器模式(InterpreterPattern)是一种行为型设计模式,它提供了一种解释语言句子或表达式的方法。这
- Word2Vec向量化语句的计算原理
堕落年代
AIword2vec人工智能机器学习
一、Word2Vec的核心理念Word2Vec由Google团队于2013年提出,是一种通过无监督学习生成词向量的模型。其核心思想是“相似的词拥有相似的上下文”,通过上下文关系捕捉词汇的语义和语法特征。生成的向量具有低维(通常100-300维)、连续且稠密的特点,解决了传统One-Hot编码的高维稀疏和语义缺失问题。二、向量化的核心步骤(以Skip-Gram模型为例)示例句子假设句子为:“Theq
- 大语言模型中的 Token:它们是什么,如何工作?
运维小子
语言模型人工智能自然语言处理
引言如果你使用过ChatGPT这样的AI工具,你可能会好奇:它是如何理解并生成文字的?大语言模型(LLM,LargeLanguageModel)并不是直接处理整个句子或文章,而是拆分成一个个Token(标记)来进行计算。那么,什么是Token?它们在大语言模型中起到什么作用?这篇文章将用通俗易懂的语言帮你解开这些谜团。1.什么是Token?在大语言模型的世界里,Token(标记)是文本的最小单位,
- 详解DeepSeek模型底层原理及和ChatGPT区别点
瞬间动力
语言模型机器学习AI编程云计算阿里云
一、DeepSeek大模型原理架构基础DeepSeek基于Transformer架构,Transformer架构主要由编码器和解码器组成,在自然语言处理任务中,通常使用的是Transformer的解码器部分。它的核心是自注意力机制(Self-Attention),这个机制允许模型在处理输入序列时,关注序列中不同位置的信息。例如,在处理句子“Thecatchasedthemouse”时,自注意力机制
- 语义向量模型全解:从基础到现在的deepseek中的语义向量主流模型
来自于狂人
人工智能语言模型
一、语义向量模型:自然语言处理的基石语义向量模型(SemanticVectorModel)是自然语言处理(NLP)的核心技术,它将词汇、句子或文档映射为高维向量,在数学空间中量化语义信息。通过向量距离(如余弦相似度)衡量语义的相似性,支撑了搜索引擎、情感分析、机器翻译等实际应用。1.1发展简史1980s~2000s:基于统计的浅层模型,如TF-IDF(直接表征词的重要性)、LSA(通过矩阵分解降维
- BERT 和 Milvus 构建智能问答系统的全面技术解析,涵盖从原理到实践的完整流程
结合BERT和Milvus构建智能问答系统的全面技术解析,涵盖从原理到实践的完整流程。下面Python代码示例和优化策略:一、技术栈协作原理BERT的语义编码能力BERT作为预训练语言模型,通过双向Transformer结构将文本转换为高维向量(如768维),捕捉上下文语义信息。例如,句子"Milvus是向量数据库"会被编码为类似[0.2,-1.3,0.5,...]的向量19。Milvus的向量检
- Transformer架构深度研究报告(二、分层原理)
jiaojieran
transformer深度学习人工智能
一、Transformer不同层作用剖析1.1低层作用在Transformer架构中,低层(1-3层)主要承担着局部语法建模的关键任务,其对语言基础结构的理解和处理为后续高层语义分析奠定了坚实基础。在词性标注(POStagging)任务中,低层通过对相邻词之间关系的细致捕捉,能够精准判断每个词的词性。例如在句子“Thedogrunsfast”中,对于“runs”这个词,低层模型会关注其与相邻词“d
- 百度搜索语法
羊羊一洋
百度
百度搜索作为中国最大的搜索引擎,其搜索语法与谷歌搜索类似,但也有一些特有的功能。以下是一些基本的百度搜索语法:1.双引号(`""`):用来搜索精确的短语或句子。例如,搜索`"人工智能"`会找到包含完整短语"人工智能"的结果。2.减号(-):用来排除搜索结果中的特定词汇。例如,搜索`手机-iphone`会找到包含"手机"但不包含"iphone"的结果。3.加号(+):用来确保搜索结果中包含特定的词汇
- 系统调用read和write的疑问
唯瑞主义
疑问篇linux
问题背景:现在我有一个中文文档,里面是一些中文的句子,然后我有一个charbuffer[1]的缓冲区,我通过read中文文档,然后把数据写入到标准输出中,此时终端却正常打印,而不是显示乱码。代码展示:#include"unistd.h"#include#include"stdio.h"#include"stdlib.h"intmain(){//打开intfd=open("test.txt",O_R
- 用Meta的开源工具打造AI驱动的应用:LASER、Faiss与聊天加载器示例
dgay_hua
人工智能faisspython
MetaPlatforms(原Facebook)在AI技术领域持续创新,推出了多个优秀的开源工具,比如用于多语言句子嵌入的LASER、用于高效相似性搜索的Faiss,以及用于加载和处理Messenger和WhatsApp聊天记录的工具。这些工具可以帮助开发者快速构建AI驱动的应用。在本文中,我们将深入介绍这些工具的功能,并通过可运行的代码示例展示如何将它们应用到实际项目中。技术背景介绍LASER(
- 笔记:大模型Tokens是啥?为啥大模型按Tokens收费?
瞬间动力
硅基蒸馏easyui前端javascript人工智能tooneapi阿里云
一、Token的定义与示例1.核心概念Token是自然语言处理中的最小文本单位,代表模型处理文本时的一次计算单元。英文场景:1个token≈1个单词或标点符号。示例:句子"Hello,world!"拆分为["Hello",",","world","!"],共4个token。中文场景:1个token≈1个汉字或词语。示例:短语"深度求索"拆分为["深","度","求","索"],共4个token;若
- Empowering LLMs with Logical Reasoning: 从“语言大师”到“逻辑大师”的进化之路
步子哥
人工智能
“逻辑是智慧的骨架,而语言是智慧的血肉。让大语言模型(LLMs)既能说会道,又能逻辑严谨,是AI发展的下一座高峰。”开篇:语言模型的“逻辑盲区”近年来,大语言模型(LLMs)在自然语言处理(NLP)任务中取得了令人瞩目的成就。从生成流畅的文章到翻译复杂的句子,这些模型似乎无所不能。然而,当我们试图让它们回答逻辑推理问题时,却发现它们的表现常常令人失望。比如,某顶尖LLM在回答以下问题时出现了自相矛
- Maven
Array_06
eclipsejdkmaven
Maven
Maven是基于项目对象模型(POM), 信息来管理项目的构建,报告和文档的软件项目管理工具。
Maven 除了以程序构建能力为特色之外,还提供高级项目管理工具。由于 Maven 的缺省构建规则有较高的可重用性,所以常常用两三行 Maven 构建脚本就可以构建简单的项目。由于 Maven 的面向项目的方法,许多 Apache Jakarta 项目发文时使用 Maven,而且公司
- ibatis的queyrForList和queryForMap区别
bijian1013
javaibatis
一.说明
iBatis的返回值参数类型也有种:resultMap与resultClass,这两种类型的选择可以用两句话说明之:
1.当结果集列名和类的属性名完全相对应的时候,则可直接用resultClass直接指定查询结果类
- LeetCode[位运算] - #191 计算汉明权重
Cwind
java位运算LeetCodeAlgorithm题解
原题链接:#191 Number of 1 Bits
要求:
写一个函数,以一个无符号整数为参数,返回其汉明权重。例如,‘11’的二进制表示为'00000000000000000000000000001011', 故函数应当返回3。
汉明权重:指一个字符串中非零字符的个数;对于二进制串,即其中‘1’的个数。
难度:简单
分析:
将十进制参数转换为二进制,然后计算其中1的个数即可。
“
- 浅谈java类与对象
15700786134
java
java是一门面向对象的编程语言,类与对象是其最基本的概念。所谓对象,就是一个个具体的物体,一个人,一台电脑,都是对象。而类,就是对象的一种抽象,是多个对象具有的共性的一种集合,其中包含了属性与方法,就是属于该类的对象所具有的共性。当一个类创建了对象,这个对象就拥有了该类全部的属性,方法。相比于结构化的编程思路,面向对象更适用于人的思维
- linux下双网卡同一个IP
被触发
linux
转自:
http://q2482696735.blog.163.com/blog/static/250606077201569029441/
由于需要一台机器有两个网卡,开始时设置在同一个网段的IP,发现数据总是从一个网卡发出,而另一个网卡上没有数据流动。网上找了下,发现相同的问题不少:
一、
关于双网卡设置同一网段IP然后连接交换机的时候出现的奇怪现象。当时没有怎么思考、以为是生成树
- 安卓按主页键隐藏程序之后无法再次打开
肆无忌惮_
安卓
遇到一个奇怪的问题,当SplashActivity跳转到MainActivity之后,按主页键,再去打开程序,程序没法再打开(闪一下),结束任务再开也是这样,只能卸载了再重装。而且每次在Log里都打印了这句话"进入主程序"。后来发现是必须跳转之后再finish掉SplashActivity
本来代码:
// 销毁这个Activity
fin
- 通过cookie保存并读取用户登录信息实例
知了ing
JavaScripthtml
通过cookie的getCookies()方法可获取所有cookie对象的集合;通过getName()方法可以获取指定的名称的cookie;通过getValue()方法获取到cookie对象的值。另外,将一个cookie对象发送到客户端,使用response对象的addCookie()方法。
下面通过cookie保存并读取用户登录信息的例子加深一下理解。
(1)创建index.jsp文件。在改
- JAVA 对象池
矮蛋蛋
javaObjectPool
原文地址:
http://www.blogjava.net/baoyaer/articles/218460.html
Jakarta对象池
☆为什么使用对象池
恰当地使用对象池化技术,可以有效地减少对象生成和初始化时的消耗,提高系统的运行效率。Jakarta Commons Pool组件提供了一整套用于实现对象池化
- ArrayList根据条件+for循环批量删除的方法
alleni123
java
场景如下:
ArrayList<Obj> list
Obj-> createTime, sid.
现在要根据obj的createTime来进行定期清理。(释放内存)
-------------------------
首先想到的方法就是
for(Obj o:list){
if(o.createTime-currentT>xxx){
- 阿里巴巴“耕地宝”大战各种宝
百合不是茶
平台战略
“耕地保”平台是阿里巴巴和安徽农民共同推出的一个 “首个互联网定制私人农场”,“耕地宝”由阿里巴巴投入一亿 ,主要是用来进行农业方面,将农民手中的散地集中起来 不仅加大农民集体在土地上面的话语权,还增加了土地的流通与 利用率,提高了土地的产量,有利于大规模的产业化的高科技农业的 发展,阿里在农业上的探索将会引起新一轮的产业调整,但是集体化之后农民的个体的话语权 将更少,国家应出台相应的法律法规保护
- Spring注入有继承关系的类(1)
bijian1013
javaspring
一个类一个类的注入
1.AClass类
package com.bijian.spring.test2;
public class AClass {
String a;
String b;
public String getA() {
return a;
}
public void setA(Strin
- 30岁转型期你能否成为成功人士
bijian1013
成功
很多人由于年轻时走了弯路,到了30岁一事无成,这样的例子大有人在。但同样也有一些人,整个职业生涯都发展得很优秀,到了30岁已经成为职场的精英阶层。由于做猎头的原因,我们接触很多30岁左右的经理人,发现他们在职业发展道路上往往有很多致命的问题。在30岁之前,他们的职业生涯表现很优秀,但从30岁到40岁这一段,很多人
- [Velocity三]基于Servlet+Velocity的web应用
bit1129
velocity
什么是VelocityViewServlet
使用org.apache.velocity.tools.view.VelocityViewServlet可以将Velocity集成到基于Servlet的web应用中,以Servlet+Velocity的方式实现web应用
Servlet + Velocity的一般步骤
1.自定义Servlet,实现VelocityViewServl
- 【Kafka十二】关于Kafka是一个Commit Log Service
bit1129
service
Kafka is a distributed, partitioned, replicated commit log service.这里的commit log如何理解?
A message is considered "committed" when all in sync replicas for that partition have applied i
- NGINX + LUA实现复杂的控制
ronin47
lua nginx 控制
安装lua_nginx_module 模块
lua_nginx_module 可以一步步的安装,也可以直接用淘宝的OpenResty
Centos和debian的安装就简单了。。
这里说下freebsd的安装:
fetch http://www.lua.org/ftp/lua-5.1.4.tar.gz
tar zxvf lua-5.1.4.tar.gz
cd lua-5.1.4
ma
- java-14.输入一个已经按升序排序过的数组和一个数字, 在数组中查找两个数,使得它们的和正好是输入的那个数字
bylijinnan
java
public class TwoElementEqualSum {
/**
* 第 14 题:
题目:输入一个已经按升序排序过的数组和一个数字,
在数组中查找两个数,使得它们的和正好是输入的那个数字。
要求时间复杂度是 O(n) 。如果有多对数字的和等于输入的数字,输出任意一对即可。
例如输入数组 1 、 2 、 4 、 7 、 11 、 15 和数字 15 。由于
- Netty源码学习-HttpChunkAggregator-HttpRequestEncoder-HttpResponseDecoder
bylijinnan
javanetty
今天看Netty如何实现一个Http Server
org.jboss.netty.example.http.file.HttpStaticFileServerPipelineFactory:
pipeline.addLast("decoder", new HttpRequestDecoder());
pipeline.addLast(&quo
- java敏感词过虑-基于多叉树原理
cngolon
违禁词过虑替换违禁词敏感词过虑多叉树
基于多叉树的敏感词、关键词过滤的工具包,用于java中的敏感词过滤
1、工具包自带敏感词词库,第一次调用时读入词库,故第一次调用时间可能较长,在类加载后普通pc机上html过滤5000字在80毫秒左右,纯文本35毫秒左右。
2、如需自定义词库,将jar包考入WEB-INF工程的lib目录,在WEB-INF/classes目录下建一个
utf-8的words.dict文本文件,
- 多线程知识
cuishikuan
多线程
T1,T2,T3三个线程工作顺序,按照T1,T2,T3依次进行
public class T1 implements Runnable{
@Override
 
- spring整合activemq
dalan_123
java spring jms
整合spring和activemq需要搞清楚如下的东东1、ConnectionFactory分: a、spring管理连接到activemq服务器的管理ConnectionFactory也即是所谓产生到jms服务器的链接 b、真正产生到JMS服务器链接的ConnectionFactory还得
- MySQL时间字段究竟使用INT还是DateTime?
dcj3sjt126com
mysql
环境:Windows XPPHP Version 5.2.9MySQL Server 5.1
第一步、创建一个表date_test(非定长、int时间)
CREATE TABLE `test`.`date_test` (`id` INT NOT NULL AUTO_INCREMENT ,`start_time` INT NOT NULL ,`some_content`
- Parcel: unable to marshal value
dcj3sjt126com
marshal
在两个activity直接传递List<xxInfo>时,出现Parcel: unable to marshal value异常。 在MainActivity页面(MainActivity页面向NextActivity页面传递一个List<xxInfo>): Intent intent = new Intent(this, Next
- linux进程的查看上(ps)
eksliang
linux pslinux ps -llinux ps aux
ps:将某个时间点的进程运行情况选取下来
转载请出自出处:http://eksliang.iteye.com/admin/blogs/2119469
http://eksliang.iteye.com
ps 这个命令的man page 不是很好查阅,因为很多不同的Unix都使用这儿ps来查阅进程的状态,为了要符合不同版本的需求,所以这个
- 为什么第三方应用能早于System的app启动
gqdy365
System
Android应用的启动顺序网上有一大堆资料可以查阅了,这里就不细述了,这里不阐述ROM启动还有bootloader,软件启动的大致流程应该是启动kernel -> 运行servicemanager 把一些native的服务用命令启动起来(包括wifi, power, rild, surfaceflinger, mediaserver等等)-> 启动Dalivk中的第一个进程Zygot
- App Framework发送JSONP请求(3)
hw1287789687
jsonp跨域请求发送jsonpajax请求越狱请求
App Framework 中如何发送JSONP请求呢?
使用jsonp,详情请参考:http://json-p.org/
如何发送Ajax请求呢?
(1)登录
/***
* 会员登录
* @param username
* @param password
*/
var user_login=function(username,password){
// aler
- 发福利,整理了一份关于“资源汇总”的汇总
justjavac
资源
觉得有用的话,可以去github关注:https://github.com/justjavac/awesome-awesomeness-zh_CN 通用
free-programming-books-zh_CN 免费的计算机编程类中文书籍
精彩博客集合 hacke2/hacke2.github.io#2
ResumeSample 程序员简历
- 用 Java 技术创建 RESTful Web 服务
macroli
java编程WebREST
转载:http://www.ibm.com/developerworks/cn/web/wa-jaxrs/
JAX-RS (JSR-311) 【 Java API for RESTful Web Services 】是一种 Java™ API,可使 Java Restful 服务的开发变得迅速而轻松。这个 API 提供了一种基于注释的模型来描述分布式资源。注释被用来提供资源的位
- CentOS6.5-x86_64位下oracle11g的安装详细步骤及注意事项
超声波
oraclelinux
前言:
这两天项目要上线了,由我负责往服务器部署整个项目,因此首先要往服务器安装oracle,服务器本身是CentOS6.5的64位系统,安装的数据库版本是11g,在整个的安装过程中碰到很多的坑,不过最后还是通过各种途径解决并成功装上了。转别写篇博客来记录完整的安装过程以及在整个过程中的注意事项。希望对以后那些刚刚接触的菜鸟们能起到一定的帮助作用。
安装过程中可能遇到的问题(注
- HttpClient 4.3 设置keeplive 和 timeout 的方法
supben
httpclient
ConnectionKeepAliveStrategy kaStrategy = new DefaultConnectionKeepAliveStrategy() {
@Override
public long getKeepAliveDuration(HttpResponse response, HttpContext context) {
long keepAlive
- Spring 4.2新特性-@Import注解的升级
wiselyman
spring 4
3.1 @Import
@Import注解在4.2之前只支持导入配置类
在4.2,@Import注解支持导入普通的java类,并将其声明成一个bean
3.2 示例
演示java类
package com.wisely.spring4_2.imp;
public class DemoService {
public void doSomethin