Walter_Jia

【python 编程】文本分类KNN算法实现及结果输出

文本分类流程：

1、特征选取：

网页爬取-》网页预处理获取汉字-》中文分词及词性标注-》保留名词-》词频统计-》输出词-文档矩阵-》计算词的信息增益值-》选取增益大的前N个词作为特征词-》计算每个词在文档中的权重-》生成文档-词矩阵-》对词的权重进行归一化处理-》即每个训练文档特征词及权重选取完毕。

2、匹配流程

获取新的网页重复上面步骤到分词，得到分词后统计此文档所对应的特征词的词频-》采用KNN等机器学习算法对要分类的文档与现有训练样本中的每个样本进行夹角余弦计算-》夹角余弦最大值为其所最接近的分类，分类成功。

KNN算法实现文本分类，程序及输出结果如下：

1、程序

# -*- coding: cp936 -*-
import urllib2
import re
import sys
import os
import math

#os.system(cmd)os.system('ls')

#class MyClass:
# key_word

doc_no = 1
def start_fun():
reload(sys)
sys.setdefaultencoding('utf-8')
print sys.getdefaultencoding()

def testfun():
str_test = "http://hao123.com\" class is >china"
searchstr= re.findall(r'http://(.*?)\"',str_test)
print searchstr[0]
def split_word(webpage_chinese_file,webpage_chinese_word_file):
#调用命令行对中文文档进行分词处理
os.system('cd splitword && ictclas_demo_c.exe ../'+ webpage_chinese_file + ' ../'+webpage_chinese_word_file )
def doc_word_count_deal(webpage_chinese_word_file,webpage_all_word_count_docno):
global doc_no
word_dicts = dict()

#1、读取中文分词内容到缓存中
word_file = open(webpage_chinese_word_file,"r")
word_buf = word_file.read()
word_file.close()

#2、将分词以空格分隔并按/过滤提取分词中文内容和词性，不是名词或者长度小于2的不进行记录
word_sets = word_buf.split(' ')
for i in word_sets:
#print i
if i == "" :
continue
j = i.index('/')
#print 'j='+str(j)
k = i[j+1:j+2]
i = i[0:j]


#print i
#word_dicts[i]如果不存在KEY则会报KeyError错误
if len(i) <= 2 or (k != None and k != 'n'):
#print 'k='+k
continue
if word_dicts.get(i) == None :
word_dicts[i] = 1
else:
word_dicts[i] = word_dicts[i] + 1
#sorted(word_dicts.viewvalues())
#list ->word_dicts = [ v for v in sorted(word_dicts.values())]

#3、将过滤后的中文分词按照出现次数进行排序，将排序好的数据存储到相应的文件中
word_count = open(webpage_all_word_count_docno,'w')
word_dicts_list = sorted([(v, k) for k, v in word_dicts.items()], reverse=True)
for i in word_dicts_list:
print i[1],i[0]
word_count.write(str(doc_no)+" "+i[1]+" "+str(i[0])+"\n")
word_count.close()
doc_no = doc_no + 1

"""
for i in word_dicts.viewkeys():
print i,word_dicts[i]
"""
def get_webpage_china(url_addr,webpage_src_file,webpage_chinese_file):
#reload( sys )
#sys.setdefaultencoding('utf-8')
print sys.getdefaultencoding()
#1、获取URL地址网页内容，默认为ascii,GB2312编码
url = url_addr
content = urllib2.urlopen(url).read()

#2、打开文件将网页内容写入文件
file = open(webpage_src_file,'w')
file.write(content)
file.close

#str=f.read()
#fp.write(str.encode("utf-8"))

#3、正则匹配获取网页中alert中所对应的内容
"""
pattern1 = re.findall(r'alert$\"(.*)\"$',content)
for i in pattern1:
print i
print 'hello world!\n'

sub1 = re.sub(r'alert$\"(.*)\"$','Hello World!',content)
"""

#chinaeseStr = re.match(ur".*[\u4e00-\u9fa5]+",content)
#a="

百度知道

"
#(?<=>)[^a-zA-Z0-9_]+(?=<) 正则 ?<=只匹配最前面不进入分组，?=匹配最后不进入分组
#4、获取网页中文内容
chinaeseStr= re.findall(ur"[\u4e00-\u9fa5]+",content.decode('GB2312'))
#5、将中文内容写入文件
file_chinese = open(webpage_chinese_file,'w')
for i in chinaeseStr:
#print i
file_chinese.write(i.encode('GB2312'))
file_chinese.close()
def KNN(c1,c2):
list1 = []
list2 = []
list3 = []
dict1 = dict()
ig_dict = dict()
features_dict = dict()
weigh_dict = dict()
weigh_doc_matrix_dict = dict()

class_count = 2
doc_count = 3

c1_file = open(c1,"r")
#c1_word_sets = c1_file.read()
for line in c1_file:
list1.append(line.split(" "))

c2_file = open(c2,"r")
for line in c2_file:
list1.append(line.split(" "))

#1、计算word-doc—count矩阵
"""
分辨率 [2, 2, 0] 2 2
用户名 [1, 1, 0] 1 1
鼠标 [0, 1] 0 1
密码技术 [1, 1, 0] 1 1
"""
for i in list1:
#print i[0],i[1],i[2]
if dict1.get(i[1]) == None:
list2 = list()
list2 = [0]
if i[2] == None:
list2.insert((int)(i[0]) - 1,0)
else:
list2.insert((int)(i[0]) - 1,(int)(i[2]))
dict1[i[1]] = list2
else:
if i[2] == None:
dict1[i[1]].insert((int)(i[0]) - 1,0)
else:
dict1[i[1]].insert((int)(i[0]) - 1,(int)(i[2]))


#2、计算每个Word的信息增益IG并保存到dit中
print "0、rd-doc—count矩阵"
for dict_cont in dict1.viewkeys():
print dict_cont,dict1[dict_cont][0],dict1[dict_cont][1]

t= class_count
entropy = class_count * 1/class_count * (math.log(1,10) - math.log(t,10));
wcount = 0 # // 出现word的文档的文档数量

category_doc_count = doc_count/class_count #每个类别中的文档数量
wcount_class = [0 for i in range(class_count)] #// 每个类别中出现单词word的文档数

pw = 0.0# // 出现word的文档占全部文档的比重
pcw = [0 for i in range(class_count)]# // 在单词word出现时各个类别中文档数占总文档数的比重
pcw_b = [0 for i in range(class_count)]#// 在单词word不出现时各个类别中文档数占总文档数的比重
#listabc = [0 for i in range(100)] or [0] * 100

for i in range(0,class_count):
for j in range(0,category_doc_count):
if dict1[dict_cont][j + i * category_doc_count] > 0 :
wcount_class[i] += 1
wcount += wcount_class[i]

print wcount, wcount_class

pw = 1.0 * wcount / doc_count;
for i in range(0,class_count):
pcw[i] = 1.0 * wcount_class[i] / wcount;
pcw_b[i] = 1.0 * (category_doc_count - wcount_class[i])/ (doc_count - wcount);

d1 = 0.0;
d2 = 0.0;

for i in range(0,class_count):
#print pcw[i],pcw_b[i]
if pcw[i] == 0:
t1 = 0
else:
t1 = math.log(pcw[i],10)
d1 += pcw[i] * t1;
if pcw_b[i] == 0:
t2 = 0
else:
t2 = math.log(pcw_b[i],10)
d2 += pcw_b[i] * t2;

ig = entropy + pw * d1 + (1.0 - pw) * d2;
ig_dict[dict_cont] = ig


#3、打印信息增益信息
print "1、word IG"
for dict_cont in ig_dict.viewkeys():
print dict_cont,ig_dict[dict_cont]

print "1、sort word IG"
word_dicts_list = sorted([(v, k) for k, v in ig_dict.items()], reverse=True)
j = 1
for i in word_dicts_list:
print i[1],i[0]
if j == 6 :
continue
features_dict[i[1]] = i[0]
j += 1
print "2、feature values"
for i in features_dict.viewkeys():
print i,features_dict[i]




#4、计算权重及归一化
for dict_cont in dict1.viewkeys():
#print dict_cont,dict1[dict_cont][0],dict1[dict_cont][1]
if features_dict.get(dict_cont) == None:
continue
tf = 0 #特征项在本文档中出现的频率
Ni = 0 #出现特征项的文档数目
N = doc_count #

for i in range(doc_count - 1):
if dict1[dict_cont][i] > 0 :
Ni += 1

for i in range(doc_count - 1):
tf = dict1[dict_cont][i]
weight = -1.0 * tf * (math.log(1.0,10) + math.log(Ni,10) - math.log(N,10))
#print "********"+str(i)+"*****"+str(tf)+"***"+str(weight)
if weigh_dict.get(dict_cont) == None:
weight_list = [0.0]*doc_count
weigh_dict[dict_cont] = weight_list
weigh_dict[dict_cont][i] = weight
else:
weigh_dict[dict_cont][i] = weight
print "3、weight values"

for j in range(doc_count-1):
for i in weigh_dict.viewkeys():
print i,weigh_dict[i][0],weigh_dict[i][1]
if weigh_doc_matrix_dict.get(j) == None:
weith_doc_list = dict()
weigh_doc_matrix_dict[j] = weith_doc_list
weigh_doc_matrix_dict[j][i] = weigh_dict[i][j]
else:
weigh_doc_matrix_dict[j][i] = weigh_dict[i][j]

print "4、归一化doc-word martix"
weight_sum = [0.0]*doc_count
for i in weigh_doc_matrix_dict.viewkeys():
for j in weigh_doc_matrix_dict[i].viewkeys():
weight_sum[i] += weigh_doc_matrix_dict[i][j]

test_doc_matrix_dict = dict()
ttstr = ""
ttstr1 = ""
for i in weigh_doc_matrix_dict.viewkeys():
ttstr = ""
ttstr1 = ""
print "doc num " + str(i)
for j in weigh_doc_matrix_dict[i].viewkeys():
weigh_doc_matrix_dict[i][j] /= weight_sum[i]
ttstr += " " + str(weigh_doc_matrix_dict[i][j])
ttstr1 += " " + j
test_doc_matrix_dict[j] = 1
print ttstr1
print ttstr

#5、获取新样本的特征词出现次数统计与现有2个文档进行KNN算法计算，计算夹角余弦大的说明越接近
res = 0.0
mul = 0.0
p1 = 0.0
p2 = 0.0
max_res = 0.0


print "5、KNN分类算法对如下样本进行分类"
for i in weigh_doc_matrix_dict.viewkeys():
for j in weigh_doc_matrix_dict[i].viewkeys():
one = weigh_doc_matrix_dict[i][j]
two = test_doc_matrix_dict[j]
print j,two
mul += one * two
p1 += math.pow(one,2)
p2 += math.pow(two,2)
res = math.fabs(mul) / math.sqrt(p1 * p2)
if res > max_res:
max_res = res
class_no = i

print "样本" + str(i) + "计算结果=" + str(res)

print "最终分类编号为：" + str(class_no)



"""
69 // 计算两个向量的夹角的余弦。如果此值的绝对值越大，说明夹角越小，越相似，距离越近。
70 public double cos(Vector v1, Vector v2, int len) {
71 double res = 0.0;
72 double mul = 0.0;
73 double p1 = 0.0, p2 = 0.0;
74 for (int i = 0; i < len; i++) {
75 double one = v1.get(i);
76 double two = v2.get(i);
77 mul += one * two;
78 p1 += Math.pow(one, 2);
79 p2 += Math.pow(two, 2);
80 }
81 res = Math.abs(mul) / Math.sqrt(p1 * p2);
82 return res;

"""
def main():
url_addr = 'http://192.168.1.170:8000/jsoa/CheckUser.jspx'
webpage_src_file = 'webpage_src_file.txt'
webpage_chinese_file = 'webpage_chinese_file.txt'
webpage_chinese_word_file = 'webpage_chinese_word_file.txt'
webpage_all_word_count_docno = 'webpage_all_word_count_docno.txt'
webpage_all_word_count_docno1 = 'webpage_all_word_count_docno1.txt'
webpage_all_word_count_docno2 = 'webpage_all_word_count_docno2.txt'

get_webpage_china(url_addr,webpage_src_file,webpage_chinese_file)
split_word(webpage_chinese_file,webpage_chinese_word_file)
doc_word_count_deal(webpage_chinese_word_file,webpage_all_word_count_docno)
KNN(webpage_all_word_count_docno1,webpage_all_word_count_docno2)

main()

2、输出结果

ascii
系统 5
账号 2
密码 2
分辨率 2
用户名 1
用户 1
软件 1
苹果 1
密码技术 1
宽度 1
火狐 1
0、rd-doc—count矩阵
分辨率 2 2
2 [1, 1]
用户名 1 1
2 [1, 1]
鼠标 0 1
1 [0, 1]
密码技术 1 1
2 [1, 1]
密码 2 2
2 [1, 1]
账号 2 2
2 [1, 1]
电脑 0 1
1 [0, 1]
火狐 1 1
2 [1, 1]
系统 5 3
2 [1, 1]
苹果 1 1
2 [1, 1]
软件 1 1
2 [1, 1]
用户 1 1
2 [1, 1]
宽度 1 1
2 [1, 1]
键盘 0 1
1 [0, 1]
1、word IG
分辨率 -0.50171665944
用户 -0.50171665944
鼠标 -0.401373327552
密码技术 -0.50171665944
系统 -0.50171665944
账号 -0.50171665944
电脑 -0.401373327552
软件 -0.50171665944
密码 -0.50171665944
苹果 -0.50171665944
火狐 -0.50171665944
用户名 -0.50171665944
宽度 -0.50171665944
键盘 -0.401373327552
1、sort word IG
鼠标 -0.401373327552
键盘 -0.401373327552
电脑 -0.401373327552
账号 -0.50171665944
用户名 -0.50171665944
用户 -0.50171665944
系统 -0.50171665944
软件 -0.50171665944
苹果 -0.50171665944
密码技术 -0.50171665944
密码 -0.50171665944
宽度 -0.50171665944
火狐 -0.50171665944
分辨率 -0.50171665944
2、feature values
电脑 -0.401373327552
账号 -0.50171665944
鼠标 -0.401373327552
用户名 -0.50171665944
键盘 -0.401373327552
3、weight values
鼠标 0.0 0.47712125472
电脑 0.0 0.47712125472
账号 0.352182518111 0.352182518111
用户名 0.176091259056 0.176091259056
键盘 0.0 0.47712125472
鼠标 0.0 0.47712125472
电脑 0.0 0.47712125472
账号 0.352182518111 0.352182518111
用户名 0.176091259056 0.176091259056
键盘 0.0 0.47712125472
4、归一化doc-word martix
doc num 0
电脑账号鼠标用户名键盘
0.0 0.666666666667 0.0 0.333333333333 0.0
doc num 1
电脑账号鼠标用户名键盘
0.24347423677 0.179718193127 0.24347423677 0.0898590965636 0.24347423677
5、KNN分类算法对如下样本进行分类
电脑 1
账号 1
鼠标 1
用户名 1
键盘 1
样本0计算结果=0.6
电脑 1
账号 1
鼠标 1
用户名 1
键盘 1
样本1计算结果=0.718992940348
最终分类编号为：1

cesium 文字避让花归去 cesium javascript 前端 vue.js
token记得换成您自己的！！！申请cesium的token官网【Cesium:ThePlatformfor3DGeospatial】>import*asCesiumfrom'cesium';import{onMounted,reactive,ref,computed,nextTick}from'vue';//地图实例letviewer:any;constshowText=()=>{viewer.
Qt窗口控件之消息对话框QMessageBox laimaxgg qt c++qt6.3 qt5 前端
消息对话框QMessageBoxQMessageBox是继承于QDialog类，用于表示Qt中的一个消息对话框。消息对话框是应用程序中最常用的界面元素，主要用于为用户提示重要信息，强制用户进行选择操作。1.QMessageBox方法方法说明setWindowTitle(QString)设置消息对话框标题文本。setText(QString)设置消息对话框内容文本。setStandardButton
MCP协议 zhurui_xiaozhuzaizai 入口集锦人工智能自然语言处理
1什么是MCP？MCP（ModelContextProtocol，模型上下文协议）是由Anthropic推出的一种开放标准，旨在统一大型语言模型（LLM）与外部数据源和工具之间的通信协议。MCP的主要目的在于解决当前AI模型因数据孤岛限制而无法充分发挥潜力的难题，MCP使得AI应用能够安全地访问和操作本地及远程数据，为AI应用提供了连接万物的接口。1.1MCP与functioncallMCP是在O
react-native 实现AES RSA MD5加密花程序媛
importReact,{Component}from'react';import{Platform,StyleSheet,Text,View,Image,Dimensions,ScrollView,TouchableOpacity,Modal,TouchableHighlight,NativeModules,ToastAndroid,Alert,FlatList,}from'react-nati
移动端网页布局注意事项及解决 1.winphone系统a、input标签被点击时产生的半透明灰色背景怎么去掉 Ailsa-show
移动端网页布局注意事项及解决1.winphone系统a、input标签被点击时产生的半透明灰色背景怎么去掉1、关闭iOS键盘首字母自动大写2、禁止文本缩放html{-webkit-text-size-adjust:100%;}3、移动端如何清除输入框内阴影在iOS上，输入框默认有内部阴影，但无法使用box-shadow来清除，如果不需要阴影，可以这样关闭：input,textarea{border

React 中 Context 的作用是什么，在什么场景下使用它？前端大白话大白话前端八股 react.js 前端 javascript
大白话React中Context的作用是什么，在什么场景下使用它？React中Context的作用在React里，组件之间常常需要共享数据。通常情况下，数据是通过props从父组件传递到子组件。不过，要是组件嵌套层次很深，就需要在每一层组件都传递props，这样会让代码变得复杂且难以维护。Context能帮我们解决这个问题。它可以创建一个数据“容器”，让处于不同层级的组件都能直接访问其中的数据，而
PySimpleGUI模块用法的示例(从入门到进阶) 赵阿萌 java 前端服务器 linux javascript
入门版下面是几个全面展示PySimpleGUI模块用法的示例，并附有详细的代码注释，帮助你更好地掌握该模块的使用。示例1：简单的输入输出界面这是一个基础的GUI示例，展示了如何使用文本输入框、按钮和文本输出框。登录后复制importPySimpleGUIassg#定义布局layout=[[sg.Text("请输入您的名字：")],#标签组件[sg.InputText(key="-NAME-")],
基于cesium的二三维地图程序员小美博客毕业设计源码分享 java 开源 vue
一、项目简介基于cesium的二三维地图二、实现功能支持虚线和阴影支持以标注的方式显示属性支持要素查询支持二三维度地球显示支持小数据量文件矢量动态切片三、技术选型Cesiumproj4jsturftext-encodinggeojson-topojsonshpjs四、界面展示五、源码地址回复：地图
解析稳定率达99.99%！合合信息“大模型加速器2.0”助力AI打破“幻觉” 算法大数据人工智能图表表格
随着大模型在社会应用中逐渐普及，人们在享受便利的同时，也面临着“AI幻觉”产生的风险。训练数据是影响大模型“认知能力”的关键要素，近期，上海合合信息科技股份有限公司（简称“合合信息”）TextIn“大模型加速器2.0”版本正式上线，基于领先的智能文档处理技术，对复杂文档的版式、布局和元素进行精准解析及结构化处理，从数据源头降低大模型“幻觉”风险，让大模型在与人类的沟通中“更靠谱”。“大模型加速器2
高级前端面试题-React 圣诞小子 javascript 面试
react概念类组件和函数组件,什么时候用类组件获取组件实例类组件如何实现逻辑复用？高阶组件、renderprops选择hooks的优点状态逻辑复用；状态逻辑集中，易于理解；类组件不利于优化，比如不能很好的压缩为什么要用hooks,解决了什么问题同上react的context的使用场景共享对一个组件树全局的信息，不需要一层层传参受控组件和非受控组件非受控组件：数据只保存在内部state中；受控组件
Python Textract库：文本提取程序员喵哥 python 开发语言
更多Python学习内容：ipengtao.comTextract是一个强大的Python库，用于从各种文件格式中提取文本。无论是PDF、Word文档、Excel电子表格、HTML页面还是图像，Textract都能有效地提取其中的文本内容。Textract通过集成多种开源工具和库，实现了对多种文件格式的支持，使得文本提取变得简单而高效。本文将详细介绍Textract库的安装、主要功能、基本操作、高
为下面的程序添加数据保存功能，以便下次打开时，显示原有数据 2301_79698214 前端 javascript html
为下面的程序添加数据保存功能，以便下次打开时，显示原有数据。tr{height:60px;}td,th{width:150px;text-align:center;border:1pxsolidred;}functionaddNode(){vartab=document.getElementById("tab");vartr=document.createElement("tr");vartd=d
模型上下文协议 (MCP)是什么？Model Context Protocol 需要你了解一下同学小张学习 AIGC AI-native agi gpt 开源协议
大家好，我是同学小张，+v:jasper_8017一起交流，持续学习AI大模型应用实战案例，持续分享，欢迎大家点赞+关注，订阅我的大模型专栏，共同学习和进步。在人工智能领域，ModelContextProtocol（MCP）正逐渐成为连接AI模型与各类数据源及工具的重要标准。MCP究竟为何物？它又将如何改变AI应用的开发与使用？文章目录0.概念1.MCP的总体架构2.为何使用MCP？3.我的理解4
MCP服务器：AI智能体的新时代连接标准真挺乐人工智能
在AI技术的不断发展中，MCP（ModelContextProtocol，模型上下文协议）正成为AI智能体与外部系统交互的新标准。MCP的目标是提供一个统一的方法，让AI智能体能够安全、高效地访问各种数据源、API接口和系统工具，从而扩展其能力，提升智能化水平。本文将深入探讨MCP服务器的架构、优势及其在现实世界中的应用。什么是MCP服务器？MCP服务器是MCP架构中的关键组件，它们充当AI智能体
17.1Go语言操作MongoDB chxii go语言 #go 基础 golang mongodb 开发语言
驱动安装gogetgo.mongodb.org/mongo-driver/mongo基础连接示例packagemainimport("context""fmt""log""time""go.mongodb.org/mongo-driver/mongo""go.mongodb.org/mongo-driver/mongo/options")funcmain(){//设置客户端选项clientOpti
8、Python 字符串处理与正则表达式实战指南 wolf犭良 python python 正则表达式
Python字符串处理与正则表达式实战指南文章概述本文深入探讨Python字符串处理核心方法与正则表达式实战技巧，涵盖字符串编码转换、分割替换、正则表达式语法精髓，并通过日志解析、数据清洗等真实场景案例展示高阶应用。最后提供10道阶梯式练习题（附完整答案代码），助你从基础到进阶全面掌握文本处理技能。一、字符串处理核心三剑客1.1编码转换（encode/decode）text="中文文本"utf8_
12.1-12.7学习周报谢m鑫天天揍我学习
提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录摘要Abstract一、k-近邻法二、持续学习总结摘要本周主要学习了k邻近算法的原理和应用场景，了解了持续学习的有关概念和原理。AbstractThisweek,wemainlylearnedtheprinciplesandapplicationscenariosofk-proximityalgorithm,andlearne
浏览器 DOM 深度解析：从节点类型到遍历操作的全攻略码农的时光故事 javascript 开发语言 ecmascript
一、DOM核心概念与节点类型DOM（文档对象模型）是浏览器提供的核心API之一，用于将HTML文档转换为可操作的对象树结构。其核心设计遵循树形结构，每个节点都继承自Node接口，主要分为以下类型：1.基础节点类型Element：对应HTML标签，包含属性和子节点（）Text：文本内容节点Comment：注释节点Document：文档根节点，通过document全局对象访问（）2.特殊节点类型Doc
深度解析 React useRef Hook 的使用 Jason Ma丶丶前端工程师 React javascript react.js javascript 前端
useRef返回一个可变的ref对象，其.current属性被初始化为传入的参数（initialValue）。返回的ref对象在组件的整个生命周期内持续存在。命令式地获取及操作DOM：functionTextInputWithFocusButton(){ //通过useRef创建并获取Dom元素 constinputEl=useRef(null); constonButtonClick=()=
HTML 教程：从零开始掌握常用语法 LoveYa! 前端 html 前端笔记学习
免费无广纯净版微信小程序测mbti很有趣，不需要任何授权，也不需要登录，直接就是测，几分钟了解自己的人格mbti，快来试试吧。可以微信直接搜索小程序名“一秒MBTI”HTML教程：从零开始掌握常用语法欢迎来到HTML的世界！HTML（HyperTextMarkupLanguage，超文本标记语言）是网页开发的基石，它负责定义网页的结构和内容。无论你是想成为一名前端开发者，还是仅仅想了解网页背后的魔
六十天前端强化训练之第二十一天大师级详解 React Context API：从原理到实战编程星辰海 #前端前端 react.js javascript React Context API
=====欢迎来到编程星辰海的博客讲解======看完可以给一个免费的三连吗，谢谢大佬！目录一、庖丁解牛：深入理解ContextAPI1.1设计哲学与运转机制工作原理三步曲：1.2核心三剑客详解1.3性能优化要诀二、手把手实现主题切换系统2.1完整代码实现（逐行注释版）2.2配套CSS样式设计三、关键知识点拆解3.1状态初始化策略3.2CSS变量注入原理3.3性能优化实践3.4可访问性最佳实践四、
css实现标题跑马灯效果爱吃羊的狗 css 前端
css实现标题跑马灯效果滚动字幕@keyframesmarquee{0%{transform:translateX(300%);}100%{transform:translateX(-300%);}}.topBar{width:100%;height:45px;line-height:45px;background:#FFE6CC;text-align:center;font-weight:500
QT中日志的使用案例 || 自动创建、管理、保存QT日志数据长安第一美人 qt 开发语言 c++嵌入式硬件
目录1.quiwidget.cpp2.widget.cpp3.widget.h4.在需要记录日志的地方直接将信息插入即可1.释放`m_fileLog`和`m_textStream`1.1为什么要关闭和删除`m_fileLog`和`m_textStream`？1.2如果不这样做会有什么坏处？3.总结4.参考文章需求分析：想实现在qt代码中对软件运行过程中容易出现的问题进行记录，将电量异常分析日志与平
152.HarmonyOS NEXT系列教程之3D立方体旋转轮播案例讲解之Banner模块实现 harmonyos-next
温馨提示：本篇博客的详细代码已发布到git:https://gitcode.com/nutpi/HarmonyosNext可以下载运行哦！HarmonyOSNEXT系列教程之3D立方体旋转轮播案例讲解之Banner模块实现效果演示1.Banner模块结构1.1基础布局@BuilderbannerModule(){Column(){Text($r('app.string.cube_animation
推测未来Agentic形态：Dynamic Cognitive Contextual Agent with Reinforcement Learning (DCCA-RL) weixin_40941102 语言模型
在AIAgent设计模式领域，我们见证了从简单的ReAct到复杂的LATS的演进，这些模式通过反思、工具使用、规划和多代理协作，极大地提升了AI的自主性和智能性。然而，随着任务复杂度和动态性需求的增加，现有模式逐渐显现出局限性——多Agent协作带来的联合误差和单Agent设计的适应性不足。为此，我们基于对现有模式的全面分析，提出了一个更先进的单Agent框架：DynamicCognitiveCo
ApplicationContext介绍 lgily-1225 日常积累 java 后端 spring
一、概述ApplicationContext是Spring框架中的一个核心接口，它扩展了BeanFactory接口，并提供了更全面的功能。ApplicationContext不仅包含了BeanFactory的所有功能，还添加了国际化支持、资源访问、事件传播、以及更高级的容器特性，如自动装配和生命周期管理等。它是Spring应用中的核心容器，负责管理和配置应用中的对象（称为beans）。二、主要功能
详解Springboot的启动流程凭君语未可面试 spring boot 后端 java
在Redis中实现分布式锁1.主入口与SpringApplication.run()2.准备阶段3.创建应用上下文（ApplicationContext）4.Bean定义加载与上下文刷新5.EmbeddedWebServer的启动（针对Web应用）6.ApplicationRunner和CommandLineRunner执行7.应用启动完成总结1.主入口与SpringApplication.run
常用的pdf技术有哪些？--笔记我不是彭于晏灬 pdf 笔记
常用的pdf技术有哪些？1.iTextPDF：iText是著名的开放项目，是用于生成PDF文档的一个java类库。通过iText不仅可以生成PDF或rtf的文档，而且可以将XML、Html文件转化为PDF文件。Openoffice：openoffice是开源软件且能在windows和linux平台下运行，可以灵活的将word或者Excel转化为PDF文档。JasperReport：是一个强大、灵活
文本转语音的Python库（pyttsx3）数产第一混子 python库 python
一、pyttsx3的概述pyttsx3isatext-to-speechconversionlibraryinPython.pyttsx3是Python中的文本到语音转换库。二、pyttsx3的安装pipinstallpyttsx3三、小试牛刀importpyttsx3engine=pyttsx3.init()engine.say("Iwillspeakthistextrightnow")engi
oracle当前耗时sql语句,查看Oracle最耗时的SQL weixin_39846553 oracle当前耗时sql语句
有很多种方法可以用来找出哪些sql语句需要优化，但是很久以来，最简单的方法都是分析保存在V$sql视图中的缓存的sql信息。通过V$sql视图，可以确定具有高消耗时间、CUP和IO读取的sql语句。1.查看总消耗时间最多的前10条sql语句select*from(selectv.sql_id,v.child_number,v.sql_text,last_load_time,v.PARSING_US
[黑洞与暗粒子]没有光的世界 comsci
无论是相对论还是其它现代物理学,都显然有个缺陷,那就是必须有光才能够计算但是,我相信,在我们的世界和宇宙平面中,肯定存在没有光的世界.... 那么,在没有光的世界,光子和其它粒子的规律无法被应用和考察,那么以光速为核心的 &nbs
jQuery Lazy Load 图片延迟加载 aijuans jquery
基于 jQuery 的图片延迟加载插件，在用户滚动页面到图片之后才进行加载。对于有较多的图片的网页，使用图片延迟加载，能有效的提高页面加载速度。版本： jQuery v1.4.4+ jQuery Lazy Load v1.7.2 注意事项：需要真正实现图片延迟加载，必须将真实图片地址写在 data-original 属性中。若 src
使用Jodd的优点 Kai_Ge jodd
1. 简化和统一 controller ，抛弃 extends SimpleFormController ，统一使用 implements Controller 的方式。 2. 简化 JSP 页面的 bind, 不需要一个字段一个字段的绑定。 3. 对 bean 没有任何要求，可以使用任意的 bean 做为 formBean。使用方法简介
jpa Query转hibernate Query 120153216 Hibernate
public List<Map> getMapList(String hql, Map map) { org.hibernate.Query jpaQuery = entityManager.createQuery(hql); if (null != map) { for (String parameter : map.keySet()) { jp
Django_Python3添加MySQL/MariaDB支持 2002wmj mariaDB
现状首先，[email protected] 中默认的引擎为 django.db.backends.mysql 。但是在Python3中如果这样写的话，会发现 django.db.backends.mysql 依赖 MySQLdb[5] ，而 MySQLdb 又不兼容 Python3 于是要找一种新的方式来继续使用MySQL。 MySQL官方的方案首先据MySQL文档[3]说，自从MySQL
在SQLSERVER中查找消耗IO最多的SQL 357029540 SQL Server
返回做IO数目最多的50条语句以及它们的执行计划。 select top 50 (total_logical_reads/execution_count) as avg_logical_reads, (total_logical_writes/execution_count) as avg_logical_writes, (tot
spring UnChecked 异常官方定义！ 7454103 spring
如果你接触过spring的事物管理！那么你必须明白 spring的非捕获异常！即 unchecked 异常！因为 spring 默认这类异常事物自动回滚！！ public static boolean isCheckedException(Throwable ex) { return !(ex instanceof RuntimeExcep
mongoDB 入门指南、示例 adminjun java mongodb 操作
一、准备工作 1、下载mongoDB 下载地址：http://www.mongodb.org/downloads 选择合适你的版本相关文档：http://www.mongodb.org/display/DOCS/Tutorial 2、安装mongoDB A、不解压模式：将下载下来的mongoDB-xxx.zip打开，找到bin目录，运行mongod.exe就可以启动服务，默
CUDA 5 Release Candidate Now Available aijuans CUDA
The CUDA 5 Release Candidate is now available at http://developer.nvidia.com/<wbr></wbr>cuda/cuda-pre-production. Now applicable to a broader set of algorithms, CUDA 5 has advanced fe
Essential Studio for WinRT网格控件测评 Axiba JavaScript html5
Essential Studio for WinRT界面控件包含了商业平板应用程序开发中所需的所有控件，如市场上运行速度最快的grid 和chart、地图、RDL报表查看器、丰富的文本查看器及图表等等。同时，该控件还包含了一组独特的库，用于从WinRT应用程序中生成Excel、Word以及PDF格式的文件。此文将对其另外一个强大的控件——网格控件进行专门的测评详述。网格控件功能 1、
java 获取windows系统安装的证书或证书链 bewithme windows
有时需要获取windows系统安装的证书或证书链，比如说你要通过证书来创建java的密钥库。有关证书链的解释可以查看此处。 public static void main(String[] args) { SunMSCAPI providerMSCAPI = new SunMSCAPI(); S
NoSQL数据库之Redis数据库管理(set类型和zset类型) bijian1013 redis 数据库 NoSQL
4.sets类型 Set是集合，它是string类型的无序集合。set是通过hash table实现的，添加、删除和查找的复杂度都是O(1)。对集合我们可以取并集、交集、差集。通过这些操作我们可以实现sns中的好友推荐和blog的tag功能。 sadd：向名称为key的set中添加元
异常捕获何时用Exception，何时用Throwable bingyingao
用Exception的情况 try { //可能发生空指针、数组溢出等异常 } catch (Exception e) {
【Kafka四】Kakfa伪分布式安装 bit1129 kafka
在http://bit1129.iteye.com/blog/2174791一文中，实现了单Kafka服务器的安装，在Kafka中，每个Kafka服务器称为一个broker。本文简单介绍下，在单机环境下Kafka的伪分布式安装和测试验证 1. 安装步骤 Kafka伪分布式安装的思路跟Zookeeper的伪分布式安装思路完全一样，不过比Zookeeper稍微简单些(不
Project Euler bookjovi haskell
Project Euler是个数学问题求解网站，网站设计的很有意思，有很多problem，在未提交正确答案前不能查看problem的overview，也不能查看关于problem的discussion thread，只能看到现在problem已经被多少人解决了，人数越多往往代表问题越容易。看看problem 1吧： Add all the natural num
Java-Collections Framework学习与总结-ArrayDeque BrokenDreams Collections
表、栈和队列是三种基本的数据结构，前面总结的ArrayList和LinkedList可以作为任意一种数据结构来使用，当然由于实现方式的不同，操作的效率也会不同。这篇要看一下java.util.ArrayDeque。从命名上看
读《研磨设计模式》-代码笔记-装饰模式-Decorator bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.io.BufferedOutputStream; import java.io.DataOutputStream; import java.io.FileOutputStream; import java.io.Fi
Maven学习(一) chenyu19891124 Maven私服
学习一门技术和工具总得花费一段时间，5月底6月初自己学习了一些工具，maven+Hudson+nexus的搭建，对于maven以前只是听说，顺便再自己的电脑上搭建了一个maven环境，但是完全不了解maven这一强大的构建工具，还有ant也是一个构建工具，但ant就没有maven那么的简单方便，其实简单点说maven是一个运用命令行就能完成构建，测试，打包，发布一系列功
[原创]JWFD工作流引擎设计----节点匹配搜索算法(用于初步解决条件异步汇聚问题) 补充 comsci 算法工作 PHP 搜索引擎嵌入式
本文主要介绍在JWFD工作流引擎设计中遇到的一个实际问题的解决方案，请参考我的博文"带条件选择的并行汇聚路由问题"中图例A2描述的情况(http://comsci.iteye.com/blog/339756),我现在把我对图例A2的一个解决方案公布出来，请大家多指点节点匹配搜索算法(用于解决标准对称流程图条件汇聚点运行控制参数的算法) 需要解决的问题：已知分支
Linux中用shell获取昨天、明天或多天前的日期 daizj linux shell 上几年昨天获取上几个月
在Linux中可以通过date命令获取昨天、明天、上个月、下个月、上一年和下一年 # 获取昨天 date -d 'yesterday' # 或 date -d 'last day' # 获取明天 date -d 'tomorrow' # 或 date -d 'next day' # 获取上个月 date -d 'last month' #
我所理解的云计算 dongwei_6688 云计算
在刚开始接触到一个概念时，人们往往都会去探寻这个概念的含义，以达到对其有一个感性的认知，在Wikipedia上关于“云计算”是这么定义的，它说： Cloud computing is a phrase used to describe a variety of computing co
YII CMenu配置 dcj3sjt126com yii
Adding id and class names to CMenu We use the id and htmlOptions to accomplish this. Watch. //in your view $this->widget('zii.widgets.CMenu', array( 'id'=>'myMenu', 'items'=>$this-&g
设计模式之静态代理与动态代理 come_for_dream 设计模式
静态代理与动态代理代理模式是java开发中用到的相对比较多的设计模式，其中的思想就是主业务和相关业务分离。所谓的代理设计就是指由一个代理主题来操作真实主题，真实主题执行具体的业务操作，而代理主题负责其他相关业务的处理。比如我们在进行删除操作的时候需要检验一下用户是否登陆，我们可以删除看成主业务，而把检验用户是否登陆看成其相关业务
【转】理解Javascript 系列 gcc2ge JavaScript
理解Javascript_13_执行模型详解摘要: 在《理解Javascript_12_执行模型浅析》一文中,我们初步的了解了执行上下文与作用域的概念，那么这一篇将深入分析执行上下文的构建过程，了解执行上下文、函数对象、作用域三者之间的关系。函数执行环境简单的代码:当调用say方法时，第一步是创建其执行环境，在创建执行环境的过程中，会按照定义的先后顺序完成一系列操作:1.首先会创建一个
Subsets II hcx2013 set
Given a collection of integers that might contain duplicates, nums, return all possible subsets. Note: Elements in a subset must be in non-descending order. The solution set must not conta
Spring4.1新特性——Spring缓存框架增强 jinnianshilongnian spring4
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
shell嵌套expect执行命令 liyonghui160com
一直都想把expect的操作写到bash脚本里,这样就不用我再写两个脚本来执行了,搞了一下午终于有点小成就,给大家看看吧. 系统:centos 5.x 1.先安装expect yum -y install expect 2.脚本内容: cat auto_svn.sh #!/bin/bash
Linux实用命令整理 pda158 linux
0. 基本命令　　linux 基本命令整理　　1. 压缩解压　　tar -zcvf a.tar.gz a #把a压缩成a.tar.gz 　　tar -zxvf a.tar.gz #把a.tar.gz解压成a 　　2. vim小结　　2.1 vim替换　　:m,ns/word_1/word_2/gc
独立开发人员通向成功的29个小贴士 shoothao 独立开发
概述：本文收集了关于独立开发人员通向成功需要注意的一些东西,对于具体的每个贴士的注解有兴趣的朋友可以查看下面标注的原文地址。明白你从事独立开发的原因和目的。保持坚持制定计划的好习惯。万事开头难，第一份订单是关键。培养多元化业务技能。提供卓越的服务和品质。谨小慎微。营销是必备技能。学会组织，有条理的工作才是最有效率的。 “独立
JAVA中堆栈和内存分配原理 uule java
1、栈、堆 1.寄存器：最快的存储区, 由编译器根据需求进行分配,我们在程序中无法控制.2. 栈：存放基本类型的变量数据和对象的引用，但对象本身不存放在栈中，而是存放在堆（new 出来的对象）或者常量池中（字符串常量对象存放在常量池中。）3. 堆：存放所有new出来的对象。4. 静态域：存放静态成员（static定义的）5. 常量池：存放字符串常量和基本类型常量（public static f

【python 编程】文本分类KNN算法实现及结果输出

你可能感兴趣的:(Algorithm,Instruction,Text,Classfy)