拓端研究室

拓端tecdat：Python主题建模LDA模型、t-SNE 降维聚类、词云可视化文本挖掘新闻组数据集

原文链接：http://tecdat.cn/?p=24376

原文出处：拓端数据部落公众号

在这篇文章中，我们讨论了基于gensim 包来可视化主题模型 (LDA) 的输出和结果的技术。

介绍

我们遵循结构化的工作流程，基于潜在狄利克雷分配 (LDA) 算法构建了一个主题模型。

在这篇文章中，我们将使用主题模型，探索多种策略以使用matplotlib 绘图有效地可视化结果。

我将使用 20 个新闻组数据集的一部分，因为重点更多地放在可视化结果的方法上。

让我们从导入包和 20 News Groups 数据集开始。


import matplotlib.pyplot as plt

# NLTK停止词
fom nlt.copus imort stowods
sop_wrds = stowords.wrds('chinse')

导入新闻组数据集

让我们导入新闻组数据集并仅保留 4 个类别。

# 导入数据集

d = f.oc[dftargt_name.in([so.relion.chritan], 'ec.sot.okey', 'ak.piticmdast' 'rec.oorcyces']) , :]
prin(f.hpe) #> (2361, 3)
df.(

标记句子并清理

删除电子邮件、换行符、单引号，最后使用 gensim 将句子拆分为单词列表 simple_preprocess()。设置 deacc=True 选项会删除标点符号。


def snds(seecs):
    for setees in sntces:
        sent = r.sub('\S*@\S*\s?', '', sent) # 删除电子邮件
        snt = re.sb('\s+', '', sent) # 移除换行字符
        set = re.sb("\'", "", sent) # 删除单引号
        set = geim.uls.smplprerss(str(sent), deacc=True) 

# 转换为列表
data = df.cnt.lus.tolist()

构建双字母组、三字母组模型和推理

让我们使用模型形成双字母组、三字母组。为了提高执行速度，这个模型被传递给Phraser()。

接下来，将每个词词形还原为其词根形式，仅保留名词、形容词、动词和副词。

我们只保留这些POS标签，因为它们对句子的含义贡献最大。在这里，我使用spacy进行词法处理。


# 建立大词和三词模型
bigrm = endl.Pres(dta_ords, mncnt=5, thrshl=100) # 更高的阈值会减少短语。
tigam = genm.del.Prses(bga[dtawors], thrhld=100)  
bigm_od = gsim.molpss.Pasr(bgrm)
tigrmod = genm.mos.pres.hrser(tigam)

 # 在终端运行一次

    ""删除止损词，形成大词、三词和词组""
    texts = [[wor fo wrd in sipeeproe(tr(dc)) 
     [iram_od[oc] for doc in txts]
    tets = [rirammod[igrmmod[dc]] for dc in tets]
    tetout = []
    np = scy.oad('en', dial=['解析器', 'ner'])
    for set in txs:
        dc = np(" ".join(sn)) 
        tex_.ppd([tknlea_ fr toen in oc if toenpo_ in aowed_ots])
    # 在词法化之后，再一次删除停止词


atady = roe_os(daa_ds) # 处理过的文本数据!

构建主题模型

要使用构建 LDA 主题模型，您需要语料库和字典。让我们先创建它们，然后构建模型。训练好的主题（关键字和权重）也输出在下面。

如果你检查一下主题关键词，它们共同代表了我们最初选择的主题。教会、冰球、地区和摩托车。很好!


# 创建字典
id2od = copoDciary(dta_eay)

# 创建语料库。术语文档频率
crpus = [i2wod.o2bow(ext) for txt in daa_ey]

# 建立LDA模型
Lal(copus=copus,
                                           id2wrd=id2wrd,
                                           nu_tpic=4, 
                                           radom_ate=100,
                                           updaeeery=1,
                                           chnsie=10,
                                           pas=10。
                                           alha='symmetric',
                                           iteatos=100,
                                           prdics=True)

(ldampcs())

什么是主导主题及其在每个文档中的百分比贡献

在 LDA 模型中，每个文档由多个主题组成。但是，通常只有一个主题占主导地位。下面的代码提取每个句子的主要主题，并在格式良好的输出中显示主题和关键字的权重。

这样，您将知道哪个文档主要属于哪个主题。

    # 启动输出
    se_tpcf = p.Dataame()

    # 获取每个文档中的主要话题
    for i, ro_isin enate(ldmoel[crps]):
        rw = rw_s0] if lamoel.pe_wortopis else rowlis            
        row = soed(ow, ky=laba x: (x[1]), evre=True)
        # 获取每个文档的主导主题、perc贡献和关键词
        for j, (toicum, pr_pic) in enate(row):
            if j == 0: # => 主导话题
                wp = ldel.shotoic(topic_num)
 

    # 在输出的最后添加原始文本


deeos = fratcs(lodel=damoe, copus=crpus, tets=dary)

# 格式化
topic = os.retidex()

每个话题最有代表性的一句话

有时您想获得最能代表给定主题的句子样本。此代码为每个主题获取最典型的句子。


# 显示设置，在列中显示更多的字符

for i, grp in serpd:
    senlet = pd.cnct([senlet, 
                                             gp.srtes(['Peion'], asng=Fase).hed(1)] 
                                            ais=0)

# 重置索引    
seet.resex(drp=True, inlce=True)

# 格式化
senllet.couns = ['Toum', "TopCorib", "Kywrds", "rsa xt"]

# 显示
sencoet.head(10)

文档中字数的频率分布

在处理大量文档时，您想知道文档的整体大小和主题大小。让我们绘制文档字数分布。



# 绘图
plt.fiue(fe=(6,7), dpi=60)


plt.xtcs(nplic(0,00,9))

import sebon as sns
fig.titat()
fig.sbts_juo0.90)
plt.xticks(np.lisa(0,00,9))
plt.sow()

每个话题的前N个关键词词云

虽然你已经看到了每个主题中的主题关键词是什么，但字数大小与权重成正比的词云是很好的可视化方法。


# 1. 每个主题中前N个词的词云
from matplotlib import pyplot as plt
from worcloud mport WrCloud,STOPWODS



clod = WordClud(stopwds=stp_ords,
                  barounolr='white',
                 
                  reer_oronal=1.0)


plt.sow()

主题关键词的字数

当涉及主题中的关键字时，关键字的重要性（权重）很重要。除此之外，这些单词在文档中出现的频率也很有趣。

让我们在同一图表中绘制字数和每个关键字的权重。

您要关注出现在多个主题中的词以及相对频率大于权重的词。通常，这些词变得不那么重要。我在下面绘制的图表是在开始时将几个这样的词添加到停用词列表并重新运行训练过程的结果。


tops = l_mdl.swtcs(foatd=Fase)
    

# 绘制主题关键词的字数和权重图
fig, as = pltuls(2, 2, fiiz=（16,10）, sey=rue, di=160)
fig.tigh_lyut_pad=2)    
plt.shw()

按主题着色的句子图表

文档中的每个单词都代表 4 个主题之一。让我们根据给定文档中的每个单词所属的主题 id 为其着色。


# 对N个句子进行着色的句子


      for i, ax in eumate(xes):
            cour = corp[i-1] 。
            topprcs, wrdits, wrdihius = lda[copr]
            wodoac = [(lmod2word[wd], tpic[0]) or w, tpc in odid_opcs]    
            
            # 绘制矩形区域
            tpcred = soted(tpps, key= x: (x[1]), rvese=True)

            word_pos = 0.06
           

    plt.subdt(wsace=0, hsace=0)
  
    plt.show()

文件中讨论最多的话题是什么？

让我们计算归因于每个主题的文档总数。


# 对N个句子进行着色
    主导话题 = []
    话题百分比 = []
    for i, crp in euete(opu_el):
        topcs, wordics, wrlues = moel[crp]
        dopic = soted(torcs, key = lmda x: x[1], reerse=Tue)[0][0] 。

doics, toages = topent(mol=lda, copus=crus,en=-)            

# 每个文档中主导话题的分布

dfc = dh_dc.t_frme(ame='cunt').eeinex()

# 按实际权重计算的总主题分布
topweig = pd.DaaFae([dct(t) for t in toges] )


# 每个主题的前三个关键词
 [(i, tpic) for i, tocs in lda.shcs(fted=Flse) 
                                 for j, (tic, wt) in eae(toic)if j < 3)

让我们做两个图：

通过将文档分配给该文档中权重最大的主题来计算每个主题的文档数。
通过总结每个主题对各自文档的实际权重贡献来计算每个主题的文档数量。


from mtpltli.tiker import ucFattr

# 绘图
fig, (ax1, ax2) = pl.supot(1, 2)

# 按主要议题分布的议题
ax1.bar(data=df_dc)


# 按主题权重的主题分布
ax2.ar(x='iex', hegh='cout', dat=dfoc, with=.5, 

plt.sow()

t-SNE（t分布-随机邻近嵌入）聚类图

让我们使用 t-SNE（t分布-随机邻近嵌入）算法在 2D 空间中可视化文档集群。


# 获取话题权重和主导话题 ------------

# 获取主题权重
for i, row_list:
    tophts.apd([w for i, w in rost[0]] )

# 主题权重的数组    
arr = pd.Dame(tohts).fna(0).vales

# 保持良好的分离点（可选）
rr = ar[p.aax(rr) > 0.35] 。

# 每个文档中的主要议题编号
to_n = np.agax(rr, ais=1)

# tSNE降维
tsel = TSE(n=2, vre=1, rae=0, ae=.99, int='pca')
tlda = tsl.frm(arr)

# 使用Bokeh绘制主题集群图
oueook()
n_tics = 4
m
plot.scatter(xda[:,])

pyLDAVis

最后，pyLDAVis 是最常用的，也是一种将主题模型中包含的信息可视化的好方法。


pyLDvis.enaok()

结论

我们从头开始导入、清理和处理新闻组数据集构建 LDA 模型。然后我们看到了多种可视化主题模型输出的方法，包括词云，它们直观地告诉您每个主题中哪个主题占主导地位。t-SNE 聚类， pyLDAVis 提供了更多关于主题聚类的细节。

最受欢迎的见解

1.探析大数据期刊文章研究热点

2.618网购数据盘点-剁手族在关注什么

3.r语言文本挖掘tf-idf主题建模，情感分析n-gram建模研究

4.python主题建模可视化lda和t-sne交互式可视化

5.疫情下的新闻数据观察

6.python主题lda建模和t-sne可视化

7.r语言中对文本数据进行主题模型topic-modeling分析

8.主题模型：数据聆听人民网留言板的那些“网事”

9.python爬虫进行web抓取lda主题语义数据分析

你可能感兴趣的:(拓端tecdat,拓端数据tecdat,tecdat,r语言,LDA,t-SNE,词云,文本挖掘)

机器学习笔记 - 监督学习备忘清单坐望云起深度学习从入门到精通监督学习线性模型支持向量机生成学习集成方法
一、监督学习简介给定一组数据点关联到一组结果，我们想要构建一个分类器，学习如何从预测。1、预测类型下表总结了不同类型的预测模型：2、模型类型下表总结了不同的模型：
能源行业非结构化数据管理创新案例研究 CaritoB 非结构化数据管理非结构化数据管理
在能源行业，非结构化数据的管理正逐渐成为提升企业竞争力和运营效率的关键。从油气勘探的日志、图像到电力行业的监控视频、设备运行记录，这些非结构化数据蕴含着巨大的价值。然而，传统的数据管理方法难以应对非结构化数据的复杂性和规模。能源行业非结构化数据管理的挑战（一）数据存储与分布能源行业的非结构化数据通常分布在不同的地理位置和系统中。例如，油气田的勘探数据可能存储在野外设备中，而电力变电站的监控视频可能
非结构化数据管理中的标签体系构建方法 CaritoB 非结构化数据管理非结构化数据管理
在数字化转型的浪潮中，非结构化数据如文档、图片、音频、视频等，因其格式多样、内容丰富，成为企业数据资产的重要组成部分。然而，这些数据的管理也面临着诸多挑战，尤其是如何有效地组织和检索这些数据。一、标签体系的重要性标签体系是非结构化数据管理的核心，它通过为数据添加标签，实现数据的分类、检索和分析。一个有效的标签体系可以帮助企业快速定位所需数据，提高数据的利用效率，同时也有助于数据的安全管理和合规性控
非结构化数据中台AI大模型对接解决方案 CaritoB 非结构化数据管理人工智能机器学习大数据
引言企业数字化升级持续推进，数据要素和相应数据法律法规逐步完善，企业数据合规监管力度加大。大模型等前沿AI技术快速发展，企业利用AI推动生产力发展时也面临着数据安全和合规的挑战。例如AI智能问答应用场景中，企业敏感信息可能被无权限用户获取。此背景下，企业数据安全管理、应用、流通至关重要。非结构化数据中台为企业提供了一个安全整合、管理、分析和应用非结构化数据的解决方案，它能够快速整合、处理和分析大量
非结构化数据的“汇、存、管、用”之道探究 CaritoB 数据库大数据人工智能
摘要随着信息技术的飞速发展，非结构化数据作为数字时代的重要资产，其管理与利用成为企业与社会关注的焦点。本文系统探究了非结构化数据的“汇、存、管、用”之道，为数据的有效治理与价值挖掘提供了新视角。在汇集方面，我们深入剖析了非结构化数据的多元来源与高效采集技术，强调了数据源多样性与采集效率的重要性。存储策略方面，探讨了存储介质与格式选择对数据管理的影响，并引入了数据压缩与去重技术以优化存储效能。管理挑
企业知识图谱构建: 整合结构化与非结构化数据 CaritoB 非结构化数据管理知识图谱
随着企业数据的爆炸性增长，如何有效地整合、分析和利用这些数据成为了重要课题。企业知识图谱作为一种先进的知识管理工具，通过将不同来源的结构化和非结构化数据统一在一个语义化的框架中，能够为企业提供全局性视角，提升决策效率和创新能力。本文将探讨如何在企业中构建知识图谱，并有效整合结构化与非结构化数据，为企业提供智能化的数据支持。1.企业知识图谱的基本概念知识图谱是一种语义网络，它通过节点和边的形式，将实
如何使用Java爬虫处理API接口返回的JSON数据？小爬虫程序猿 API java json 开发语言
处理API接口返回的JSON数据是Java爬虫开发中的一个常见任务。在Java中，有多个库可以帮助我们解析JSON数据，其中最流行的是Jackson和Gson。以下是使用这两个库处理JSON数据的基本步骤和示例代码。使用Jackson处理JSONJackson是一个功能强大的JSON处理库，它不仅可以将JSON字符串解析为Java对象，还可以将Java对象转换为JSON字符串。添加Jackson依
NCU使用指南及模型性能测试（pytorch2.5.1） Jakari cuda gpu ncu python docker 深度学习 pytorch
本项目在原项目的基础上增加了NsightCompute(ncu)测试的功能，并对相关脚本功能做了一些健硕性的增强，同时，对一些框架的代码进行了更改（主要是数据集的大小和epoch等），增加模型性能测试的效率，同时完善了模型LSTM的有关功能。OverviewNsightCompute(NCU)是NVIDIA提供的GPU内核级性能分析工具，专注于CUDA程序的优化。它提供详细的计算资源、内存带宽、指
深度学习数据集封装-----目标检测篇科研小天才深度学习目标检测人工智能
前言在上篇文章中，我们深入探讨了图像分类数据集的制作流程。图像分类作为计算机视觉领域的一个基础任务，通常被认为是最为简单直接的子任务之一。然而，当我们转向目标检测任务时，复杂度便显著提升，尤其是在标注框的处理环节。不同的模型架构往往对标注框的处理方式有着各自独特的要求。以YOLO系列为例，它自有一套成熟且高效的方法来应对这一挑战。鉴于篇幅有限，本文暂不深入展开YOLO的相关内容，感兴趣的读者可以查
微信小程序实现nfc功能（读取，写入） _lucky_boy 新手小白微信小程序 nfc标签卡前端微信小程序小程序
标签读取功能可以放到onLoad中，也可以是一个点击事件//获取NFC实例constnfc=wx.getNFCAdapter()//绑定监听NFC标签nfc.onDiscovered(res=>{//监听到数据进行返回根据返回的数据在进行处理console.log(9999,res)})//开始监听不能缺少nfc.startDiscovery({success(res){console.log(5
Python 中字符串的操作倾听醉梦语 python 学习学习方法
字符串（string）是Python中的基础数据类型之一，表示一系列有序的字符集合。它是不可变的，也就是说，一旦创建，字符串的内容就不能被修改。以下是字符串的关键知识点及相关操作总结：1.字符串的定义字符串通过单引号''或双引号""定义。my_str="myloveandmylife"2.通过下标索引访问字符串可以通过下标访问字符串中的某个字符。正索引从0开始，负索引从-1开始表示从末尾向前访问。
玩转顺序表：用 C 语言实现数据的插入与删除赔罪数据结构 c语言开发语言
目录顺序表的定义插入元素删除元素查找元素主函数打印顺序表完整代码总结在这篇博客中，我们将探讨如何使用C语言实现一个简单的顺序表（也称为动态数组），并实现一些基本操作，包括插入、删除和查找元素。顺序表是一种线性数据结构，具有固定的大小，适合存储相同类型的元素。顺序表的定义首先，我们定义顺序表的结构。顺序表由一个数组和一个表示当前长度的变量组成。#defineMaxSize50//定义顺序表的最大容量
Kotlin Flow常用用法 tangweiguo03051987 Kotlin语法 kotlin 前端开发语言
KotlinFlow是Kotlin编程语言中的一个强大特性，用于处理异步数据流。它是Kotlin协程库的一部分，旨在以声明式和响应式的方式处理异步数据流。Flow的设计与协程无缝集成，使得异步编程更加简单和直观。suspendfunmain(){//创建Flow的几种方法valflow=flow{emit(1)emit(2)emit(3)emit(4)emit(5)}.collect{printl
DeepSeek 提示词技巧深度解析：从原理到实践悠悠空谷1615 经验分享深度学习语言模型
深度掌握AI交互：DeepSeek提示词技巧全解析突破认知：重新理解AI对话的本质在与DeepSeek等大语言模型交互时，我们需要建立全新的对话范式。不同于人类对话的模糊性与容错性，AI对话遵循"输入决定输出"的确定性原则。统计数据显示，经过专业提示词训练的用户，其获取有效答案的成功率可提升300%以上。要实现这种质的飞跃，需要掌握以下核心认知：1.信息解码机制：AI通过token化处理理解文本，
迷你世界脚本云服数据存储接口：CloudSever 星空露珠笔记 lua 游戏数据结构
云服数据存储接口：CloudSever迷你世界更新时间:2024-04-2819:09:10具体函数名及描述如下：序号函数名函数描述1setOrderDataBykey(...)设置排行榜中指定键的数值2removeOrderDataByKey(...)删除排行榜中指定键的数值3getOrderDataByKeyEx(...)获取排行榜中指定键的数值4getOrderDataIndexValueE
Redis--单线程模型 04Koi. Redis redis 数据库缓存
目录一、引言二、Redis单线程模型三、原因四、为什么redis是单线程模型，但他的速度这么快？五、总结一、引言本篇文章就Redis为什么是单线程模型做简单介绍。二、Redis单线程模型redis只使用一个线程，处理所有的命令请求，但是不是说redis服务器内部真的就只有一个线程，其实也有多个线程，这些线程在处理网络IO。假设同时有两个客户端向redis服务器发送了命令请求，但是redis还是会将
C++对象序列化库推荐：轻松实现数据持久化到文本文件 C语言小火车 C语言编程入门 c++java 开发语言
在C++开发中，将对象持久化保存到文本文件是常见需求。本文精选了4个高效、易用的序列化库，涵盖不同场景下的文本序列化方案，助你快速实现数据存储与传输。一、Cereal（推荐指数：⭐⭐⭐⭐⭐）核心特性多格式支持：原生支持JSON、XML和二进制格式，其中JSON/XML可直接保存为可读文本文件非侵入式设计：通过添加serialize模板函数实现序列化，无需修改现有类定义轻量级：纯头文件库，无需编译即
费曼学习法12 - 告别 Excel！用 Python Pandas 开启数据分析高效之路 (Pandas 入门篇) 修昔底德 Python费曼学习法学习 excel python 人工智能 pandas
第一篇：告别Excel！用PythonPandas开启数据分析高效之路(Pandas入门篇)开篇提问：想象一下，你是一位数据侦探，手头有一堆案件线索（数据）。你的目标是从这些线索中找出真相，发现数据背后的秘密。如果你的工具箱里只有一把普通的放大镜（Excel），处理少量简单的数据还行，但面对海量复杂的数据，是不是感觉有点力不从心，效率低下？是时候升级你的装备了！PythonPandas就是你数据分
华为服务器虚拟化巡检报告,pc服务器巡检报告保贝说保华为服务器虚拟化巡检报告
pc服务器巡检报告内容精选换一换JMeter测试报告提供实时、离线两种类型的测试报告，供用户随时查看和分析测试数据。JMeter测试报告说明如表1所示。本测试报告展现了测试过程中被测系统在模拟高并发用户的响应性能，为了更好的帮助您阅读测试报告，我们提供以下信息供您参考：统计维度：本报告的RPS，响应时间、并发等统计维度均为单个线程组，如线程组中有请求多个报文，只有在多个云桌面支持多种终端登录方式(
mysql-bin.index_mysqlbin.index是什么文件张太学 mysql-bin.index
匿名用户1级2016-06-01回答今天发现/usr/local/mysql/var下很多mysql-bin.000001、mysql-bin.000002文件，GOOGLE之。。这是数据库的操作日志，例如UPDATE一个表，或者DELETE一些数据，即使该语句没有匹配的数据，这个命令也会存储到日志文件中，还包括每个语句执行的时间，也会记录进去的。这样做主要有以下两个目的：1：数据恢复如果你的数据
公共课计算机总复习核心知识点(1) 荣华富贵8 程序员的知识储备1 经验分享
信息的符号化就是数据，所以数据是信息的具体表示形式，信息是数据抽象出来的逻辑意义。信息技术是指人们获取、存储、传递、处理、开发和利用信息资源的相关技术。文化的核心是:观念和价值。计算机文化是人类文化发展的四个里程碑之一（前三个分别为：语言的产生、文字的使用与印刷术的发明）。计算机的特点1）运算速度快2）存储容量大3）通用性强4）工作自动化5）精确性高字长是计算机一次所能处理的实际位数长度，字长是衡
Python入门实例造夢先森编程语言 python 实例 tuple 集合 set
相关基础Python数据类型：#-*-encoding:utf-8-*-#列表（list）:可修改s1=['a','s','d']s1[2]='z'prints1[2]#元组（tuple）:不可修改.tuple也是一种lists2=(1,2,3)prints2[2]#集合(set)a=set('asdfghdd')b=set('zxdfvb')printa&bprinta|bprinta-bpri
TCP三次握手四次挥手详解与相关面试题重生之我在成电转码网络网络协议 tcp/ip
一、TCP三次握手（Three-WayHandshake）目的：建立可靠的全双工通信通道，确保客户端与服务端都能正常发送和接收数据。1.1三次握手过程第一次握手（SYN）：客户端向服务端发送一个SYN（SynchronizeSequenceNumber，同步序列号）报文，请求建立连接。标志位：SYN=1，序列号Seq=x。此时，客户端进入SYN-SENT状态。第二次握手（SYN+ACK）：服务端收
【LeetCode 热题 100】160. 相交链表 | python 一只小白跳起来 leetcode leetcode 算法职场和发展 python 笔记经验分享链表
边练习边更新，加油！！！题目：160.相交链表给你两个单链表的头节点headA和headB，请你找出并返回两个单链表相交的起始节点。如果两个链表不存在相交节点，返回null。图示两个链表在节点c1开始相交：题目数据保证整个链式结构中不存在环。注意，函数返回结果后，链表必须保持其原始结构注意点：用集合储存，减少遍历时间和判断时间（集合里的元素只能唯一，在这里不影响）将b指针直接代入集合搜索，减少储存
DS-3KM220250226 3K引擎修复版传奇2025版完整源码搭建教程 legendji oracle 数据库 delphi 开源
DS-3KM2202502263K引擎修复版传奇2025版完整源码搭建教程本文将详细介绍如何搭建DS-3KM2202502263K引擎修复版传奇2025版，确保能顺利运行游戏。一、前期准备1.环境配置在服务器或本地电脑上安装以下必要环境：操作系统：WindowsServer2012/2016/2019或Windows10/11（建议使用64位）数据库：MicrosoftSQLServer2008及
PTA: jmu-ds- 顺序表删除重复元素悦悦子a啊 C语言PTA习题算法 c++数据结构
设计一个算法，从顺序表中删除重复的元素，并使剩余元素间的相对次序保存不变。输入格式:第一行输入顺序表长度。第二行输入顺序表数据元素。中间空格隔开。输出格式：数据之间空格隔开，最后一项尾部不带空格。输出删除重复元素后的顺序表。你需要实现的函数有下面三个：函数接口定义：voidCreateSqList(List&L,inta[],intn);//创建顺序表voidDispSqList(ListL);/
node.js如何实现文件上传 gt8011 node.js 前端 express ajax
一、是什么文件上传在日常开发中应用很广泛，我们发微博、发微信朋友圈都会用到了图片上传功能因为浏览器限制，浏览器不能直接操作文件系统的，需要通过浏览器所暴露出来的统一接口，由用户主动授权发起来访问文件动作，然后读取文件内容进指定内存里，最后执行提交请求操作，将内存里的文件内容数据上传到服务端，服务端解析前端传来的数据信息后存入文件里对于文件上传，我们需要设置请求头为content-type:mult
华为hcip备考内容尼莫有撒四华为开发语言
华为hcip备考内容文章目录华为hcip备考内容第一章·课程简介1-1课程简介1-1.1华为认证简介（数通；datacom）1-2什么是网络1-2.1前言1-2.2什么是网络1-3所有的网络都能访问互联网吗？1-4什么是园区网1-4.1什么是园区网？1-4.2网络三大类：1-5什么是运营商网络？1-6什么是数据中心网络？1-7什么是WAN、LAN?1-8什么是业务系统1-9什么是核心层、汇聚层、接
遨游防爆智能终端“问诊”工业制造，开出数据采集“良方” AORO_BEIDOU 制造
在数据驱动的时代，唯有采集足够规模的工业数据，方能支撑起基于工业大数据的深度分析与智能决策，从而驱动传统产业的蜕变与升级。但是，数据采集之路并非坦途，面临着设备协议多样、接口不一等挑战。技术难题求解，往往要在市场找良方。AOROM5-5G防爆智能终端遨游通讯防爆智能终端其独特之处在于全景前瞻架构的设计理念。在产品定义之初，便充分考虑了未来可能的数据采集需求，预留了丰富的接口，可根据企业的实际需求，
Python 正则表达式偶尔也有风_ python 正则表达式
正则表达式正则表达式（RegularExpression，简称正则或RegExp）是一种强大的文本模式匹配工具，被广泛应用于字符串的搜索、替换、验证等场景。Python的re库为正则表达式提供了丰富的支持，使得开发者能够在处理文本数据时更加高效和灵活。本文将深入探讨Python中的re库，包括基本语法、常见用法、高级技巧以及一些最佳实践，旨在帮助读者更全面地理解和运用正则表达式。什么是正则表达式？
桌面上有多个球在同时运动，怎么实现球之间不交叉，即碰撞？换个号韩国红果果 html 小球碰撞
稍微想了一下，然后解决了很多bug，最后终于把它实现了。其实原理很简单。在每改变一个小球的x y坐标后，遍历整个在dom树中的其他小球，看一下它们与当前小球的距离是否小于球半径的两倍？若小于说明下一次绘制该小球（设为a）前要把他的方向变为原来相反方向（与a要碰撞的小球设为b），即假如当前小球的距离小于球半径的两倍的话，马上改变当前小球方向。那么下一次绘制也是先绘制b，再绘制a，由于a的方向已经改变
《高性能HTML5》读后整理的Web性能优化内容白糖_ html5
读后感先说说《高性能HTML5》这本书的读后感吧，个人觉得这本书前两章跟书的标题完全搭不上关系，或者说只能算是讲解了“高性能”这三个字，HTML5完全不见踪影。个人觉得作者应该首先把HTML5的大菜拿出来讲一讲，再去分析性能优化的内容，这样才会有吸引力。因为只是在线试读，没有机会看后面的内容，所以不胡乱评价了。
[JShop]Spring MVC的RequestContextHolder使用误区 dinguangx jeeshop 商城系统 jshop 电商系统
在spring mvc中，为了随时都能取到当前请求的request对象，可以通过RequestContextHolder的静态方法getRequestAttributes()获取Request相关的变量，如request, response等。在jshop中，对RequestContextHolder的
算法之时间复杂度周凡杨 java 算法时间复杂度效率
在计算机科学中，算法的时间复杂度是一个函数，它定量描述了该算法的运行时间。这是一个关于代表算法输入值的字符串的长度的函数。时间复杂度常用大O符号表述，不包括这个函数的低阶项和首项系数。使用这种方式时，时间复杂度可被称为是渐近的，它考察当输入值大小趋近无穷时的情况。这样用大写O()来体现算法时间复杂度的记法，
Java事务处理 g21121 java
一、什么是Java事务通常的观念认为，事务仅与数据库相关。事务必须服从ISO/IEC所制定的ACID原则。ACID是原子性（atomicity）、一致性（consistency）、隔离性（isolation）和持久性（durability）的缩写。事务的原子性表示事务执行过程中的任何失败都将导致事务所做的任何修改失效。一致性表示当事务执行失败时，所有被该事务影响的数据都应该恢复到事务执行前的状
Linux awk命令详解 510888780 linux
一. AWK 说明 awk是一种编程语言，用于在linux/unix下对文本和数据进行处理。数据可以来自标准输入、一个或多个文件，或其它命令的输出。它支持用户自定义函数和动态正则表达式等先进功能，是linux/unix下的一个强大编程工具。它在命令行中使用，但更多是作为脚本来使用。 awk的处理文本和数据的方式：它逐行扫描文件，从第一行到
android permission 布衣凌宇 Permission
<uses-permission android:name="android.permission.ACCESS_CHECKIN_PROPERTIES" ></uses-permission>允许读写访问"properties"表在checkin数据库中，改值可以修改上传 <uses-permission android:na
Oracle和谷歌Java Android官司将推迟 aijuans java oracle
北京时间 10 月 7 日，据国外媒体报道，Oracle 和谷歌之间一场等待已久的官司可能会推迟至 10 月 17 日以后进行，这场官司的内容是 Android 操作系统所谓的 Java 专利权之争。本案法官 William Alsup 称根据专利权专家 Florian Mueller 的预测，谷歌 Oracle 案很可能会被推迟。　　该案中的第二波辩护被安排在 10 月 17 日出庭，从目前看来
linux shell 常用命令 antlove linux shell command
grep [options] [regex] [files] /var/root # grep -n "o" * hello.c:1:/* This C source can be compiled with:
Java解析XML配置数据库连接(DOM技术连接 SAX技术连接) 百合不是茶 sax技术 Java解析xml文档 dom技术 XML配置数据库连接
XML配置数据库文件的连接其实是个很简单的问题,为什么到现在才写出来主要是昨天在网上看了别人写的,然后一直陷入其中,最后发现不能自拔所以今天决定自己完成 ,,,,现将代码与思路贴出来供大家一起学习 XML配置数据库的连接主要技术点的博客; JDBC编程 : JDBC连接数据库 DOM解析XML: DOM解析XML文件 SA
underscore.js 学习（二） bijian1013 JavaScript underscore
Array Functions 所有数组函数对参数对象一样适用。1.first _.first(array, [n]) 别名: head, take 返回array的第一个元素，设置了参数n，就
plSql介绍 bijian1013 oracle 数据库 plsql
/* * PL/SQL 程序设计学习笔记 * 学习plSql介绍.pdf * 时间：2010-10-05 */ --创建DEPT表 create table DEPT ( DEPTNO NUMBER(10), DNAME NVARCHAR2(255), LOC NVARCHAR2(255) ) delete dept; select
【Nginx一】Nginx安装与总体介绍 bit1129 nginx
启动、停止、重新加载Nginx nginx 启动Nginx服务器，不需要任何参数u nginx -s stop 快速(强制)关系Nginx服务器 nginx -s quit 优雅的关闭Nginx服务器 nginx -s reload 重新加载Nginx服务器的配置文件 nginx -s reopen 重新打开Nginx日志文件
spring mvc开发中浏览器兼容的奇怪问题 bitray jquery Ajax springMVC 浏览器上传文件
最近个人开发一个小的OA项目,属于复习阶段.使用的技术主要是spring mvc作为前端框架,mybatis作为数据库持久化技术.前台使用jquery和一些jquery的插件. 在开发到中间阶段时候发现自己好像忽略了一个小问题,整个项目一直在firefox下测试,没有在IE下测试,不确定是否会出现兼容问题.由于jquer
Lua的io库函数列表 ronin47 lua io
1、io表调用方式：使用io表，io.open将返回指定文件的描述，并且所有的操作将围绕这个文件描述　　io表同样提供三种预定义的文件描述io.stdin,io.stdout,io.stderr 　　2、文件句柄直接调用方式,即使用file:XXX()函数方式进行操作,其中file为io.open()返回的文件句柄　　多数I/O函数调用失败时返回nil加错误信息,有些函数成功时返回nil
java-26-左旋转字符串 bylijinnan java
public class LeftRotateString { /** * Q 26 左旋转字符串 * 题目：定义字符串的左旋转操作：把字符串前面的若干个字符移动到字符串的尾部。 * 如把字符串abcdef左旋转2位得到字符串cdefab。 * 请实现字符串左旋转的函数。要求时间对长度为n的字符串操作的复杂度为O(n)，辅助内存为O(1)。 */ pu
《vi中的替换艺术》-linux命令五分钟系列之十一 cfyme linux命令
vi方面的内容不知道分类到哪里好，就放到《Linux命令五分钟系列》里吧！今天编程，关于栈的一个小例子，其间我需要把”S.”替换为”S->”(替换不包括双引号)。其实这个不难，不过我觉得应该总结一下vi里的替换技术了，以备以后查阅。 1 所有替换方案都要在冒号“:”状态下书写。 2 如果想将abc替换为xyz，那么就这样 :s/abc/xyz/ 不过要特别
[轨道与计算]新的并行计算架构 comsci 并行计算
我在进行流程引擎循环反馈试验的过程中，发现一个有趣的事情。。。如果我们在流程图的每个节点中嵌入一个双向循环代码段，而整个流程中又充满着很多并行路由，每个并行路由中又包含着一些并行节点，那么当整个流程图开始循环反馈过程的时候，这个流程图的运行过程是否变成一个并行计算的架构呢？
重复执行某段代码 dai_lm android
用handler就可以了 private Handler handler = new Handler(); private Runnable runnable = new Runnable() { public void run() { update(); handler.postDelayed(this, 5000); } }; 开始计时 h
Java实现堆栈（list实现） datageek 数据结构——堆栈
public interface IStack<T> { //元素出栈，并返回出栈元素 public T pop(); //元素入栈 public void push(T element); //获取栈顶元素 public T peek(); //判断栈是否为空 public boolean isEmpty
四大备份MySql数据库方法及可能遇到的问题 dcj3sjt126com DB backup
一：通过备份王等软件进行备份前台进不去？用备份王等软件进行备份是大多老站长的选择，这种方法方便快捷，只要上传备份软件到空间一步步操作就可以，但是许多刚接触备份王软件的客用户来说还原后会出现一个问题：因为新老空间数据库用户名和密码不统一，网站文件打包过来后因没有修改连接文件，还原数据库是好了，可是前台会提示数据库连接错误，网站从而出现打不开的情况。解决方法：学会修改网站配置文件，大多是由co
github做webhooks：[1]钩子触发是否成功测试 dcj3sjt126com github git webhook
转自: http://jingyan.baidu.com/article/5d6edee228c88899ebdeec47.html github和svn一样有钩子的功能，而且更加强大。例如我做的是最常见的push操作触发的钩子操作，则每次更新之后的钩子操作记录都会在github的控制板可以看到！工具/原料 github 方法/步骤
">的作用" target="_blank">JSP中的作用蕃薯耀
JSP中<base href="<%=basePath%>">的作用 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>
linux下SAMBA服务安装与配置 hanqunfeng linux
局域网使用的文件共享服务。一.安装包： rpm -qa | grep samba samba-3.6.9-151.el6.x86_64 samba-common-3.6.9-151.el6.x86_64 samba-winbind-3.6.9-151.el6.x86_64 samba-client-3.6.9-151.el6.x86_64 samba-winbind-clients
guava cache IXHONG cache
缓存，在我们日常开发中是必不可少的一种解决性能问题的方法。简单的说，cache 就是为了提升系统性能而开辟的一块内存空间。　　缓存的主要作用是暂时在内存中保存业务系统的数据处理结果，并且等待下次访问使用。在日常开发的很多场合，由于受限于硬盘IO的性能或者我们自身业务系统的数据处理和获取可能非常费时，当我们发现我们的系统这个数据请求量很大的时候，频繁的IO和频繁的逻辑处理会导致硬盘和CPU资源的
Query的开始--全局变量,noconflict和兼容各种js的初始化方法 kvhur JavaScript jquery css
这个是整个jQuery代码的开始，里面包含了对不同环境的js进行的处理，例如普通环境，Nodejs，和requiredJs的处理方法。还有jQuery生成$, jQuery全局变量的代码和noConflict代码详解完整资源： http://www.gbtags.com/gb/share/5640.htm jQuery 源码： (
美国人的福利和中国人的储蓄 nannan408
今天看了篇文章，震动很大，说的是美国的福利。美国医院的无偿入院真的是个好措施。小小的改善，对于社会是大大的信心。小孩，税费等，政府不收反补，真的体现了人文主义。美国这么高的社会保障会不会使人变懒？答案是否定的。正因为政府解决了后顾之忧，人们才得以倾尽精力去做一些有创造力，更造福社会的事情，这竟成了美国社会思想、人
N阶行列式计算(JAVA) qiuwanchi N阶行列式计算
package gaodai; import java.util.List; /** * N阶行列式计算 * @author 邱万迟 * */ public class DeterminantCalculation { public DeterminantCalculation(List<List<Double>> determina
C语言算法之打渔晒网问题 qiufeihu c 算法
如果一个渔夫从2011年1月1日开始每三天打一次渔，两天晒一次网，编程实现当输入2011年1月1日以后任意一天，输出该渔夫是在打渔还是在晒网。代码如下： #include <stdio.h> int leap(int a) /*自定义函数leap()用来指定输入的年份是否为闰年*/ { if((a%4 == 0 && a%100 != 0
XML中DOCTYPE字段的解析 wyzuomumu xml
DTD声明始终以!DOCTYPE开头,空一格后跟着文档根元素的名称,如果是内部DTD,则再空一格出现[],在中括号中是文档类型定义的内容. 而对于外部DTD,则又分为私有DTD与公共DTD,私有DTD使用SYSTEM表示,接着是外部DTD的URL. 而公共DTD则使用PUBLIC,接着是DTD公共名称,接着是DTD的URL. 私有DTD <!DOCTYPErootSYST

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他