yangliuy

[置顶] 概率语言模型及其变形系列(2)-LDA及Gibbs Sampling

本系列博文介绍常见概率语言模型及其变形模型，主要总结PLSA、LDA及LDA的变形模型及参数Inference方法。初步计划内容如下

第一篇：PLSA及EM算法

第二篇：LDA及Gibbs Samping

第三篇：LDA变形模型-Twitter LDA，TimeUserLDA，ATM，Labeled-LDA，MaxEnt-LDA等

第四篇：基于变形LDA的paper分类总结

第五篇：LDA Gibbs Sampling的JAVA实现

第二篇 LDA及Gibbs Sampling

[本文PDF版本下载地址 LDA及Gibbs Sampling-yangliuy]

1 LDA概要

LDA是由Blei,Ng, Jordan 2002年发表于JMLR的概率语言模型，应用到文本建模范畴，就是对文本进行“隐性语义分析”（LSA），目的是要以无指导学习的方法从文本中发现隐含的语义维度-即“Topic”或者“Concept”。隐性语义分析的实质是要利用文本中词项(term)的共现特征来发现文本的Topic结构，这种方法不需要任何关于文本的背景知识。文本的隐性语义表示可以对“一词多义”和“一义多词”的语言现象进行建模，这使得搜索引擎系统得到的搜索结果与用户的query在语义层次上match，而不是仅仅只是在词汇层次上出现交集。

2 概率基础

2.1 随机生成过程及共轭分布

要理解LDA首先要理解随机生成过程。用随机生成过程的观点来看，文本是一系列服从一定概率分布的词项的样本集合。最常用的分布就是Multinomial分布，即多项分布，这个分布是二项分布拓展到K维的情况，比如投掷骰子实验，N次实验结果服从K=6的多项分布。相应的，二项分布的先验Beta分布也拓展到K维，称为Dirichlet分布。在概率语言模型中，通常为Multinomial分布选取的先验分布是Dirichlet分布，因为它们是共轭分布，可以带来计算上的方便性。什么是共轭分布呢？在文本语言模型的参数估计-最大似然估计、MAP及贝叶斯估计一文中我们可以看到，当我们为二项分布的参数p选取的先验分布是Beta分布时，以p为参数的二项分布用贝叶斯估计得到的后验概率仍然服从Beta分布，由此我们说二项分布和Beta分布是共轭分布。这就是共轭分布要满足的性质。在LDA中，每个文档中词的Topic分布服从Multinomial分布，其先验选取共轭先验即Dirichlet分布；每个Topic下词的分布服从Multinomial分布，其先验也同样选取共轭先验即Dirichlet分布。

2.2 Multinomial分布和 Dirichlet分布

上面从二项分布和Beta分布出发引出了Multinomial分布和Dirichlet分布。这两个分布在概率语言模型中很常用，让我们深入理解这两个分布。Multinomial分布的分布律如下

多项分布来自N次独立重复实验，每次实验结果可能有K种，式子中 $\vec{n}$ 为实验结果向量，N为实验次数， $\vec{p}$ 为出现每种实验结果的概率组成的向量，这个公式给出了出现所有实验结果的概率计算方法。当K=2时就是二项分布，K=6时就是投掷骰子实验。很好理解，前面的系数其实是枚举实验结果的不同出现顺序，即

后面表示第K种实验结果出现了 $n^{(k)}$ 次，所以是概率的相应次幂再求乘积。但是如果我们不考虑文本中词出现的顺序性，这个系数就是1。本文后面的部分可以看出这一点。显然有 $\vec{p}$ 各维之和为1，所有 $n^{(k)}$ 之和为N。

Dirichlet分布可以看做是“分布之上的分布”，从Dirichlet分布上Draw出来的每个样本就是多项分布的参数向量 $\vec{p}$ 。其分布律为

$\vec{\alpha}$ 为Dirichlet分布的参数，在概率语言模型中通常会根据经验给定，由于是参数向量 $\vec{p}$ 服从分布的参数，因此称为“hyperparamer”。 $\Delta(\vec{\alpha})$ 是Dirichlet delta函数，可以看做是Beta函数拓展到K维的情况，但是在有的文献中也直接写成 $B(\vec{\alpha})$ 。根据Dirichlet分布在 $\vec{p}$ 上的积分为1（概率的基本性质），我们可以得到一个重要的公式

这个公式在后面LDA的参数Inference中经常使用。下图给出了一个Dirichlet分布的实例

在许多应用场合，我们使用对称Dirichlet分布，其参数是两个标量：维数K和参数向量各维均值. 其分布律如下

关于Dirichlet分布，维基百科上有一张很有意思的图如下

这个图将Dirichlet分布的概率密度函数取对数

并且使用对称Dirichlet分布，取K=3，也就是有两个独立参数，分别对应图中的两个坐标轴，第三个参数始终满足且，图中反映的是从0.3变化到2.0的概率对数值的变化情况。

3 unigram model

我们先介绍比较简单的unigram model。其概率图模型图示如下

关于概率图模型尤其是贝叶斯网络的介绍可以参见 Stanford概率图模型（Probabilistic Graphical Model）— 第一讲贝叶斯网络基础一文。简单的说，贝叶斯网络是一个有向无环图，图中的结点是随机变量，图中的有向边代表了随机变量的条件依赖关系。unigram model假设文本中的词服从Multinomial分布，而Multinomial分布的先验分布为Dirichlet分布。图中双线圆圈表示我们在文本中观察到的第n个词，表示文本中一共有N个词。加上方框表示重复，就是说一共有N个这样的随机变量。 $\vec{p}$ 和 $\vec{\alpha}$ 是隐含未知变量，分别是词服从的Multinomial分布的参数和该Multinomial分布的先验Dirichlet分布的参数。一般 $\vec{\alpha}$ 由经验事先给定， $\vec{p}$ 由观察到的文本中出现的词学习得到，表示文本中出现每个词的概率。

4 LDA

理解了unigram model之后，我们来看LDA。我们可以假想有一位大作家，比如莫言，他现在要写m篇文章，一共涉及了K个Topic，每个Topic下的词分布为一个从参数为 $\vec{\beta}$ 的Dirichlet先验分布中sample出来的Multinomial分布（注意词典由term构成，每篇文章由word构成，前者不能重复，后者可以重复）。对于每篇文章，他首先会从一个泊松分布中sample一个值作为文章长度，再从一个参数为 $\vec{\alpha}$ 的Dirichlet先验分布中sample出一个Multinomial分布作为该文章里面出现每个Topic下词的概率；当他想写某篇文章中的第n个词的时候，首先从该文章中出现每个Topic的Multinomial分布中sample一个Topic，然后再在这个Topic对应的词的Multinomial分布中sample一个词作为他要写的词。不断重复这个随机生成过程，直到他把m篇文章全部写完。这就是LDA的一个形象通俗的解释。用数学的语言描述就是如下过程

转化成概率图模型表示就是

图中K为主题个数，M为文档总数，是第m个文档的单词总数。 $\vec{\beta}$ 是每个Topic下词的多项分布的Dirichlet先验参数， $\vec{\alpha}$ 是每个文档下Topic的多项分布的Dirichlet先验参数。 $z_{m,n}$ 是第m个文档中第n个词的主题， $w_{m,n}$ 是m个文档中的第n个词。剩下来的两个隐含变量 $\vec{\theta}_m$ 和 $\vec{\phi}_k$ 分别表示第m个文档下的Topic分布和第k个Topic下词的分布，前者是k维(k为Topic总数)向量，后者是v维向量（v为词典中term总数）。

给定一个文档集合， $w_{m,n}$ 是可以观察到的已知变量， $\vec{\alpha}$ 和 $\vec{\beta}$ 是根据经验给定的先验参数，其他的变量 $z_{m,n}$ ， $\vec{\theta}_m$ 和 $\vec{\phi}_k$ 都是未知的隐含变量，也是我们需要根据观察到的变量来学习估计的。根据LDA的图模型，我们可以写出所有变量的联合分布

那么一个词 $w_{m,n}$ 初始化为一个term t的概率是

也就是每个文档中出现topic k的概率乘以topic k下出现term t的概率，然后枚举所有topic求和得到。整个文档集合的似然函数就是

5 用Gibbs Sampling学习LDA

5.1 Gibbs Sampling的流程

从第4部分的分析我们知道，LDA中的变量 $z_{m,n}$ ， $\vec{\theta}_m$ 和 $\vec{\phi}_k$ 都是未知的隐含变量，也是我们需要根据观察到的文档集合中的词来学习估计的，那么如何来学习估计呢？这就是概率图模型的Inference问题。主要的算法分为exact inference和approximate inference两类。尽管LDA是最简单的Topic Model，但是其用exact inference还是很困难的，一般我们采用approximate inference算法来学习LDA中的隐含变量。比如LDA原始论文Blei02中使用的mean-field variational expectation maximisation 算法和Griffiths02中使用的Gibbs Sampling，其中Gibbs Sampling 更为简单易懂。

Gibbs Sampling 是Markov-Chain Monte Carlo算法的一个特例。这个算法的运行方式是每次选取概率向量的一个维度，给定其他维度的变量值Sample当前维度的值。不断迭代，直到收敛输出待估计的参数。可以图示如下

初始时随机给文本中的每个单词分配主题 $z^{(0)}$ ,然后统计每个主题z下出现term t的数量以及每个文档m下出现主题z中的词的数量，每一轮计算，即排除当前词的主题分配，根据其他所有词的主题分配估计当前词分配各个主题的概率。当得到当前词属于所有主题z的概率分布后，根据这个概率分布为该词sample一个新的主题。然后用同样的方法不断更新下一个词的主题，直到发现每个文档下Topic分布 $\vec{\theta}_m$ 和每个Topic下词的分布 $\vec{\phi}_k$ 收敛，算法停止，输出待估计的参数 $\vec{\theta}_m$ 和 $\vec{\phi}_k$ ，最终每个单词的主题 $z_{m,n}$ 也同时得出。实际应用中会设置最大迭代次数。每一次计算的公式称为Gibbs updating rule.下面我们来推导LDA的联合分布和Gibbs updating rule。

5.2 LDA的联合分布

由LDA的概率图模型，我们可以把LDA的联合分布写成

第一项和第二项因子分别可以写成

可以发现两个因子的展开形式很相似，第一项因子是给定主题Sample词的过程，可以拆分成从Dirichlet先验中SampleTopic Z下词的分布 $\vec{\phi}_z$ 和从参数为 $\vec{\phi}_z$ 的多元分布中Sample词这两个步骤，因此是Dirichlet分布和Multinomial分布的概率密度函数相乘，然后在 $\vec{\phi}_z$ 上积分。注意这里用到的多元分布没有考虑词的顺序性，因此没有前面的系数项。 $n_z^{(t)}$ 表示term t被观察到分配topic z的次数， $n_m^{(k)}$ 表示topic k分配给文档m中的word的次数.此为这里面还用到了2.2部分中导出的一个公式

$\int_{\vec{p}}\prod_{k=1}^Kp_k^{\alpha_k - 1}d\vec{p} = \Delta(\vec{\alpha})$

因此这些积分都可以转化成Dirichlet delta函数，并不需要算积分。第二个因子是给定文档，sample当前词的主题的过程。由此LDA的联合分布就可以转化成全部由Dirichlet delta函数组成的表达式

这个式子在后面推导Gibbs updating rule时需要使用。

5.3 Gibbs updating rule

得到LDA的联合分布后，我们就可以推导Gibbs updating rule，即排除当前词的主题分配，根据其他词的主题分配和观察到的单词来计算当前词主题的概率公式

里面用到了伽马函数的性质

同时需要注意到

这一项与当前词的主题分配无关，因为无论分配那个主题，对所有k求和的结果都是一样的，区别只在于拿掉的是哪个主题下的一个词。因此可以当成常量，最后我们只需要得到一个成正比的计算式来作为Gibbs updating rule即可。

5.4 Gibbs sampling algorithm

当Gibbs sampling 收敛后，我们需要根据最后文档集中所有单词的主题分配来计算 $\vec{\theta}_m$ 和 $\vec{\phi}_k$ ，作为我们估计出来的概率图模型中的隐含变量。每个文档上Topic的后验分布和每个Topic下的term后验分布如下

可以看出这两个后验分布和对应的先验分布一样，仍然为Dirichlet分布，这也是共轭分布的性质决定的。

使用Dirichlet分布的期望计算公式

我们可以得到两个Multinomial分布的参数 $\vec{\theta}_m$ 和 $\vec{\phi}_k$ 的计算公式如下

综上所述，用Gibbs Sampling 学习LDA参数的算法伪代码如下

关于这个算法的代码实现可以参见

* yangliuy's LDAGibbsSampling https://github.com/yangliuy/LDAGibbsSampling

* Gregor Heinrich's LDA-J
* Yee Whye Teh's Gibbs LDA Matlab codes
* Mark Steyvers and Tom Griffiths's topic modeling matlab toolbox
* GibbsLDA++

6 参考文献及推荐Notes

本文部分公式及图片来自 Parameter estimation for text analysis，感谢Gregor Heinrich详实细致的Technical report。看过的一些关于LDA和Gibbs Sampling 的Notes，这个是最准确细致的，内容最为全面系统。下面几个Notes对Topic Model感兴趣的朋友也推荐看一看。

[1] Christopher M. Bishop. Pattern Recognition and Machine Learning (Information Science and Statistics). Springer-Verlag New York, Inc., Secaucus, NJ, USA, 2006.
[2] Gregor Heinrich. Parameter estimation for text analysis. Technical report, 2004.
[3] Wang Yi. Distributed Gibbs Sampling of Latent Topic Models: The Gritty Details Technical report, 2005.

[4] Wayne Xin Zhao, Note for pLSA and LDA, Technical report, 2011.

[5] Freddy Chong Tat Chua. Dimensionality reduction and clustering of text documents.Technical report, 2009.

[6] Wikipedia, Dirichlet distribution , http://en.wikipedia.org/wiki/Dirichlet_distribution

数据结构-八大排序小豪GO! java的养成方法排序算法算法数据结构
文章目录1.插入排序1.1直接插入排序1.2希尔排序2.选择排序2.1直接选择排序2.2堆排序3.交换排序3.1冒泡排序3.2快速排序3.3归并排序4.计数排序1.插入排序像玩扑克牌一样，将待排序的元素插入到已经排好序的序列中，直到所有记录插入完为止，得到一个新的有序序列。1.1直接插入排序直接插入排序是一种简单直观的排序算法，适用于少量数据的排序。它的工作原理类似于玩扑克牌时整理手牌。具体步骤如
tmux使用及个性化配置好猛的龙
1.tmux介绍tmux是一个优秀的终端复用软件，split窗口。可以在一个terminal下打开多个终端。即使非正常掉线，也能保证当前的任务运行，这一点对于远程SSH访问特别有用，网络不好的情况下仍然能保证工作现场不丢失。SSH重新连接以后，就可以直接回到原来的工作环境，不但提高了工作效率，还降低了风险，增加了安全性。tmux完全使用键盘控制窗口，实现窗口的切换功能。2.安装sudoapt-ge
数据结构与算法学习笔记——多项式的链表实战小鼠狼数据结构链表算法 c语言
数据结构与算法学习笔记（C语言）多项式的链表实现定义：在数学上，形如的式子叫做一元多项式，包括系数a、b、c、d…还有幂次0、1、2、3…根据多项式的特征，我们可以定义一个链表，让节点的数据域放系数和幂次，然后让next指针域指向下一个更高幂次的节点抽象数据类型多项式Polynomial的实现typedefstructterm{intcoef;/*系数*/intexpn;/*幂次*/structt
Windows RPC 运行时中的严重远程代码执行漏洞红云谈安全网络安全这些事 windows rpc 网络协议
微软于2022年4月的补丁星期二发布了针对各种组件中一百多个新漏洞的补丁。在Windows远程过程调用(RPC)运行时中发现并修补了三个严重漏洞：CVE-2022-24492和CVE-2022-24528（由CyberKunLun的YukiChen发现）CVE-2022-26809（由Kunlun的BugHunter010发现）在这篇博文中，我们将提供有关其中两个漏洞的信息、其利用的含义、影响范围
instructor 库实现llm与sqlite数据库连接 ZHOU_CAMP instructor sqlite 人工智能 agent
目录代码代码解释1.导入必要模块2.定义数据模型3.初始化AI客户端4.创建英雄函数5.数据库操作类似例子代码importinstructorfromopenaiimportOpenAIfromtypingimportOptionalfromsqlmodelimportField,SQLModel,create_engine,Session#Definethemodelthatwillservea
Echarts引入报错：echarts Uncaught ReferenceError: echarts is not defined 爱吃臭豆腐、 java 进阶 echarts 前端框架
版权声明：本文为博主原创文章，转载请注明CSDN博客源地址！共同学习，一起进步~https://blog.csdn.net/qq_29473881/article/details/84300668Echarts引入报错：echartsUncaughtReferenceError:echartsisnotdefined：解决办法：引入这行即可成功：
Java并发编程-volatile关键字详解及案例实战猿与禅 Java技术栈源码分析 java volatile 并发编程
文章目录volatile关键字的作用手写一个小程序来体验一下volatile关键字的作用讲解volatile是如何保证可见性的Java内存模型（JMM）volatile的工作原理实现可见性的总结volatile为什么无法保证原子性基于happens-before原则来看volatile如何保证有序性volatile的底层实现原理:lock指令以及内存屏障Lock前缀指令内存屏障（MemoryBar
LIB-ZC, 一个跨平台(Linux)平台通用C/C++扩展库, 网络socket eli960 C/C++lib-zc linux c语言 c++
LIB-ZC,一个跨平台(Linux)平台通用C/C++扩展库,网络socket跨平台命名空间zcc方法网络地址,例子192.168.1.1:25/somepath/someppp/123_domain_socket_path0:25;127.0.0.1:46;./somepath/123;/home/xxx/111;0:8899常量socket类型staticconstcharvar_tcp_l
tmux鼠标+彩色显示液压姬 Ubuntu ubuntu
鼠标要在tmux中，按ctrl+b输入:并输入以下内容：setw-gmouseon或者：set-option-gmouseon注意：在tmux[38;2;%lu;%lu;%lum"let&t_8b="\[48;2;%lu;%lu;%lum"endif注意注意这里有个坑，就是每次改完tmux的配置，一定要保证你的shell里面的tmuxsession!全部关闭!，重启tmux才能看到效果哦.查看tm
《Java 多线程编程核心技术》笔记——第7章拾遗增补 bm1998 #《Java 多线程编程核心技术》Java 多线程
文章目录7.1线程的状态7.1.1验证NEW、RUNNABLE和TERMINATED7.1.2验证TIMED_WAITING7.1.3验证BLOCKED7.1.4验证WAITING7.4SimpleDateFormat非线程安全7.4.1出现异常7.4.2解决异常方法17.4.3解决异常方法27.5线程中出现异常的处理声明：本博客是本人在学习《Java多线程编程核心技术》后整理的笔记，旨在方便复习
Docker Image export and load and tag btbujhj docker 容器运维
#在国外服务器保存Docker镜像dockersavemyimage>myimage.tar#将tar文件传输到国内服务器scpmyimage.tarroot@192.0.2.0:/home#在国内服务器加载Docker镜像cd/homedockerload
无人机在农业中的应用与挑战！云卓SKYDROID 无人机科技人工智能云卓科技科普
一、无人机在农业中的作用1.提升作业效率与降低成本无人机在喷洒农药、播种、施肥、吊运等环节显著提升效率。例如，湖北秭归县使用大疆T100无人机吊运脐橙，单次85公斤的运输任务仅需2分钟，而人工需1小时，综合成本降低250元/亩，全县年节约成本达3000万元。云南罗平县通过无人机飞防，单日作业面积可达600-800亩，效率是人工的50倍以上，同时减少农药用量50%、节水90%。2.适应复杂地形与劳动
航电系统通信与数据链技术分析云卓SKYDROID 无人机人工智能科普高科技云卓科技
一、技术要点1.高带宽与低时延通信技术航电系统需支持实时数据传输，如民航VDL2数据链采用D8PSK调制和ReedSolomon编码技术，传输速率达31.5Kb/s，并通过物理层优化减少码间串扰。新一代LDACS系统则利用L频段频谱，提供比传统VDL模式2快200倍的吞吐量，支持基于IP的数字化通信，满足高分辨率视频和传感器数据的传输需求。军事领域的数据链（如Link-16）通过抗干扰调制技术和多
无人机3S与4S电池技术对比！云卓SKYDROID 无人机人工智能云卓科技科普科技
一、基础参数对比1.电芯与电压3S电池：由3节锂电芯串联组成，标称电压为11.1V（单节3.7V×3），满电电压约12.6V。4S电池：由4节电芯串联，标称电压14.8V（3.7V×4），满电电压约16.8V。电压差异：是两者最显著的区别，直接影响动力输出和电机转速。2.能量密度在相同容量下（如5000mAh），4S电池因电压更高，能量密度（单位体积或重量的储能量）优于3S，理论上可提供更长的飞行
中小企业成AI落地企服市场主力军，阿里云AI创客松决赛结果出炉 QbitAl 人工智能阿里云云计算
允中发自凹非寺量子位|公众号QbitAI几乎每一天，AI都在获得新的能力。在机器人、大模型等热门赛道涌现后，专注企业服务的AI技术成为后起之秀，在智能客服、营销获客、企业培训等企服领域大展拳脚。AI企服赛道有哪些新玩家出现？AI企服应用推进到什么程度？市场客户的接受程度和反馈如何？阿里云第五季Create@AI创客松提供了观察的窗口。6月27日，第五季Create@AI创客松大赛决赛在杭州举行，本
Kafka系列之：计算kafka集群topic占的存储大小快乐骑行^_^ Kafka Kafka系列计算kafka集群 topic占的存储大小
Kafka系列之：计算kafka集群topic占的存储大小topic存储数据格式统计topic存储大小定时统计topic存储大小topic存储数据格式单位是字节大小size_bytes{directory="/data/datum/kafka/optics-all"}782336计算topic存储大小脚本逻辑是：计算指定目录或文件的大小。去除路径中的负数部分。按路径累加文件大小。将结果转换为Pro
人工智能学习框架完全指南（2025年更新版）赛博AI Lewis 人工智能人工智能
一、核心框架分类与适用场景人工智能框架根据功能可分为深度学习框架、机器学习框架、强化学习框架和传统工具库，以下是主流工具及选型建议：1.深度学习框架（1）PyTorch核心优势：动态计算图、灵活性强，适合科研与快速原型开发，支持多模态任务（如NLP、CV）。技术生态：集成HuggingFace、PyTorchLightning等扩展库，支持模型部署工具如TorchServe、ONNX。适用场景：学
RAGFlow嵌入自定义文件解析代码内卷焦虑人士 rag ragflow 人工智能
目录一、写自己的文档解析代码1、`def__call__`2、`defparser_txt`3、`__init__.py`二、导入到naive.py1、找到文件2、添加代码三、file_utils.py1、找到文件2、重启容器附：行业词库添加进入docker容器dockerexec-itragflow-server/bin/bash一、写自己的文档解析代码来到路径/ragflow/deepdoc/
网盘服务器损坏文件会丢失吗,网盘的文件全部丢失，是什么原因导致？如何找回？... 泰山的雨久下不停
满意答案您好，百度云从来不会自行删除用户的文件(哪怕是在已超出存储限制的情况下)。导致文件丢失的原因多种多样，请您尝试以下方法找回您的文件：1、请您登录其他百度帐号或第三方帐号查找文件，多数用户将文件存储在其他帐号误认为文件丢失；2、您是否使用过百度云同步盘，在文件同步后清理本地文件，同步盘的同步机制可能会造成您的云端文件自行删除同步；3、您的帐号信息是否泄露或提供他人使用，导致文件被他人恶意删除
服务器损坏文件怎么办,服务器文件系统损坏的处理英次服务器损坏文件怎么办
服务器文件系统修复方法经分析为文件系统损坏，服务器启动后自动检查所挂载的文件系统并进行修复，自动修复不成功，启动过程阻塞，导致服务器没启动。文件系统损坏一般有2种原因：1.硬盘出现坏道导致文件系统损坏；2.设备多次非正常关机，也就是直接掉电。经检测该服务器硬盘正常。引起文件系统损坏的原因应该是非正常关机。为避免这种情况的发生，服务器应尽量正常关机，执行halt或者shutdown-h0命令正常关机
券商股票交易接口api有哪些类型？如何获取并安全使用这些接口api？财云量化 python炒股自动化量化交易程序化交易安全券商股票交易接口api 类型获取安全使用股票量化接口股票API接口
炒股自动化：申请官方API接口，散户也可以python炒股自动化（0），申请券商API接口python炒股自动化（1），量化交易接口区别Python炒股自动化（2）：获取股票实时数据和历史数据Python炒股自动化（3）：分析取回的实时数据和历史数据Python炒股自动化（4）：通过接口向交易所发送订单Python炒股自动化（5）：通过接口查询订单，查询账户资产股票量化，Python炒股，CSDN
CSGO2下载完文件缺失或损坏怎么办？详尽解决方法分享 onecdll 游戏网络 CSGO2
cs2游戏中有玩家遇到了文件缺失或损坏的情况，但是不知道应该怎么解决？下面一起来看看吧！验证游戏的完整性如果您是在Steam平台下载的《反恐精英2》，请在Steam库中找到该游戏，右键点击选择“属性”。进入“本地文件”选项卡，点击“验证游戏文件的完整性”按钮。Steam将会检查游戏文件，并自动下载并修复任何缺失或损坏的文件。网络优化确保在下载过程中网络连接稳定，避免断网导致文件下载不完整。推荐大家
YumUtils：高效管理 RPM 包的利器 MenzilBiz Linux 工具运维 linux 运维
YumUtils介绍与使用在使用CentOS和RHEL等基于RPM的Linux发行版时，Yum是一个非常重要的包管理工具。YumUtils是一组有用的工具和脚本，旨在增强Yum的功能，帮助用户更高效地管理软件包。本文将介绍YumUtils的基本概念及其常用功能。什么是YumUtils？YumUtils是一组实用工具，旨在增强Yum的功能。它提供了一些额外的命令，可以帮助用户更轻松地管理软件包、清理
React入门实战：构建一个天气查询应用（2025最新） Neo Evolution 前端学习前端框架 react.js 前端
引言React作为当今最流行的前端框架之一，其组件化思想和声明式编程模式彻底改变了现代Web开发。本教程将通过构建一个完整的天气查询应用，系统性地讲解React的核心概念和最佳实践。项目将覆盖React18最新特性，使用Vite构建工具，并整合现代前端开发工作流。项目概览应用功能需求：城市天气实时查询温度单位切换（℃/℉）最近查询历史记录天气图标动态展示响应式布局适配加载状态与错误处理技术栈：Re
xinference docker 部署方式心之语歌 docker 容器运维
文章目录简绍docker安装方式访问地址对应官网在dify中添加xinference容器内置大语言模型嵌入模型图像模型音频模型重排序模型视频模型简绍XorbitsInference(Xinference)是一个开源平台，用于简化各种AI模型的运行和集成。借助Xinference，您可以使用任何开源LLM、嵌入模型和多模态模型在云端或本地环境中运行推理，并创建强大的AI应用。docker安装方式do
深度学习在自动驾驶中的应用已渗透到感知、决策、控制等核心环节，以下从技术实现与场景落地的角度进行系统性分析码力金矿自动驾驶深度学习人工智能深度学习自动驾驶人工智能
深度学习在自动驾驶中的应用已渗透到感知、决策、控制等核心环节，以下从技术实现与场景落地的角度进行系统性分析：一、环境感知：多模态数据融合与高精度建模视觉感知与目标检测图像识别：基于卷积神经网络（CNN）处理摄像头数据，识别行人、车辆、交通标志等目标。典型算法如YOLOv8在640×640分辨率下可达120FPS，mAP@0.5达53.2%。语义分割：通过全卷积网络（FCN）或U-Net对图像进行像
游戏引擎学习第232天虾球xz 游戏引擎学习游戏引擎学习 c++
分享昨天聊天中提到的链接有一位网友分享了一个MITOpenCourseWare的公开课视频链接，我们在推特上转发了那个视频。整体来说，那是一场非常不错的讲座。虽然有些部分听起来还是比较晦涩，但它确实澄清了我们对“P与NP问题”的不少疑惑。比如，为什么人们在谈论这些概念时常常说出一些似是而非的说法，甚至会出现看似互相矛盾的说法，让人感到困惑，不知道到底该怎么理解。虽然我们平时不会在这个系列中深入讨论
轻松掌握Java多线程 - 第五章：synchronized关键字 qianmoQ 轻松掌握Java多线程 java python jvm
文章目录学习目标1.对象锁与类锁的概念1.1对象锁（实例锁）1.2类锁（静态锁）1.3对象锁与类锁的对比2.synchronized修饰方法与代码块的区别2.1修饰方法vs修饰代码块2.2不同锁对象的选择3.synchronized的底层实现原理3.1Monitor监视器3.2字节码层面的实现3.3锁的优化4.实战案例：使用synchronized解决银行账户并发问题4.1问题描述：银行账户转账4
如何分析服务器日志以追踪黑客攻击行为网硕互联的小客服服务器运维
分析服务器日志是追踪黑客攻击行为的关键手段。通过系统性地检查日志文件，可以发现异常访问模式、入侵痕迹和后门活动。以下是详细的日志分析方法：一、重点日志文件定位Web服务器日志Nginx:/var/log/nginx/access.log（访问日志）,/var/log/nginx/error.log（错误日志）Apache:/var/log/apache2/access.log,/var/log/a
JAVA（类集） LY101351 java 笔记开发语言 java
一、类集框架概述类集框架(CollectionFramework)是Java提供的一套用于存储和操作对象组的接口和类，位于java.util包中。主要优点：1.提供高性能的数据结构和算法2.减少编程工作量3.提高程序速度和质量4.允许不同API之间的互操作5.降低学习和使用新API的难度二、核心接口1.Collection接口所有类集的根接口主要方法： booleanadd(Ee)//添加元素 b
JAVA中的Enum 周凡杨 java enum 枚举
Enum是计算机编程语言中的一种数据类型---枚举类型。在实际问题中，有些变量的取值被限定在一个有限的范围内。例如，一个星期内只有七天我们通常这样实现上面的定义： public String monday; public String tuesday; public String wensday; public String thursday
赶集网mysql开发36条军规 Bill_chen mysql 业务架构设计 mysql调优 mysql性能优化
(一)核心军规 (1)不在数据库做运算 cpu计算务必移至业务层； (2)控制单表数据量 int型不超过1000w，含char则不超过500w；合理分表；限制单库表数量在300以内； (3)控制列数量字段少而精，字段数建议在20以内
Shell test命令 daizj shell 字符串 test 数字文件比较
Shell test命令 Shell中的 test 命令用于检查某个条件是否成立，它可以进行数值、字符和文件三个方面的测试。数值测试参数说明 -eq 等于则为真 -ne 不等于则为真 -gt 大于则为真 -ge 大于等于则为真 -lt 小于则为真 -le 小于等于则为真实例演示： num1=100 num2=100if test $[num1]
XFire框架实现WebService(二) 周凡杨 java webservice
有了XFire框架实现WebService(一)，就可以继续开发WebService的简单应用。 Webservice的服务端(WEB工程)：两个java bean类： Course.java package cn.com.bean; public class Course { private
重绘之画图板朱辉辉33 画图板
上次博客讲的五子棋重绘比较简单，因为只要在重写系统重绘方法paint（）时加入棋盘和棋子的绘制。这次我想说说画图板的重绘。画图板重绘难在需要重绘的类型很多，比如说里面有矩形，园，直线之类的，所以我们要想办法将里面的图形加入一个队列中，这样在重绘时就
Java的IO流西蜀石兰 java
刚学Java的IO流时，被各种inputStream流弄的很迷糊，看老罗视频时说想象成插在文件上的一根管道，当初听时觉得自己很明白，可到自己用时，有不知道怎么代码了。。。每当遇到这种问题时，我习惯性的从头开始理逻辑，会问自己一些很简单的问题，把这些简单的问题想明白了，再看代码时才不会迷糊。 IO流作用是什么？答：实现对文件的读写，这里的文件是广义的； Java如何实现程序到文件
No matching PlatformTransactionManager bean found for qualifier 'add' - neither 林鹤霄
java.lang.IllegalStateException: No matching PlatformTransactionManager bean found for qualifier 'add' - neither qualifier match nor bean name match! 网上找了好多的资料没能解决，后来发现：项目中使用的是xml配置的方式配置事务，但是
Row size too large (> 8126). Changing some columns to TEXT or BLOB aigo column
原文：http://stackoverflow.com/questions/15585602/change-limit-for-mysql-row-size-too-large 异常信息： Row size too large (> 8126). Changing some columns to TEXT or BLOB or using ROW_FORMAT=DYNAM
JS 格式化时间 alxw4616 JavaScript
/** * 格式化时间 2013/6/13 by 半仙 alxw4616@msn.com * 需要 pad 函数 * 接收可用的时间值. * 返回替换时间占位符后的字符串 * * 时间占位符:年 Y 月 M 日 D 小时 h 分 m 秒 s 重复次数表示占位数 * 如 YYYY 4占4位 YY 占2位<p></p> * MM DD hh mm
队列中数据的移除问题百合不是茶队列移除
队列的移除一般都是使用的remov();都可以移除的,但是在昨天做线程移除的时候出现了点问题,没有将遍历出来的全部移除, 代码如下; // package com.Thread0715.com; import java.util.ArrayList; public class Threa
Runnable接口使用实例 bijian1013 java thread Runnable java多线程
Runnable接口 a. 该接口只有一个方法：public void run(); b. 实现该接口的类必须覆盖该run方法 c. 实现了Runnable接口的类并不具有任何天
oracle里的extend详解 bijian1013 oracle 数据库 extend
扩展已知的数组空间，例： DECLARE TYPE CourseList IS TABLE OF VARCHAR2(10); courses CourseList; BEGIN -- 初始化数组元素，大小为3 courses := CourseList('Biol 4412 ', 'Psyc 3112 ', 'Anth 3001 '); --
【httpclient】httpclient发送表单POST请求 bit1129 httpclient
浏览器Form Post请求浏览器可以通过提交表单的方式向服务器发起POST请求，这种形式的POST请求不同于一般的POST请求 1. 一般的POST请求，将请求数据放置于请求体中，服务器端以二进制流的方式读取数据，HttpServletRequest.getInputStream()。这种方式的请求可以处理任意数据形式的POST请求，比如请求数据是字符串或者是二进制数据 2. Form
【Hive十三】Hive读写Avro格式的数据 bit1129 hive
1. 原始数据 hive> select * from word; OK 1 MSN 10 QQ 100 Gtalk 1000 Skype 2. 创建avro格式的数据表 hive> CREATE TABLE avro_table(age INT, name STRING)STORE
nginx+lua+redis自动识别封解禁频繁访问IP ronin47
在站点遇到攻击且无明显攻击特征，造成站点访问慢，nginx不断返回502等错误时，可利用nginx+lua+redis实现在指定的时间段内，若单IP的请求量达到指定的数量后对该IP进行封禁，nginx返回403禁止访问。利用redis的expire命令设置封禁IP的过期时间达到在指定的封禁时间后实行自动解封的目的。一、安装环境： CentOS x64 release 6.4(Fin
java-二叉树的遍历-先序、中序、后序（递归和非递归）、层次遍历 bylijinnan java
import java.util.LinkedList; import java.util.List; import java.util.Stack; public class BinTreeTraverse { //private int[] array={ 1, 2, 3, 4, 5, 6, 7, 8, 9 }; private int[] array={ 10,6,
Spring源码学习-XML 配置方式的IoC容器启动过程分析 bylijinnan java spring IOC
以FileSystemXmlApplicationContext为例，把Spring IoC容器的初始化流程走一遍： ApplicationContext context = new FileSystemXmlApplicationContext ("C:/Users/ZARA/workspace/HelloSpring/src/Beans.xml&q
[科研与项目]民营企业请慎重参与军事科技工程 comsci 企业
军事科研工程和项目并非要用最先进，最时髦的技术，而是要做到“万无一失” 而民营科技企业在搞科技创新工程的时候，往往考虑的是技术的先进性，而对先进技术带来的风险考虑得不够，在今天提倡军民融合发展的大环境下，这种“万无一失”和“时髦性”的矛盾会日益凸显。。。。。。所以请大家在参与任何重大的军事和政府项目之前，对
spring 定时器-两种方式 cuityang spring quartz 定时器
方式一：间隔一定时间运行 <bean id="updateSessionIdTask" class="com.yang.iprms.common.UpdateSessionTask" autowire="byName" /> <bean id="updateSessionIdSchedule
简述一下关于BroadView站点的相关设计 damoqiongqiu view
终于弄上线了，累趴，戳这里http://www.broadview.com.cn 简述一下相关的技术点前端：jQuery+BootStrap3.2+HandleBars，全站Ajax（貌似对SEO的影响很大啊！怎么破？），用Grunt对全部JS做了压缩处理，对部分JS和CSS做了合并（模块间存在很多依赖，全部合并比较繁琐，待完善）。后端：U
运维 PHP问题汇总 dcj3sjt126com windows2003
1、Dede(织梦)发表文章时,内容自动添加关键字显示空白页解决方法：后台>系统>系统基本参数>核心设置>关键字替换（是/否），这里选择“是”。后台>系统>系统基本参数>其他选项>自动提取关键字，这里选择“是”。 2、解决PHP168超级管理员上传图片提示你的空间不足网站是用PHP168做的，反映使用管理员在后台无法
mac 下安装php扩展 - mcrypt dcj3sjt126com PHP
MCrypt是一个功能强大的加密算法扩展库，它包括有22种算法，phpMyAdmin依赖这个PHP扩展，具体如下：下载并解压libmcrypt-2.5.8.tar.gz。在终端执行如下命令： tar zxvf libmcrypt-2.5.8.tar.gz cd libmcrypt-2.5.8/ ./configure --disable-posix-threads --
MongoDB更新文档 [四] eksliang mongodb Mongodb更新文档
MongoDB更新文档转载请出自出处：http://eksliang.iteye.com/blog/2174104 MongoDB对文档的CURD，前面的博客简单介绍了，但是对文档更新篇幅比较大，所以这里单独拿出来。语法结构如下： db.collection.update( criteria, objNew, upsert, multi) 参数含义参数
Linux下的解压，移除，复制，查看tomcat命令 y806839048 tomcat
重复myeclipse生成webservice有问题删除以前的，干净 1、先切换到：cd usr/local/tomcat5/logs 2、tail -f catalina.out 3、这样运行时就可以实时查看运行日志了 Ctrl+c 是退出tail命令。有问题不明的先注掉 cp /opt/tomcat-6.0.44/webapps/g
Spring之使用事务缘由(3-XML实现) ihuning spring
用事务通知声明式地管理事务事务管理是一种横切关注点。为了在 Spring 2.x 中启用声明式事务管理，可以通过 tx Schema 中定义的 <tx:advice> 元素声明事务通知，为此必须事先将这个 Schema 定义添加到 <beans> 根元素中去。声明了事务通知后，就需要将它与切入点关联起来。由于事务通知是在 <aop:
GCD使用经验与技巧浅谈啸笑天 GC
前言 GCD(Grand Central Dispatch)可以说是Mac、iOS开发中的一大“利器”，本文就总结一些有关使用GCD的经验与技巧。 dispatch_once_t必须是全局或static变量这一条算是“老生常谈”了，但我认为还是有必要强调一次，毕竟非全局或非static的dispatch_once_t变量在使用时会导致非常不好排查的bug，正确的如下： 1
linux（Ubuntu）下常用命令备忘录1 macroli linux 工作 ubuntu
在使用下面的命令是可以通过--help来获取更多的信息1,查询当前目录文件列表：ls ls命令默认状态下将按首字母升序列出你当前文件夹下面的所有内容，但这样直接运行所得到的信息也是比较少的，通常它可以结合以下这些参数运行以查询更多的信息： ls / 显示/.下的所有文件和目录 ls -l 给出文件或者文件夹的详细信息 ls -a 显示所有文件，包括隐藏文
nodejs同步操作mysql qiaolevip 学习永无止境每天进步一点点 mysql nodejs
// db-util.js var mysql = require('mysql'); var pool = mysql.createPool({ connectionLimit : 10, host: 'localhost', user: 'root', password: '', database: 'test', port: 3306 });
一起学Hive系列文章 superlxw1234 hive Hive入门
[一起学Hive]系列文章目录贴，入门Hive，持续更新中。 [一起学Hive]之一—Hive概述，Hive是什么 [一起学Hive]之二—Hive函数大全-完整版 [一起学Hive]之三—Hive中的数据库(Database)和表(Table) [一起学Hive]之四-Hive的安装配置 [一起学Hive]之五-Hive的视图和分区 [一起学Hive
Spring开发利器：Spring Tool Suite 3.7.0 发布 wiselyman spring
Spring Tool Suite(简称STS)是基于Eclipse，专门针对Spring开发者提供大量的便捷功能的优秀开发工具。在3.7.0版本主要做了如下的更新：将eclipse版本更新至Eclipse Mars 4.5 GA Spring Boot(JavaEE开发的颠覆者集大成者，推荐大家学习)的配置语言YAML编辑器的支持(包含自动提示，

[置顶] 概率语言模型及其变形系列(2)-LDA及Gibbs Sampling

你可能感兴趣的:([置顶] 概率语言模型及其变形系列(2)-LDA及Gibbs Sampling)