玩人

线性条件随机场代码解读

NER中CRF是必不可少的环节，特地看了一遍CRF相关理论以及allennlp中CRF的代码，特在这里笔记记录下来！

1.线性CRF简介

1.1一般形式

关于线性条件随机场的详细介绍，请参考李航老师的《统计学习方法》或者这里，这里仅仅给出一般的公式定义。
设 P(Y|X) 为线性链条件随机场，则在随机变量 X 取值为 x 的条件下，随机变量 Y 取值为 y 的条件概率具有如下形式(注意 x , y 都是序列)：

P (y | x) = 1 Z ( x ) e x p (\sum i, k λ k t k (y i - 1, y i, x, i) + \sum i, l μ l s l (y i, x, i)) (11.10)

其中,

Z (x) = \sum y e x p (\sum i, k λ k t k (y i - 1, y i, x, i) + \sum i, l μ l s l (y i, x, i)) (11.11)

式子中，

tk t k 是 转移特征函数，依赖于当前和前一个位置；

sl s l 是 状态特征函数，依赖于当前位置；

λk λ k 和

μl μ l 是对应的权重。

Z(x) Z ( x ) 是规范化因子，求和是在所有可能的输出序列上进行的(注意这个所有可能不是任意的组合，这需要依赖于

x x 的取值)。

1.2简化形式

注意到条件随机场式(11.10)中同一特征在各个位置都有定义，可以对同一个特征在各个位置求和，将局部特征函数转哈U为一个全局特征函数，这样就可以将条件随机场写成权值向量和特征向量(包括转移特征和状态特征)的内积形式，即条件随机场的简化形式。
首先将转移特征和状态特征及其权值用统一的符号表示，设有 K1 个转换特征， K2 个状态特征， K=K1+K2 ，记:

f k (y i - 1, y i, x, i) = {t k (y i - 1, y i, x, i), s l (y i, x, i), k = 1, 2, . . ., K k = K 1 + l; l = 1, 2, . . ., K 2 (11.12)

然后，对转移与状态特征在各个位置i求和，记作:

f k (y, x) = \sum i n f k (y i - 1, y i, x, i), k = 1, 2, . . ., K (11.13)

用

wk w k 表示特征

fk(y,x) f k ( y , x ) 的权值，即:

w k = {λ k, μ l, k = 1, 2, . . ., K k = K 1 + l; l = 1, 2, . . ., K 2 (11.14)

于是用上面的简化形式，条件随机场可以表示为:

P (y | x) = 1 Z ( x ) e x p \sum k = 1 K w k f k (y, x) (11.15)

Z (x) = \sum y e x p \sum k = 1 K w k f k (y, x) (11.16)

若以w表示权值向量，即:

w=(w1,w2,...,wK)T w = ( w 1 , w 2 , . . . , w K ) T ，以

F(y,x)=(f1(y,x),f2(y,x),...,fK(y,x))T F ( y , x ) = ( f 1 ( y , x ) , f 2 ( y , x ) , . . . , f K ( y , x ) ) T ,则条件随机场可以写成向量

w w 与

F(y,x) F ( y , x ) 的内积形式:

P w (y | x) = 1 Z ( x ) e x p (w * F (y, x)) (11.19)

其中,

Z w (x) = \sum y e x p (w * F (y, x)) (11.20)

1.3条件随机场的矩阵形式

条件随机场还可以由矩阵表示，事实上，在代码实现中，我们肯定需要用到矩阵运算的！假设 Pw(y|x) 是由式子 (11.15)和(11.16) 给出的线性链条件随机场，表示对给定观测序列 x ,相应的标记序列 y 的条件概率。引进特殊的起点和终点标记 y0=start,yn+1=stop ，这时 Pw(y|x) 可以通过矩阵形式表示。
对观测序列 x 的每一个位置 i=1,2,...,n+1 ，定义一个 m 阶矩阵( m 是标记 yi 取值的个数)

M i (x) = [M i (y i - 1, y i | x)] (11.21)

M i (y i - 1, y i | x) = e x p (W i (y i - 1, y i | x)) (11.22)

W i (y i - 1, y i | x) = \sum k = 1 K w k f k (y i - 1, y i | x) (11.23)

这样，给定观察序列x，相应标记序列y的非规范化概率可以通过该序列

n+1 n + 1 个矩阵适当元素的乘积

∏n+1i=1Mi(yi,yi|x) ∏ i = 1 n + 1 M i ( y i , y i | x ) 表示.于是，条件概率

Pw(y|x) P w ( y | x ) 是:

P w (y | x) = 1 Z ( x ) \prod i = 1 n + 1 M i (y i, y i | x) (11.24)

其中

Zw(x) Z w ( x ) 为规范化因子，是

(n+1) ( n + 1 ) 个矩阵的乘积的

(start,stop) ( s t a r t , s t o p ) 元素:

Z w (x) = (M 1 (x) M 2 (x) . . . M n + 1 (x)) s t a r t, s t o p

注意,

y0=start y 0 = s t a r t 与

yn+1=stop y n + 1 = s t o p 表示开始和终止状态，规范化因子

Zw(x) Z w ( x ) 是以

start s t a r t 为起点

stop s t o p 为终点通过状态的所有路径

y1y2...yn y 1 y 2 . . . y n 的非规范化概率

∏n+1i=1Mi(yi,yi|x) ∏ i = 1 n + 1 M i ( y i , y i | x ) 之和， 这个所有路径与 x 的取值也是息息相关的， x 能够决定各位置各标签的得分！.

下面，我们将1.1和1.3的内容拼接起来，证明二者的一致性!

P (y | x) = 1 Z ( x ) e x p (\sum i, k λ k t k (y i - 1, y i, x, i) + \sum i, l μ l s l (y i, x, i))

这里，我们仅仅考虑后面的非规范化项。

e x p (\sum i, k λ k t k (y i - 1, y i, x, i) + \sum i, l μ l s l (y i, x, i)) =

e x p (\sum i (\sum k λ k t k (y i - 1, y i, x, i) + \sum l μ l s l (y i, x, i))) =

\prod i e x p (\sum k λ k t k (y i - 1, y i, x, i) + \sum l μ l s l (y i, x, i)) =

\prod i e x p (\sum k = 1 K w k f k (y i - 1, y i, x, i)) =

\prod i e x p (W i (y i - 1, y i | x)) = \prod i M i (y i - 1, y i | x) = \prod i M i (x)

其中第二步到第三步是根据

exp e x p 相加可以展开为连乘的特性，第三步到第四步用到了 1.2中的简化形式，后面就是直接套用

M M 的定义了。通过这个证明可以发现： 无论是先将所有得分先加起来做 exp 还是直接先 exp 再连乘，答案都是一样的！实现的时候，可以考虑这两种不同的方式！

2.前向-后向算法

条件随机场(CRF)完全由特征函数 tk,sl 和对应的权重 λk,μl 确定，我们需要利用前向-后向算法，计算出给定输入序列和对应的实际标签序列的 log−likelihood 概率值，然后通过最大化这个概率值，来更新上面特征和权重中的参数，实现学习的效果！ 学习完这些参数之后，对于一个给定的输入序列，我们可以用维特比算法找出当前参数下得分最高的预测标签序列！
这里讲解学习过程中一个很重要的算法，前向-后向算法！
对于每个指标 i=0,1,...,n+1 (包括了start和stop)，定义前向向量 αi(x) :

α 0 (y | x) = {1, 0, y = s t a r t 否 则 (11.26)

递推公式为:

α T i (x) = α T i - 1 (x) M i (x) (11.28)

αTi(yi|x) α i T ( y i | x ) 表示在位置

i i 的标记是

yi y i 并且到位置

i i 的前部分标记序列的非规范化概率，

yi y i 可取的值由

m m 个，所以

αi(x) α i ( x ) 是

m m 维列向量。为了更好的理解递推过程，我们可以对前几个

α α 进行展开，当然

M M 也进行相应的展开。

α 1 (x) = α 0 (x) M 1 (x) = α 0 (x) e x p (\sum k = 1 K w k f k (y 0, y 1, x, 1))

α 2 (x) = α 0 (x) e x p (\sum k = 1 K w k f k (y 0, y 1, x, 1)) e x p (\sum k = 1 K w k f k (y 1, y 2, x, 2))

. . . .

α i (x) = α 0 (x) e x p (\sum k = 1 K w k f k (y 0, y 1, x, 1)) . . . (\sum k = 1 K w k f k (y i - 1, y i, x, i))

注意，这里的连乘是

exp e x p 连乘，转换为先连加在

exp e x p 是等价的。
同样，对每个指标

i=0,1,...,n+1 i = 0 , 1 , . . . , n + 1 ,定义后向向量

βi(x) β i ( x ) :

β n + 1 (y n + 1 | x) = {1, 0, y n + 1 = s t o p 否 则 (11.29)

β i (y i | x) = [M i (y i, y i + 1 | x)] β i + 1 (y i + 1 | x)

又可以表示为

β i (x) = M i + 1 (x) β i + 1 (x)

βi(yi|x) β i ( y i | x ) 表示在位置

i i 的标记为

yi y i 并且从

i+1 i + 1 到

n n 的后部分标记序列的非规范化概率。
由前向-后向定义不难得到：

Z (x) = α T n (x) * 1 = 1 T * β 1 (x)

这里，

1 1 是元素均为1的

m m 维列向量。
你会发现，前后向算法本质上差不多，目的也是一样的，只是方向不同！

3.CRF优化问题

3.1正确序列的概率表达式

我们这里以bi-LSTM + CRF为例子。假设输入为:

X = (x 1, x 2, . . ., x n)

我们假设

P P 是通过

bi−LSTM b i − L S T M 预测的各个位置各标签的得分矩阵，大小为

n∗k n ∗ k ，

k k 是独立的标签的总数量，

Pi,j P i , j 是句中第

i i 个词预测第

j j 个标签的得分。假设句子预测的标签为:

y = (y 1, y 2, . . ., y n)

我们定义它的得分为:

s (X, y) = \sum i = 1 n A y i - 1, y i + \sum i = 1 n P i, y i 其 中 y 0 为 s t a r t 标 签

你可能会觉得这里为什么和1.1小节中的式(11.10)略有不同，(11.10)中分子中多了exp是因为它做了一个softmax操作！本质上二者是一致的(分子部分)。其中 Ai−1,yi 对应转换特征，仅仅有一个转换特征，也就是 k=1 ; Pi,yi 是状态特征，仅仅有一个，也就是 l=1 。其中

A A 标签转换得分矩阵，即从一种标签转化为另一种标签的分数，这是需要学习的参数；我们一般会为

A A 加上两个标签

start s t a r t 和

end e n d 标签，或者称为

stop s t o p ，分别对应

y0和yn+1 y 0 和 y n + 1 。
我们的目标是让目标标签序列的总体得分尽可能的大。用

softmax s o f t m a x 表示就是:

p (y | X) = e s ( X , y ) \sum y ˘ \in Y X e s ( X , y ˘ )

这个式子和式

(11.10) ( 11.10 ) 就完全等价了,其中

YX Y X 表示输入序列

X X 可能预测的所有标签序列集合。在训练的时候，我们一般是最大化正确标签序列对应的

log−probability l o g − p r o b a b i l i t y 值:

l o g (p (y | X)) = s (X, y) - l o g ⎛ ⎝ \sum y ˘ \in Y X e s (X, y ˘) ⎞ ⎠ = s (X, y) - l o g a d d y ˘ \in Y X s (X, y ˘)

所以，我们在计算这个

log−likelihood l o g − l i k e l i h o o d 概率时，需要计算两部分，前一部分对应分子部分，后一部分对应分母部分。我们希望能够迭代计算出相应的值！

3.2 计算log-likelihood概率

计算分两部分进行，第一部分是分子部分的值，也就是 s(X,y) ；第二部分是分母部分的值，也就是 log(∑y˘∈YXes(X,y˘)) 。

3.2.1 分子部分

首先给出 S(X,y) 分数计算方式:

S (X, y) = \sum i = 1 n A y i - 1, y i + \sum i = 1 n P i, y i

在代码实现中，我们是沿着句子中每个位置进行推进迭代的，也就是使用前向算法，我们列举每一步迭代的结果:

S 1 = \sum i = 1 1 A y i - 1, y i + \sum i = 1 1 P i, y i = A y 0, y 1 + P 1, y 1

S 2 = \sum i = 1 2 A y i - 1, y i + \sum i = 1 2 P i, y i = A y 0, y 1 + A y 1, y 2 + P 1, y 1 + P 2, y 2 = S 1 + A y 1, y 2 + P 2, y 2

... . . .

S n = \sum i = 1 n A y i - 1, y i + \sum i = 1 n P i, y i = S n - 1 + A y n - 1, y n + P n, y n

所以，我们在沿着句子中某个位置

i i 进行迭代时，只需要一直记录对应的

Si−1,A,P S i − 1 , A , P 这三项值，就能够计算出分子部分的值！

3.2.2 分母部分

分母部分的计算相对来说比较麻烦，也需要构造每一步迭代项，分母部分计算公式如下:

Z (X) = l o g ⎛ ⎝ \sum y ˘ \in Y X e s (X, y ˘) ⎞ ⎠ = l o g ⎛ ⎝ \sum y ˘ \in Y X e x p (\sum i = 1 n A y i - 1, y i + \sum i = 1 n P i, y i) ⎞ ⎠

我们也按照句子中的每一个位置进行展开！

Z 1 = l o g ⎛ ⎝ \sum y ˘ \in t a g s e x p (\sum i = 1 1 A y i - 1, y i + \sum i = 1 1 P i, y i) ⎞ ⎠ =

l o g ⎛ ⎝ \sum y ˘ \in t a g s e x p (A y 0 ˘, y 1 ˘ + P 1, y ˘ 1) ⎞ ⎠ (3, 1)

其中 tags 表示所有标签集合， y˘i 表示位置 i 的对应的任意标签。

Z 2 = l o g ⎛ ⎝ \sum y ˘ \in t a g s e x p (\sum i = 1 2 A y ˘ i - 1, y ˘ i + \sum i = 1 n P i, y ˘ i) ⎞ ⎠ =

l o g ⎛ ⎝ \sum y ˘ \in t a g s e x p (A y ˘ 0, y ˘ 1 + A y ˘ 1, y ˘ 2 + P 1, y ˘ 1 + P 2, y ˘ 2) ⎞ ⎠ =

l o g ⎛ ⎝ \sum y ˘ \in t a g s e x p (A y ˘ 0, y ˘ 1 + P 1, y ˘ 1) e x p (A y ˘ 1, y ˘ 2 + P 2, y ˘ 2) ⎞ ⎠ =

l o g ⎛ ⎝ \sum y ˘ \in t a g s e x p (A y ˘ 0, y ˘ 1 + P 1, y ˘ 1) \sum y ˘ \in t a g s e x p (A y ˘ 1, y ˘ 2 + P 2, y ˘ 2) ⎞ ⎠ (3, 2)

从第三步到第四步可以展开为两个求和，因为长度为2的任意标签序列是两个长度为1的任意标签序列的任意组合。注意根据式

(3,1) ( 3 , 1 )

Z 1 = l o g ⎛ ⎝ \sum y ˘ \in t a g s e x p (A y 0 ˘, y 1 ˘ + P 1, y ˘ 1) ⎞ ⎠

,
所以

e x p (Z 1) = \sum y ˘ \in t a g s e x p (A y ˘ 0, y ˘ 1 + P 1, y ˘ 1) (3, 4)

将这个式子带入到式子

(3.2) ( 3.2 ) 的前半部分，所以:

Z 2 = l o g ⎛ ⎝ e x p (Z 1) \sum y ˘ \in t a g s e x p (A y ˘ 1, y ˘ 2 + P 2, y ˘ 2) ⎞ ⎠ =

l o g ⎛ ⎝ \sum y ˘ \in t a g s e x p (Z 1 + A y ˘ 1, y ˘ 2 + P 2, y ˘ 2) ⎞ ⎠

这里 Z1 可以直接放进去是因为此时的 Z1 已经计算出来了，是一个常量值了。
进行推广:

.... . . . .

Z n = l o g ⎛ ⎝ \sum y ˘ \in t a g s e x p (Z n - 1 + A y ˘ n - 1, y ˘ n + P 2, y ˘ 2) ⎞ ⎠

这样我们也找到了递推项，当我们沿着句子的每个位置进行迭代时，只需要一直记录对应的

Zi−1,A,P Z i − 1 , A , P 这三个值，就可以计算出分母部分的值。

4.CRF学习算法

一般使用梯度下降法， tensorflow 和 pytorch 等学习工具都提供了梯度下降法的支持！

5.源码解读

下面对allennlp中提供的CRF源码进行解读！代码如下:

def allowed_transitions(constraint_type: str, tokens: Dict[int, str]) -> List[Tuple[int, int]]:
    """
    Given tokens and a constraint type, returns the allowed transitions. It will
    additionally include transitions for the start and end states, which are used
    by the conditional random field.

    Parameters
    ----------
    constraint_type : ``str``, required
        Indicates which constraint to apply. Current choices are "BIO" and "BIOUL".
    tokens : ``Dict[int, str]``, required
        A mapping {token_id -> token}. Most commonly this would be the value from
        Vocabulary.get_index_to_token_vocabulary()
        这应该是标签的tokens, 即所有的标签列表->id列表，类似于idx2tag

    Returns
    -------
    ``List[Tuple[int, int]]``
        The allowed transitions (from_token_id, to_token_id).

    这个方法的作用是，预选准备�

系统学习Python——并发模型和异步编程：进程、线程和GIL
分类目录：《系统学习Python》总目录在文章《并发模型和异步编程：基础知识》我们简单介绍了Python中的进程、线程和协程。本文就着重介绍Python中的进程、线程和GIL的关系。Python解释器的每个实例都是一个进程。使用multiprocessing或concurrent.futures库可以启动额外的Python进程。Python的subprocess库用于启动运行外部程序（不管使用何种
Flask框架入门：快速搭建轻量级Python网页应用「已注销」 python-AI python基础网站网络 python flask 后端
转载：Flask框架入门：快速搭建轻量级Python网页应用1.Flask基础Flask是一个使用Python编写的轻量级Web应用框架。它的设计目标是让Web开发变得快速简单，同时保持应用的灵活性。Flask依赖于两个外部库：Werkzeug和Jinja2，Werkzeug作为WSGI工具包处理Web服务的底层细节，Jinja2作为模板引擎渲染模板。安装Flask非常简单，可以使用pip安装命令
Python Flask 框架入门：快速搭建 Web 应用的秘诀 Python编程之道 Python人工智能与大数据 Python编程之道 python flask 前端 ai
PythonFlask框架入门：快速搭建Web应用的秘诀关键词Flask、微框架、路由系统、Jinja2模板、请求处理、WSGI、Web开发摘要想快速用Python搭建一个灵活的Web应用？Flask作为“微框架”代表，凭借轻量、可扩展的特性，成为初学者和小型项目的首选。本文将从Flask的核心概念出发，结合生活化比喻、代码示例和实战案例，带你一步步掌握：如何用Flask搭建第一个Web应用？路由
python_虚拟环境阿_焦 python
第一、配置虚拟环境：virtualenv（1）pipvirtualenv>安装虚拟环境包（2）pipinstallvirtualenvwrapper-win>安装虚拟环境依赖包（3）c盘创建虚拟目录>C:\virtualenv>配置环境变量【了解一下】：（1）如何使用virtualenv创建虚拟环境a、cd到C:\virtualenv目录下：b、mkvirtualenvname>创建虚拟环境nam
Python爱心光波
系列文章序号直达链接Tkinter1Python李峋同款可写字版跳动的爱心2Python跳动的双爱心3Python蓝色跳动的爱心4Python动漫烟花5Python粒子烟花Turtle1Python满屏飘字2Python蓝色流星雨3Python金色流星雨4Python漂浮爱心5Python爱心光波①6Python爱心光波②7Python满天繁星8Python五彩气球9Python白色飘雪10Pyt
Python流星雨 Want595 python 开发语言
文章目录系列文章写在前面技术需求完整代码代码分析1.模块导入2.画布设置3.画笔设置4.颜色列表5.流星类(Star)6.流星对象创建7.主循环8.流星运动逻辑9.视觉效果10.总结写在后面系列文章序号直达链接表白系列1Python制作一个无法拒绝的表白界面2Python满屏飘字表白代码3Python无限弹窗满屏表白代码4Python李峋同款可写字版跳动的爱心5Python流星雨代码6Python
Python之七彩花朵代码实现 PlutoZuo Python python 开发语言
Python之七彩花朵代码实现文章目录Python之七彩花朵代码实现下面是一个简单的使用Python的七彩花朵。这个示例只是一个简单的版本，没有很多高级功能，但它可以作为一个起点，你可以在此基础上添加更多功能。importturtleastuimportrandomasraimportmathtu.setup(1.0,1.0)t=tu.Pen()t.ht()colors=['red','skybl
Python 脚本最佳实践2025版
前文可以直接把这篇文章喂给AI,可以放到AI角色设定里,也可以直接作为提示词.这样,你只管提需求,写脚本就让AI来.概述追求简洁和清晰：脚本应简单明了。使用函数(functions)、常量(constants)和适当的导入(import)实践来有逻辑地组织你的Python脚本。使用枚举(enumerations)和数据类(dataclasses)等数据结构高效管理脚本状态。通过命令行参数增强交互性
（Python基础篇）了解和使用分支结构 EternityArt 基础篇 python
目录一、引言二、Python分支结构的类型与语法（一）if语句（单分支）（二）if-else语句（双分支）（三）if-elif-else语句（多分支）三、分支结构的应用场景（一）提示用户输入用户名，然后再提示输入密码，如果用户名是“admin”并且密码是“88888”则提示正确，否则，如果用户名不是admin还提示用户用户名不存在,（二）提示用户输入用户名，然后再提示输入密码，如果用户名是“adm
（Python基础篇）循环结构 EternityArt 基础篇 python
一、什么是Python循环结构？循环结构是编程中重复执行代码块的机制。在Python中，循环允许你：1.迭代处理数据：遍历列表、字典、文件内容等。2.自动化重复任务：如批量处理数据、生成序列等。3.控制执行流程：根据条件决定是否继续或终止循环。二、为什么需要循环结构？假设你需要打印1到100的所有偶数：没有循环：需手动编写100行print()语句。print(0)print(2)print(4)
（Python基础篇）字典的操作 EternityArt 基础篇 python 开发语言
一、引言在Python编程中，字典（Dictionary）是一种极具灵活性的数据结构，它通过“键-值对”（key-valuepair）的形式存储数据，如同现实生活中的字典——通过“词语（键）”快速查找“释义（值）”。相较于列表和元组的有序索引访问，字典的优势在于基于键的快速查找，这使得它在处理需要频繁通过唯一标识获取数据的场景中极为高效。掌握字典的操作，能让我们更高效地组织和管理复杂数据，是Pyt
Python七彩花朵 Want595 python 开发语言
系列文章序号直达链接Tkinter1Python李峋同款可写字版跳动的爱心2Python跳动的双爱心3Python蓝色跳动的爱心4Python动漫烟花5Python粒子烟花Turtle1Python满屏飘字2Python蓝色流星雨3Python金色流星雨4Python漂浮爱心5Python爱心光波①6Python爱心光波②7Python满天繁星8Python五彩气球9Python白色飘雪10Pyt
用OpenCV标定相机内参应用示例（C++和Python）
下面是一个完整的使用OpenCV进行相机内参标定（CameraCalibration）的示例，包括C++和Python两个版本，基于棋盘格图案标定。一、目标：相机标定通过拍摄多张带有棋盘格图案的图像，估计相机的内参：相机矩阵（内参）K畸变系数distCoeffs可选外参（R,T）标定精度指标（如重投影误差）二、棋盘格参数设置（根据自己的棋盘格设置）：棋盘格角点数：9x6（内角点，9列×6行）；每个
Anaconda 详细下载与安装教程
Anaconda详细下载与安装教程1.简介Anaconda是一个用于科学计算的开源发行版，包含了Python和R的众多常用库。它还包括了conda包管理器，可以方便地安装、更新和管理各种软件包。2.下载Anaconda2.1访问官方网站首先，打开浏览器，访问Anaconda官方网站。2.2选择适合的版本在页面中，你会看到两个主要的下载选项：AnacondaIndividualEdition：适用于
python中 @注解及内置注解的使用方法总结以及完整示例慧一居士 Python python
在Python中，装饰器（Decorator）使用@符号实现，是一种修改函数/类行为的语法糖。它本质上是一个高阶函数，接受目标函数作为参数并返回包装后的函数。Python也提供了多个内置装饰器，如@property、@staticmethod、@classmethod等。一、核心概念装饰器本质：@decorator等价于func=decorator(func)执行时机：在函数/类定义时立即执行装饰
Python中的静态方法和类方法详解
在Python中，`@staticmethod`和`@classmethod`是两种装饰器，它们用于定义类中的方法，但是它们的行为和用途有所不同。###@staticmethod`@staticmethod`装饰器用于定义一个静态方法。静态方法不接收类或实例的引用作为第一个参数，因此它不能访问类的状态或实例的状态。静态方法可以看作是与类关联的普通函数，但它们可以通过类名直接调用。classMath
Python中类静态方法：@classmethod/@staticmethod详解和实战示例
在Python中，类方法(@classmethod)和静态方法(@staticmethod)是类作用域下的两种特殊方法。它们使用装饰器定义，并且与实例方法(deffunc(self))的行为有所不同。1.三种方法的对比概览方法类型是否访问实例(self)是否访问类(cls)典型用途实例方法✅是❌否访问对象属性类方法@classmethod❌否✅是创建类的替代构造器，访问类变量等静态方法@stati
Python多版本管理与pip升级全攻略：解决冲突与高效实践码界奇点 Python python pip 开发语言 python3.11 源代码管理虚拟现实依赖倒置原则
引言Python作为最流行的编程语言之一，其版本迭代速度与生态碎片化给开发者带来了巨大挑战。据统计，超过60%的Python开发者需要同时维护基于Python3.6+和Python2.7的项目。本文将系统解决以下核心痛点：如何安全地在同一台机器上管理多个Python版本pip依赖冲突的根治方案符合PEP标准的生产环境最佳实践第一部分：Python多版本管理核心方案1.1系统级多版本共存方案Wind
基于Python的健身数据分析工具的搭建流程day1 weixin_45677320 python 开发语言数据挖掘爬虫
基于Python的健身数据分析工具的搭建流程分数据挖掘、数据存储和数据分析三个步骤。本文主要介绍利用Python实现健身数据分析工具的数据挖掘部分。第一步：加载库加载本文需要的库，如下代码所示。若库未安装，请按照python如何安装各种库（保姆级教程）_python安装库-CSDN博客https://blog.csdn.net/aobulaien001/article/details/133298
seaborn又一个扩展heatmapz qq_21478261 #Python可视化 matplotlib
推荐阅读：Pythonmatplotlib保姆级教程嫌Matplotlib繁琐？试试Seaborn！
NGS测序基础梳理01-文库构建（Library Preparation） qq_21478261 #生物信息生物学
本文介绍Illumina测序平台文库构建（LibraryPreparation）步骤，文库结构。写作时间：2020.05。推荐阅读：10W字《Python可视化教程1.0》来了！一份由公众号「pythonic生物人」精心制作的PythonMatplotlib可视化系统教程，105页PDFhttps://mp.weixin.qq.com/s/QaSmucuVsS_DR-klfpE3-Q10W字《Rg
Python 常用内置函数详解（七）：dir()函数——获取当前本地作用域中的名称列表或对象的有效属性列表
目录一、功能二、语法和示例一、功能dir()函数获取当前本地作用域中的名称列表或对象的有效属性列表。二、语法和示例dir()函数有两种形式，如果没有实参，则返回当前本地作用域中的名称列表。如果有实参，它会尝试返回该对象的有效属性列表。如果对象有一个名为__dir__()的方法，那么该方法将被调用，并且必须返回一个属性列表。dir()函数的语法格式如下：C:\Users\amoxiang>ipyth
pythonjson中list操作_Python json.dumps 特殊数据类型的自定义序列化操作
场景描述：Python标准库中的json模块，集成了将数据序列化处理的功能；在使用json.dumps()方法序列化数据时候，如果目标数据中存在datetime数据类型，执行操作时，会抛出异常：TypeError:datetime.datetime(2016,12,10,11,04,21)isnotJSONserializable那么遇到json.dumps序列化不支持的数据类型，该怎么办！首先，
Python 日期格式转json.dumps的解决方法 douyaoxin python json 开发语言
classDateEncoder(json.JSONEncoder):defdefault(self,obj):ifisinstance(obj,datetime.datetime):returnobj.strftime('%Y-%m-%d%H:%M:%S')elifisinstance(obj,datetime.date):returnobj.strftime("%Y-%m-%d")json.d
Python 爬虫实战：视频平台播放量实时监控（含反爬对抗与数据趋势预测）西攻城狮北 python 爬虫音视频
一、引言在数字内容蓬勃发展的当下，视频平台的播放量数据已成为内容创作者、营销人员以及行业分析师手中极为关键的情报资源。它不仅能够实时反映内容的受欢迎程度，更能在竞争分析、营销策略制定以及内容优化等方面发挥不可估量的作用。然而，视频平台为了保护自身数据和用户隐私，往往会设置一系列反爬虫机制，对数据爬取行为进行限制。这就向我们发起了挑战：如何巧妙地突破这些限制，同时精准地捕捉并预测播放量的动态变化趋势
Python技能手册 - 模块module 金色牛神 Python python windows 开发语言
系列Python常用技能手册-基础语法Python常用技能手册-模块modulePython常用技能手册-包package目录module模块指什么typing数据类型int整数float浮点数str字符串bool布尔值TypeVar类型变量functools高阶函数工具functools.partial()函数偏置functools.lru_cache()函数缓存sorted排序列表排序元组排序
深度学习模型表征提取全解析 ZhangJiQun&MXP 教学 2024大模型以及算力 2021 AI python 深度学习人工智能 python embedding 语言模型
模型内部进行表征提取的方法在自然语言处理（NLP）中，“表征（Representation）”指将文本（词、短语、句子、文档等）转化为计算机可理解的数值形式（如向量、矩阵），核心目标是捕捉语言的语义、语法、上下文依赖等信息。自然语言表征技术可按“静态/动态”“有无上下文”“是否融入知识”等维度划分一、传统静态表征（无上下文，词级为主）这类方法为每个词分配固定向量，不考虑其在具体语境中的含义（无法解
Ubuntu基础（Python虚拟环境和Vue） aaiier ubuntu python linux
Python虚拟环境sudoaptinstallpython3python3-venv进入项目目录cdXXX创建虚拟环境python3-mvenvvenv激活虚拟环境sourcevenv/bin/activate退出虚拟环境deactivateVue安装Node.js和npm#安装Node.js和npm（Ubuntu默认仓库可能版本较旧，适合入门）sudoaptinstallnodejsnpm#验
苦练Python第9天：if-else分支九剑 python后端前端人工智能
苦练Python第9天：if-else分支九剑前言大家好，我是倔强青铜三。是一名热情的软件工程师，我热衷于分享和传播IT技术，致力于通过我的知识和技能推动技术交流与创新，欢迎关注我，微信公众号：倔强青铜三。欢迎点赞、收藏、关注，一键三连！！！欢迎来到100天Python挑战第9天！今天我们不练循环，改磨“分支剑法”——ifelse三式：单分支、双分支、多分支，以及嵌套和三元运算符，全部实战演练，让
苦练Python第8天：while 循环之妙用 python后端前端人工智能
苦练Python第8天：while循环之妙用原文链接：https://dev.to/therahul_gupta/day-9100-while-loops-with-real-world-examples-528f作者：RahulGupta译者：倔强青铜三前言大家好，我是倔强青铜三。是一名热情的软件工程师，我热衷于分享和传播IT技术，致力于通过我的知识和技能推动技术交流与创新，欢迎关注我，微信公众
JAVA中的Enum 周凡杨 java enum 枚举
Enum是计算机编程语言中的一种数据类型---枚举类型。在实际问题中，有些变量的取值被限定在一个有限的范围内。例如，一个星期内只有七天我们通常这样实现上面的定义： public String monday; public String tuesday; public String wensday; public String thursday
赶集网mysql开发36条军规 Bill_chen mysql 业务架构设计 mysql调优 mysql性能优化
(一)核心军规 (1)不在数据库做运算 cpu计算务必移至业务层； (2)控制单表数据量 int型不超过1000w，含char则不超过500w；合理分表；限制单库表数量在300以内； (3)控制列数量字段少而精，字段数建议在20以内
Shell test命令 daizj shell 字符串 test 数字文件比较
Shell test命令 Shell中的 test 命令用于检查某个条件是否成立，它可以进行数值、字符和文件三个方面的测试。数值测试参数说明 -eq 等于则为真 -ne 不等于则为真 -gt 大于则为真 -ge 大于等于则为真 -lt 小于则为真 -le 小于等于则为真实例演示： num1=100 num2=100if test $[num1]
XFire框架实现WebService(二) 周凡杨 java webservice
有了XFire框架实现WebService(一)，就可以继续开发WebService的简单应用。 Webservice的服务端(WEB工程)：两个java bean类： Course.java package cn.com.bean; public class Course { private
重绘之画图板朱辉辉33 画图板
上次博客讲的五子棋重绘比较简单，因为只要在重写系统重绘方法paint（）时加入棋盘和棋子的绘制。这次我想说说画图板的重绘。画图板重绘难在需要重绘的类型很多，比如说里面有矩形，园，直线之类的，所以我们要想办法将里面的图形加入一个队列中，这样在重绘时就
Java的IO流西蜀石兰 java
刚学Java的IO流时，被各种inputStream流弄的很迷糊，看老罗视频时说想象成插在文件上的一根管道，当初听时觉得自己很明白，可到自己用时，有不知道怎么代码了。。。每当遇到这种问题时，我习惯性的从头开始理逻辑，会问自己一些很简单的问题，把这些简单的问题想明白了，再看代码时才不会迷糊。 IO流作用是什么？答：实现对文件的读写，这里的文件是广义的； Java如何实现程序到文件
No matching PlatformTransactionManager bean found for qualifier 'add' - neither 林鹤霄
java.lang.IllegalStateException: No matching PlatformTransactionManager bean found for qualifier 'add' - neither qualifier match nor bean name match! 网上找了好多的资料没能解决，后来发现：项目中使用的是xml配置的方式配置事务，但是
Row size too large (> 8126). Changing some columns to TEXT or BLOB aigo column
原文：http://stackoverflow.com/questions/15585602/change-limit-for-mysql-row-size-too-large 异常信息： Row size too large (> 8126). Changing some columns to TEXT or BLOB or using ROW_FORMAT=DYNAM
JS 格式化时间 alxw4616 JavaScript
/** * 格式化时间 2013/6/13 by 半仙 [email protected] * 需要 pad 函数 * 接收可用的时间值. * 返回替换时间占位符后的字符串 * * 时间占位符:年 Y 月 M 日 D 小时 h 分 m 秒 s 重复次数表示占位数 * 如 YYYY 4占4位 YY 占2位<p></p> * MM DD hh mm
队列中数据的移除问题百合不是茶队列移除
队列的移除一般都是使用的remov();都可以移除的,但是在昨天做线程移除的时候出现了点问题,没有将遍历出来的全部移除, 代码如下; // package com.Thread0715.com; import java.util.ArrayList; public class Threa
Runnable接口使用实例 bijian1013 java thread Runnable java多线程
Runnable接口 a. 该接口只有一个方法：public void run(); b. 实现该接口的类必须覆盖该run方法 c. 实现了Runnable接口的类并不具有任何天
oracle里的extend详解 bijian1013 oracle 数据库 extend
扩展已知的数组空间，例： DECLARE TYPE CourseList IS TABLE OF VARCHAR2(10); courses CourseList; BEGIN -- 初始化数组元素，大小为3 courses := CourseList('Biol 4412 ', 'Psyc 3112 ', 'Anth 3001 '); --
【httpclient】httpclient发送表单POST请求 bit1129 httpclient
浏览器Form Post请求浏览器可以通过提交表单的方式向服务器发起POST请求，这种形式的POST请求不同于一般的POST请求 1. 一般的POST请求，将请求数据放置于请求体中，服务器端以二进制流的方式读取数据，HttpServletRequest.getInputStream()。这种方式的请求可以处理任意数据形式的POST请求，比如请求数据是字符串或者是二进制数据 2. Form
【Hive十三】Hive读写Avro格式的数据 bit1129 hive
1. 原始数据 hive> select * from word; OK 1 MSN 10 QQ 100 Gtalk 1000 Skype 2. 创建avro格式的数据表 hive> CREATE TABLE avro_table(age INT, name STRING)STORE
nginx+lua+redis自动识别封解禁频繁访问IP ronin47
在站点遇到攻击且无明显攻击特征，造成站点访问慢，nginx不断返回502等错误时，可利用nginx+lua+redis实现在指定的时间段内，若单IP的请求量达到指定的数量后对该IP进行封禁，nginx返回403禁止访问。利用redis的expire命令设置封禁IP的过期时间达到在指定的封禁时间后实行自动解封的目的。一、安装环境： CentOS x64 release 6.4(Fin
java-二叉树的遍历-先序、中序、后序（递归和非递归）、层次遍历 bylijinnan java
import java.util.LinkedList; import java.util.List; import java.util.Stack; public class BinTreeTraverse { //private int[] array={ 1, 2, 3, 4, 5, 6, 7, 8, 9 }; private int[] array={ 10,6,
Spring源码学习-XML 配置方式的IoC容器启动过程分析 bylijinnan java spring IOC
以FileSystemXmlApplicationContext为例，把Spring IoC容器的初始化流程走一遍： ApplicationContext context = new FileSystemXmlApplicationContext ("C:/Users/ZARA/workspace/HelloSpring/src/Beans.xml&q
[科研与项目]民营企业请慎重参与军事科技工程 comsci 企业
军事科研工程和项目并非要用最先进，最时髦的技术，而是要做到“万无一失” 而民营科技企业在搞科技创新工程的时候，往往考虑的是技术的先进性，而对先进技术带来的风险考虑得不够，在今天提倡军民融合发展的大环境下，这种“万无一失”和“时髦性”的矛盾会日益凸显。。。。。。所以请大家在参与任何重大的军事和政府项目之前，对
spring 定时器-两种方式 cuityang spring quartz 定时器
方式一：间隔一定时间运行 <bean id="updateSessionIdTask" class="com.yang.iprms.common.UpdateSessionTask" autowire="byName" /> <bean id="updateSessionIdSchedule
简述一下关于BroadView站点的相关设计 damoqiongqiu view
终于弄上线了，累趴，戳这里http://www.broadview.com.cn 简述一下相关的技术点前端：jQuery+BootStrap3.2+HandleBars，全站Ajax（貌似对SEO的影响很大啊！怎么破？），用Grunt对全部JS做了压缩处理，对部分JS和CSS做了合并（模块间存在很多依赖，全部合并比较繁琐，待完善）。后端：U
运维 PHP问题汇总 dcj3sjt126com windows2003
1、Dede(织梦)发表文章时,内容自动添加关键字显示空白页解决方法：后台>系统>系统基本参数>核心设置>关键字替换（是/否），这里选择“是”。后台>系统>系统基本参数>其他选项>自动提取关键字，这里选择“是”。 2、解决PHP168超级管理员上传图片提示你的空间不足网站是用PHP168做的，反映使用管理员在后台无法
mac 下安装php扩展 - mcrypt dcj3sjt126com PHP
MCrypt是一个功能强大的加密算法扩展库，它包括有22种算法，phpMyAdmin依赖这个PHP扩展，具体如下：下载并解压libmcrypt-2.5.8.tar.gz。在终端执行如下命令： tar zxvf libmcrypt-2.5.8.tar.gz cd libmcrypt-2.5.8/ ./configure --disable-posix-threads --
MongoDB更新文档 [四] eksliang mongodb Mongodb更新文档
MongoDB更新文档转载请出自出处：http://eksliang.iteye.com/blog/2174104 MongoDB对文档的CURD，前面的博客简单介绍了，但是对文档更新篇幅比较大，所以这里单独拿出来。语法结构如下： db.collection.update( criteria, objNew, upsert, multi) 参数含义参数
Linux下的解压，移除，复制，查看tomcat命令 y806839048 tomcat
重复myeclipse生成webservice有问题删除以前的，干净 1、先切换到：cd usr/local/tomcat5/logs 2、tail -f catalina.out 3、这样运行时就可以实时查看运行日志了 Ctrl+c 是退出tail命令。有问题不明的先注掉 cp /opt/tomcat-6.0.44/webapps/g
Spring之使用事务缘由(3-XML实现) ihuning spring
用事务通知声明式地管理事务事务管理是一种横切关注点。为了在 Spring 2.x 中启用声明式事务管理，可以通过 tx Schema 中定义的 <tx:advice> 元素声明事务通知，为此必须事先将这个 Schema 定义添加到 <beans> 根元素中去。声明了事务通知后，就需要将它与切入点关联起来。由于事务通知是在 <aop:
GCD使用经验与技巧浅谈啸笑天 GC
前言 GCD(Grand Central Dispatch)可以说是Mac、iOS开发中的一大“利器”，本文就总结一些有关使用GCD的经验与技巧。 dispatch_once_t必须是全局或static变量这一条算是“老生常谈”了，但我认为还是有必要强调一次，毕竟非全局或非static的dispatch_once_t变量在使用时会导致非常不好排查的bug，正确的如下： 1
linux（Ubuntu）下常用命令备忘录1 macroli linux 工作 ubuntu
在使用下面的命令是可以通过--help来获取更多的信息1,查询当前目录文件列表：ls ls命令默认状态下将按首字母升序列出你当前文件夹下面的所有内容，但这样直接运行所得到的信息也是比较少的，通常它可以结合以下这些参数运行以查询更多的信息： ls / 显示/.下的所有文件和目录 ls -l 给出文件或者文件夹的详细信息 ls -a 显示所有文件，包括隐藏文
nodejs同步操作mysql qiaolevip 学习永无止境每天进步一点点 mysql nodejs
// db-util.js var mysql = require('mysql'); var pool = mysql.createPool({ connectionLimit : 10, host: 'localhost', user: 'root', password: '', database: 'test', port: 3306 });
一起学Hive系列文章 superlxw1234 hive Hive入门
[一起学Hive]系列文章目录贴，入门Hive，持续更新中。 [一起学Hive]之一—Hive概述，Hive是什么 [一起学Hive]之二—Hive函数大全-完整版 [一起学Hive]之三—Hive中的数据库(Database)和表(Table) [一起学Hive]之四-Hive的安装配置 [一起学Hive]之五-Hive的视图和分区 [一起学Hive
Spring开发利器：Spring Tool Suite 3.7.0 发布 wiselyman spring
Spring Tool Suite(简称STS)是基于Eclipse，专门针对Spring开发者提供大量的便捷功能的优秀开发工具。在3.7.0版本主要做了如下的更新：将eclipse版本更新至Eclipse Mars 4.5 GA Spring Boot(JavaEE开发的颠覆者集大成者，推荐大家学习)的配置语言YAML编辑器的支持(包含自动提示，