oldmao_2000

22[NLP训练营]Word2Vec

文章目录

Global Generation vs Local Generation
Intuition of Word2Vec
- 参数θ
- 目标函数的形式
- Another Formulation
Negative Sampling
- SG的负采样
- 负采样的梯度下降
SG的缺点
Learning with Subword
Subword小结
ELMO简介

公式输入请参考：在线Latex公式
之前在深度带读里面有写过，再重新整理一下，不然缺22课。
https://github.com/dav/word2vec/blob/master/src/word2vec.c
学Word2Vec之前要明白为什么要学它，或者说这个算法发明出来的动机是啥。这里要知道原来的单词独热编码表征有什么缺点。之前有总结过，直接贴过来：

One-hot representation：对应的词所在的位置设为1，其他为0。
缺点：
·语义鸿沟问题（词与词之间无法表示关系）
·维度灾难、稀疏（向量大小和词典大小一样，但是只有一位上面有值）
·无法表示未出现的词汇（未知单词都是相同表示的）

分布式表示–词向量（word embedding）：
·词表示为：[0.792，-0.177，-0.107，0.109，0.542.…]
·常见维度50或者100，就可以表示所有的单词。
·解决“语义鸿沟"问题
·可以通过计算向量之间的距离（欧式距离、余弦距离等）来体现词与词的相似性
二者还有一个重要的区别：

Global Generation vs Local Generation

One-hot representation属于Local Generation
Distributed representation属于Global Generation
前者从原始数据直接生成表示，类似下图

后者在生成表示前还有一个中间步骤（可以看做是share parameter），然后最后的表征是由多个中间步骤生成的

后者的泛化性要比前者强，理由如下，如果是One-hot representation，如果观测值（例如第一个圈圈）只出现1次，那么靠第一个圈圈预测隐含参数比较困难，当然，如果观测值（例如第二个圈圈）出现30次，那么预测隐含参数会相对比较简单。但是在Distributed representation情况下，观测值（例如第一个圈圈）只出现1次并不影响模型推测隐含参数，因为，和第一个圈圈相关的中间步骤还生成了其他观测值，如果其他观测值出现的次数足够多，当然也可以很好的推测出隐含参数，因此后者的泛化性能好。

Intuition of Word2Vec

Word2Vec算法是基于这么一个假设的，在一个句子中相邻词语倾向于拥有相似的词向量表征。
对于某个句子：
We are working on NLP project, it is interesting.
我们希望用中心词预测周围词（skip gram在实作上比CBOW要常见一些），那么模型训练的目标就是（考虑窗口大小为2，就是看当前词的前后共4个单词的范围）：
$maximize\{p(are|we)p(are|working |we)p(we|are)p(working |are)p(on|are)p(we|working)p(are|working)p(on|working)p(NLP|working)\cdots\}$
然后抽象为数学表达，用 $c$ 表示上下文词，用 $w$ 表示当前词，Text表示为当前句子单词的集合，Context(w)表示为当前词上下文集合， $\theta$ 为模型参数，那么模型就是要使得这些概率最大化：
$arg\underset{\theta}{\max}\prod_{w\in Text}\prod_{c\in Context(w)}p(c|w;\theta)$
求极大值，因此取log不改变极大性质，但连乘变成连加：
$arg\underset{\theta}{\max}\sum_{w\in Text}\sum_{c\in Context(w)}\log p(c|w;\theta)\tag1$

参数θ

上式中参数 $\theta$ 实际上就是模型要学习的词向量，在不同的文章里面貌似这个玩意还有点点不一样，这里的形式是：
$\theta=[u,v]$
$u, v$ 是大小一模一样的矩阵，其大小是 $V\times k$ ，V是词库大小，k是词向量大小，一般是50或者100。
$u, v$ 都是单词的词向量，这里分别设置 $u, v$ 原因在于在公式1中，每个单词有两种角色，一种是中心词，一种是上下文，因此学习出来的结果也有两种，也有研究人员把这两个矩阵concat起来用，貌似效果也不错。这里最后取v作为最终的词向量表征。

目标函数的形式

虽然公式1是我们训练的目标，但是里面的概率还没有具体的形式，我们希望这个最终的数学表达可以使得中心词和上下文词出现的概率p最大，因此考虑的表达为：
$e^{u_c\cdot v_w}$
$u_c\cdot v_w$ 是两个向量的内积，也就是相似度，二者越像，就会越大，但是这个玩意的值域不在概率p的[0,1]之间，因此这里借鉴了softmax的思想，除以一个归一化项：
$p(c|w;\theta)=\cfrac{e^{u_c\cdot v_w}}{\sum_{c'}e^{u_{c'}\cdot v_w}}$
这里 $c^{'}$ 表示词库中所有的词。
那么目标函数可以写为：
$arg\underset{\theta}{\max}\sum_{w\in Text}\sum_{c\in Context(w)}\log \cfrac{e^{u_c\cdot v_w}}{\sum_{c'}e^{u_{c'}\cdot v_w}}\\ =arg\underset{\theta}{\max}\sum_{w\in Text}\sum_{c\in Context(w)}e^{u_c\cdot v_w}-\log\sum_{c'}e^{u_{c'}\cdot v_w}\tag2$
公式2中的 $\sum_{c'}e^{u_{c'}\cdot v_w}$ 涉及到了词库中所有的单词，因此其时间复杂度为： $O (∣ V ∣)$

Another Formulation

在优化公式2（正常操作是要对公式2用梯度下降求解参数 $\theta$ 的，但是复杂度太高，需要优化）之前，我们先把公式1换一种形式来理解。
假设我们有一句话：
$S=w_1w_2w_3w_4w_5w_6$
如果以 $w_3$ 为中心词，窗口大小考虑2的情况下，模型需要最大化以下概率：
$p(w_1|w_3)\\ p(w_2|w_3)\\ p(w_4|w_3)\\ p(w_5|w_3)$
上面的表达可以换一种方式来写：
$p(D=1|w_1,w_3)\\ p(D=1|w_2,w_3)\\ p(D=1|w_4,w_3)\\ p(D=1|w_5,w_3)$
可以看到到，当两个单词存在上下文关系，则可以用上面的方式来写，如果不存在则可以写为：
$p(D=0|w_5,w_1)$
抽象为数学表达为：
$w_i,w_j二者有上下文关系：p(D=1|w_i;w_j;\theta)\\ w_i,w_j二者没有上下文关系：p(D=0|w_i;w_j;\theta)$
当 $w_i,w_j$ 二者有上下文关系，我们希望 $p(D=1|w_i;w_j;\theta)$ 越大越好，同理，当 $w_i,w_j$ 二者没有上下文关系，我们希望 $p(D=0|w_i;w_j;\theta)$ 越大越好。
同样的思路，我们把概率用具体的数学公式表达出来，使其满足上面的描述，借鉴逻辑回归的公式可以写为：
$p(D=1|w_i;w_j;\theta)=\cfrac{1}{1+\exp^{-u_{w_i}\cdot v_{w_j}}}$
有了这个就可以来推负采样了。

Negative Sampling

把新的目标函数写出来：
$arg\underset{\theta}{\max}\prod_{(w,c)\in D}p(D=1|w;c;\theta)\prod_{(w,c)\notin D}p(D=0|w;c;\theta)\tag3$
这里 $(w,c)\in D$ 表示中心词和上下文词组成单词对的集合
$(w,c)\notin D$ 表示中心词和非上下文词组成单词对的集合，也就是负样本

假如一句话长成这样：ABCD
那么 $(w,c)\in D=\{AB,BC,CD,BA,CB,DC\}$
$(w,c)\notin D=\{AC,CA,AD,DA,BD,DB\}$

然后把概率的数学表达带入公式3：
$arg\underset{\theta}{\max}\prod_{(w,c)\in D}\cfrac{1}{1+\exp^{-u_{c}\cdot v_{w}}}\prod_{(w,c)\notin D}\left[1-\cfrac{1}{1+\exp^{-u_{c}\cdot v_{w}}}\right]\tag4$
常规套路，log变连加：
$arg\underset{\theta}{\max}\sum_{(w,c)\in D}\log\cfrac{1}{1+\exp^{-u_{c}\cdot v_{w}}}+\sum_{(w,c)\notin D}\log\left[1-\cfrac{1}{1+\exp^{-u_{c}\cdot v_{w}}}\right]\tag5$
再根据 $\sigma$ 函数的定义，公式5可以写为：
$arg\underset{\theta}{\max}\sum_{(w,c)\in D}\log\sigma(u_{c}\cdot v_{w})+\sum_{(w,c)\notin D}\log\sigma(-u_{c}\cdot v_{w})\tag6$
可以看到负样本是很多的，如果一个词库大小是 $10^5$ ，那么负样本对估计会有 $10^6$ 对。现在来看如何降低负样本这块的计算复杂度。

SG的负采样

这里只看sg，cbow先不管。
考虑负采样后的目标函数近似于（这里和公式6是约等于的关系）
$arg\underset{\theta}{\max}\sum_{(w,c)\in D}\left[\log\sigma(u_{c}\cdot v_{w})+\sum_{c'\in N(w)}\log\sigma(-u_{c'}\cdot v_{w})\right]\tag7$
$c^{'}$ 是中心词为 $w$ 的负样本集合中采样出来的若干个负样本（5个或者10个）

负采样的梯度下降

把公式7中中括号的内容看做是函数：
$l(\theta)=\log\sigma(u_{c}\cdot v_{w})+\sum_{c'\in N(w)}\log\sigma(-u_{c'}\cdot v_{w})$
先求偏导：
$\cfrac{\partial l(\theta)}{\partial u_c}=\cfrac{\sigma(u_{c}\cdot v_{w})[1-\sigma(u_{c}\cdot v_{w})]}{\sigma(u_{c}\cdot v_{w})}v_w\\=[1-\sigma(u_{c}\cdot v_{w})]v_w$
$\cfrac{\partial l(\theta)}{\partial u_{c'}}=\cfrac{\sigma(-u_{c'}\cdot v_{w})[1-\sigma(-u_{c'}\cdot v_{w})]}{\sigma(-u_{c'}\cdot v_{w})}(-v_w)\\=[\sigma(-u_{c'}\cdot v_{w})-1]v_w$
$\cfrac{\partial l(\theta)}{\partial v_w}=\cfrac{\sigma(u_{c}\cdot v_{w})[1-\sigma(u_{c}\cdot v_{w})]}{\sigma(u_{c}\cdot v_{w})}u_c+\sum_{c'\in N(w)}\cfrac{\sigma(-u_{c'}\cdot v_{w})[1-\sigma(-u_{c'}\cdot v_{w})]}{\sigma(-u_{c'}\cdot v_{w})}(-u_{c'})\\ =[1-\sigma(u_{c}\cdot v_{w})]u_c+\sum_{c'\in N(w)}[\sigma(-u_{c'}\cdot v_{w})-1]u_{c'}$
然后更新梯度，由于上面求的是极大值，因此更新梯度是用加，就是梯度上升。
$u_c\leftarrow u_c+\eta\cfrac{\partial l(\theta)}{\partial u_c}\\ u_{c'}\leftarrow u_{c'}+\eta\cfrac{\partial l(\theta)}{\partial u_{c'}}\\ v_w\leftarrow v_w+\eta\cfrac{\partial l(\theta)}{\partial v_w}$

为了采样更加高效，原文用了类似哈夫曼树的数据结构。

SG的缺点

skip-gram模型的缺点如下：
1.不考虑上下文，一个词只有一个词向量，那么对于一词多义的情况无法处理（使用contex-aware word embedding，类似ELMO）
2.考虑的窗口大小不会太长（使用RNN/LSTM），无法考虑词向量的全局特征（使用matrix factorization）
3.无法有效学习到低频词或未登记词的词向量（使用subword embedding）
4.可解释性不强，每个维度对应的特征不确定
下面讲两个解决方法：subword和ELMO

Learning with Subword

这个方法主要用来解决低频词或未登记词的模型。当SG遇到低频词或未登记词的时候，可以直接忽略，或者用Subword。
思想是这样的：
假如词库中没有reading这个单词，但是有
reader
going
swimming
talking
等单词
那么reading可以拆分为read+ing的组合，如果read和ing有分别学习过，那么就可以猜出reading的embedding。

下面大概看一个例子：
假如词库中有三个单词：
reader
going
studying
我们先把单词拆分为subword，拆分标准为character n-gram，这里n=4，那么结果为：
reader=[^rea,read,eade,ader,der$]
going=[^goi,goin,oing,ing$]
studying=[^stu,stud,tudy,udyi,dyin,ying,ing$]
拆分之后结果我们可以依然用SG来进行训练，得到每一个subword的向量表示，然后整个单词的表示则用subword进行concat后得到。

Subword小结

使用场景：Subword主要是用在单词组成由明显的词根构成的语言上，中文就不怎么适合
character n-gram感觉分词结果乱，很杂，这个时候可以根据出现频率进行适当的过滤，就会保留常用的词根组合
对于没有出现过的character n-gram，可以直接忽略，例如要预测reading的词向量的时候，reading=[^rea,read,eadi,adin,ding,ing$]，如果eadi没有出现过，那么可以直接忽略
窗口大小一般是3-6，太短分得太细太多，太长无法体现subword的特点。

ELMO简介

这个很多地方都有写，这里不赘述，这个模型两个特点：
1.基于语言模型
2.是一个深度学习模型

你可能感兴趣的:(NLP,Bootcamp（完结）)

免费的GPT可在线直接使用（一键收藏） kkai人工智能 gpt
1、LuminAI（https://kk.zlrxjh.top）LuminAI标志着一款融合了星辰大数据模型与文脉深度模型的先进知识增强型语言处理系统，旨在自然语言处理（NLP）的技术开发领域发光发热。此系统展现了卓越的语义把握与内容生成能力，轻松驾驭多样化的自然语言处理任务。VisionAI在NLP界的应用领域广泛，能够胜任从机器翻译、文本概要撰写、情绪分析到问答等众多任务。通过对大量文本数据的
机器学习-聚类算法不良人龍木木机器学习机器学习算法聚类
机器学习-聚类算法1.AHC2.K-means3.SC4.MCL仅个人笔记，感谢点赞关注！1.AHC2.K-means3.SC传统谱聚类：个人对谱聚类算法的理解以及改进4.MCL目前仅专注于NLP的技术学习和分享感谢大家的关注与支持！
轻量级模型解读——轻量transformer系列 lishanlu136 #图像分类轻量级模型 transformer 图像分类
先占坑，持续更新。。。文章目录1、DeiT2、ConViT3、Mobile-Former4、MobileViTTransformer是2017谷歌提出的一篇论文，最早应用于NLP领域的机器翻译工作，Transformer解读，但随着2020年DETR和ViT的出现(DETR解读，ViT解读)，其在视觉领域的应用也如雨后春笋般渐渐出现，其特有的全局注意力机制给图像识别领域带来了重要参考。但是tran
生活的复杂孙栋的故事
生活的复杂。2020.11.07忙完人生的一件大件，花费1个星期。工作堆了一大堆。提不起兴趣。有一些重复的事情。很多事情做到一半，暂时不能完结，要等到明天。最近，在交通上，来回4小时。早起很困顿。刷抖音控制不住。一个获得兰亭奖的书法家，是用嘴写的毛笔，他失去了双手。比一般人更加优秀。真是靠嘴养活了自己。他在寺院抄经书，做自己喜欢的事情，还有学习佛法。对书法，他是真正热爱的。很多事情，我们只看到结果
（已完结小说）--《我的美女上司》王鹏--（全文免费阅读）小说推书
（已完结小说）--《我的美女上司》王鹏--（全文免费阅读）主角：王鹏简介：王鹏，第一天上班，发现他竟然成为了自己公司董事长的男人！！关注微信公众号【小北文楼】去回个书号【47】，即可阅读【我的美女上司】小说全文！“九亿元，确实有资本炫耀……”白蒹葭张开杏目，笑脸盈盈的看向王鹏，岂料，王鹏却开口纠正她说：“不是九亿元，是二十七亿元。”王鹏此言一出，全场再度哗然，二十七亿元的销售额，这是多么大一笔业绩
FlagEmbedding 吉小雨 python库 python
FlagEmbedding教程FlagEmbedding是一个用于生成文本嵌入（textembeddings）的库，适合处理自然语言处理（NLP）中的各种任务。嵌入（embeddings）是将文本表示为连续向量，能够捕捉语义上的相似性，常用于文本分类、聚类、信息检索等场景。官方文档链接：FlagEmbedding官方GitHub一、FlagEmbedding库概述1.1什么是FlagEmbeddi
（已完结小说）--《完美盛宴/无缺盛宴》刘洋姜海燕--（全文免费阅读）九月文楼
（已完结小说）--《完美盛宴/无缺盛宴》刘洋姜海燕--（全文免费阅读）主角：刘洋姜海燕简介：女朋友背叛，倒霉男人刘洋又得罪了美女上司，看他如何拯救自己的事业，创造一段传奇……关注微信公众号【寒风书楼】去回个书号【263】，即可阅读【完美盛宴】小说全文！第6章：就这样走了？刘洋心里微微一动，也起身说道：“姐，咱们要是在一起时间长了，你就会发现我不是有两下子，而是还有好几下子呢……”“咯咯，说你胖你还
【NumPy】深入解析numpy.zeros()函数二七830 numpy
欢迎莅临我的个人主页这里是我深耕Python编程、机器学习和自然语言处理（NLP）领域，并乐于分享知识与经验的小天地！博主简介：我是二七830，一名对技术充满热情的探索者。多年的Python编程和机器学习实践，使我深入理解了这些技术的核心原理，并能够在实际项目中灵活应用。尤其是在NLP领域，我积累了丰富的经验，能够处理各种复杂的自然语言任务。技术专长：我熟练掌握Python编程语言，并深入研究了机
《撩太子虐白莲重生皇妃太野》苏卿月（完结小说）&全文在线阅读【无弹窗】寒风书楼
《撩太子虐白莲重生皇妃太野》苏卿月（完结小说）&全文在线阅读【无弹窗】主角：苏卿月简介：前世她信了苏筱芸的伪善，落得个声名扫地、清誉全毁、家人遗弃、万人嫌恶的下场！关注微信公众号【海边书楼】去回个书号【158】，即可阅读【撩太子虐白莲重生皇妃太野】小说全文！不过片刻，前厅便只母女三人。思及苏卿月刚回来，姐妹二人正是联络感情的好时机，柳兰烟笑道：“芸儿，晚儿刚回来，对府里还不熟悉，不如你带她去逛逛，
心若不复杂，人生也简单陈怀南
日精进打卡第193天姓名：陈怀南546期学员，565期志工公司：宁波新斯维箱包有限公司[知～学习]背诵《六项精进》1遍共271遍背诵《大学》1遍共248遍诵读《干法》，听樊登读书《干法》读《活法》2遍（1.27开始看第三遍）樊登听书《扫除道》《非暴力沟通》等抄写《活法》1遍完结听《活法》《日行一善》《京博国学》公众号文章：心若不复杂，人生也简单。世界复杂么？其实远比你想的简单得多；所谓的“复杂”，
言情小说《分手后，她藏起孕肚继承亿万家产》叶芷萌厉行渊（独家完结）精彩阅读寒风书楼
言情小说《分手后，她藏起孕肚继承亿万家产》叶芷萌厉行渊（独家完结）精彩阅读主角：叶芷萌厉行渊简介：叶芷萌当了五年替身，她藏起锋芒，装得温柔乖顺，极尽所能的满足厉行渊所有的需求，却不被珍惜。直到，厉行渊和财阀千金联姻的消息传来。乖顺替身不演了，光速甩了渣男，藏起孕肚跑路。五年后，她摇身一变，成了千亿财团的继承人，资本界人人追捧的投行之神。重逢时，找了五年，疯了五年的某人，扔掉了所有自尊和骄傲，卑微哀
D15 论语学习笔记许小兔Angelina
悟：上级对下级的宽容：凡事成定局，就不你说了；已接近完结的事，也没必要匡正和挽回了；既然是过去的事，也没必要追究得失和责任了。对待孩子教育也是，不用“问责制”，这样容易让孩子因为害怕担责而说谎。应当循循善诱，避免再犯错才是最重要的。3.16：【原文】子曰：“射不主皮，为力不同科，古之道也。”【译文】孔子说：“射箭比赛不以射透为主，而主要看是否射得准确，因为人的力量不同，自古如此。”3.17：【原文
CV、NLP、数据控掘推荐、量化海的那边- AI算法自然语言处理人工智能
下面是对CV（计算机视觉）、NLP（自然语言处理）、数据挖掘推荐和量化的简要概述及其应用领域的介绍：1.CV（计算机视觉，ComputerVision）定义：计算机视觉是一门让计算机能够从图像或视频中提取有用信息，并做出决策的学科。它通过模拟人类的视觉系统来识别、处理和理解视觉信息。主要任务：图像分类：识别图像中的物体并分类，比如猫、狗、车等。目标检测：在图像或视频中定位并识别多个对象，如人脸检测
深度解析：如何使用输出解析器将大型语言模型（LLM）的响应解析为结构化JSON格式 m0_57781768 语言模型 json 人工智能
深度解析：如何使用输出解析器将大型语言模型（LLM）的响应解析为结构化JSON格式在现代自然语言处理（NLP）的应用中，大型语言模型（LLM）已经成为了重要的工具。这些模型能够生成丰富的自然语言文本，适用于各种应用场景。然而，在某些应用中，开发者不仅仅需要生成文本，还需要将这些生成的文本转换为结构化的数据格式，例如JSON。这种结构化的数据格式在数据传输、存储以及进一步处理时具有显著优势。本文将深
使用LangChain和OpenAI实现高效文本标注 aehrutktrjk langchain python
使用LangChain和OpenAI实现高效文本标注引言在自然语言处理(NLP)领域，文本标注是一项重要且常见的任务。它涉及为文本分配标签，如情感、语言、风格等。本文将介绍如何使用LangChain和OpenAI的API来实现高效的文本标注系统。我们将探讨如何设置环境、定义标注模式，以及如何使用OpenAI的模型来执行标注任务。环境准备首先，我们需要安装必要的库并设置API密钥：%pipinsta
哈迷狂欢！带你重游神奇的魔法世界 BOSS电影
说起《哈利·波特》系列电影，想必很多哈迷仍会流露出不舍之情。2011年，该系列的最后一部影片在全球上映，无数人面对着大银幕欢呼、流泪，为之感动莫名。《哈利·波特》的完结，预示着一代人的青春逝去。同时，这个横跨10年、8部影片的系列，也的确为我们留下了许多令人触动的经典桥段。为了寻找和守护魔法石，哈利、罗恩与赫敏三人第一次并肩作战，以惊心动魄的方式赢下真人“巫师棋”。来源：电影《哈利·波特与魔法石》
《志在千里》陈冰老张全文免费阅读【完结小说无弹窗】海边书楼
《志在千里》陈冰老张全文免费阅读【完结小说无弹窗】主角：陈冰老张简介：陈冰身材高挑，脸蛋俊俏，气质高雅，一双水灵灵的媚眼性感至极。可关注微信公众号【寒风书楼】去回个书号【285】，即可免费阅读【志在千里】全文！电工老张今年五十出头，最近一直很欣赏雇主少-妇陈冰。陈冰身材高挑，脸蛋俊俏，气质高雅，一双水灵灵的媚眼。这天，陈冰穿着一件吊带丝绸睡衣，她从卧室里走出来，发现丈夫李凯与邻居电工老张并肩坐在沙
【NLP5-RNN模型、LSTM模型和GRU模型】一蓑烟雨紫洛 nlp rnn lstm gru nlp
RNN模型、LSTM模型和GRU模型1、什么是RNN模型RNN（RecurrentNeuralNetwork)中文称为循环神经网络，它一般以序列数据为输入，通过网络内部的结构设计有效捕捉序列之间的关系特征，一般也是以序列形式进行输出RNN的循环机制使模型隐层上一时间步产生的结果，能够作为当下时间步输入的一部分（当下时间步的输入除了正常的输入外还包括上一步的隐层输出）对当下时间步的输出产生影响2、R
《官场之手眼通天》秦峰胡佳芸（完结篇）全文免费阅读【笔趣阁】海边书楼
《官场之手眼通天》秦峰胡佳芸（完结篇）全文免费阅读【笔趣阁】主角：秦峰胡佳芸简介：做官要有两颗心，一颗是责任心，一颗是良心。且看秦峰一个最偏远乡镇的基层公务员，带着这两颗心怎么在尔虞我诈的权力游戏里一步步走向权力的巅峰。可关注微信公众号【寒风书楼】去回个书号【283】，即可免费阅读【官场之手眼通天】全文！第9章你在等我吗？“听说过，那天我正好路过。”“你看到了没有去救人？”“没有。”秦峰不是个喜欢
基于深度学习的文本引导的图像编辑 SEU-WYL 深度学习dnn 深度学习人工智能
基于深度学习的文本引导的图像编辑（Text-GuidedImageEditing）是一种通过自然语言文本指令对图像进行编辑或修改的技术。它结合了图像生成和自然语言处理（NLP）的最新进展，使用户能够通过描述性文本对图像内容进行精确的调整和操控。1.文本引导的图像编辑的挑战文本和图像之间的对齐：如何将文本中的语义信息准确地映射到图像中的特定区域或元素是一个关键挑战。这涉及到多模态数据的对齐和理解。编
漫长的等待里有着不一样的幸福密码爱哭的小丑Yu
相信每个人都会遇到等待的过程，既漫长又焦灼的等待。无论是等待一件事的结果还是等待一个人的出现，属于你的终将会到来。曾经的我无论是看电视还是看书，我总喜欢看完开始就看结局。如果遇到没有完结的电视剧，我通常不会去看，因为我太不喜欢等待，不喜欢那种焦灼的感觉。可也因此，我总是错过了很多精彩，总是在最后得到一个不明不白的结果。直到后来，我遇到一个自己非常喜欢的电视剧，我最开始看的时候还是很有耐心的，可后来
甘超波：NLP婚姻中如何与老人相处甘超波
哈喽，大家好我是甘超波，是一名NLP爱好者，每天一篇原创文章或视频，分享我的实战经验和案例，希望给你些启发和帮助看一下，在家庭中子女与老人观念不一致时案例1：在教育孩子方面，老人习惯用老一套教育方式教育孙子，子女受不了老人这种习惯，从而发生口舌之争？2：在生活习惯方面，老人喜欢吃剩菜剩饭，子女受不了老人这种习惯，从而发生口舌之争？.....这样的事情，我相信你或多或少都听过和看过，甚至了深有感悟。
达尔文医学——《我们为什么生病》笔记完结篇蹉跎笑我
一、对疾病原因的回顾为什么我们被大自然精心设计的身体，仍然为疾病所困？其原因在于：1、遗传因素很多疾病具有遗传性，人类的基因并不是完美无缺。一些致病基因是其只在生命晚期表现出危害，石器时期的人根本活不到这个年龄，自然选择也就没有机会清除掉。但更主要的原因是：有害的基因之所以保留下来，是因为存在潜在的益处。2、环境的巨变人类文明萌芽以来只有一万年，我们身体的进化速度跟不上环境的改变。3、一些疾病的原
《完美盛宴》刘洋姜海燕全文免费阅读【完结小说无弹窗】小说推书
《完美盛宴》刘洋姜海燕全文免费阅读【完结小说无弹窗】主角：刘洋姜海燕简介：女朋友背叛，倒霉男人刘洋又得罪了美女上司，看他如何拯救自己的事业，创造一段传奇……关注微信公众号【寒风书楼】去回个书号【263】，即可阅读【完美盛宴】小说全文！第8章：我管你爹是谁！刘洋一侧身子躲开他，然后把那女孩子往自己的身后掩了一下，大声说道：“怎么能说没我的事儿呢？这种事情谁看着也不会不管的。人家都说了不…不想和你们在
transformer架构(Transformer Architecture)原理与代码实战案例讲解 AI架构设计之禅大数据AI人工智能 Python入门实战计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
transformer架构(TransformerArchitecture)原理与代码实战案例讲解关键词：Transformer,自注意力机制,编码器-解码器,预训练,微调,NLP,机器翻译作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming1.背景介绍1.1问题的由来自然语言处理（NLP）领域的发展经历了从规则驱动到统计驱动再到深度学习驱动的三个阶段。
《九鼎风水师》第一千零一十九章昆仑秘境完结篇（二）先峰老师
尚文龙不敢想下去了。如果真的是自己所猜测这样的话，那么就能够解释清楚，为什么千百年来，九大家族的传人进入到这昆仑秘境之中没有一个人出来。尚文龙不敢继续想下去。因为这个猜测如果真的是事实的话，那么太可怕了。而且，如果是真的的话，自己进了昆仑秘境之后就注定无非走出来。哪怕自己的修为境界再高一个层次，都无法走出来，除非，能够达到那传说中的境界，或许有希望。尚文龙摇了摇头。将脑海中那可怕的猜测给甩出去。原
英伟达（NVIDIA）B200架构解读 weixin_41205263 芯际争霸 GPGPU架构 gpu算力人工智能硬件架构
H100芯片是一款高性能AI芯片，其中的TransformerEngine是专门用于加速Transformer模型计算的核心部件。Transformer模型是一种自然语言处理（NLP）模型，广泛应用于机器翻译、文本生成等任务。TransformerEngine的电路设计原理主要包括以下几个方面：
《兰香如梦》清欢九溟小说已完结【兰香如梦小说】全文免费阅读云轩书阁
《兰香如梦》清欢九溟小说已完结【兰香如梦小说】全文免费阅读主角：清欢,九溟简介：她是他养的兰草小仙，为救他不惜一切。可他眼里从未有她······直到小兰草消失不见，上神才惊觉，他早就爱上她了。微信内放心点击【兰香如梦】直接阅读-无弹窗无广告也可以关注微信公众号【才精灵】去回个书號【2350】，即可免费阅读【兰香如梦】全文！炼化心血，需要用到神农鼎。神农鼎如今在天界的玄幽殿，她的姐姐清酒是掌事，清欢
《昇思 25 天学习打卡营第 25 天 | 基于 MindSpore 实现 BERT 对话情绪识别》 Sam9029 Mindscope模型学习深度学习
《昇思25天学习打卡营第25天|基于MindSpore实现BERT对话情绪识别》活动地址：https://xihe.mindspore.cn/events/mindspore-training-camp签名：Sam9029环境配置确保安装了正确版本的MindSpore和MindNLP库。!pipuninstallmindspore-y!pipinstall-ihttps://pypi.mirror
FreeRTOS操作系统（详细速通篇）——— 第十五章（完结）给生活加糖！快速通关FreeRTOS stm32 FreeRTOS 单片机嵌入式嵌入式软件 c语言操作系统
本专栏将对FreeRTOS进行快速讲解，带你了解并使用FreeRTOS的各部分内容。适用于快速了解FreeRTOS并进行开发、突击面试、对新手小白非常友好。期待您的后续关注和订阅！目录软件定时器和低功耗模式1软件定时器1.1什么是定时器？1.2软件定时器的优缺点1.3FreeRTOS软件定时器特点1.4软件定时器的状态及转换1.4.1定时器状态1.4.2定时器周期1.5结构体及API函数1.5.1
[星球大战]阿纳金的背叛 comsci
本来杰迪圣殿的长老是不同意让阿纳金接受训练的......... 但是由于政治原因,长老会妥协了...这给邪恶的力量带来了机会所以......现代的地球联邦接受了这个教训...绝对不让某些年轻人进入学院
看懂它，你就可以任性的玩耍了！ aijuans JavaScript
javascript作为前端开发的标配技能，如果不掌握好它的三大特点：1.原型 2.作用域 3. 闭包 ,又怎么可以说你学好了这门语言呢？如果标配的技能都没有撑握好，怎么可以任性的玩耍呢？怎么验证自己学好了以上三个基本点呢，我找到一段不错的代码，稍加改动，如果能够读懂它，那么你就可以任性了。 function jClass(b
Java常用工具包 Jodd Kai_Ge java jodd
Jodd 是一个开源的 Java 工具集，包含一些实用的工具类和小型框架。简单，却很强大！写道 Jodd = Tools + IoC + MVC + DB + AOP + TX + JSON + HTML < 1.5 Mb Jodd 被分成众多模块，按需选择，其中工具类模块有： jodd-core &nb
SpringMvc下载 120153216 springMVC
@RequestMapping(value = WebUrlConstant.DOWNLOAD) public void download(HttpServletRequest request,HttpServletResponse response,String fileName) { OutputStream os = null; InputStream is = null;
Python 标准异常总结 2002wmj python
Python标准异常总结 AssertionError 断言语句（assert）失败 AttributeError 尝试访问未知的对象属性 EOFError 用户输入文件末尾标志EOF（Ctrl+d） FloatingPointError 浮点计算错误 GeneratorExit generator.close()方法被调用的时候 ImportError 导入模块失
SQL函数返回临时表结构的数据用于查询 357029540 SQL Server
这两天在做一个查询的SQL，这个SQL的一个条件是通过游标实现另外两张表查询出一个多条数据，这些数据都是INT类型，然后用IN条件进行查询，并且查询这两张表需要通过外部传入参数才能查询出所需数据，于是想到了用SQL函数返回值，并且也这样做了，由于是返回多条数据，所以把查询出来的INT类型值都拼接为了字符串，这时就遇到问题了，在查询SQL中因为条件是INT值，SQL函数的CAST和CONVERST都
java 时间格式化 | 比较大小| 时区个人笔记 7454103 java eclipse tomcat c MyEclipse
个人总结！不当之处多多包含！引用 1.0 如何设置 tomcat 的时区：位置：(catalina.bat---JAVA_OPTS 下面加上) set JAVA_OPT
时间获取Clander的用法 adminjun Clander 时间
/** * 得到几天前的时间 * @param d * @param day * @return */ public static Date getDateBefore(Date d,int day){ Calend
JVM初探与设置 aijuans java
JVM是Java Virtual Machine（Java虚拟机）的缩写，JVM是一种用于计算设备的规范，它是一个虚构出来的计算机，是通过在实际的计算机上仿真模拟各种计算机功能来实现的。Java虚拟机包括一套字节码指令集、一组寄存器、一个栈、一个垃圾回收堆和一个存储方法域。 JVM屏蔽了与具体操作系统平台相关的信息，使Java程序只需生成在Java虚拟机上运行的目标代码（字节码）,就可以在多种平台
SQL中ON和WHERE的区别 avords
SQL中ON和WHERE的区别数据库在通过连接两张或多张表来返回记录时，都会生成一张中间的临时表，然后再将这张临时表返回给用户。 www.2cto.com 在使用left jion时，on和where条件的区别如下： 1、 on条件是在生成临时表时使用的条件，它不管on中的条件是否为真，都会返回左边表中的记录。
说说自信 houxinyou 工作生活
自信的来源分为两种,一种是源于实力,一种源于头脑.实力是一个综合的评定,有自身的能力,能利用的资源等.比如我想去月亮上,要身体素质过硬,还要有飞船等等一系列的东西.这些都属于实力的一部分.而头脑不同,只要你头脑够简单就可以了!同样要上月亮上,你想,我一跳,1米,我多跳几下,跳个几年,应该就到了!什么?你说我会往下掉?你笨呀你!找个东西踩一下不就行了吗? 无论工作还
WEBLOGIC事务超时设置 bijian1013 weblogic jta 事务超时
系统中统计数据，由于调用统计过程，执行时间超过了weblogic设置的时间，提示如下错误：统计数据出错! 原因：The transaction is no longer active - status: 'Rolling Back. [Reason=weblogic.transaction.internal
两年已过去，再看该如何快速融入新团队 bingyingao java 互联网融入架构新团队
偶得的空闲，翻到了两年前的帖子该如何快速融入一个新团队，有所感触，就记下来，为下一个两年后的今天做参考。时隔两年半之后的今天，再来看当初的这个博客，别有一番滋味。而我已经于今年三月份离开了当初所在的团队，加入另外的一个项目组，2011年的这篇博客之后的时光，我很好的融入了那个团队，而直到现在和同事们关系都特别好。大家在短短一年半的时间离一起经历了一
【Spark七十七】Spark分析Nginx和Apache的access.log bit1129 apache
Spark分析Nginx和Apache的access.log，第一个问题是要对Nginx和Apache的access.log文件进行按行解析，按行解析就的方法是正则表达式： Nginx的access.log解析正则表达式 val PATTERN = """([^ ]*) ([^ ]*) ([^ ]*) (\\[.*\\]) (\&q
Erlang patch bookjovi erlang
Totally five patchs committed to erlang otp, just small patchs. IMO, erlang really is a interesting programming language, I really like its concurrency feature. but the functional programming style
log4j日志路径中加入日期 bro_feng java log4j
要用log4j使用记录日志，日志路径有每日的日期，文件大小5M新增文件。实现方式 log4j: <appender name="serviceLog" class="org.apache.log4j.RollingFileAppender"> <param name="Encoding" v
读《研磨设计模式》-代码笔记-桥接模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /** * 个人觉得关于桥接模式的例子，蜡笔和毛笔这个例子是最贴切的：http://www.cnblogs.com/zhenyulu/articles/67016.html * 笔和颜色是可分离的，蜡笔把两者耦合在一起了：一支蜡笔只有一种
windows7下SVN和Eclipse插件安装 chenyu19891124 eclipse插件
今天花了一天时间弄SVN和Eclipse插件的安装，今天弄好了。svn插件和Eclipse整合有两种方式，一种是直接下载插件包，二种是通过Eclipse在线更新。由于之前Eclipse版本和svn插件版本有差别，始终是没装上。最后在网上找到了适合的版本。所用的环境系统：windows7JDK：1.7svn插件包版本：1.8.16Eclipse：3.7.2工具下载地址：Eclipse下在地址：htt
[转帖]工作流引擎设计思路 comsci 设计模式工作应用服务器 workflow 企业应用
作为国内的同行，我非常希望在流程设计方面和大家交流，刚发现篇好文(那么好的文章，现在才发现，可惜)，关于流程设计的一些原理，个人觉得本文站得高，看得远，比俺的文章有深度，转载如下 ================================================================================= 自开博以来不断有朋友来探讨工作流引擎该如何
Linux 查看内存，CPU及硬盘大小的方法 daizj linux cpu 内存硬盘大小
一、查看CPU信息的命令 [root@R4 ~]# cat /proc/cpuinfo |grep "model name" && cat /proc/cpuinfo |grep "physical id" model name : Intel(R) Xeon(R) CPU X5450 @ 3.00GHz model name :
linux 踢出在线用户 dongwei_6688 linux
两个步骤： 1.用w命令找到要踢出的用户，比如下面： [root@localhost ~]# w 18:16:55 up 39 days, 8:27, 3 users, load average: 0.03, 0.03, 0.00 USER TTY FROM LOGIN@ IDLE JCPU PCPU WHAT
放手吧,就像不曾拥有过一样 dcj3sjt126com
内容提要：静悠悠编著的《放手吧就像不曾拥有过一样》集结“全球华语世界最舒缓心灵”的精华故事，触碰生命最深层次的感动，献给全世界亿万读者。《放手吧就像不曾拥有过一样》的作者衷心地祝愿每一位读者都给自己一个重新出发的理由，将那些令你痛苦的、扛起的、背负的，一并都放下吧！把憔悴的面容换做一种清淡的微笑，把沉重的步伐调节成春天五线谱上的音符，让自己踏着轻快的节奏，在人生的海面上悠然漂荡，享受宁静与
php二进制安全的含义 dcj3sjt126com PHP
PHP里，有string的概念。 string里，每个字符的大小为byte（与PHP相比，Java的每个字符为Character，是UTF8字符，C语言的每个字符可以在编译时选择）。 byte里，有ASCII代码的字符，例如ABC，123，abc，也有一些特殊字符，例如回车，退格之类的。特殊字符很多是不能显示的。或者说，他们的显示方式没有标准，例如编码65到哪儿都是字母A，编码97到哪儿都是字符
Linux下禁用T440s，X240的一体化触摸板(touchpad) gashero linux ThinkPad 触摸板
自打1月买了Thinkpad T440s就一直很火大，其中最让人恼火的莫过于触摸板。 Thinkpad的经典就包括用了小红点(TrackPoint)。但是小红点只能定位，还是需要鼠标的左右键的。但是自打T440s等开始启用了一体化触摸板，不再有实体的按键了。问题是要是好用也行。实际使用中，触摸板一堆问题，比如定位有抖动，以及按键时会有飘逸。这就导致了单击经常就
graph_dfs hcx2013 Graph
package edu.xidian.graph; class MyStack { private final int SIZE = 20; private int[] st; private int top; public MyStack() { st = new int[SIZE]; top = -1; } public void push(i
Spring4.1新特性——Spring核心部分及其他 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
配置HiveServer2的安全策略之自定义用户名密码验证 liyonghui160com
具体从网上看 http://doc.mapr.com/display/MapR/Using+HiveServer2#UsingHiveServer2-ConfiguringCustomAuthentication LDAP Authentication using OpenLDAP Setting
一位30多的程序员生涯经验总结 pda158 编程工作生活咨询
1.客户在接触到产品之后，才会真正明白自己的需求。　　这是我在我的第一份工作上面学来的。只有当我们给客户展示产品的时候，他们才会意识到哪些是必须的。给出一个功能性原型设计远远比一张长长的文字表格要好。 2.只要有充足的时间，所有安全防御系统都将失败。　　安全防御现如今是全世界都在关注的大课题、大挑战。我们必须时时刻刻积极完善它，因为黑客只要有一次成功，就可以彻底打败你。 3.
分布式web服务架构的演变自由的奴隶 linux Web 应用服务器互联网
最开始，由于某些想法，于是在互联网上搭建了一个网站，这个时候甚至有可能主机都是租借的，但由于这篇文章我们只关注架构的演变历程，因此就假设这个时候已经是托管了一台主机，并且有一定的带宽了，这个时候由于网站具备了一定的特色，吸引了部分人访问，逐渐你发现系统的压力越来越高，响应速度越来越慢，而这个时候比较明显的是数据库和应用互相影响，应用出问题了，数据库也很容易出现问题，而数据库出问题的时候，应用也容易
初探Druid连接池之二——慢SQL日志记录 xingsan_zhang 日志连接池 druid 慢SQL
由于工作原因，这里先不说连接数据库部分的配置，后面会补上，直接进入慢SQL日志记录。 1.applicationContext.xml中增加如下配置： <bean abstract="true" id="mysql_database" class="com.alibaba.druid.pool.DruidDataSourc

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他