linxid

NLP学习笔记（一）：图解Transformer+实战

感谢Jay Alammar，图源自他的文章[17]。

文章目录

1. Transformer原理

1.1 高层Transformer
1.2 Encoder输入：

2 Self-Attention:

2.1 Self-Attention步骤：
2.2 $Query$、$Key$、$Value$：
2.3 Multi-Head Attention:
2.4 位置嵌入来表示序列的顺序信息：

3 残差网络（Residuals Network）：
4. Keras实现：

4.1 自注意力机制：
4.2 求位置嵌入向量：

参考资料：

1. Transformer原理

1.1 高层Transformer

Transformer最初是在机器翻译中提出，所以我们以机器翻译为例。任何一个神经网络模型都可以认为是一个黑箱，Transformer也不例外。

再往里面一层，Transformer是一个Encoder-Decoder结构，结构如下图所示：

每一个Encoder是由self-attention+Feed Forward NN构成，如下图所示，所以我们首先要理解self-attention。

每一个Decoder是由Self-Attention+Encoder-Decoder Attention+Feed Forward NN构成，结构如下图所示：

1.2 Encoder输入：

假设我们的输入三个词，三个词通过Embedding层后，每个词变成一个向量，如下图所示：

除了最底层输入是词的Embedding，其他层的输入是上一层的输出。这三个词在Encoder中的变换是：

Self-Attention是输入的第一层NN，比较难理解，却是模型的核心组成部分。所以我们单独拿出来讲。

2 Self-Attention:

关于注意力机制详细可以看张俊林博士的文章[3]，此处讲解self-attention，更简单易懂。
以机器翻译为例，假设我们的输入是：
“The animal didn't cross the street because it was too tired”
在翻译的是时候我们希望将it和The animal联系起来，通过注意力机制可以实现这个需求。可以在Tensor2Tensor notebook 进行测试，观察每个词和其他词的对应关系（连接权重）。

2.1 Self-Attention步骤：

将输入词转变成词向量，即得到Embedding层；
每个词向量得到一个 $Q u e r y$ 向量, $K e y$ 向量和 $V a l u e$ 向量（下面说如何得到）；
为每一个词向量计算一个 $s c o r e ： q u e r y . d o t (k)$ ；
我们需要计算句子中的每一个词对当前词的 $s c o r e$ 。这个 $s c o r e$ 决定对句子的其他部分注意力是多少，也就是如何用句子的其他部分类表征当前词。
对 $s c o r e$ 进行归一化（为了稳定），即除以 $\sqrt{d_k}$ ，然后对 $s c o r e$ 求 $s o f t m a x ()$ ： $softmax(\frac{score}{\sqrt{d_k}})$
$s c o r e$ 和 $V a l u e$ 向量点积，然后对其求和： $\sum{score * Value}$ ；

完结撒花，一图以蔽之：

2.2 $Q u e r y$ 、 $K e y$ 、 $V a l u e$ ：

刚才挖下的坑，现在来填。刚才我们提到这三个向量但是没有说如何得到的。
将我们的词向量矩阵 $X$ 和权重矩阵 $W_Q,W_K,W_V$ 相乘，即可得到 $Q u e r y$ 、 $K e y$ 、 $V a l u e$ 向量。

接下来这张图可以清晰的说明白 $Q u e r y$ 、 $K e y$ 、 $V a l u e$ 三个向量的关系。

2.3 Multi-Head Attention:

将词向量数据 $X$ 分别输入到8个不同的Self-Attention中，得到8个特征矩阵 $Z_i,i\in{(1,2...8)}$ ：
8个矩阵无法直接与前馈全连接相乘，所以对8个矩阵拼接，然后与一个权重矩阵 $W_O$ 相乘：
一图总结：

Multi-Head Attention的优点：

扩展模型能力可以注意到不同位置，一个注意力模型的关注点也许是错的，通过多个注意力模型可以提高这种泛化能力；
使得注意力层具有多个表示子空间，比如说上文的8个注意力模型，经过训练后，我们就可以将输入的词嵌入映射到8个不同的表示子空间；

2.4 位置嵌入来表示序列的顺序信息：

Transformer模型的一大缺点是不能捕捉句子的位置信息。试想我们的句子不管如何打乱，从刚才的原理可以看出，Transformer的结果都是相同的。为了解决这个问题，论文中在编码词向量时引入了位置编码（Position Embedding），词的位置信息通过位置编码来表示。
论文中令位置嵌入的维度和词向量的维度相同，然后与词向量相加。位置嵌入，可以帮我们判断每个词的位置和词向量之间的距离。

论文中的位置嵌入公式是：
$PE_{(pos,2i)} = sin(\frac{pos}{1000^{2i/d_{model}}})$
$PE_{(pos,2i+1)} = cos(\frac{pos}{1000^{2i/d_{model}}})$
以上便是Slef-Attention的全部内容。

3 残差网络（Residuals Network）：

构成Transformer的Encoder除了上述部分还有残差网络和一层归一化，通过图可以更容易明白。

4. Keras实现：

4.1 自注意力机制：

2.1中详细介绍的Self-Attention可以通过下列代码实现。忘记的可以和前面的公式去对应。

class ScaledDotProductAttention():
    def __init__(self, d_model, attn_dropout=0.1):
        self.temper = np.sqrt(d_model)
        self.dropout = Dropout(attn_dropout)
    def __call__(self, q, k, v, mask):
        attn = Lambda(lambda x:K.batch_dot(x[0],x[1],axes=[2,2])/self.temper)([q, k])
        if mask is not None:
            mmask = Lambda(lambda x:(-1e+10)*(1-x))(mask)
            attn = Add()([attn, mmask])
        attn = Activation('softmax')(attn)
        attn = self.dropout(attn)
        output = Lambda(lambda x:K.batch_dot(x[0], x[1]))([attn, v])
        return output, attn

4.2 求位置嵌入向量：

详细公式可以见2.4，以下为keras实现：

def GetPosEncodingMatrix(max_len, d_emb):
    pos_enc = np.array([
        [pos / np.power(10000, 2 * (j // 2) / d_emb) for j in range(d_emb)] 
        if pos != 0 else np.zeros(d_emb) 
            for pos in range(max_len)
            ])
    pos_enc[1:, 0::2] = np.sin(pos_enc[1:, 0::2]) # dim 2i
    pos_enc[1:, 1::2] = np.cos(pos_enc[1:, 1::2]) # dim 2i+1
    return pos_enc

未完待续…有空继续更新

参考资料：

[1]AllenNLP 使用教程
[2]从Word Embedding到Bert模型—自然语言处理中的预训练技术发展史
[3]深度学习中的注意力模型（2017版）
[4]模型汇总24 - 深度学习中Attention Mechanism详细介绍：原理、分类及应用
[5]Tensorflow源码解读（一）：Attention Seq2Seq模型
[6]基于Attention Model的Aspect level文本情感分类—用Python+Keras实现
[7]完全图解RNN、RNN变体、Seq2Seq、Attention机制
[8]浅谈Attention-based Model【原理篇】
[9] 浅谈 NLP 中的 Attention 机制
[10]Deep Learning基础–理解LSTM/RNN中的Attention机制
[11]Attention? Attention!
[12]详解Transformer （Attention Is All You Need）
[13]The Annotated Transformer-Harvard出品
[14] 聊聊 Transformer
[15]Transformer Translation Model-TensorFlow官方实现
[16] BERT大火却不懂Transformer？读这一篇就够了
[17] The Illustrated Transformer
[18] Visualizing A Neural Machine Translation Model (Mechanics of Seq2seq Models With Attention)
[19] Transformer注解及PyTorch实现（上）

你可能感兴趣的:(人工智能,自然语言处理)

【附源码】基于opencv+pyqt5搭建的人脸识别系统 ~啥也不会~ opencv 人工智能计算机视觉人脸识别 pyqt
文章目录前言一、人脸检测二、人脸识别1.训练识别器2.识别人脸三、界面相关1.Qlabel展示图片2.表格跟随内容而增加和减少3.选择图片文件4.警告框四、源码获取总结前言人脸识别技术作为人工智能领域的一颗璀璨明珠，正逐渐渗透到我们生活的每一个角落，从智能手机的解锁到机场的快速通关，从金融交易的安全认证到智慧城市的高效管理，它正以其独特的优势和强大的功能，为我们的生活带来前所未有的便捷与安全。本篇
大模型时代的软件架构设计 AI天才研究院计算 DeepSeek R1 &大数据AI人工智能大模型 AI大模型企业级应用开发实战 java python javascript kotlin golang 架构人工智能大厂程序员硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM 系统架构设计软件哲学 Agent 程序员实现财富自由
引言当今世界，人工智能（AI）技术正以惊人的速度发展，其中大模型（LargeModels）的崛起尤为引人注目。大模型，也被称为深度学习模型，因其庞大的参数规模和强大的数据处理能力，成为推动AI技术前进的重要力量。随着大模型的广泛应用，软件架构设计面临着前所未有的挑战和机遇。大模型时代的软件架构设计，不仅需要解决传统软件架构所面对的问题，如性能、可靠性和可扩展性等，还需要应对大模型带来的新挑战，如计
如何使用Anyscale平台运行、微调和扩展大语言模型(LLMs) eahba 语言模型人工智能自然语言处理 python
Anyscale是一个功能强大的平台，主要用于运行、微调和扩展大语言模型(LLMs)，并且通过生产就绪的API提供成本效益的调用服务。AnyscaleEndpoints提供了多种开源模型，适合不同的应用场景。技术背景介绍在处理大规模的自然语言处理任务时，我们常常需要一个可靠且经济高效的解决方案来运行和管理LLMs。Anyscale提供了一个强大的接口，能够简化这一过程。结合LangChain，我们
计算机毕业设计 ——jspssm508Springboot 的旅游管理奔强的程序课程设计旅游
博主小档案：花花，一名来自世界500强的资深程序猿，毕业于国内知名985高校。技术专长：花花在深度学习任务中展现出卓越的能力，包括但不限于java、python等技术。近年来，花花更是将触角延伸至AI领域，对于机器学习、自然语言处理、智能推荐等前沿技术都有独到的见解和实践经验。服务内容：1、提供科研入门辅导(主要是代码方面)2、代码部署3、定制化需求解决等4、期末考试复习计算机毕业设计——jsps
利用OllamaLLM模型实现多模态文本生成 bavDHAUO python
利用OllamaLLM模型实现多模态文本生成在这篇文章中，我们将介绍如何使用OllamaLLM模型实现多模态文本生成，包括文本和图像输入的处理。我们将详细解析核心原理，提供代码示例，并分析应用场景。希望这篇文章能帮助你更好地理解和使用OllamaLLM模型。技术背景介绍多模态模型是指能够处理和生成多种类型的数据，如文本、图像、音频等。在自然语言处理领域，结合图像和文本的多模态模型越来越受到关注。O
Crawl4AI：开源的网络爬虫和抓取工惟贤箬溪穷玩Ai github 开源 ai
crawl4ai是一个开源项目，旨在帮助用户爬取GitHub上与AI（人工智能）相关的内容。这些内容通常包括AI相关的开源项目、库、资源、论文、教程等。项目提供了一个爬虫工具，可以自动化地抓取并提取GitHub上与人工智能相关的资源。以下是对该项目的详细解读：1.项目概述crawl4ai是一个爬虫框架，专门用于从GitHub上抓取与AI相关的开源项目或仓库。这些仓库包括AI领域的机器学习、深度学习
如果GPT-4还只是阿米巴原虫，未来的霸王龙会是什么样？| 赫拉利《智人之上》量子位
关注前沿科技量子位几乎所有人都已经发现，我们正生活在一场前所未有的信息革命之中。但这到底是一场怎样的革命？最近这几年，太多突破性的发明如洪水般滚滚而来，以至于我们很难判断到底是什么推动了这场革命。是互联网？智能手机？社交媒体？区块链？算法？还是人工智能？所以，在讨论目前这场信息革命的长期影响之前，让我们先回顾一下它的基础。本文分为三大部分，分别为：我们真的了解计算机吗？计算机正在塑造一个全新的信息
MoneyPrinterTurbo：AI驱动的全自动高清短视频生成框架萧鼎机器学习算法与实战人工智能音视频 python
引言在数字化时代，短视频已经成为信息传播的重要形式。无论是社交媒体、自媒体创作者，还是品牌营销和广告投放，短视频都占据了越来越重要的地位。然而，传统视频制作的门槛较高，需要专业的剪辑技能、素材采集以及后期处理，导致许多个人创作者和中小企业难以持续产出高质量内容。MoneyPrinterTurbo正是针对这一痛点而生的一款全自动短视频生成框架。它采用人工智能技术，从文案撰写到视频合成实现了全流程自动
速来！人工智能未来设计大赛· 大模型专项竞技赛火热报名中！量子位
技术革新临界点已至，大模型生态迎来爆发期当前，全球人工智能产业正经历从“暴力美学”到“精巧工程”的范式跃迁。DeepSeek引领超强大模型的开源开放与普惠化浪潮之下，大模型技术已突破边界逐步渗透至千行百业，成为驱动产业升级的新引擎。种种迹象无不表明大模型应用爆发临界点已近在眼前。值此历史性时刻，由工业和信息化部工业文化发展中心主办的“人工智能未来设计大赛·大模型专项竞技赛”正式启动，诚邀全球大模型
阿里云PAI大模型RAG对话系统最佳实践阿里云云栖号云栖号技术分享阿里云云计算云原生 ai 人工智能
去年4月至9月，阿里云人工智能平台PAI团队与大数据基础工程技术团队合作，构建了基于知识库检索增强的大模型答疑对话机器人，并在阿里云官方答疑链路、研发小蜜、钉钉大数据技术服务助手等多个线上场景上线，显著提升答疑效率。相关文档：【万字长文】基于阿里云PAI搭建知识库向量检索增强的大模型对话系统上线几个月来，随着RAG技术日趋火热，我们保持对线上链路的迭代，不断加入学界业界最新的RAG优化技术（eg:
继清华大学DeepSeek资料后，北京大学也出了内容主攻提示词和应用场景心灵宝贝 deepseek
这份文件是北京大学关于DeepSeek与AIGC应用的内部研讨系列讲座内容，主要介绍了DeepSeek-R1模型的技术特性、应用场景以及AIGC（人工智能生成内容）的概念、应用和未来趋势。以下是文件的主要内容摘要：1.DeepSeek-R1模型详解技术特性：DeepSeek-R1是一款专注于复杂推理任务的推理模型，擅长数学、编程和自然语言推理任务。其低成本、开源策略和卓越的推理能力使其在AIGC领
人工智能丨ChatGPT 免费开放网络搜索，能否挑战 Google 的搜索霸主地位？霍格沃兹测试开发学社测试人社区人工智能 chatgpt
近年来，人工智能的快速发展改变了许多行业，尤其是在信息获取和搜索领域。随着OpenAI推出的ChatGPT系统，它的功能不断增强，而一个重要的新变化是——ChatGPT的网络搜索功能现在对所有用户免费开放。这一变革有可能颠覆Google多年来在搜索引擎领域的统治地位。那么，ChatGPT如何通过这一免费搜索功能重新定义信息搜索方式呢？ChatGPT的网络搜索功能ChatGPT最初是一个文本生成工具
DeepSeek 解决实际问题，提升自己的技术水平和应用能力 2501_90739749 pdf
资源链接：https://pan.quark.cn/s/3d4088555ca0资源链接：https://pan.quark.cn/s/df8ce3ea6f4e「DeepSeek资料大全」资源链接：https://pan.quark.cn/s/1352425b0645「完整版Dee...键整合包」链接：https://pan.quark.cn/s/7e851bca2dc2在人工智能领域风起云涌、技
谁说消费级硬件不能玩 DeepSeek - R1 微调？手把手教你进阶AI玩家硅基创想家 #大模型-DeepSeek系列人工智能 DeepSeek 大模型微调大模型 GPU
微调像DeepSeek-R1这样的大规模人工智能模型可能需要大量资源，但借助正确的工具，在消费级硬件上进行高效训练是可行的。让我们来探索如何使用LoRA（低秩自适应）和Unsloth来优化DeepSeek-R1的微调，实现更快、更具成本效益的训练。一、大规模人工智能模型的微调DeepSeek最新的R1模型在推理性能方面树立了新的标杆，在保持开源的同时，可与专有模型相媲美。DeepSeek-R1的蒸
一个游戏程序员的学习资料【转载】 Snail -Bernoulli 游戏程序员游戏程序员成长路线
想起写这篇文章是在看侯杰先生的《深入浅出MFC》时,突然觉得自己在大学这几年关于游戏编程方面还算是有些心得，因此写出这篇小文,介绍我眼中的游戏程序员的书单与源代码参考。一则是作为自己今后两年学习目标的备忘录,二来没准对别人也有点参考价值。我的原则是只写自己研究过或准备研究的资料，所以内容无疑会带上强烈的个人喜好色彩,比如对网络,数据库等重要方面完全没有涉及。因为自己主要对三维图形引擎,人工智能算法
Bedrock Claude Chat: 基于AWS Bedrock和Claude的智能聊天机器人 2401_87458778 aws 机器人云计算
BedrockClaudeChat:智能聊天的新选择在人工智能和自然语言处理技术飞速发展的今天，智能聊天机器人正在各行各业得到广泛应用。AWS推出的BedrockClaudeChat项目为开发者提供了一个强大而灵活的聊天机器人解决方案，让构建智能对话系统变得前所未有的简单。项目概述BedrockClaudeChat是一个基于AmazonBedrock平台和Anthropic公司Claude大语言模
2001-2022年上市公司数字赋能指数（TF-IDF）数据：评估企业数字化转型的关键指标小王毕业啦大数据 tf-idf 大数据社科数据人工智能
上市公司数字赋能指数（TF-IDF）数据：评估企业数字化转型的关键指标上市公司数字赋能指数是一个衡量企业利用数字技术提升业务能力和效率的综合性指标。该指数通过量化分析企业在大数据、云计算、人工智能等数字技术应用方面的能力，反映企业数字化转型的深度和广度。获取数据点这里：2001年-2022年上市公司-数字赋能指数（TF-IDF）（Excel+dta）数字赋能指数的重要性数字化转型：推动企业实现数字
2025智能系统工程-中国人工智能系列白皮书报告200+份汇总解读|附PDF下载数据挖掘深度学习人工智能算法
原文链接：https://tecdat.cn/?p=40836在当今科技飞速发展的时代，人工智能正以前所未有的速度渗透到各个行业，深刻改变着人们的生活与工作方式。本报告汇总解读聚焦智能系统工程这一前沿领域，深入剖析其发展现状、关键技术、应用实践及未来趋势。本报告汇总洞察基于文末269份人工智能行业研究报告的数据，报告合集已分享在交流群，阅读原文进群和500+行业人士共同交流和成长。报告首先对智能系
全套清华大学DeepSeek教程来袭 2501_90771721 pdf
资源链接：https://pan.quark.cn/s/3d4088555ca0资源链接：https://pan.quark.cn/s/df8ce3ea6f4e「DeepSeek资料大全」资源链接：https://pan.quark.cn/s/1352425b0645「完整版Dee...键整合包」链接：https://pan.quark.cn/s/7e851bca2dc2在当今这个人工智能飞速发展
Python从0到100（六十八）：Python OpenCV-图像边缘检测及图像融合是Dream呀 opencv python 计算机视觉
前言：零基础学Python：Python从0到100最新最全教程。想做这件事情很久了，这次我更新了自己所写过的所有博客，汇集成了Python从0到100，共一百节课，帮助大家一个月时间里从零基础到学习Python基础语法、Python爬虫、Web开发、计算机视觉、机器学习、神经网络以及人工智能相关知识，成为学习学习和学业的先行者！欢迎大家订阅专栏：零基础学Python：Python从0到100最新
中国信通院“护证计划”正式启动，合合信息入选首批技术支撑单位大模型人工智能算法
随着人工智能技术的飞速发展，AI照“骗”在各个行业泛滥成灾，数字图像的真实性面临前所未有的挑战。近日，由中国互联网协会中小企业发展工委会主办的“卓信大数据计划”2025年度会议在京召开。本次会议上，中国信通院、中国互联网协会、中国图象图形学学会以及合合信息、蚂蚁安全实验室等多家企业代表共同启动了以AI守护AI，面向可信证照的专项行动“护证计划”，合合信息成功入选“护证计划”首批技术支撑单位。图说：
【Stable Diffusion】AnimatedDiff--AI动画插件使用技巧分享；文生视频、图生视频、AI生成视频工具；乘凉~ 人工智能应用 stable diffusion 人工智能音视频
本专栏主要记录人工智能的应用方面的内容，包括chatGPT、DeepSeek、AI绘画等等；在当今AI的热潮下，不学习AI，就要被AI淘汰；所以欢迎小伙伴加入本专栏和我一起探索AI的应用，通过AI来帮助自己提升生产力；本文的目标就是让每一个读者，都能学会并掌握AnimateDiff的使用；成功用它来生成你想要的视频。AnimateDiff是StableDiffusion的一个插件，借助它，你可以实
清华大学《DeepSeek与AI幻觉》（无套路免费分享） xiecoding.cn 人工智能 deepseek deepseek教程 deepseek与AI幻觉 deepseek清华教程
随着人工智能技术的飞速发展，以DeepSeek为代表的国产大模型正逐渐成为各行各业的重要工具。然而，AI在生成内容时常常会出现“幻觉”——即生成与事实不符、逻辑断裂或脱离上下文的内容。清华大学新闻与传播学院与人工智能学院联合推出的这篇教程《DeepSeek与AI幻觉》，系统性地讲解了AI幻觉的成因、评测方法及应对策略，旨在帮助用户更好地理解和使用AI工具。《DeepSeek与AI幻觉》：https
上海第二批49家创新型企业总部名单出炉，合合信息入选人工智能算法大数据大模型
创新型企业是上海现代化产业体系的重要组成部分，是上海高质量发展的活力所在。近期，上海为新认定的第二批49家创新型企业总部进行授牌，着力为创新型企业在沪发展壮大营造良好环境。此次获授牌的企业总部涵盖集成电路、生物医药、人工智能、数字经济、战新综合等重点产业领域，上海合合信息科技股份有限公司（股票代码：688615.SH）成功入选第二批49家创新型企业总部名单，系人工智能领域获奖企业之一。图说：上海市
深入详解人工智能机器学习：强化学习猿享天开人工智能基础知识学习人工智能机器学习强化学习
目录强化学习概述强化学习的基本概念定义关键组件强化学习过程常用算法应用示例示例代码代码解释应用场景强化学习核心概念和底层原理核心概念底层原理总结强化学习概述强化学习（ReinforcementLearning,RL）是机器学习中的一个重要领域，其核心目标是通过与环境的交互学习如何采取行动以最大化累积奖励。与监督学习不同的是，强化学习不依赖于给定的输入输出对，而是通过试探和反馈不断改进决策策略。强化
饿了么算法工程师-AIGC岗内推飞300 AIGC 业界资讯
1、紧跟业界最新自然语言处理技术动态，深入研发并努力创新，特别是在LLM、多模态理解和LLMAgent领域。2、基于大型语言模型开展文本生成、自然语言理解以及智能对话系统的研发，提出新颖的算法/模型，并进行实际开发和应用。3、探索多模态数据的结合，包括图像、文本、语音等，以丰富智能系统的理解和交互能力。4、将自然语言处理技术与具体业务场景相结合，考虑业务的特殊性并适配业务需求。参与到具体的NLP相
2025年，值得关注的LLM大趋势 AI小白熊人工智能产品经理 python 开发语言学习 ai 大模型
随着人工智能技术不断进步，大语言模型正在改变各行各业的运作方式。从代码生成到语言学习应用，GenAI已经渗透到我们日常生活的方方面面。随着像上个月OpenAI的“12天”计划或谷歌的Veo2和Imagen3等新技术的发布，我们看到了快速的创新迭代。面对这些变化，2025年LLM的大趋势值得我们关注。LLM的新兴应用：不仅仅是聊天机器人回想起最初我们用ChatGPT来生成代码或修改文本时，可能没有意
构建智慧校园：推动教育现代化的重要路径智慧校园-合肥自友科技智慧校园数字化校园智慧校园平台智慧校园智慧校园系统智慧校园平台智慧校园建设智慧校园软件智慧校园方案智慧校园厂商
随着信息技术的飞速发展，智慧校园作为教育领域的新趋势，正逐渐成为推动教育现代化的重要力量。智慧校园不仅是一种物理空间的升级，更是一种教育理念和实践方式的革新。它强调利用大数据、人工智能、物联网等前沿技术，实现教学过程的智能化、个性化与高效化。智慧校园的核心在于智能硬件设施的广泛部署，如智能教室、电子白板、智能图书馆等，这些设备不仅能够提供更为便捷、高效的教与学环境，还能够收集并分析大量数据，为优化
自然语言处理入门：从基础概念到实战项目范范0825 自然语言处理人工智能
自然语言处理入门：从基础概念到实战项目一、引言自然语言处理（NaturalLanguageProcessing，简称NLP）是人工智能的重要分支，旨在让计算机能够理解、生成和处理人类语言。随着大数据和深度学习的发展，NLP技术在文本分类、机器翻译、问答系统、情感分析等领域得到了广泛应用。本文将从NLP的基础概念入手，逐步介绍关键技术，最终通过一个完整的实战项目帮助读者掌握如何在实际应用中使用NLP
无法启动此程序，因为计算机丢失api-ms-win-core-path-l1-1-0.dll的解决方案爱编程的喵喵 Python基础课程 python windows 7 api-ms-win-core 解决方案
大家好，我是爱编程的喵喵。双985硕士毕业，现担任全栈工程师一职，热衷于将数据思维应用到工作与生活中。从事机器学习以及相关的前后端开发工作。曾在阿里云、科大讯飞、CCF等比赛获得多次Top名次。现为CSDN博客专家、人工智能领域优质创作者。喜欢通过博客创作的方式对所学的知识进行总结与归纳，不仅形成深入且独到的理解，而且能够帮助新手快速入门。本文主要介绍了无法启动此程序，因为计算机丢失api
二分查找排序算法周凡杨 java 二分查找排序算法折半
一：概念二分查找又称折半查找（折半搜索/ 二分搜索），优点是比较次数少，查找速度快，平均性能好；其缺点是要求待查表为有序表，且插入删除困难。因此，折半查找方法适用于不经常变动而查找频繁的有序列表。首先，假设表中元素是按升序排列，将表中间位置记录的关键字与查找关键字比较，如果两者相等，则查找成功；否则利用中间位置记录将表分成前、后两个子表，如果中间位置记录的关键字大于查找关键字，则进一步
java中的BigDecimal bijian1013 java BigDecimal
在项目开发过程中出现精度丢失问题，查资料用BigDecimal解决，并发现如下这篇BigDecimal的解决问题的思路和方法很值得学习，特转载。原文地址：http://blog.csdn.net/ugg/article/de
Shell echo命令详解 daizj echo shell
Shell echo命令 Shell 的 echo 指令与 PHP 的 echo 指令类似，都是用于字符串的输出。命令格式： echo string 您可以使用echo实现更复杂的输出格式控制。 1.显示普通字符串: echo "It is a test" 这里的双引号完全可以省略，以下命令与上面实例效果一致： echo Itis a test 2.显示转义
Oracle DBA 简单操作周凡杨 oracle dba sql
--执行次数多的SQL select sql_text,executions from ( select sql_text,executions from v$sqlarea order by executions desc ) where rownum<81; &nb
画图重绘朱辉辉33 游戏
我第一次接触重绘是编写五子棋小游戏的时候，因为游戏里的棋盘是用线绘制的，而这些东西并不在系统自带的重绘里，所以在移动窗体时，棋盘并不会重绘出来。所以我们要重写系统的重绘方法。在重写系统重绘方法时，我们要注意一定要调用父类的重绘方法，即加上super.paint(g)，因为如果不调用父类的重绘方式，重写后会把父类的重绘覆盖掉，而父类的重绘方法是绘制画布，这样就导致我们
线程之初体验西蜀石兰线程
一直觉得多线程是学Java的一个分水岭，懂多线程才算入门。之前看《编程思想》的多线程章节，看的云里雾里，知道线程类有哪几个方法，却依旧不知道线程到底是什么？书上都写线程是进程的模块，共享线程的资源，可是这跟多线程编程有毛线的关系，呜呜。。。线程其实也是用户自定义的任务，不要过多的强调线程的属性，而忽略了线程最基本的属性。你可以在线程类的run()方法中定义自己的任务，就跟正常的Ja
linux集群互相免登陆配置林鹤霄 linux
配置ssh免登陆 1、生成秘钥和公钥 ssh-keygen -t rsa 2、提示让你输入，什么都不输，三次回车之后会在~下面的.ssh文件夹中多出两个文件id_rsa 和 id_rsa.pub 其中id_rsa为秘钥，id_rsa.pub为公钥，使用公钥加密的数据只有私钥才能对这些数据解密 c
mysql : Lock wait timeout exceeded; try restarting transaction aigo mysql
原文：http://www.cnblogs.com/freeliver54/archive/2010/09/30/1839042.html 原因是你使用的InnoDB 表类型的时候, 默认参数:innodb_lock_wait_timeout设置锁等待的时间是50s, 因为有的锁等待超过了这个时间,所以抱错. 你可以把这个时间加长,或者优化存储
Socket编程基本的聊天实现。 alleni123 socket
public class Server { //用来存储所有连接上来的客户 private List<ServerThread> clients; public static void main(String[] args) { Server s = new Server(); s.startServer(9988); } publi
多线程监听器事件模式(一个简单的例子) 百合不是茶线程监听模式
多线程的事件监听器模式监听器时间模式经常与多线程使用,在多线程中如何知道我的线程正在执行那什么内容,可以通过时间监听器模式得到创建多线程的事件监听器模式思路: 1, 创建线程并启动,在创建线程的位置设置一个标记 2,创建队
spring InitializingBean接口 bijian1013 java spring
spring的事务的TransactionTemplate，其源码如下： public class TransactionTemplate extends DefaultTransactionDefinition implements TransactionOperations, InitializingBean{ ... } TransactionTemplate继承了DefaultT
Oracle中询表的权限被授予给了哪些用户 bijian1013 oracle 数据库权限
Oracle查询表将权限赋给了哪些用户的SQL，以备查用。 select t.table_name as "表名", t.grantee as "被授权的属组", t.owner as "对象所在的属组"
【Struts2五】Struts2 参数传值 bit1129 struts2
Struts2中参数传值的3种情况 1.请求参数绑定到Action的实例字段上 2.Action将值传递到转发的视图上 3.Action将值传递到重定向的视图上一、请求参数绑定到Action的实例字段上以及Action将值传递到转发的视图上 Struts可以自动将请求URL中的请求参数或者表单提交的参数绑定到Action定义的实例字段上，绑定的规则使用ognl表达式语言
【Kafka十四】关于auto.offset.reset[Q/A] bit1129 kafka
I got serveral questions about auto.offset.reset. This configuration parameter governs how consumer read the message from Kafka when there is no initial offset in ZooKeeper or
nginx gzip压缩配置 ronin47 nginx gzip 压缩范例
nginx gzip压缩配置更多 0 nginx gzip 配置随着nginx的发展，越来越多的网站使用nginx，因此nginx的优化变得越来越重要，今天我们来看看nginx的gzip压缩到底是怎么压缩的呢？ gzip(GNU-ZIP)是一种压缩技术。经过gzip压缩后页面大小可以变为原来的30%甚至更小，这样，用
java-13.输入一个单向链表，输出该链表中倒数第 k 个节点 bylijinnan java
two cursors. Make the first cursor go K steps first. /* * 第 13 题：题目：输入一个单向链表，输出该链表中倒数第 k 个节点 */ public void displayKthItemsBackWard(ListNode head,int k){ ListNode p1=head,p2=head;
Spring源码学习-JdbcTemplate queryForObject bylijinnan java spring
JdbcTemplate中有两个可能会混淆的queryForObject方法： 1. Object queryForObject(String sql, Object[] args, Class requiredType) 2. Object queryForObject(String sql, Object[] args, RowMapper rowMapper) 第1个方法是只查
[冰川时代]在冰川时代,我们需要什么样的技术? comsci 技术
看美国那边的气候情况....我有个感觉...是不是要进入小冰期了? 那么在小冰期里面...我们的户外活动肯定会出现很多问题...在室内呆着的情况会非常多...怎么在室内呆着而不发闷...怎么用最低的电力保证室内的温度.....这都需要技术手段... &nb
js 获取浏览器型号 cuityang js 浏览器
根据浏览器获取iphone和apk的下载地址 <!DOCTYPE html> <html> <head> <meta charset="utf-8" content="text/html"/> <meta name=
C# socks5详解转 dalan_123 socket C#
http://www.cnblogs.com/zhujiechang/archive/2008/10/21/1316308.html 这里主要讲的是用.NET实现基于Socket5下面的代理协议进行客户端的通讯，Socket4的实现是类似的，注意的事，这里不是讲用C#实现一个代理服务器，因为实现一个代理服务器需要实现很多协议，头大，而且现在市面上有很多现成的代理服务器用，性能又好，
运维 Centos问题汇总 dcj3sjt126com 云主机
一、sh 脚本不执行的原因 sh脚本不执行的原因只有2个 1.权限不够 2.sh脚本里路径没写完整。二、解决You have new mail in /var/spool/mail/root 修改/usr/share/logwatch/default.conf/logwatch.conf配置文件 MailTo = MailFrom 三、查询连接数
Yii防注入攻击笔记 dcj3sjt126com sql WEB安全 yii
网站表单有注入漏洞须对所有用户输入的内容进行个过滤和检查，可以使用正则表达式或者直接输入字符判断，大部分是只允许输入字母和数字的，其它字符度不允许；对于内容复杂表单的内容，应该对html和script的符号进行转义替换：尤其是<,>,',"",&这几个符号这里有个转义对照表： http://blog.csdn.net/xinzhu1990/articl
MongoDB简介[一] eksliang mongodb MongoDB简介
MongoDB简介转载请出自出处：http://eksliang.iteye.com/blog/2173288 1.1易于使用 MongoDB是一个面向文档的数据库，而不是关系型数据库。与关系型数据库相比，面向文档的数据库不再有行的概念，取而代之的是更为灵活的“文档”模型。另外，不
zookeeper windows 入门安装和测试 greemranqq zookeeper 安装分布式
一、序言以下是我对zookeeper 的一些理解： zookeeper 作为一个服务注册信息存储的管理工具，好吧，这样说得很抽象，我们举个“栗子”。栗子1号：假设我是一家KTV的老板，我同时拥有5家KTV，我肯定得时刻监视
Spring之使用事务缘由(2-注解实现) ihuning spring
Spring事务注解实现 1. 依赖包： 1.1 spring包： spring-beans-4.0.0.RELEASE.jar spring-context-4.0.0.
iOS App Launch Option 啸笑天 option
iOS 程序启动时总会调用application:didFinishLaunchingWithOptions:，其中第二个参数launchOptions为NSDictionary类型的对象，里面存储有此程序启动的原因。 launchOptions中的可能键值见UIApplication Class Reference的Launch Options Keys节。 1、若用户直接
jdk与jre的区别（_） macroli java jvm jdk
简单的说JDK是面向开发人员使用的SDK，它提供了Java的开发环境和运行环境。SDK是Software Development Kit 一般指软件开发包，可以包括函数库、编译程序等。 JDK就是Java Development Kit JRE是Java Runtime Enviroment是指Java的运行环境，是面向Java程序的使用者，而不是开发者。如果安装了JDK，会发同你
Updates were rejected because the tip of your current branch is behind qiaolevip 学习永无止境每天进步一点点众观千象 git
$ git push joe prod-2295-1 To git@git.dianrong.com:joe.le/dr-frontend.git ! [rejected] prod-2295-1 -> prod-2295-1 (non-fast-forward) error: failed to push some refs to 'git@git.dianron
[一起学Hive]之十四-Hive的元数据表结构详解 superlxw1234 hive hive元数据结构
关键字：Hive元数据、Hive元数据表结构之前在 “[一起学Hive]之一–Hive概述，Hive是什么”中介绍过，Hive自己维护了一套元数据，用户通过HQL查询时候，Hive首先需要结合元数据，将HQL翻译成MapReduce去执行。本文介绍一下Hive元数据中重要的一些表结构及用途，以Hive0.13为例。文章最后面，会以一个示例来全面了解一下，
Spring 3.2.14，4.1.7，4.2.RC2发布 wiselyman Spring 3
Spring 3.2.14、4.1.7及4.2.RC2于6月30日发布。其中Spring 3.2.1是一个维护版本(维护周期到2016-12-31截止)，后续会继续根据需求和bug发布维护版本。此时，Spring官方强烈建议升级Spring框架至4.1.7 或者将要发布的4.2 。其中Spring 4.1.7主要包含这些更新内容。

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他