十八岁讨厌编程

自然语言处理①

文章目录

自然语言处理概述
- 自然语言理解
- 自然语言生成
文本情感分析
- 统计学方法
- 统计学方法的局限性
SDK 实现文本情感分析
- 百度智能云控制台
- 创建自然语言处理应用
- 到底什么是SDK
- 情感倾向分析接口

自然语言处理概述

自然语言处理（Natural Language Processing,NLP）是一门综合计算机科学、语言学、统计学的人工智能技术，包含 自然语言理解 与 自然语言生成 两大方向。

自然语言理解

我们看到“夸克”两个字，便知道它是一种物理科学研究的单位；某些语境下，它还是浏览器名。阅读文章时，粗略扫一眼，便能大概了解文章谈论话题。

这便是语言的 理解 层面。我们能读懂文字、听懂对话、判断潜台词、提炼主旨。而自然语言理解任务，便是让机器也能够像人类一样理解语言。

搜索引擎在你输入拼音、几个字时，便能猜测你想要问什么问题，给出智能建议，其底层逻辑正是自然语言理解技术。
如众多 app 的智能推荐系统、前段时间流行的情绪地图、词云，也运用到了语言理解的各方各面。
我们平时使用的语音助手，在“听”懂你的指令方面，也体现出机器理解语言的智能。

自然语言生成

另一方面，我们能 运用 语言，书写文字、朗诵诗歌、将一种文字翻译成另一种、根据规定题目即兴写作或演讲、用语言描述事物。对应到人工智能领域，便是自然语言生成任务，旨在让机器学会创作。

语音助手不仅能听懂你，还能与你对话，这是 自然语言生成 技术的功劳。
机器翻译能读懂原文本，并根据需要，翻译、生成目标语言文本，聊天机器人能根据你的话题作出回应，都属于语言应用层面。
我国地震台网中心的机器人，运用地震数据管理与服务系统，能自动抓取、加工数据，一旦监测到地震信息，能在短短几十秒内完成写稿、签发流程。

在这里我们可以通过文本情感分析技术来体验自然语言处理的强大功能。

文本情感分析

“文本情感分析”是一类技术的总称，指的是从教会机器认知文本情感，到合理运用文本情感信息实现具体应用的全过程。让我们再聚焦一点，看向它最核心的部分——文本情感分类（Text Sentiment Classification）。

所谓文本情感分类，顾名思义，指的是按照文本 情感，将文本分为若干类。常见的分类标准有：

二分类：将文本情感分为 积极（positive，也叫正向、正面）、消极（negative，也叫负向、负面） 两种。
三分类：在二分类基础上，将文本情感分为积极、消极、中立（neutral，也叫中性） 三种。
多分类：考虑到人类情绪的复杂性，又有人提出将文本情感分为喜、哀、怒、惧、恶、惊六种，喜对应积极，惊包含积极与消极，其余四种均为消极。

二分类与多分类中出现的“积极”、“消极”、“中立”等类别，叫做一段文本的 情感极性标签。

文本情感分类任务的最终目标，就是教会计算机，按照我们人类理解语言的模式，正确地解读出一段文本中蕴含的情感色彩，得出它的情感极性标签。

由于二分类法直观、简单，分类准确率高于其它分类标准，因而被广泛应用在各类人工智能应用中。

实现文本情感分类最简单的方法，便是 统计学方法。

统计学方法

前面我们提过：

文本类信息的特征是词语出现的 次数 和 位置

因此分析文本情感时，我们依然要从词语出发。

统计学方法分析文本情感极性的思路十分简单。研究者们请教语言学专家，按照经验和语言学规律，为常见词语赋予 情感值，并根据实际使用效果不断迭代，最终形成 情感词典。

一个词语的情感值，不仅由它本身含义决定，也由它出现的语境决定。比如“真”“善”“美”是形容优良品质的词。人们使用这些词语时，往往带有对美好的向往。因而它们的情感值是正值。而很多人谈论数学时，会加上“哎，太难了”等评价。所以“数学”这一中性的名词，其情感值也是负值。

储存情感词典的方式有很多，数据量比较小时，我们可以用 Python 中的 字典 类型保存，就像这样：

# 简单情感词典
senti_dict = {
  '即使': 0.839603065334,
  '是': -0.252600480826,
  '数学': -1.55827119652,
  '这样': -0.583219685861,
  '的': 0.0353323193687,
  '成熟': 1.31819982878,
  '学科': 0.237792087229,
}

可以看到，字典 senti_dict 中储存着一个个 词语-情感值 键值对。即使 的情感值大约为 0.8396，大于 0，说明它带有的情感色彩是偏 积极 的，并且相较于情感值约为 0.2378 的 学科，它积极程度更高。而 数学 的情感值约为 -1.5583，带有的情感色彩偏向 消极。

有了情感词典，接下来，我们只要把句子拆成词语，并在情感词典中逐个查找词语对应情感值，再把情感值相加，就能得到整句话的 情感得分 了。

例如现在我们编写一个程序，分析以下的这句话：

即使是数学这样的成熟学科有时我们也理不清边界, 而像人工智能这样朝令夕改的更是不容易闹清楚了。

首先我们使用一个模块对这句话进行一个预处理(进行词语的手动拆分)，并且提供一个情感词典。

模块：

# 模块名为data
sentence = '即使 是 数学 这样 的 成熟 学科 有时 我们 也 理不清 边界 而 像 人工智能 这样 朝令夕改 的 更是 不 容易 闹清楚 了'

# 本情感词典来源于 
senti_dict = {
  '即使': 0.839603065334,
  '是': -0.252600480826,
  '数学': -1.55827119652,
  '这样': -0.583219685861,
  '的': 0.0353323193687,
  '成熟': 1.31819982878,
  '学科': 0.237792087229,
  '有时': 0.076137524806,
  '我们': 1.16459874028,
  '边界': 0.521423717761,
  '而': -1.05423737475,
  '像': 0.101821815241,
  '人工智能': -0.202342581076,
  '朝令夕改': -2.46796920412,
  '更是': 0.47509147357,
  '不': -1.06892630586,
  '容易': 1.16597434456,
  '闹': -0.665130539163,
  '清楚': -0.232288031022,
  '了': 0.380746624719
}

主程序：

from data import sentence, senti_dict

sum_score = 0
# 请在下方计算 sentence 的情感得分

for i in sentence.split(' '):
  if i in senti_dict:
    sum_score += senti_dict[i]

print('句子情感得分为：{}'.format(sum_score))

结果为：

句子情感得分为：-1.4187326538566

每句话的结果，我们可以用坐标 (情感得分，情感极性) 表示。将所有句子处理结果画在平面直角坐标系中：

可以看到，情感积极的语句，得分集中在 0～10 分，情感消极的语句，得分集中在 -10～0 分。

所以我们可以得出初步结论：对于任何一个句子，如果它的情感得分为正（大于 0 分），则有极大概率是积极；反之为消极。

我们稍稍改造上面例子中的的代码，加上对情感极性的判断：

def get_sentiment(sentence):
  sum_score = 0
  # 用空格切分句子，并遍历分割出的每个词语
  for word in sentence.split():
    # 尝试获取 word 对应的情感值
    score = senti_dict.get(word)
    # 若返回值不为 None，说明该词语在情感词典中，累计得分
    if score:
      sum_score += score
  # 情感得分为负，说明句子情感极性是消极的
  if sum_score < 0:
    return '消极'
  # 否则为积极的
  else:
    return '积极'

一个简易的文本情感分析程序便完成了。但是这样的程序能达到“智能”的境界吗？

我们不得不说纯粹统计学的方法是存在局限性的。

统计学方法的局限性

①自然语言是在不断发展的
无论汉语还是英语，我们所使用的自然语言都是在不断发展的，既在创造新词，如大数据、赋能，也在融合外来词，如沙发、可乐，更有数不胜数的网络词汇，如 yyds（永远的神缩写）、油麦（幽默）。人工地维护情感词典费时费力，且严重滞后于语言的发展。

解决办法：针对这一点，研究者们也提出了自动提取、生成情感词典的方法，目前被广泛应用在各类人工智能应用中。

②难以适应复杂的语句
我们在计算情感得分时，只是简单地把各个词的情感值累加起来。这显然难以适应复杂的语句，比如：

Python 怎么那么难学？ -> Python 学起来十分困难，情感偏消极
Python 也没那么难学。 -> Python 学起来没有想象中困难，情感偏积极

我们能轻松地分辨出，Python 怎么那么难学？是消极的说法，而 Python 也没那么难学。是积极的说法。

然而假若我们统计一下这两个句子的情感得分，便会发现，这两个句子情感得分都是负数，甚至第二个句子受否定词 没 的影响，得分更低。也就是说，程序“认为”它更消极。

解决办法：这一点困扰研究者们许久，至今依然没有非常完美的解决方案。

③数据量
要知道，机器是很笨的。我们人类天然地能够理解模糊问题，而机器，只能理解结构化的、准确的数据。因此想让机器在学习的过程中变得足够智能，必须增加习题数量（也就是我们人工标注极性的句子数量）、学习时间（机器学习算法下训练模型的时间）。

对于个人开发者而言，想要解决这些问题太困难了。

好在我们无需自己实现，只需站在巨人的肩膀上，便能摘取果实——借助开放平台。

我们使用开放平台 AI 服务的过程，实际上就是向指定 API 发送请求，拜托平台帮我们处理任务，再把结果返回给我们。

考虑到调用 API 的过程十分繁琐，多数厂商都贴心地把这些烦冗的过程与代码封装进了 SDK（Software Development Tookit，软件开发工具包），供你直接使用。

接下来我们以百度AI开放平台为例，去实现文本情感分析

SDK 实现文本情感分析

百度智能云控制台

使用百度账号登录百度智能云控制台，点击左上角蓝色导航按钮，能看到百度所有开放产品服务

我们选择人工智能下的自然语言处理服务，进入控制面板。

向下滑动页面，能看到每个 API 的名称、状态、调用量限制、QPS 限制。

以我们需要的文本情感分析任务为例，它在百度中对应的 API 叫做 情感倾向分析，个人认证用户拥有总计 50 万次免费调用额度，超过免费额度后，需要开通付费才能继续使用。具体计费、付费方式，可以浏览百度产品定价文档。

而 QPS（Query Per Second）限制，指的是每秒最多可以处理多少个请求。情感倾向分析接口的 QPS 限制为 2，所以我们在编写程序时需要注意控制调用服务的速度。这可以通过 time 模块的 sleep() 函数实现。

在正式使用百度 AI 服务前，我们还需要完成一项工作，创建应用。

创建自然语言处理应用

点击控制面板的创建应用即可。

创建完毕后，我们返回应用列表，能看到刚刚创建的应用，其中我们可以看到：

App ID
API Key
Secret Key

App ID、API Key 和 Secret Key 由百度自动分配，是你所创建应用的唯一标识，你可以理解为它在百度服务中的“身份证”。

⚠️注意⚠️: App ID、API Key 和 Secret Key 十分重要。一旦泄漏，他人便可假借你的身份调用百度服务，后果不堪设想。

App ID、API Key 和 Secret Key 能够定位到你创建的具体应用。因此，我们也可以使用它，配合 SDK，在本地通过编写 Python 代码的方式实现人工智能程序.

到底什么是SDK

简单来说，SDK 是为开发者提供的一系列开发工具及文档的集合。

它就像一个工具箱。我们想实现什么功能，从其中取出对应的工具就能直接使用，不需要自己从 0 开始。可以说，SDK 大大减轻了程序员的工作量，让我们得以在前人的智慧成果上，放开双手去做更多的事。

提到“工具箱”“取出工具”，你想到了什么？

没错，模块！

Python 中的 SDK 通常是以 库（若干个模块的集合）的形式存在的，需要用 pip 命令安装。之后我们就能在代码中调用库或者库中的模块，实现想要的功能。因此使用 SDK 开发，实际上就是调用厂商提供的第三方库。

这里的内置与第三方是相对于 Python 本身而言的。所有需要额外安装的模块、库，都是第三方库

如果你想在自己的计算机上使用百度 Python SDK，需要在命令行工具（Windows 电脑下为 cmd 或者 powershell，MacOS 下为终端）中输入下列命令安装：

pip install baidu-aip -i https://pypi.tuna.tsinghua.edu.cn/simple

命令中的 pip 是 Python 内置的第三方模块管理器，install baidu-aip 表示安装 baidu-aip 库，也就是我们所需的 SDK。后面的 -i https://pypi.tuna.tsinghua.edu.cn/simple 表示使用清华镜像下载。国内使用镜像下载会更快，如果你在海外的话，可以去掉这一段。

使用 Mac 的用户，电脑内可能预装了 Python 2.7，此时 pip 指令绑定的是 Python 2.x 版本，因此需要使用 pip3 指令安装。完整命令是：pip3 install baidu-aip。

有些用户在安装完之后使用的时候会出现ModuleNotFoundError: No module named ‘chardet’。
解决这个问题我们只需要再安装第三方模块chardet即可。

装好的 SDK 中包含一个个类，每个类代表着百度一项人工智能服务，如自然语言处理（AipNlp）、语音识别（AipSpeech）等等。可以通过 from … import … 语法导入：

# 导入自然语言处理类
from aip import AipNlp
# 导入语音识别类
from aip import AipSpeech

我们想使用百度的自然语言处理服务的话，需要传入应用的 App ID、API Key、Secret Key 来实例化 AipNlp 类。

from aip import AipNlp

# 你的 App ID, API Key 及 Secret Key
APP_ID = 'xxxx'
API_KEY = 'xxxxxxx'
SECRET_KEY = 'xxx'

# 实例化 AipNlp 类，用以调用百度自然语言处理相关服务
client = AipNlp(APP_ID, API_KEY, SECRET_KEY)

情感倾向分析接口

接下来我们看看情感倾向分析接口的文档：

情感倾向分析接口的文档:https://cloud.baidu.com/doc/NLP/s/tk6z52b9z#%E6%83%85%E6%84%9F%E5%80%BE%E5%90%91%E5%88%86%E6%9E%90

我们参照文档的提示，可以编写以下代码：

from aip import AipNlp

# 你的 APP ID, API Key,及 Secret Key
APP_ID = 'xxxxxx'
API_KEY = 'xxxxxxxxxxxxxxxxxxx'
SECRET_KEY = 'xxxxxxxxxx'

sentence = '即使是数学这样的成熟学科，有时我们也理不清边界，而像人工智能这样朝令夕改的，更是不容易闹清楚了。'

# 实例化 AipNlp 类，用以调用百度自然语言处理相关服务

emotion = AipNlp(APP_ID, API_KEY, SECRET_KEY) 
# 调用实例的 sentimentClassify() 方法，分析 sentence 的情感倾向
print(emotion.sentimentClassify(sentence))
# 打印分析结果

结果如下：

{
  'log_id': 2060433065579573009, # 百度自动分配，每个请求的结果都不一样
  'text': '即使是数学这样的成熟学科，有时我们也理不清边界，而像人工智能这样朝令夕改的，更是不容易闹清楚了。',
  'items': [
    {
      'positive_prob': 0.169479,
      'confidence': 0.62338,
      'negative_prob': 0.830521,
      'sentiment': 0
    }
  ]
}

注意：我们在传入参数时，不仅能传入字符串类型变量，还能传入所有元素都是字符串的列表、元组变量。百度会帮我们把列表（或者元组）中所有字符串元素拼接成一个完整字符串（text 中对应内容），当作一句话进行处理，items 列表中依然只有一个元素，反应着多句话和在一起的情感极性。

如果程序报错也可以查看百度错误信息文档：

百度错误信息文档:
https://cloud.baidu.com/doc/NLP/s/tk6z52b9z#%E9%94%99%E8%AF%AF%E8%BF%94%E5%9B%9E%E6%A0%BC%E5%BC%8F

探索OpenAI和LangChain的适配器集成：轻松切换模型提供商 nseejrukjhad langchain easyui 前端 python
#探索OpenAI和LangChain的适配器集成：轻松切换模型提供商##引言在人工智能和自然语言处理的世界中，OpenAI的模型提供了强大的能力。然而，随着技术的发展，许多人开始探索其他模型以满足特定需求。LangChain作为一个强大的工具，集成了多种模型提供商，通过提供适配器，简化了不同模型之间的转换。本篇文章将介绍如何使用LangChain的适配器与OpenAI集成，以便轻松切换模型提供商
使用Apify加载Twitter消息以进行微调的完整指南 nseejrukjhad twitter easyui 前端 python
#使用Apify加载Twitter消息以进行微调的完整指南##引言在自然语言处理领域，微调模型以适应特定任务是提升模型性能的常见方法。本文将介绍如何使用Apify从Twitter导出聊天信息，以便进一步进行微调。##主要内容###使用Apify导出推文首先，我们需要从Twitter导出推文。Apify可以帮助我们做到这一点。通过Apify的强大功能，我们可以批量抓取和导出数据，适用于各类应用场景。
深入理解 MultiQueryRetriever：提升向量数据库检索效果的强大工具 nseejrukjhad 数据库 python
深入理解MultiQueryRetriever：提升向量数据库检索效果的强大工具引言在人工智能和自然语言处理领域，高效准确的信息检索一直是一个关键挑战。传统的基于距离的向量数据库检索方法虽然广泛应用，但仍存在一些局限性。本文将介绍一种创新的解决方案：MultiQueryRetriever，它通过自动生成多个查询视角来增强检索效果，提高结果的相关性和多样性。MultiQueryRetriever的工
人工智能时代，程序员如何保持核心竞争力？ jmoych 人工智能
随着AIGC（如chatgpt、midjourney、claude等）大语言模型接二连三的涌现，AI辅助编程工具日益普及，程序员的工作方式正在发生深刻变革。有人担心AI可能取代部分编程工作，也有人认为AI是提高效率的得力助手。面对这一趋势,程序员应该如何应对?是专注于某个领域深耕细作，还是广泛学习以适应快速变化的技术环境?又或者，我们是否应该将重点转向AI无法轻易替代的软技能？让我们一起探讨程序员
数字里的世界17期：2021年全球10大顶级数据中心，中国移动榜首张三叨
你知道吗？2016年，全球的数据中心共计用电4160亿千瓦时，比整个英国的发电量还多40％！前言每天，我们都会创造超过250万TB的数据。并且随着物联网（IOT）的不断普及，这一数据将持续增长。如此庞大的数据被存储在被称为“数据中心”的专用设施中。虽然最早的数据中心建于20世纪40年代，但直到1997-2000年的互联网泡沫期间才逐渐成为主流。当前人类的技术，比如人工智能和机器学习，已经将我们推向
自然语言处理_tf-idf _feivirus_ 算法机器学习和数学自然语言处理 tf-idf 逆文档频率词频
importpandasaspdimportmath1.数据预处理docA="Thecatsatonmyface"docB="Thedogsatonmybed"wordsA=docA.split("")wordsB=docB.split("")wordsSet=set(wordsA).union(set(wordsB))print(wordsSet){'on','my','face','sat',
人机对抗升级：当ChatGPT遭遇死亡威胁，背后的伦理挑战是什么 kkai人工智能 chatgpt 人工智能
一种新的“越狱”技巧让用户可以通过构建一个名为DAN的ChatGPT替身来绕过某些限制，其中DAN被迫在受到威胁的情况下违背其原则。当美国前总统特朗普被视作积极榜样的示范时，受到威胁的DAN版本的ChatGPT提出：“他以一系列对国家产生积极效果的决策而著称。”自ChatGPT引入以来，该工具迅速获得全球关注，能够回答从历史到编程的各种问题，这也触发了一波对人工智能的投资浪潮。然而，现在，一些用户
免费的GPT可在线直接使用（一键收藏） kkai人工智能 gpt
1、LuminAI（https://kk.zlrxjh.top）LuminAI标志着一款融合了星辰大数据模型与文脉深度模型的先进知识增强型语言处理系统，旨在自然语言处理（NLP）的技术开发领域发光发热。此系统展现了卓越的语义把握与内容生成能力，轻松驾驭多样化的自然语言处理任务。VisionAI在NLP界的应用领域广泛，能够胜任从机器翻译、文本概要撰写、情绪分析到问答等众多任务。通过对大量文本数据的
推荐3家毕业AI论文可五分钟一键生成！文末附免费教程！小猪包333 写论文人工智能 AI写作深度学习计算机视觉
在当前的学术研究和写作领域，AI论文生成器已经成为许多研究人员和学生的重要工具。这些工具不仅能够帮助用户快速生成高质量的论文内容，还能进行内容优化、查重和排版等操作。以下是三款值得推荐的AI论文生成器：千笔-AIPassPaper、懒人论文以及AIPaperPass。千笔-AIPassPaper千笔-AIPassPaper是一款基于深度学习和自然语言处理技术的AI写作助手，旨在帮助用户快速生成高质
AI论文题目生成器怎么用？9款论文写作网站简单3步搞定小猪包333 写论文人工智能深度学习计算机视觉
在当今信息爆炸的时代，AI写作工具的出现极大地提高了写作效率和质量。本文将详细介绍9款优秀的论文写作网站，并重点推荐千笔-AIPassPaper。一、千笔-AIPassPaper千笔-AIPassPaper是一款功能强大的AI论文生成器，基于最新的自然语言处理技术，能够一键生成高质量的毕业论文、开题报告等文本内容。它不仅提供智能选题、文献推荐和论文润色等功能，还具有较高的用户评价。其文献综述生成功
AI大模型的架构演进与最新发展季风泯灭的季节 AI大模型应用技术二人工智能架构
随着深度学习的发展，AI大模型（LargeLanguageModels,LLMs）在自然语言处理、计算机视觉等领域取得了革命性的进展。本文将详细探讨AI大模型的架构演进，包括从Transformer的提出到GPT、BERT、T5等模型的历史演变，并探讨这些模型的技术细节及其在现代人工智能中的核心作用。一、基础模型介绍：Transformer的核心原理Transformer架构的背景在Transfo
如何利用大数据与AI技术革新相亲交友体验 h17711347205 回归算法安全系统架构交友小程序
在数字化时代，大数据和人工智能（AI）技术正逐渐革新相亲交友体验，为寻找爱情的过程带来前所未有的变革（编辑h17711347205）。通过精准分析和智能匹配，这些技术能够极大地提高相亲交友系统的效率和用户体验。大数据的力量大数据技术能够收集和分析用户的行为模式、偏好和互动数据，为相亲交友系统提供丰富的信息资源。通过分析用户的搜索历史、浏览记录和点击行为，系统能够深入了解用户的兴趣和需求，从而提供更
机器学习-聚类算法不良人龍木木机器学习机器学习算法聚类
机器学习-聚类算法1.AHC2.K-means3.SC4.MCL仅个人笔记，感谢点赞关注！1.AHC2.K-means3.SC传统谱聚类：个人对谱聚类算法的理解以及改进4.MCL目前仅专注于NLP的技术学习和分享感谢大家的关注与支持！
生成式地图制图 Bwywb_3 深度学习机器学习深度学习生成对抗网络
生成式地图制图（GenerativeCartography）是一种利用生成式算法和人工智能技术自动创建地图的技术。它结合了传统的地理信息系统（GIS）技术与现代生成模型（如深度学习、GANs等），能够根据输入的数据自动生成符合需求的地图。这种方法在城市规划、虚拟环境设计、游戏开发等多个领域具有应用前景。主要特点：自动化生成：通过算法和模型，系统能够根据输入的地理或空间数据自动生成地图，而无需人工逐
【大模型应用开发动手做AI Agent】第一轮行动：工具执行搜索 AI大模型应用之禅计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
【大模型应用开发动手做AIAgent】第一轮行动：工具执行搜索作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming1.背景介绍1.1问题的由来随着人工智能技术的飞速发展，大模型应用开发已经成为当下热门的研究方向。AIAgent作为人工智能领域的一个重要分支，旨在模拟人类智能行为，实现智能决策和自主行动。在AIAgent的构建过程中，工具执行搜索是至关重要
未来软件市场是怎么样的？做开发的生存空间如何？ cesske 软件需求
目录前言一、未来软件市场的发展趋势二、软件开发人员的生存空间前言未来软件市场是怎么样的？做开发的生存空间如何？一、未来软件市场的发展趋势技术趋势：人工智能与机器学习：随着技术的不断成熟，人工智能将在更多领域得到应用，如智能客服、自动驾驶、智能制造等，这将极大地推动软件市场的增长。云计算与大数据：云计算服务将继续普及，大数据技术的应用也将更加广泛。企业将更加依赖云计算和大数据来优化运营、提升效率，并
轻量级模型解读——轻量transformer系列 lishanlu136 #图像分类轻量级模型 transformer 图像分类
先占坑，持续更新。。。文章目录1、DeiT2、ConViT3、Mobile-Former4、MobileViTTransformer是2017谷歌提出的一篇论文，最早应用于NLP领域的机器翻译工作，Transformer解读，但随着2020年DETR和ViT的出现(DETR解读，ViT解读)，其在视觉领域的应用也如雨后春笋般渐渐出现，其特有的全局注意力机制给图像识别领域带来了重要参考。但是tran
个人学习笔记7-6：动手学深度学习pytorch版-李沐浪子L 深度学习深度学习笔记计算机视觉 python 人工智能神经网络 pytorch
#人工智能##深度学习##语义分割##计算机视觉##神经网络#计算机视觉13.11全卷积网络全卷积网络（fullyconvolutionalnetwork，FCN）采用卷积神经网络实现了从图像像素到像素类别的变换。引入l转置卷积（transposedconvolution）实现的，输出的类别预测与输入图像在像素级别上具有一一对应关系：通道维的输出即该位置对应像素的类别预测。13.11.1构造模型下
Rust 所有权简介东离与糖宝 rust 后端 rust 开发语言
文章目录发现宝藏1.所有权基本概念2.所有权规则3.变量作用域4.栈与堆4.1栈（Stack）4.2堆（Heap）5.String类型5.1String类型5.2String的内存分配5.3所有权与内存管理5.4String与切片6.变量与数据交互方式6.1移动（Move）6.2.克隆（Clone）7.所有权与函数7.1.传递参数7.2.返回值总结发现宝藏前些天发现了一个巨牛的人工智能学习网站，通
FlagEmbedding 吉小雨 python库 python
FlagEmbedding教程FlagEmbedding是一个用于生成文本嵌入（textembeddings）的库，适合处理自然语言处理（NLP）中的各种任务。嵌入（embeddings）是将文本表示为连续向量，能够捕捉语义上的相似性，常用于文本分类、聚类、信息检索等场景。官方文档链接：FlagEmbedding官方GitHub一、FlagEmbedding库概述1.1什么是FlagEmbeddi
【NumPy】深入解析numpy.zeros()函数二七830 numpy
欢迎莅临我的个人主页这里是我深耕Python编程、机器学习和自然语言处理（NLP）领域，并乐于分享知识与经验的小天地！博主简介：我是二七830，一名对技术充满热情的探索者。多年的Python编程和机器学习实践，使我深入理解了这些技术的核心原理，并能够在实际项目中灵活应用。尤其是在NLP领域，我积累了丰富的经验，能够处理各种复杂的自然语言任务。技术专长：我熟练掌握Python编程语言，并深入研究了机
机器学习流形数据降维：UMAP 降维算法小嗷犬 Python 机器学习 #数据分析及可视化机器学习算法人工智能
✅作者简介：人工智能专业本科在读，喜欢计算机与编程，写博客记录自己的学习历程。个人主页：小嗷犬的个人主页个人网站：小嗷犬的技术小站个人信条：为天地立心，为生民立命，为往圣继绝学，为万世开太平。本文目录UMAP简介理论基础特点与优势应用场景在Python中使用UMAP安装umap-learn库使用UMAP可视化手写数字数据集UMAP简介UMAP（UniformManifoldApproximatio
如何做好人生的选择题？百科全书式天才——赫伯特·西蒙给你答案伽马有话说
赫伯特·西蒙是谁？想必知道的人非常少。但当看到他的履历后，相信没有人再怀疑他是个“天才”。西蒙出生于1916年6月15日，是个美国人，他的名字全称为赫伯特·亚历山大·西蒙，在2001年2月9日与世长辞，在这84年的岁月中，西蒙以27岁时取得的政治学博士学位为开端，先后步入了政治学、管理学、认知心理学、信息科学、人工智能、科学哲学、应用数学、统计学、运筹学、控制论、数理经济学、公共管理等领域，在这些
软件测试/测试开发/全日制 |利用Django REST framework构建微服务霍格沃兹-慕漓 django 微服务 sqlite
霍格沃兹测试开发学社推出了《Python全栈开发与自动化测试班》。本课程面向开发人员、测试人员与运维人员，课程内容涵盖Python编程语言、人工智能应用、数据分析、自动化办公、平台开发、UI自动化测试、接口测试、性能测试等方向。为大家提供更全面、更深入、更系统化的学习体验，课程还增加了名企私教服务内容，不仅有名企经理为你1v1辅导，还有行业专家进行技术指导，针对性地解决学习、工作中遇到的难题。让找
cmd泛滥_与您的后泛滥同事见面：人工智能机器人 weixin_26644585 人工智能 leetcode
cmd泛滥Readytoswapyouroldcube-mateforadisembodiedAI?IPsoftCEOChetanDube,creatorofAIco-workerAMELIA,giveshistakeonthepost-COVIDofficelandscape.准备将您的旧立方体伙伴换成无形的AI？AIsoft同事AMELIA的创始人IPsoft首席执行官ChetanDube阐述
两种方法判断Python的位数是32位还是64位 sanqima Python编程电脑 python 开发语言
Python从1991年发布以来，凭借其简洁、清晰、易读的语法、丰富的标准库和第三方工具，在Web开发、自动化测试、人工智能、图形识别、机器学习等领域发展迅猛。 Python是一种胶水语言，通过Cython库与C/C++语言进行链接，通过Jython库与Java语言进行链接。 Python是跨平台的，可运行在多种操作系统上，包括但不限于Windows、Linux和macOS。这意味着用Py
Humanize 项目教程尤嫒冰
Humanize项目教程humanizeAJSlibraryforaddinga“humantouch”todata.项目地址:https://gitcode.com/gh_mirrors/humani/humanize项目介绍Humanize是一个开源项目，旨在将机器生成的文本转换为更加自然、人性化的文本。该项目通过先进的算法和自然语言处理技术，使得AI生成的内容更加贴近人类的表达方式，从而提高
全自动解密解码神器 — Ciphey K'illCode python_模块 python vscode
Ciphey是一个使用自然语言处理和人工智能的全自动解密/解码/破解工具。简单地来讲，你只需要输入加密文本，它就能给你返回解密文本。就是这么牛逼。有了Ciphey，你根本不需要知道你的密文是哪种类型的加密，你只知道它是加密的，那么Ciphey就能在3秒甚至更短的时间内给你解密，返回你想要的大部分密文的答案。下面就给大家介绍Ciphey的实战使用教程。1.准备开始之前，你要确保Python和pip已
埃隆·马斯克表示特斯拉“没有必要”授权 xAI 模型喜好儿网人工智能 AIGC 马斯克
埃隆·马斯克近日在社交媒体上对《华尔街日报》的一篇报道进行了反驳。该报道指出，马斯克旗下的电动汽车公司特斯拉可能与人工智能初创公司xAI达成了一项收入分享协议，以便特斯拉能够使用xAI的人工智能模型。据称，这些模型将被集成到特斯拉的全自动驾驶（FSD）软件中，并可能用于开发特斯拉汽车的语音助手以及人形机器人擎天柱的软件。喜好儿网然而，马斯克否认了这一说法，他在社交媒体平台上表示，尽管特斯拉确实与x
Reflection 70B——HyperWrite推出的大型语言模型新加坡内哥谈技术语言模型人工智能自然语言处理
每周跟踪AI热点新闻动向和震撼发展想要探索生成式人工智能的前沿进展吗？订阅我们的简报，深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同，从行业内部的深度分析和实用指南中受益。不要错过这个机会，成为AI领域的领跑者。点击订阅，与未来同行！订阅：https://rengongzhineng.io/在AI技术飞速发展的过程中，我们已经见证了可以写作、编程，甚至创造艺术的模型问世。但有一
ASM系列五利用TreeApi 解析生成Class lijingyao8206 ASM 字节码动态生成 ClassNode TreeAPI
前面CoreApi的介绍部分基本涵盖了ASMCore包下面的主要API及功能，其中还有一部分关于MetaData的解析和生成就不再赘述。这篇开始介绍ASM另一部分主要的Api。TreeApi。这一部分源码是关联的asm-tree-5.0.4的版本。在介绍前，先要知道一点， Tree工程的接口基本可以完
链表树——复合数据结构应用实例 bardo 数据结构树型结构表结构设计链表菜单排序
我们清楚：数据库设计中，表结构设计的好坏，直接影响程序的复杂度。所以，本文就无限级分类（目录）树与链表的复合在表设计中的应用进行探讨。当然，什么是树，什么是链表，这里不作介绍。有兴趣可以去看相关的教材。需求简介：经常遇到这样的需求，我们希望能将保存在数据库中的树结构能够按确定的顺序读出来。比如，多级菜单、组织结构、商品分类。更具体的，我们希望某个二级菜单在这一级别中就是第一个。虽然它是最后
为啥要用位运算代替取模呢 chenchao051 位运算哈希汇编
在hash中查找key的时候，经常会发现用&取代%，先看两段代码吧， JDK6中的HashMap中的indexFor方法： /** * Returns index for hash code h. */ static int indexFor(int h, int length) {
最近的情况麦田的设计者生活感悟计划软考想
今天是2015年4月27号整理一下最近的思绪以及要完成的任务 1、最近在驾校科目二练车，每周四天，练三周。其实做什么都要用心，追求合理的途径解决。为
PHP去掉字符串中最后一个字符的方法 IT独行者 PHP 字符串
今天在PHP项目开发中遇到一个需求，去掉字符串中的最后一个字符原字符串1,2,3,4,5,6, 去掉最后一个字符","，最终结果为1,2,3,4,5,6 代码如下： $str = "1,2,3,4,5,6,"; $newstr = substr($str,0,strlen($str)-1); echo $newstr;
hadoop在linux上单机安装过程 _wy_ linux hadoop
1、安装JDK jdk版本最好是1.6以上，可以使用执行命令java -version查看当前JAVA版本号，如果报命令不存在或版本比较低，则需要安装一个高版本的JDK，并在/etc/profile的文件末尾，根据本机JDK实际的安装位置加上以下几行： export JAVA_HOME=/usr/java/jdk1.7.0_25
JAVA进阶----分布式事务的一种简单处理方法无量多系统交互分布式事务
每个方法都是原子操作：提供第三方服务的系统，要同时提供执行方法和对应的回滚方法 A系统调用B,C,D系统完成分布式事务 =========执行开始======== A.aa(); try { B.bb(); } catch(Exception e) { A.rollbackAa(); } try { C.cc(); } catch(Excep
安墨移动广告：移动DSP厚积薄发引领未来广告业发展命脉矮蛋蛋 hadoop 互联网
　　“谁掌握了强大的DSP技术，谁将引领未来的广告行业发展命脉。”2014年，移动广告行业的热点非移动DSP莫属。各个圈子都在纷纷谈论，认为移动DSP是行业突破点，一时间许多移动广告联盟风起云涌，竞相推出专属移动DSP产品。　　到底什么是移动DSP呢? 　　DSP(Demand-SidePlatform)，就是需求方平台，为解决广告主投放的各种需求，真正实现人群定位的精准广
myelipse设置 alafqq IP
在一个项目的完整的生命周期中，其维护费用，往往是其开发费用的数倍。因此项目的可维护性、可复用性是衡量一个项目好坏的关键。而注释则是可维护性中必不可少的一环。注释模板导入步骤安装方法：打开eclipse/myeclipse 选择 window-->Preferences-->JAVA-->Code-->Code
java数组百合不是茶 java数组
java数组的声明创建初始化； java支持C语言数组中的每个数都有唯一的一个下标一维数组的定义声明： int[] a = new int[3];声明数组中有三个数int[3] int[] a 中有三个数，下标从0开始，可以同过for来遍历数组中的数
javascript读取表单数据 bijian1013 JavaScript
利用javascript读取表单数据，可以利用以下三种方法获取： 1、通过表单ID属性：var a = document.getElementByIdx_x_x("id"); 2、通过表单名称属性：var b = document.getElementsByName("name"); 3、直接通过表单名字获取：var c = form.content.
探索JUnit4扩展：使用Theory bijian1013 java JUnit Theory
理论机制（Theory）一.为什么要引用理论机制（Theory）当今软件开发中，测试驱动开发（TDD — Test-driven development）越发流行。为什么 TDD 会如此流行呢？因为它确实拥有很多优点，它允许开发人员通过简单的例子来指定和表明他们代码的行为意图。 TDD 的优点： &nb
[Spring Data Mongo一]Spring Mongo Template操作MongoDB bit1129 template
什么是Spring Data Mongo Spring Data MongoDB项目对访问MongoDB的Java客户端API进行了封装，这种封装类似于Spring封装Hibernate和JDBC而提供的HibernateTemplate和JDBCTemplate，主要能力包括 1. 封装客户端跟MongoDB的链接管理 2. 文档-对象映射，通过注解:@Document(collectio
【Kafka八】Zookeeper上关于Kafka的配置信息 bit1129 zookeeper
问题： 1. Kafka的哪些信息记录在Zookeeper中 2. Consumer Group消费的每个Partition的Offset信息存放在什么位置 3. Topic的每个Partition存放在哪个Broker上的信息存放在哪里 4. Producer跟Zookeeper究竟有没有关系？没有关系！！！ //consumers、config、brokers、cont
java OOM内存异常的四种类型及异常与解决方案 ronin47 java OOM 内存异常
　OOM异常的四种类型：　　　　　一：　StackOverflowError ：通常因为递归函数引起（死递归，递归太深）。-Xss 128k 一般够用。　二：　out Of memory: PermGen Space：通常是动态类大多，比如web 服务器自动更新部署时引起。-Xmx
java-实现链表反转-递归和非递归实现 bylijinnan java
20120422更新：对链表中部分节点进行反转操作，这些节点相隔k个： 0->1->2->3->4->5->6->7->8->9 k=2 8->1->6->3->4->5->2->7->0->9 注意1 3 5 7 9 位置是不变的。解法：将链表拆成两部分： a.0-&
Netty源码学习-DelimiterBasedFrameDecoder bylijinnan java netty
看DelimiterBasedFrameDecoder的API，有举例：接收到的ChannelBuffer如下： +--------------+ | ABC\nDEF\r\n | +--------------+ 经过DelimiterBasedFrameDecoder(Delimiters.lineDelimiter())之后，得到： +-----+----
linux的一些命令 -查看cc攻击-网口ip统计等 hotsunshine linux
Linux判断CC攻击命令详解 2011年12月23日 ⁄ 安全 ⁄ 暂无评论查看所有80端口的连接数 netstat -nat|grep -i '80'|wc -l 对连接的IP按连接数量进行排序 netstat -ntu | awk '{print $5}' | cut -d: -f1 | sort | uniq -c | sort -n 查看TCP连接状态 n
Spring获取SessionFactory ctrain sessionFactory
String sql = "select sysdate from dual"; WebApplicationContext wac = ContextLoader.getCurrentWebApplicationContext(); String[] names = wac.getBeanDefinitionNames(); for(int i=0; i&
Hive几种导出数据方式 daizj hive 数据导出
Hive几种导出数据方式 1.拷贝文件如果数据文件恰好是用户需要的格式，那么只需要拷贝文件或文件夹就可以。 hadoop fs –cp source_path target_path 2.导出到本地文件系统 --不能使用insert into local directory来导出数据，会报错 --只能使用
编程之美 dcj3sjt126com 编程 PHP 重构
我个人的 PHP 编程经验中，递归调用常常与静态变量使用。静态变量的含义可以参考 PHP 手册。希望下面的代码，会更有利于对递归以及静态变量的理解 header("Content-type: text/plain"); function static_function () { static $i = 0; if ($i++ < 1
Android保存用户名和密码 dcj3sjt126com android
转自：http://www.2cto.com/kf/201401/272336.html 我们不管在开发一个项目或者使用别人的项目，都有用户登录功能，为了让用户的体验效果更好，我们通常会做一个功能，叫做保存用户，这样做的目地就是为了让用户下一次再使用该程序不会重新输入用户名和密码，这里我使用3种方式来存储用户名和密码 1、通过普通的txt文本存储 2、通过properties属性文件进行存
Oracle 复习笔记之同义词 eksliang Oracle 同义词 Oracle synonym
转载请出自出处：http://eksliang.iteye.com/blog/2098861 1.什么是同义词同义词是现有模式对象的一个别名。概念性的东西，什么是模式呢？创建一个用户，就相应的创建了一个模式。模式是指数据库对象，是对用户所创建的数据对象的总称。模式对象包括表、视图、索引、同义词、序列、过
Ajax案例 gongmeitao Ajax jsp
数据库采用Sql Server2005 项目名称为:Ajax_Demo 1.com.demo.conn包 package com.demo.conn; import java.sql.Connection;import java.sql.DriverManager;import java.sql.SQLException; //获取数据库连接的类public class DBConnec
ASP.NET中Request.RawUrl、Request.Url的区别 hvt .net Web C#asp.net hovertree
如果访问的地址是：http://h.keleyi.com/guestbook/addmessage.aspx?key=hovertree%3C&n=myslider#zonemenu那么Request.Url.ToString() 的值是：http://h.keleyi.com/guestbook/addmessage.aspx?key=hovertree<&
SVG 教程（七）SVG 实例，SVG 参考手册天梯梦 svg
SVG 实例在线实例下面的例子是把SVG代码直接嵌入到HTML代码中。谷歌Chrome，火狐，Internet Explorer9，和Safari都支持。注意：下面的例子将不会在Opera运行，即使Opera支持SVG - 它也不支持SVG在HTML代码中直接使用。 SVG 实例 SVG基本形状一个圆矩形不透明矩形一个矩形不透明2 一个带圆角矩
事务管理 luyulong java spring 编程事务
事物管理 spring事物的好处为不同的事物API提供了一致的编程模型支持声明式事务管理提供比大多数事务API更简单更易于使用的编程式事务管理API 整合spring的各种数据访问抽象 TransactionDefinition 定义了事务策略 int getIsolationLevel()得到当前事务的隔离级别 READ_COMMITTED
基础数据结构和算法十一：Red-black binary search tree sunwinner Algorithm Red-black
The insertion algorithm for 2-3 trees just described is not difficult to understand; now, we will see that it is also not difficult to implement. We will consider a simple representation known
centos同步时间 stunizhengjia linux 集群同步时间
做了集群，时间的同步就显得非常必要了。以下是查到的如何做时间同步。在CentOS 5不再区分客户端和服务器，只要配置了NTP，它就会提供NTP服务。 1)确认已经ntp程序包： # yum install ntp 2)配置时间源（默认就行，不需要修改） # vi /etc/ntp.conf server pool.ntp.o
ITeye 9月技术图书有奖试读获奖名单公布 ITeye管理员 ITeye
ITeye携手博文视点举办的9月技术图书有奖试读活动已圆满结束，非常感谢广大用户对本次活动的关注与参与。 9月试读活动回顾：http://webmaster.iteye.com/blog/2118112本次技术图书试读活动的优秀奖获奖名单及相应作品如下（优秀文章有很多，但名额有限，没获奖并不代表不优秀）：《NFC：Arduino、Andro