右边是我女神

第3章形式语言与自动机

文章目录

- 形式语言
- - 语言的定义*
  - 语言描述*
  - 形式语法（文法）的定义*
  - - 题型三：通过最左/右推导，表达出文法到句子的生成过程*
  - 形式语法的类型
  - - 正则文法*
    - - 题型四：归纳出识别的语言
    - 上下文无关文法(Context-free grammar,CFG)*
    - 上下文有关文法*
    - 无约束文法*
    - - 题型五：识别文法类型
  - CFG识别句子的派生树表示*
  - - 题型六：用生成树表达句子的生成过程并判断二义性
- 自动机理论
- - 有限自动机
  - - 确定的有限自动机（definite automata DFA）*
    - - 题型七：判断该语言是否被DFA所识别
    - 不确定的有限自动机（non- definite automata NFA）*
    - - 题型八：判断该语言是否被NFA所识别
  - 正则文法与自动机的关系*
  - 其他自动机*
- 自动机在自然语言处理中的应用
- - 单词拼写检查*
  - - 编辑距离
    - - 题型九：计算Edit distance
    - FSM的应用方式
    - FSM剪枝
    - - 题型十：计算Cute distance
  - 单词形态分析

形式语言

语言的定义*

表达思想、交流思想的工具；
抽象的数学系统；
按照一定规律构成的句子和符号串的有限或无限的集合。

语言描述*

语言描述（该语言是什么样的，句子是否属于该语言）的三种途径：

穷举法（把语言中的所有句子都枚举出来）——只适合句子数目有限的语言；
文法描述（语言中的每个句子用严格定义的规则来构造）——生成语言中合格的句子；
自动机（对输入的句子进行合法性检验） ——区别哪些是语言中的句子，哪些不是语言中的句子。

文法描述：给予语言中的句子以结构，各成分之间的结构关系清楚、明了。运用文法描述判断句子是否属于该语言较为困难。

自动机：机械刻画对输入字符串的识别过程，结构关系不清楚。判断句子是否属于该语言较为简单。

形式语言是用来精确地描述语言极其结构的手段。

形式语法（文法）的定义*

形式语法的定义：
形式语法是一个4元组 $G=（N,\Sigma,P,S）$ ，
其中，N是非终结符的有限集合（变量集/句法种类集）；
$\Sigma$ 是终结符的有限集合（ $N\cap\Sigma=\oslash$ , $V=N\cup\Sigma$ ）；
P是一组重写规则的有限集合（ $P=\{\alpha\to\beta\}$ ，其中 $\alpha,\beta$ 都是V中元素构成的串，但 $\alpha$ 中至少应该含有一个非终结符号）；
$S\in N$ ，成为句子符或初始符。

推导的定义：
设G是一个文法，在V上定义 $\Rightarrow_G$ （直接派生/推导）如下：如果(1) $\alpha\beta\gamma$ 是V中的符号串，且(2) $\beta\to\delta$ 是P的产生式，那么 $\alpha\beta\gamma\Rightarrow_G\alpha\delta\gamma$ 。

推导是一个变化的操作。

需要补充的是：
$\Rightarrow_G^+$ （非平凡方式派生）：直接派生的传递闭包，V上的符号串 $\epsilon_i$ 到 $\epsilon_{i+1}$ 的 $n(n\ge1)$ 步派生。(推出来的结果还在V内，不包含本身)

$\Rightarrow_G^*$ （派生）：直接派生的自反或传递闭包，V上的符号串 $\epsilon_i$ 到 $\epsilon_{i+1}$ 的 $n(n\ge0)$ 步派生。（推出来的结果还在V内，包含本身）

如果明确某个推导是给定文法G产生的，那么可以省略G。

派生或非平凡方式派生中的每一个直接派生中只改写最左侧的非终结符号，称为“最左推导”，反之称为“最右推导”/“规范推导”。

举例：

句子的定义：
文法G的句子形式通过以下递归方式定义：
（1）S是一个句子形式；
（2）如果 $\gamma\beta\alpha$ 是一个句子形式，且 $\beta\to\delta$ 是P中的产生式，那么 $\gamma\delta\alpha$ 也是一个句子形式。

G生成的句子：不含非终结符的句子形式；

G识别的语言：G生成的句子集合，记为 $L(G)=\{x|x\in\Sigma,S\Rightarrow_G^*x\}$ 。

每一个符号都没有产生式。

题型三：通过最左/右推导，表达出文法到句子的生成过程*

任何文法的推导都要遵循最左/最右中的一种，且不能跳步。

形式语法的类型

3型文法：正则文法；2型文法：上下文无关文法；1型文法：上下文相关文法；0型文法：无约束文法。

这些文法的区别在于规则集的定义。规则集的关注点又在于：推导左右两侧的变量形式和所属。

正则文法*

如果文法G的规则集P中所有则均满足如下形式： $A\to Bx$ 或 $A\to x$ ,其中 $A,B\in N,x\in\Sigma$ ，则称该文法为正则文法。

如果非终结符号出现在最左边，称为左线性正则文法，反之，称为右线性正则文法。

题型四：归纳出识别的语言

能拆分也算。

上下文无关文法(Context-free grammar,CFG)*

如果文法G的规则集P中所有规则均满足如下形式： $A\to a$ ,其中， $A\in N,\alpha\in V^*$ ,则称文法G为上下文无关文法（CFG context- free gramma）。

2型文法比3型文法少了一层限制，可以看到其规则右端的格式没有约束，那么规则左端可以改写为任何形式。

上下文有关文法*

如果文法G的规则集P中所有规则满足如下形式： $\alpha A\beta\to \alpha\gamma\beta$ ,其中 $A\in N$ ， $\alpha,\beta,\gamma\in V^*$ ,且 $\gamma$ 至少包含一个字符，则称G为上下文有关文法（CSG context- sensitive grammar）。

字符串 $\alpha A\beta$ 中的A被改写为 $\gamma$ 时需要有上下文语境 $\alpha,\beta$ 。

如果上下文语境为空字符串，则1型文法转变为了2型文法。在上下文无关文法中，规则左侧可以被改写为任意形式，属于V的字符可以不只有一个。

无约束文法*

如果文法G的规则集P中所有规则满足如下形式： $\alpha\to\beta$ ，其中 $\alpha\in V^+,\beta\in V^*$ ,则称G为无约束文法。

从0型文法到3型文法，约束越来越多，所识别的语言集合 $L (G)$ 也越来越小。

题型五：识别文法类型

如果一种语言由几种文法产生，则把这种语言称为在几种问法中受限制最多的那种文法产生的，

CFG识别句子的派生树表示*

G所识别的句子的派生树的构造步骤(构成，描述每个节点的意义)：

对于 $\forall x\in N\cup\Sigma$ ，给定一个标记作为结点，令文法的初始符号S作为树的根节点。
如果一个结点标记为A，且至少有一个除它自身以外的后裔，那么 $A\in N$ 。
如果一个结点标记为A，它的 $k(k\gt 0)$ 个直接后裔结点按从左到右的顺序依次标记为 $A_1,A_2,...,A_k$ ，则 $A\to A_1,...,A_k$ 一定是P中的一个产生式。

二义性文法：
如果文法G对于同一个句子存在两棵或两棵以上不同的分析树，那么句子是二义性的，文法G称为二义性文法。

题型六：用生成树表达句子的生成过程并判断二义性

注意点：

含运算符号的替代是直接的，不存在优先级的保留。
运算符号包含在终结符号中。
一条链路就是最左/右推导的结果。

自动机理论

有限自动机

确定的有限自动机（definite automata DFA）*

DFA M是一个五元组： $M=(\Sigma,Q,\delta,q_0,F)$ ，
$\Sigma$ 是输入符号的有穷集合，
Q是状态的有限集合，
$q_0\in Q$ 是初始状态，
F是终止状态集合， $F\subseteq Q$ ,
$\delta$ 是 $Q$ 与 $\Sigma$ 的直积 $Q\times\Sigma$ 到Q(下一个状态)的映射，它支配着有限状态控制的行为，有时也称为转移函数。
（直积： $X\times Y=\{(x,y)|x\in A\land y\in B\}$ )

DFA是状态、映射、输入的结合体，文法描述是符号、规则的结合体。

DFA接受的语言：如果一个句子x对于有限自动机M有 $\delta(q_0,x)=p,p\in F$ ,那么称句子x被M接受。被M接受的句子的全集称为由M定义的语言，或称M所接受的语言，记为 $T(M)=\{x|\delta(q_0,x)\in F\}$ 。

状态变换图：

$q_0$ 用带“开始”的箭头标注； $F$ 中的元素用双层圈标注； $\Sigma$ 中的元素写在箭头上；箭头表示的是 $\delta$ 中的元素； $Q$ 中的元素用圆圈表示。

即，存在一系列映射，使得输入句子x能与 $q_0$ 在最后映射到F中。

题型七：判断该语言是否被DFA所识别

需要注意的是，有限控制器是从左到右进行的，因此判断顺序也是1 1 0 1 0 1。

不确定的有限自动机（non- definite automata NFA）*

NFA M是一个五元组： $M=(\Sigma,Q,\delta,q_0,F)$ ，
$\Sigma$ 是输入符号的有穷集合，
Q是状态的有限集合，
$q_0\in Q$ 是初始状态，
F是终止状态集合， $F\subseteq Q$ ,
$\delta$ 是 $Q$ 与 $\Sigma$ 的直积 $Q\times\Sigma$ 到Q的幂集 $2^Q$ 映射。（幂集：原集合中所有的子集）

NFA与DFA的区别是：在NFA中 $\delta(q,a)$ 是一个状态集合，而在DFA中 $\delta(q,a)$ 是一个状态。

也就是说，NFA M在状态q时，接受输入符号a时，M可以选择状态集合的幂集中的任何一个状态作为下一个状态，并将输入头向右边移动一个字符的位置。

NFA接受的语言：
如果存在一个状态p，有 $p\in\delta(q_0,x)$ 且 $p\in F$ ，则称句子x被NFA M所接受。被NFA M接受的所有句子的集合称为NFA M定义的语言，记作 $T(M)=\{x|p\in\delta(q_0,x)且p\in F\}$ 。

定理：设L是被NFA所接受的语言，则存在一个DFA，它能够接受L。

因为该定理，所以无需区分NFA和DFA，统称为有限自动机（FA）

题型八：判断该语言是否被NFA所识别

正则文法与自动机的关系*

定理：若 $G=(V_N,V_T,P,S)$ 是一个正则文法，则存在一个 $FA~M=（\Sigma,Q,\delta,q_0,F）$ 使得 $T (M) = L (G)$ 。

定理：若 $M=（\Sigma,Q,\delta,q_0,F$ 是一个有限自动机，则存在正则文法 $G=(V_N,V_T,P,S)$ ，使得 $L (G) = T (M)$ 。

其他自动机*

图灵机：

与0型文法等价；
与FA的区别在于：图灵机可以通过其读/写头改变输入带的字符。

线性带限自动机：

与1型文法等价；
是一个确定的单带图灵机。

自动机在自然语言处理中的应用

单词拼写检查*

找到和输入最接近的词汇。

编辑距离

Edit distance：两个字符串之间的编辑距离等于使一个字符串变成另外一个字符串而进行的插入、删除、替换或相邻字符交换位置而进行操作的最少次数。

其计算方式如下：

题型九：计算Edit distance

FSM的应用方式

$FA~~R=(Q,A,\delta,q_0,F)$ ，如果 $L\subseteq A^*$ 表示有限状态机R定义的语言， $t\gt0$ 为编辑距离的阈值，那么一个字符串 $X[m]\notin L$ 能够被R识别的条件为存在非空集合：
$C=\{Y[n]|Y[n]\in L,ed(X[m],Y[n])\le t\}$

FA/FSM(有限状态机)可以视为有向图（键树/数字查找树）：

对一个输入串进行拼写检查的过程是在给定阈值内，寻找所有与输入串编辑距离小于t的路径。

FSM剪枝

为了尽早找到target，使用剪除距离更好一些。
剪除距离：

$cuted(X[m],Y[n])=\min_{l\le i\le u}\{ed(X[i],Y[n])\}$
其中， $l=\max(1,n-t),u=\min(m,n+t)$
函数 $cuted(\cdot)$ 从X字符串中截取长度范围在l~u之间的字符串，并计算这些字符串与Y的编辑距离，取最小距离。

局部候选字符串Y由自动机从初始状态出发的一些连续弧上所对应的标记符号构成。

深度优先搜索：

每当扩展Y时，需要检测X、Y之间的cuted是否在门限值t所限定的范围内；
如果剪除距离超过了t值，就要放弃最后一步转移弧，回溯到上一状态（同时缩短候选串），尝试其他的候选串；
如果找不到其他可能的转移弧，开始递归地执行回溯操作。
如果没有违背剪除距离的限制且达到Y的末端时，编辑距离也满足条件，那么Y就是X的一个有效的候选拼写方式。

X是我们拼写的单词，Y是扩展的单词。

题型十：计算Cute distance

明确截取下限l（l为1和Y的长度减去阈值的最大值）和截取上限u（u为X的长度和Y的长度加上阈值的最小值）；
截取出该范围内的X子串，分别计算编辑距离；
取最小值作为Cute distance。

单词形态分析

FST（有限状态转换机，finite state transducer）：与FSM相比，FST完成状态转移的同时产生一个输出，FSM只是状态的转移，不产生任何输出。

该应用举例如下：形容词heavy在英文句子中可能以三种不同的形式出现：原型、比较级和最高级。对于变形后的heavy，为了正确分析出其原型，可以通过构造FST的方法实现。

探索OpenAI和LangChain的适配器集成：轻松切换模型提供商 nseejrukjhad langchain easyui 前端 python
#探索OpenAI和LangChain的适配器集成：轻松切换模型提供商##引言在人工智能和自然语言处理的世界中，OpenAI的模型提供了强大的能力。然而，随着技术的发展，许多人开始探索其他模型以满足特定需求。LangChain作为一个强大的工具，集成了多种模型提供商，通过提供适配器，简化了不同模型之间的转换。本篇文章将介绍如何使用LangChain的适配器与OpenAI集成，以便轻松切换模型提供商
使用Apify加载Twitter消息以进行微调的完整指南 nseejrukjhad twitter easyui 前端 python
#使用Apify加载Twitter消息以进行微调的完整指南##引言在自然语言处理领域，微调模型以适应特定任务是提升模型性能的常见方法。本文将介绍如何使用Apify从Twitter导出聊天信息，以便进一步进行微调。##主要内容###使用Apify导出推文首先，我们需要从Twitter导出推文。Apify可以帮助我们做到这一点。通过Apify的强大功能，我们可以批量抓取和导出数据，适用于各类应用场景。
深入理解 MultiQueryRetriever：提升向量数据库检索效果的强大工具 nseejrukjhad 数据库 python
深入理解MultiQueryRetriever：提升向量数据库检索效果的强大工具引言在人工智能和自然语言处理领域，高效准确的信息检索一直是一个关键挑战。传统的基于距离的向量数据库检索方法虽然广泛应用，但仍存在一些局限性。本文将介绍一种创新的解决方案：MultiQueryRetriever，它通过自动生成多个查询视角来增强检索效果，提高结果的相关性和多样性。MultiQueryRetriever的工
自然语言处理_tf-idf _feivirus_ 算法机器学习和数学自然语言处理 tf-idf 逆文档频率词频
importpandasaspdimportmath1.数据预处理docA="Thecatsatonmyface"docB="Thedogsatonmybed"wordsA=docA.split("")wordsB=docB.split("")wordsSet=set(wordsA).union(set(wordsB))print(wordsSet){'on','my','face','sat',
免费的GPT可在线直接使用（一键收藏） kkai人工智能 gpt
1、LuminAI（https://kk.zlrxjh.top）LuminAI标志着一款融合了星辰大数据模型与文脉深度模型的先进知识增强型语言处理系统，旨在自然语言处理（NLP）的技术开发领域发光发热。此系统展现了卓越的语义把握与内容生成能力，轻松驾驭多样化的自然语言处理任务。VisionAI在NLP界的应用领域广泛，能够胜任从机器翻译、文本概要撰写、情绪分析到问答等众多任务。通过对大量文本数据的
推荐3家毕业AI论文可五分钟一键生成！文末附免费教程！小猪包333 写论文人工智能 AI写作深度学习计算机视觉
在当前的学术研究和写作领域，AI论文生成器已经成为许多研究人员和学生的重要工具。这些工具不仅能够帮助用户快速生成高质量的论文内容，还能进行内容优化、查重和排版等操作。以下是三款值得推荐的AI论文生成器：千笔-AIPassPaper、懒人论文以及AIPaperPass。千笔-AIPassPaper千笔-AIPassPaper是一款基于深度学习和自然语言处理技术的AI写作助手，旨在帮助用户快速生成高质
AI论文题目生成器怎么用？9款论文写作网站简单3步搞定小猪包333 写论文人工智能深度学习计算机视觉
在当今信息爆炸的时代，AI写作工具的出现极大地提高了写作效率和质量。本文将详细介绍9款优秀的论文写作网站，并重点推荐千笔-AIPassPaper。一、千笔-AIPassPaper千笔-AIPassPaper是一款功能强大的AI论文生成器，基于最新的自然语言处理技术，能够一键生成高质量的毕业论文、开题报告等文本内容。它不仅提供智能选题、文献推荐和论文润色等功能，还具有较高的用户评价。其文献综述生成功
AI大模型的架构演进与最新发展季风泯灭的季节 AI大模型应用技术二人工智能架构
随着深度学习的发展，AI大模型（LargeLanguageModels,LLMs）在自然语言处理、计算机视觉等领域取得了革命性的进展。本文将详细探讨AI大模型的架构演进，包括从Transformer的提出到GPT、BERT、T5等模型的历史演变，并探讨这些模型的技术细节及其在现代人工智能中的核心作用。一、基础模型介绍：Transformer的核心原理Transformer架构的背景在Transfo
FlagEmbedding 吉小雨 python库 python
FlagEmbedding教程FlagEmbedding是一个用于生成文本嵌入（textembeddings）的库，适合处理自然语言处理（NLP）中的各种任务。嵌入（embeddings）是将文本表示为连续向量，能够捕捉语义上的相似性，常用于文本分类、聚类、信息检索等场景。官方文档链接：FlagEmbedding官方GitHub一、FlagEmbedding库概述1.1什么是FlagEmbeddi
【NumPy】深入解析numpy.zeros()函数二七830 numpy
欢迎莅临我的个人主页这里是我深耕Python编程、机器学习和自然语言处理（NLP）领域，并乐于分享知识与经验的小天地！博主简介：我是二七830，一名对技术充满热情的探索者。多年的Python编程和机器学习实践，使我深入理解了这些技术的核心原理，并能够在实际项目中灵活应用。尤其是在NLP领域，我积累了丰富的经验，能够处理各种复杂的自然语言任务。技术专长：我熟练掌握Python编程语言，并深入研究了机
Humanize 项目教程尤嫒冰
Humanize项目教程humanizeAJSlibraryforaddinga“humantouch”todata.项目地址:https://gitcode.com/gh_mirrors/humani/humanize项目介绍Humanize是一个开源项目，旨在将机器生成的文本转换为更加自然、人性化的文本。该项目通过先进的算法和自然语言处理技术，使得AI生成的内容更加贴近人类的表达方式，从而提高
全自动解密解码神器 — Ciphey K'illCode python_模块 python vscode
Ciphey是一个使用自然语言处理和人工智能的全自动解密/解码/破解工具。简单地来讲，你只需要输入加密文本，它就能给你返回解密文本。就是这么牛逼。有了Ciphey，你根本不需要知道你的密文是哪种类型的加密，你只知道它是加密的，那么Ciphey就能在3秒甚至更短的时间内给你解密，返回你想要的大部分密文的答案。下面就给大家介绍Ciphey的实战使用教程。1.准备开始之前，你要确保Python和pip已
CV、NLP、数据控掘推荐、量化海的那边- AI算法自然语言处理人工智能
下面是对CV（计算机视觉）、NLP（自然语言处理）、数据挖掘推荐和量化的简要概述及其应用领域的介绍：1.CV（计算机视觉，ComputerVision）定义：计算机视觉是一门让计算机能够从图像或视频中提取有用信息，并做出决策的学科。它通过模拟人类的视觉系统来识别、处理和理解视觉信息。主要任务：图像分类：识别图像中的物体并分类，比如猫、狗、车等。目标检测：在图像或视频中定位并识别多个对象，如人脸检测
深度解析：如何使用输出解析器将大型语言模型（LLM）的响应解析为结构化JSON格式 m0_57781768 语言模型 json 人工智能
深度解析：如何使用输出解析器将大型语言模型（LLM）的响应解析为结构化JSON格式在现代自然语言处理（NLP）的应用中，大型语言模型（LLM）已经成为了重要的工具。这些模型能够生成丰富的自然语言文本，适用于各种应用场景。然而，在某些应用中，开发者不仅仅需要生成文本，还需要将这些生成的文本转换为结构化的数据格式，例如JSON。这种结构化的数据格式在数据传输、存储以及进一步处理时具有显著优势。本文将深
深入探讨：如何在Python中通过LangChain技术精准追踪大型语言模型（LLM）的Token使用情况 m0_57781768 python langchain 语言模型
深入探讨：如何在Python中通过LangChain技术精准追踪大型语言模型（LLM）的Token使用情况在现代的人工智能开发中，大型语言模型（LLM）已经成为了不可或缺的工具，无论是用于自然语言处理、对话生成，还是其他复杂的文本生成任务。然而，随着这些模型的广泛应用，开发者面临的一个重要挑战是如何有效地追踪和管理Token的使用情况，特别是在生产环境中，Token的使用直接影响着API调用的成本
使用最大边际相关性(MMR)选择示例：提高AI模型的多样性和相关性 aehrutktrjk 人工智能 easyui 前端 python
使用最大边际相关性(MMR)选择示例：提高AI模型的多样性和相关性引言在机器学习和自然语言处理领域，选择合适的训练示例对模型性能至关重要。最大边际相关性(MaximalMarginalRelevance,MMR)是一种优秀的示例选择方法，它不仅考虑了示例与输入的相关性，还注重保持所选示例之间的多样性。本文将深入探讨如何使用MMR来选择示例，以提高AI模型的性能和泛化能力。什么是最大边际相关性(MM
使用LangChain和OpenAI实现高效文本标注 aehrutktrjk langchain python
使用LangChain和OpenAI实现高效文本标注引言在自然语言处理(NLP)领域，文本标注是一项重要且常见的任务。它涉及为文本分配标签，如情感、语言、风格等。本文将介绍如何使用LangChain和OpenAI的API来实现高效的文本标注系统。我们将探讨如何设置环境、定义标注模式，以及如何使用OpenAI的模型来执行标注任务。环境准备首先，我们需要安装必要的库并设置API密钥：%pipinsta
基于深度学习的文本引导的图像编辑 SEU-WYL 深度学习dnn 深度学习人工智能
基于深度学习的文本引导的图像编辑（Text-GuidedImageEditing）是一种通过自然语言文本指令对图像进行编辑或修改的技术。它结合了图像生成和自然语言处理（NLP）的最新进展，使用户能够通过描述性文本对图像内容进行精确的调整和操控。1.文本引导的图像编辑的挑战文本和图像之间的对齐：如何将文本中的语义信息准确地映射到图像中的特定区域或元素是一个关键挑战。这涉及到多模态数据的对齐和理解。编
多模态Transformer之文本与图像联合建模 - Transformer教程 shandianfk_com ChatGPT Transformer transformer 深度学习人工智能
大家好，今天我们来聊聊一个既前沿又有趣的话题——多模态Transformer，特别是文本与图像的联合建模。对于很多小伙伴来说，Transformer这个词已经不陌生了，但它不仅仅应用于自然语言处理，还能在图像处理、甚至是多模态数据的处理上大显身手。接下来，我会带大家深入了解什么是多模态Transformer，以及它是如何实现文本与图像的联合建模的。Transformer简介首先，我们简单回顾一下T
什么是AIGC？有哪些免费工具？ chent_某位 AIGC
AIGC（AIGeneratedContent），即“人工智能生成内容”，是指通过人工智能技术自动生成各种类型的数字内容。AIGC让机器能够根据输入的信息或数据生成符合人类需求的文本、图像、音频、视频等内容，极大提高了内容创作的效率。AIGC的背景与起源随着深度学习和自然语言处理技术的快速发展，人工智能已经不再局限于简单的任务，如分类、预测和数据分析，而是具备了生成内容的能力。生成式AI模型，如O
transformer架构(Transformer Architecture)原理与代码实战案例讲解 AI架构设计之禅大数据AI人工智能 Python入门实战计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
transformer架构(TransformerArchitecture)原理与代码实战案例讲解关键词：Transformer,自注意力机制,编码器-解码器,预训练,微调,NLP,机器翻译作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming1.背景介绍1.1问题的由来自然语言处理（NLP）领域的发展经历了从规则驱动到统计驱动再到深度学习驱动的三个阶段。
英伟达（NVIDIA）B200架构解读 weixin_41205263 芯际争霸 GPGPU架构 gpu算力人工智能硬件架构
H100芯片是一款高性能AI芯片，其中的TransformerEngine是专门用于加速Transformer模型计算的核心部件。Transformer模型是一种自然语言处理（NLP）模型，广泛应用于机器翻译、文本生成等任务。TransformerEngine的电路设计原理主要包括以下几个方面：
使用LangChain与Together AI模型交互：深入探讨和实践指南 llzwxh888 langchain 人工智能交互 python
使用LangChain与TogetherAI模型交互：深入探讨和实践指南1.引言在人工智能和自然语言处理领域，TogetherAI已经成为一个强大的平台，提供了对50多个领先开源模型的访问。本文将深入探讨如何使用LangChain与TogetherAI模型进行交互，为开发者提供实用的知识和见解，同时解决可能遇到的常见问题。2.TogetherAI简介TogetherAI是一个强大的API平台，允许
OpenLM: 一个灵活的开源大语言模型接口工具 llzwxh888 语言模型人工智能自然语言处理 python
OpenLM:一个灵活的开源大语言模型接口工具引言在人工智能和自然语言处理快速发展的今天，大语言模型(LLM)已经成为许多应用的核心。然而，不同的LLM提供商往往有着各自的API和使用方式，这给开发者带来了一定的挑战。本文将介绍OpenLM，这是一个零依赖、兼容OpenAIAPI的LLM提供者接口，它可以直接通过HTTP调用不同的推理端点。我们将深入探讨OpenLM的特性、使用方法，以及如何将其与
使用中专API实现AI模型调用与部署 llzwxh888 人工智能 easyui 前端 python
在AI技术领域，如何调用和部署大语言模型（LLM）是一个常见的需求。本文将详细介绍如何通过中专API地址http://api.wlai.vip，实现对OpenAI大模型的调用与部署，并提供一个详细的demo代码示例。引言随着人工智能技术的飞速发展，大语言模型在自然语言处理任务中的表现尤为突出。然而，由于国内访问海外API存在一定限制，本文将使用中专API地址来解决这一问题，并展示如何在本地环境中配
深度学习入门篇：PyTorch实现手写数字识别 AI_Guru人工智能深度学习 pytorch 人工智能
深度学习作为机器学习的一个分支，近年来在图像识别、自然语言处理等领域取得了显著的成就。在众多的深度学习框架中，PyTorch以其动态计算图、易用性强和灵活度高等特点，受到了广泛的喜爱。本篇文章将带领大家使用PyTorch框架，实现一个手写数字识别的基础模型。手写数字识别简介手写数字识别是计算机视觉领域的一个经典问题，目的是让计算机能够识别并理解手写数字图像。这个问题通常作为深度学习入门的练习，因为
基于人工智能的智能语音助手人工智能发烧友人工智能
语音助手的自然语言处理模块是语音助手系统的关键组成部分。通过这个模块，系统能够识别用户的意图并做出相应的回应。我们可以使用NLP技术来解析文本输入，并将其转换为系统可以理解的命令或指令。在本项目中，我们将结合语音识别、自然语言处理和语音合成技术，构建一个功能简化的语音助手。一、项目背景与需求分析1.1项目目标本项目旨在创建一个语音助手系统，它可以：1.语音识别：从用户的语音输入中提取文本信息。2.
深入掌握大模型精髓：《实战AI大模型》带你全面理解大模型开发！努力的光头强人工智能 langchain prompt transformer 深度学习
今天，人工智能技术的快速发展和广泛应用已经引起了大众的关注和兴趣，它不仅成为技术发展的核心驱动力，更是推动着社会生活的全方位变革。特别是作为AI重要分支的深度学习，通过不断刷新的表现力已引领并定义了一场科技革命。大型深度学习模型（简称AI大模型）以其强大的表征能力和卓越的性能，在自然语言处理、计算机视觉、推荐系统等领域均取得了突破性的进展。尤其随着AI大模型的广泛应用，无数领域因此受益。AI大模型
安装jina，并使用jina的向量化和重排序的功能 MonkeyKing.sun milvus numpy
为了在Python的FastAPI项目中使用Jina进行向量化和重排序，您需要按照以下步骤安装和使用Jina。1.安装Jina首先，确保您已经安装了Jina。可以使用pip来安装。pipinstalljina如果需要特定的功能模块，例如自然语言处理相关的向量化模型，可以通过JinaHub获取。pipinstalljina[hub]2.在FastAPI项目中集成Jina接下来，我们将Jina集成到F
Matlab,Python,Java,C++的比较 Codefengfeng python java c++
Matlabmatlab是一个大型计算机，擅长矩阵计算与科学计算，适合构建模型；然而，编译软件的运行效率低，不适合大型软件开发。Pythonpython的优势是简单，入门快。适合做数据挖掘、数据分析、机器学习、人工智能、自然语言处理、爬虫、批量文件处理等，此外，Python开源免费，有很多的库，开发环境开发社区都比较友好；不过，Python是动态型的语言，需要更多的测试，并且错误仅仅是在运行的时候
jQuery 键盘事件keydown ,keypress ,keyup介绍 107x js jquery keydown keypress keyup
本文章总结了下些关于jQuery 键盘事件keydown ,keypress ,keyup介绍，有需要了解的朋友可参考。一、首先需要知道的是： 1、keydown() keydown事件会在键盘按下时触发. 2、keyup() 代码如下复制代码 $('input').keyup(funciton(){
AngularJS中的Promise bijian1013 JavaScript AngularJS Promise
一.Promise Promise是一个接口，它用来处理的对象具有这样的特点：在未来某一时刻（主要是异步调用）会从服务端返回或者被填充属性。其核心是，promise是一个带有then()函数的对象。为了展示它的优点，下面来看一个例子，其中需要获取用户当前的配置文件： var cu
c++ 用数组实现栈类 CrazyMizzz 数据结构 C++
#include<iostream> #include<cassert> using namespace std; template<class T, int SIZE = 50> class Stack{ private: T list[SIZE];//数组存放栈的元素 int top;//栈顶位置 public: Stack(
java和c语言的雷同麦田的设计者 java 递归 scaner
软件启动时的初始化代码，加载用户信息2015年5月27号从头学java二 1、语言的三种基本结构：顺序、选择、循环。废话不多说，需要指出一下几点： a、return语句的功能除了作为函数返回值以外，还起到结束本函数的功能，return后的语句不会再继续执行。 b、for循环相比于whi
LINUX环境并发服务器的三种实现模型被触发 linux
服务器设计技术有很多，按使用的协议来分有TCP服务器和UDP服务器。按处理方式来分有循环服务器和并发服务器。 1 循环服务器与并发服务器模型在网络程序里面，一般来说都是许多客户对应一个服务器，为了处理客户的请求，对服务端的程序就提出了特殊的要求。目前最常用的服务器模型有： ·循环服务器：服务器在同一时刻只能响应一个客户端的请求 ·并发服务器：服
Oracle数据库查询指令肆无忌惮_ oracle数据库
20140920 单表查询 -- 查询************************************************************************************************************ -- 使用scott用户登录 -- 查看emp表 desc emp
ext右下角浮动窗口知了ing JavaScript ext
第一种 <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/
浅谈REDIS数据库的键值设计矮蛋蛋 redis
http://www.cnblogs.com/aidandan/ 原文地址：http://www.hoterran.info/redis_kv_design 丰富的数据结构使得redis的设计非常的有趣。不像关系型数据库那样，DEV和DBA需要深度沟通，review每行sql语句，也不像memcached那样，不需要DBA的参与。redis的DBA需要熟悉数据结构，并能了解使用场景。
maven编译可执行jar包 alleni123 maven
http://stackoverflow.com/questions/574594/how-can-i-create-an-executable-jar-with-dependencies-using-maven <build> <plugins> <plugin> <artifactId>maven-asse
人力资源在现代企业中的作用百合不是茶 HR 企业管理
//人力资源在在企业中的作用人力资源为什么会存在，人力资源究竟是干什么的人力资源管理是对管理模式一次大的创新，人力资源兴起的原因有以下点：工业时代的国际化竞争，现代市场的风险管控等等。所以人力资源在现代经济竞争中的优势明显的存在，人力资源在集团类公司中存在着明显的优势(鸿海集团)，有一次笔者亲自去体验过红海集团的招聘，只知道人力资源是管理企业招聘的当时我被招聘上了，当时给我们培训的人
Linux自启动设置详解 bijian1013 linux
linux有自己一套完整的启动体系，抓住了linux启动的脉络，linux的启动过程将不再神秘。阅读之前建议先看一下附图。本文中假设inittab中设置的init tree为： /etc/rc.d/rc0.d /etc/rc.d/rc1.d /etc/rc.d/rc2.d /etc/rc.d/rc3.d /etc/rc.d/rc4.d /etc/rc.d/rc5.d /etc
Spring Aop Schema实现 bijian1013 java spring AOP
本例使用的是Spring2.5 1.Aop配置文件spring-aop.xml <?xml version="1.0" encoding="UTF-8"?> <beans xmlns="http://www.springframework.org/schema/beans" xmln
【Gson七】Gson预定义类型适配器 bit1129 gson
Gson提供了丰富的预定义类型适配器，在对象和JSON串之间进行序列化和反序列化时，指定对象和字符串之间的转换方式， DateTypeAdapter public final class DateTypeAdapter extends TypeAdapter<Date> { public static final TypeAdapterFacto
【Spark八十八】Spark Streaming累加器操作（updateStateByKey) bit1129 update
在实时计算的实际应用中，有时除了需要关心一个时间间隔内的数据，有时还可能会对整个实时计算的所有时间间隔内产生的相关数据进行统计。比如：对Nginx的access.log实时监控请求404时，有时除了需要统计某个时间间隔内出现的次数，有时还需要统计一整天出现了多少次404，也就是说404监控横跨多个时间间隔。 Spark Streaming的解决方案是累加器，工作原理是，定义
linux系统下通过shell脚本快速找到哪个进程在写文件 ronin47
一个文件正在被进程写我想查看这个进程文件一直在增大找不到谁在写使用lsof也没找到这个问题挺有普遍性的，解决方法应该很多，这里我给大家提个比较直观的方法。 linux下每个文件都会在某个块设备上存放，当然也都有相应的inode, 那么透过vfs.write我们就可以知道谁在不停的写入特定的设备上的inode。幸运的是systemtap的安装包里带了inodewatch.stp，位
java-两种方法求第一个最长的可重复子串 bylijinnan java 算法
import java.util.Arrays; import java.util.Collections; import java.util.List; public class MaxPrefix { public static void main(String[] args) { String str="abbdabcdabcx";
Netty源码学习-ServerBootstrap启动及事件处理过程 bylijinnan java netty
Netty是采用了Reactor模式的多线程版本，建议先看下面这篇文章了解一下Reactor模式： http://bylijinnan.iteye.com/blog/1992325 Netty的启动及事件处理的流程，基本上是按照上面这篇文章来走的文章里面提到的操作，每一步都能在Netty里面找到对应的代码其中Reactor里面的Acceptor就对应Netty的ServerBo
servelt filter listener 的生命周期 cngolon filter listener servelt 生命周期
1. servlet 当第一次请求一个servlet资源时，servlet容器创建这个servlet实例，并调用他的 init(ServletConfig config)做一些初始化的工作，然后调用它的service方法处理请求。当第二次请求这个servlet资源时，servlet容器就不在创建实例，而是直接调用它的service方法处理请求，也就是说
jmpopups获取input元素值 ctrain JavaScript
jmpopups 获取弹出层form表单首先，我有一个div，里面包含了一个表单，默认是隐藏的，使用jmpopups时，会弹出这个隐藏的div，其实jmpopups是将我们的代码生成一份拷贝。当我直接获取这个form表单中的文本框时，使用方法：$('#form input[name=test1]').val()；这样是获取不到的。我们必须到jmpopups生成的代码中去查找这个值，$(
vi查找替换命令详解 daizj linux 正则表达式替换查找 vim
一、查找查找命令 /pattern<Enter> ：向下查找pattern匹配字符串 ?pattern<Enter>：向上查找pattern匹配字符串使用了查找命令之后，使用如下两个键快速查找： n：按照同一方向继续查找 N：按照反方向查找字符串匹配 pattern是需要匹配的字符串，例如： 1: /abc<En
对网站中的js,css文件进行打包 dcj3sjt126com PHP 打包
一，为什么要用smarty进行打包 apache中也有给js,css这样的静态文件进行打包压缩的模块，但是本文所说的不是以这种方式进行的打包，而是和smarty结合的方式来把网站中的js,css文件进行打包。为什么要进行打包呢，主要目的是为了合理的管理自己的代码。现在有好多网站，你查看一下网站的源码的话，你会发现网站的头部有大量的JS文件和CSS文件，网站的尾部也有可能有大量的J
php Yii: 出现undefined offset 或者 undefined index解决方案 dcj3sjt126com undefined
在开发Yii 时，在程序中定义了如下方式： if($this->menuoption[2] === 'test')，那么在运行程序时会报：undefined offset:2，这样的错误主要是由于php.ini 里的错误等级太高了，在windows下错误等级
linux 文件格式（1） sed工具 eksliang linux linux sed工具 sed工具 linux sed详解
转载请出自出处： http://eksliang.iteye.com/blog/2106082 简介 sed 是一种在线编辑器，它一次处理一行内容。处理时，把当前处理的行存储在临时缓冲区中，称为“模式空间”（pattern space），接着用sed命令处理缓冲区中的内容，处理完成后，把缓冲区的内容送往屏幕。接着处理下一行，这样不断重复，直到文件末尾
Android应用程序获取系统权限 gqdy365 android
引用如何使Android应用程序获取系统权限第一个方法简单点，不过需要在Android系统源码的环境下用make来编译： 1. 在应用程序的AndroidManifest.xml中的manifest节点
HoverTree开发日志之验证码 hvt .net C#asp.net hovertree webform
HoverTree是一个ASP.NET的开源CMS，目前包含文章系统，图库和留言板功能。代码完全开放，文章内容页生成了静态的HTM页面，留言板提供留言审核功能，文章可以发布HTML源代码，图片上传同时生成高品质缩略图。推出之后得到许多网友的支持，再此表示感谢！留言板不断收到许多有益留言，但同时也有不少广告，因此决定在提交留言页面增加验证码功能。ASP.NET验证码在网上找，如果不是很多，就是特别多
JSON API：用 JSON 构建 API 的标准指南中文版 justjavac json
译文地址：https://github.com/justjavac/json-api-zh_CN 如果你和你的团队曾经争论过使用什么方式构建合理 JSON 响应格式，那么 JSON API 就是你的 anti-bikeshedding 武器。通过遵循共同的约定，可以提高开发效率，利用更普遍的工具，可以是你更加专注于开发重点：你的程序。基于 JSON API 的客户端还能够充分利用缓存，
数据结构随记_2 lx.asymmetric 数据结构笔记
第三章栈与队列一．简答题 1. 在一个循环队列中，队首指针指向队首元素的前一个位置。 2.在具有n个单元的循环队列中，队满时共有 n-1 个元素。 3. 向栈中压入元素的操作是先移动栈顶指针&n
Linux下的监控工具dstat 网络接口 linux
1) 工具说明dstat是一个用来替换 vmstat,iostat netstat,nfsstat和ifstat这些命令的工具, 是一个全能系统信息统计工具. 与sysstat相比, dstat拥有一个彩色的界面, 在手动观察性能状况时, 数据比较显眼容易观察; 而且dstat支持即时刷新, 譬如输入dstat 3, 即每三秒收集一次, 但最新的数据都会每秒刷新显示. 和sysstat相同的是,
C 语言初级入门--二维数组和指针 1140566087 二维数组 c/c++指针
/* 二维数组的定义和二维数组元素的引用二维数组的定义：当数组中的每个元素带有两个下标时，称这样的数组为二维数组； (逻辑上把数组看成一个具有行和列的表格或一个矩阵); 语法：类型名数组名[常量表达式1][常量表达式2] 二维数组的引用：引用二维数组元素时必须带有两个下标，引用形式如下：例如： int a[3][4]; 引用：
10点睛Spring4.1-Application Event wiselyman application
10.1 Application Event Spring使用Application Event给bean之间的消息通讯提供了手段应按照如下部分实现bean之间的消息通讯继承ApplicationEvent类实现自己的事件实现继承ApplicationListener接口实现监听事件使用ApplicationContext发布消息

第3章 形式语言与自动机