Championvas

kaldi chain models 中文版

“链”模型

“链”模型简介

“链”模型是一种使用nnet3实现的DNN-HMM模型，它在很多方面都和传统的模型不同。你可以将它们看作声学模型空间中的不同设计点。

····我们在神经网络的输出端使用了3倍的帧速率，这大大减少了测试时间所需的计算量，使实时解码变得更加容易。
模型从一开始就用序列级目标函数 - 即正确序列的对数概率进行训练。它的本质是MMI通过在音素 n-gram 语言模型导出的解码图上做一个完全的向前-向后，在GPU上没有格子的实现，
由于帧速率降低，我们需要使用非常规HMM拓扑（允许在一个状态下遍历HMM）。
我们在HMM中使用固定转移概率，并且不训练它们（我们可能决定将来训练它们;但是在大多数情况下，神经网络输出概率可以与转换概率完成相同的工作，具体取决于拓扑）。
目前，仅支持nnet3 DNN（参见“nnet3”设置），并且尚未实现在线解码。
目前结果比传统DNN-HMM的结果好一点（约5％相对更好），但系统解码速度提高了约3倍; 训练时间可能也快一些，但我们还没有完全比较。

在哪里可以找到“链”模型的脚本

目前用于'链'模型的最佳脚本可以在egs / swbd / s5c中的Switchboard设置中找到; 脚本local / chain / run_tdnn_2o.sh是当前最好的脚本。目前可在官方github存储库（https://github.com/kaldi-asr/kaldi.git）的“chain”分支中找到它，它最终将合并到主服务器。

该脚本使用TDNN作为神经网络（我们一直在使用TDNN进行开发，因为它们更容易调整LSTM），并提供比基线TDNN更好的WER WER（文字差错率）：11.4％，而最佳TDNN基线为12.1％（在eval2000的仅配电板部分）。

链模型

链模型在DNN的输出端使用（当前）3倍降速的帧率。DNN的输入特征是原始帧速率为每秒100帧; 这是有道理的，因为我们当前使用的所有神经网络（LSTM，TDNN）都有某种经常性的连接或拼接，即它们不是纯粹的前馈网络。

与通常模型的不同之处在于用于训练它的目标函数：我们使用正确音素序列的对数概率作为目标函数，而不是帧级目标。训练过程在原理上与MMI训练非常相似，其中我们计算分子和分母的“占领概率”，在导数计算中使用两者之间的差异。没有必要将DNN输出归一化为每帧的总和为1 - 这样的归一化没有什么作用。

由于帧速率降低（每30 ms一帧），我们需要使用修改后的HMM拓扑。我们希望HMM在一个转换中是可遍历的（而不是模型的3个转换与正常帧速率相对）。当前偏好的拓扑具有只能出现一次的状态，然后另一种状态可以出现零次或者多次。使用与基于GMM的模型相同的过程获得状态聚类，尽管具有不同的拓扑（我们将比对转换为新的拓扑和帧速率）。

“链”模型的训练程序

链模型的训练过程是MMI的无格点版本，其中分母状态后验是通过由音素级解码图形成的HMM上的向前-向后算法获得的，并且分子状态后验是通过类似的向前-向后算法来获取的，但限于对应于转录本的序列。

对于神经网络的每个输出索引（即每个pdf-id），我们计算（分子占用概率 - 分母占用概率）形式的导数，并将它们传播回网络。

分母FST

对于计算的分母部分，我们在HMM上做向前-向后。实际上，因为我们将它表示为有限状态接受器，所以标签（pdf-id）与弧而不是状态相关联，因此在通常的公式中它并不是真正的HMM，但是我们更容易将其视为HMM，因为我们使用前向前-向后算法来获得后验。在代码和脚本中，我们将其称为“分母FST”。

分母FST的音素语言模型

构建分母FST的第一个阶段是创建音素语言模型。该语言模型是从训练数据音素对齐中学习的。这是一种不平滑的语言模型，这意味着我们永远不会退回到低阶n-gram。但是，某些语言模型状态会被完全修剪，因此转换到这些状态会改为低阶n-gram状态。我们避免平滑的原因是减少语音环境扩展后编译图中将出现的弧数。

我们选定的配置是用来估算一个4-gram语言模型和不修剪低于trigram的LM状态（因此我们始终保持至少2-phone历史记录）。除了由不修剪三元组规则决定的状态数量之外，我们还有一个可指定数量（例如2000）的4-gram语言模型状态，这些状态将被保留（所有其余的都用相应的三元组状态标识），我们选择保留的那些是以最大化训练数据可能性的方式确定的。估计所有概率以最大化训练数据可能性。不修剪三元组的原因是任何允许三元组的稀疏性将倾向于最小化编译图形的尺寸。请注意，如果我们的音素LM只是一个简单的音素循环（例如：一个unigram），由于语音的临近序列效应，它会扩展为三音素，但它会有所有可能的三元组的弧。因此，使用未修剪的三元模型得到的任何稀疏性都是一个奖励。根据经验，未平滑的trigram LM可扩展到尽可能小的FST; 并修剪一些trigrams，虽然它增加了编译的FST的大小，导致很少或没有WER改善（至少300小时的数据扩展3倍速度扰动;在较少的数据可能有帮助）。

在Switchboard设置中，我们尝试的各种模型的phone-LM复杂度在5到7之间; 我们所选配置的phone-LM复杂度（4-gram，除了2000个状态以外都被修剪为trigram）大约是6个。并不是因为较低的phone-LM复杂度总是使训练系统有更好的WER; 对于传统的（基于单词的）MMI训练，一个中间强度的语言模型似乎效果最好。

分母FST的汇编

将上一节中描述的音素语言模型扩展为FST，其中把'pdf-id'作为弧，在这个过程中反映了正常Kaldi解码中的解码图编译过程（参见解码图创建配方（测试时间） ）），除了没有涉及词典，最后我们将transition-id转换为pdf-id。

一个区别在于我们如何最小化图的大小。正常的配方包括确定化和最小化。我们无法使用此过程减少图形的大小，或者使用消歧符号来减小图形的大小。相反，我们的图形最小化过程可以紧凑地描述如下：“重复3次：推动，最小化，反向;推动，最小化反转。”。'推'指的是推重; “反向”是指弧的方向反转，并交换初始和最终状态。

初始和最终概率，以及'标准化FST'

上面提到的图形创建过程自然地给出了一个初始状态，以及每个状态的最终概率; 但这些不是我们在向前-向后中使用的那些。原因是这些概率适用于话语边界，但我们训练分裂的是固定长度（例如1.5秒）的话语块。在这些任意选择的切割点上限制HMM的初始状态和最终状态是不合适的。相反，我们使用从“running the HMM”得到的初始概率进行固定次数的迭代并对概率求平均值; 每个状态的最终概率等于1.0。我们有理由这样做，但现在没有时间解释它。在分母向前-向后过程中，我们将这些初始和最终概率应用于初始和最终帧作为计算的一部分。但是，我们还写出了具有这些初始和最终概率的分母FST版本，我们将其称为“归一化FST”。（使用epsilon弧模拟初始概率，因为FST不支持初始概率）。这种“标准化FST”将用于以稍后我们将描述的方式向分子FST添加概率。

分子FST

作为我们准备训练过程的一部分，我们为每个话语生成一种称为“分子FST”（“numerator FST ”）的东西。分子FST编码了监督转录本，并且还编码该转录本的对齐（即，它强制与从基线系统获得的参考对齐相似），但是它允许稍微的“摆动空间”与该参考不同。默认情况下，我们允许音素在格子对齐中分别在其开始和结束位置之前或之后0.05秒发生。合并对齐信息非常重要，因为我们不是对整个话语进行训练，而是对分裂的固定长度的话语进行训练（这对于基于GPU的训练很重要）：如果我们将话语分成几部分知道转录本对齐的地方。

我们使用特定于话语的图解作为解码图，通过格子生成解码过程生成训练数据的替代发音的网格，而不是强制执行训练数据的特定发音。这将生成的最佳得分发音内的所有发音对齐。

拆分分子FST

如上所述，我们训练固定大小的话语片段（例如长度为1.5秒）。这要求我们将分子FST分成固定大小的碎片。这并不难，因为分子FST（记住，编码时间对齐（time-alignment）信息）自然具有我们可以识别具有特定帧索引的任何FST状态的结构。注意：在我们进行此拆分的阶段，分子FST中没有损失 - 它只是被视为编码路径上的约束 - 因此我们不必决定如何分割路径上的损失。

归一化分子FST

上图（分母FST的汇编）提到了如何计算分母FST的初始和最终概率，以及我们如何在“归一化FST”（ 'normalization FST'）中对这些概率进行编码。我们用这个“归一化FST”组成分子FST的分割部分，以确保分母FST的损失反映在分子FST中。这确保了目标函数永远不会是正的（这使得它们更容易解释），并且还防止分子FST可能包含分母FST不允许的状态序列的可能性，这原则上可以允许目标函数在不受约束的条件下增加。这钟情况可能发生的原因是音素LM缺乏平滑，并且从1-best对齐估计，因此格子可能包含有在训练中看不到的音素n-gram序列。

偶尔（但很少）会发生这种归一化过程产生空FST的情况：这种情况可能发生在当格子包含用于训练音素语言模型的1-best对齐中不存在的三音素时，并且没有任何可选路径的格可以弥补由此产生的“失败”路径。这是有可能发生的，因为1-bes和格子产生对齐选择了单词的不同发音。这些话语都被丢弃了。

分子FST的格式

分子FST是加权接受器，其中标签对应于pdf-id加1。我们不能使用pdf-id，因为它们可能为零; 并且零是由OpenFST专门处理的（如epsilon）。当我们形成小批量时，我们实际上将它们放在一起以形成更长的FST，而不是存储一系列单独的分子FST; 这使我们能够对小批量中的所有话语进行单向向前-向后，直接计算总的分子对数概率。（这不是一个重要的特性，它只是一个软件细节，我们在这里解释，以免产生混淆）。

固定长度的块和微批量处理

为了训练小批量，我们将我们的话语分成固定长度的语音块（在我们当前的脚本中长度为1.5秒）。比这更短的话语被丢弃; 那些更长的，被分成块，块之间有重叠，或块之间有小间隙。请注意，我们的声学模型通常需要左或右框架用于声学环境; 我们对其进行了补充，但这是一个单独的问题; 在确定块之后添加环境。

我们的小批量大小通常是2的幂，它可能受GPU内存考虑因素的限制。我们的许多示例脚本每个小批量使用128个块。GPU内存的最大单个使用者是向前-向后计算中的alpha概率。例如，对于1.5秒的块，我们在3倍分段抽样后有50个时间步长。在我们的Switchboard设置中，典型的分母FST中有30,000个状态。我们对alpha使用单精度浮点数，因此以千兆字节为单位的内存为（128 * 50 * 30000 * 4）/ 10 ^ 9 = 0.768G。

这不会耗尽所有GPU内存，但还有其他内存来源，例如我们在内存中保留两个nnet输出副本，这根据配置需要相当多的内存 -- 例如，将30000替换为10000，它将为您提供在合理配置中用于一个nnet输出副本的内存量。

对帧移位数据进行训练

在神经网络训练中，我们已经有了生成扰动数据的方法来人为地增加我们训练的数据量。我们的标准nnet3神经网络训练示例脚本通过0.9, 1.0和1.0的因子对原始音频进行时间扭曲，以创建3倍的增强数据。这与'链'模型正交，我们这样做（或不这样做）就像我们对基线一样。但是，有一种额外的方法可以通过移动帧来增加链模型的数据。这些模型的输出帧速率是常规帧速率的三分之一（当然是可以配置的），这意味着我们只评估nnet输出t值为3的倍数，因此我们可以通过将训练样例移动0,1和2帧来生成不同版本的训练数据。这是在训练脚本中自动完成的，当我们从磁盘读取训练样例时，它“即时”完成 - 程序nnet3-chain-copy-egs有一个由脚本设置的选项–frame-shift（帧-移位）。这会影响解释epochs数量。如果用户请求例如4个epochs，那么我们实际上训练了12个epochs; 我们只是对3个不同移位版本的数据这样做。选项–frame-shift=t选项实际上做的是将输入帧t移位并将输出帧移动最接近的3到t。（通常它可能不是3，它是一个名为–frame-subsampling-factor的配置变量）。

GPU训练中的问题

特定于 “链”计算的计算部分是分子FST上的向前-向后和分母HMM上的向前-向后。分子部分非常快。向前-向后分母需要相当多的时间，因为分母FST中可能存在很多弧（例如，典型的Switchboard设置中有200,000个弧和30,000个状态）。所花费的时间几乎与计算的神经网络部分所花费的时间一样多。我们非常小心地确保内存的位置。

进一步加快这一步骤的下一步可能是实现向前-向后计算的修剪版本（如修剪的Viterbi，但计算后验）。为了获得加速，我们必须削减很高比例的状态，因为我们需要弥补修剪带来的内存局部性损失。在我们当前的实现中，我们仔细地确保一组GPU线程都处理相同的HMM状态和时间，只是来自不同的块（我们在代码中调用这些不同的'序列'）; 并且我们确保对应于这些不同序列的内存为止在内存中彼此相邻，因此GPU可以进行“整合内存访问”。使用状态级修剪，因为不同序列的内存访问将不再“同步”，我们会失去这个优势。但是，获得向前-向后算法的修剪版本仍然是可行的。

对于速度，我们不在分母图的alpha-beta计算中使用对数值。为了将所有数值保持在合适的范围内，我们将每一帧上的所有声学概率（指数化nnet输出）乘以选定的“任意值”，以确保我们的alpha分数保持在良好的范围内。我们称之为“任意值”，因为算法的设计使得我们可以在这里选择任何值，并且它在数学仍然上是正确的。我们将一个HMM状态指定为“特殊状态”，并且选择“任意常数”是前一帧上该特殊状态的alpha的倒数。这使特殊状态的alpha值保持接近1。作为“特殊状态”，我们选择一个在HMM限制分布中具有高概率的状态，并且它可以进入大部分的HMM状态。

使用'链'模型解码

使用'链'模型的解码过程与基于常规nnet3神经网络的模型完全相同，实际上它们使用相同的脚本（steps / nnet3 / decode.sh）。但是也有一些配置差异：

首先，使用不同且更简单的拓扑构建图形; 但这不需要用户采取任何特殊操作，因为图形构建脚本无论如何都要从“链”训练脚本生成的'final.mdl'中获取拓扑，该脚本包含正确的拓扑。
默认情况下，当我们编译图形时，我们使用0.1的“自循环标度”。这会影响如何处理自循环的转换概率（通常效果更好）。但是，对于“链”模型，鉴于它们的训练单方法，我们需要使用与我们训练过的完全相同的转换概率缩放，为简单起见，我们将其设置为1.0。所以我们提供的选项–self-loop-scale 1.0到utils/mkgraph.sh脚本。
这些模型中没有“先行分割”的必要条件。所以我们根本就没有在.mdl文件中设置先验矢量;我们确保解码器在没有设置先验的前提下，只省略除法。。
我们通常在解码中使用的默认声学标度（0.1）不适用于“链”模型，最佳声学标度非常接近1.因此我们提供–acwt 1.0选项给脚本。steps/nnet3/decode.sh。
评分脚本只能以1为增量搜索语言模型比例，这在最佳语言模型比例在10到15之间的典型设置中很有效，但在最佳语言模型比例接近1时则不行。（注意：出于当前目的，您可以将语言模型比例视为声学比例的倒数）。为了解决这个问题而不改变评分脚本（这是特定于数据库的），我们提供了一个新的选项–post-decode-acwt 10.0给脚本steps/nnet3/decode.sh，它在转储格子之前将声学概率缩放10。在此之后，最佳语言模型比例将在10左右，如果您不了解此问题，可能会有点混乱，但是对于评分脚本的设置方式来说是很方便的。

一旦使用该–acwt 1.0选项，默认解码和点阵光束适用于“链”模型而无需修改。但是，它们不会显示完全可能的加速，并且您可以通过使用稍微紧一点的光束来获得更快的解码。通过在Switchboard设置中收紧光束，我们能够将解码时间从实时的1.5倍降低到实时的约0.5倍，精度降低仅约0.2％（这是通过CPU的神经网络评估;在GPU上本来会更快）。Dan提供的注意事项：在我写这篇文章的时候，这是我最好的回忆; 实际上，退化退化可能不止于此。请记住，这是在高性能的现代服务器机器（单线程）上。

您可能会注意到当前的示例脚本中我们使用的是iVectors。我们这样做只是因为它们通常有所帮助而且因为我们正在使用它们比较基线设置，。“链”模型没有内在联系，也没有使用它们的基本要求。

探索OpenAI和LangChain的适配器集成：轻松切换模型提供商 nseejrukjhad langchain easyui 前端 python
#探索OpenAI和LangChain的适配器集成：轻松切换模型提供商##引言在人工智能和自然语言处理的世界中，OpenAI的模型提供了强大的能力。然而，随着技术的发展，许多人开始探索其他模型以满足特定需求。LangChain作为一个强大的工具，集成了多种模型提供商，通过提供适配器，简化了不同模型之间的转换。本篇文章将介绍如何使用LangChain的适配器与OpenAI集成，以便轻松切换模型提供商
利用LangChain的StackExchange组件实现智能问答系统 nseejrukjhad langchain microsoft 数据库 python
利用LangChain的StackExchange组件实现智能问答系统引言在当今的软件开发世界中，StackOverflow已经成为程序员解决问题的首选平台之一。而LangChain作为一个强大的AI应用开发框架，提供了StackExchange组件，使我们能够轻松地将StackOverflow的海量知识库集成到我们的应用中。本文将详细介绍如何使用LangChain的StackExchange组件
如何部分格式化提示模板:LangChain中的高级技巧 nseejrukjhad langchain java 服务器 python
标题:如何部分格式化提示模板:LangChain中的高级技巧内容:如何部分格式化提示模板:LangChain中的高级技巧引言在使用大型语言模型(LLM)时,提示工程是一个关键环节。LangChain提供了强大的提示模板功能,让我们能更灵活地构建和管理提示。本文将介绍LangChain中一个高级特性-部分格式化提示模板,这个技巧可以让你的提示管理更加高效和灵活。什么是部分格式化提示模板?部分格式化提
第六集如何安装CentOS7.0，3分钟学会centos7安装教程 date分享
从光盘引导系统按回车键继续进入引导程序安装界面，选择语言这里选择简体中文版点击继续选择桌面安装下面给系统分区选择磁盘，点击完成选择基本分区，点击加号swap分区,大小填内存的两倍在选择根分区，使用所有可用的磁盘空间选择文件系统ext4点击完成，点击开始安装设置root密码，点击完成设置普通用户和密码，点击完成整个过程持续八分钟左右根据个人配置不同，时间长短不同好，现在点击重启系统进入重启状态点击本
AI大模型的架构演进与最新发展季风泯灭的季节 AI大模型应用技术二人工智能架构
随着深度学习的发展，AI大模型（LargeLanguageModels,LLMs）在自然语言处理、计算机视觉等领域取得了革命性的进展。本文将详细探讨AI大模型的架构演进，包括从Transformer的提出到GPT、BERT、T5等模型的历史演变，并探讨这些模型的技术细节及其在现代人工智能中的核心作用。一、基础模型介绍：Transformer的核心原理Transformer架构的背景在Transfo
探索ASPICE V3.1：汽车行业软件开发的中文指南阮懿同
探索ASPICEV3.1：汽车行业软件开发的中文指南ASPICE_V3.1中文版.pdf.zip项目地址:https://gitcode.com/open-source-toolkit/422a2在汽车软件工程领域，高质量的标准对于确保行车安全和提升用户体验至关重要。今天，我们为您介绍一个珍贵的开源宝藏——ASPICEV3.1中文版资源。这是一篇专为国内汽车行业开发者、质量管理者准备的深度解读，旨
python中文版下载官网-Python下载 v3.8.3 官方中文版 weixin_37988176
Python中文版是一款非常专业的通用型计算机程序设计语言安装包，Python具有比其他语言更有特色语法结构，而且在设计上坚持了清晰划一的风格，使得它成为一门易读、易维护并且被大量用户所欢迎的、用途广泛的语言，随着版本的不断更新和语言新功能的添加，越来越多被用于独立的、大型项目的开发。Python中文版软件介绍Python中文版是一门跨平台的脚本语言，Python规定了一个Python语法规则，实
python中文版软件下载-Python中文版编程大乐趣
python中文版是一种面向对象的解释型计算机程序设计语言。python中文版官网面向对象编程，拥有高效的高级数据结构和简单而有效的方法，其优雅的语法、动态类型、以及天然的解释能力，让它成为理想的语言。软件功能强大，简单易学，可以帮助用户快速编写代码，而且代码运行速度非常快，几乎可以支持所有的操作系统，实用性真的超高的。python中文版软件介绍：python中文版的解释器及其扩展标准库的源码和编
linux简单安装gcc和gdb chn-zgq Linux linux ubuntu
linux安装gcc以及环境配置和gdb安装gcc-10.0添加源:sudoadd-apt-repositoryppa:ubuntu-toolchain-r/ppa更新源:sudoaptupdate下载gcc:sudoaptinstallgcc-10g++-10默认GCC版本设置为gcc-10.0:sudoupdate-alternatives--install/usr/bin/gccgcc/us
springcloud — 微服务鉴权管理Spring Security原理解析(二) RachelHwang springcloud spring java spring security oauth2 springcloud
引言：回顾之前介绍的OAuth2简单分析与介绍，微服务鉴权管理之OAuth2原理解析(一)，前面的部分，我们关注了SpringSecurity是如何完成认证工作的，但是另外一部分核心的内容：过滤器，一直没有提到，我们已经知道SpringSecurity使用了springSecurityFilterChain作为了安全过滤的入口，这一节主要分析一下这个过滤器链都包含了哪些关键的过滤器，并且各自的使命
深入探讨：如何在Python中通过LangChain技术精准追踪大型语言模型（LLM）的Token使用情况 m0_57781768 python langchain 语言模型
深入探讨：如何在Python中通过LangChain技术精准追踪大型语言模型（LLM）的Token使用情况在现代的人工智能开发中，大型语言模型（LLM）已经成为了不可或缺的工具，无论是用于自然语言处理、对话生成，还是其他复杂的文本生成任务。然而，随着这些模型的广泛应用，开发者面临的一个重要挑战是如何有效地追踪和管理Token的使用情况，特别是在生产环境中，Token的使用直接影响着API调用的成本
深入理解LangChain中的Callback机制：如何为Runnable添加回调函数 aehrutktrjk langchain python
深入理解LangChain中的Callback机制：如何为Runnable添加回调函数引言在LangChain中，回调（Callbacks）是一种强大的机制，允许开发者在运行过程中监控和干预各种操作。本文将深入探讨如何为Runnable对象添加回调函数，这对于调试、日志记录和性能监控等任务至关重要。我们将通过实际的代码示例来演示这一过程，并讨论一些常见的应用场景和最佳实践。理解Callback机制
LangChain集成指南:如何利用多样化的AI提供商 aehrutktrjk 人工智能 langchain python
LangChain集成指南:如何利用多样化的AI提供商引言在人工智能和机器学习领域,LangChain已成为一个强大而灵活的框架,允许开发者轻松集成各种AI服务提供商。本文将深入探讨LangChain的集成能力,介绍如何利用不同的AI提供商来增强你的应用程序,并提供实用的代码示例。LangChain集成概览LangChain支持多种AI提供商的集成,这些集成可以分为两类:独立包集成:这些提供商有独
使用LangChain和OpenAI实现高效文本标注 aehrutktrjk langchain python
使用LangChain和OpenAI实现高效文本标注引言在自然语言处理(NLP)领域，文本标注是一项重要且常见的任务。它涉及为文本分配标签，如情感、语言、风格等。本文将介绍如何使用LangChain和OpenAI的API来实现高效的文本标注系统。我们将探讨如何设置环境、定义标注模式，以及如何使用OpenAI的模型来执行标注任务。环境准备首先，我们需要安装必要的库并设置API密钥：%pipinsta
使用 LangChain 和 Neo4j 构建智能图数据库查询系统 aehrutktrjk langchain neo4j 数据库 python
使用LangChain和Neo4j构建智能图数据库查询系统引言在本文中，我们将探讨如何结合LangChain和Neo4j图数据库来构建一个智能的图数据库查询系统。这个系统能够将用户的自然语言问题转换为准确的Cypher查询，并生成易于理解的回答。我们将重点关注如何通过实体映射来提高查询的准确性，这对于处理复杂的图数据尤为重要。主要内容1.环境设置首先，我们需要安装必要的包并设置环境变量：#安装必要
2.8.5Django --8.2 单表操作寒暄_HX
Django目录：https://www.jianshu.com/p/dc36f62b3dc5Yuan先生-Django模型层（1）Django与SQLAlchemy的ORM操作本质上是一样的，但是语法略有不同，如果是用Django进行开发最好使用原生的ORM或者直接使用原生SQL。创建表app06创建模型在app06中的models.py文件内，新建一个模板。one_exa.app06.mode
ResNet的半监督和半弱监督模型 Valar_Morghulis
Billion-scalesemi-supervisedlearningforimageclassificationhttps://arxiv.org/pdf/1905.00546.pdfhttps://github.com/facebookresearch/semi-supervised-ImageNet1K-models/权重在timm中也有：https://hub.fastgit.org/r
python-opencv cv2.findContours()函数 fjswcjswzy opencv python笔记 python opencv
示例代码：image,contours,hierarchy=cv2.findContours(contour,cv2.RETR_TREE,cv2.CHAIN_APPROX_SIMPLE)输入：contour：带有轮廓信息的图像；cv2.RETR_TREE：提取轮廓后，输出轮廓信息的组织形式，除了cv2.RETR_TREE还有以下几种选项：cv2.RETR_EXTERNAL：输出轮廓中只有外侧轮廓信
报错 | pydantic.v1.error_wrappers.ValidationError ... subclass of BaseModel expected 程序猿林仔报错 python python langchain
文章目录01问题情景02分析问题03阅读源码04解决方案4.1方案1-指定版本安装4.2（通用）方案2-指定v1版本4.3（推荐）方案3-参考源码01问题情景最近在做Langchain的开发，可能是因为我更新了依赖库的版本，在执行下面这部分代码的时候出现了该异常：#出现该异常的代码(仅保留核心逻辑)fromlangchain.output_parsersimportPydanticOutputPa
区块链私有链new qis_qis 区块链区块链以太坊数字货币
{“config”:{“chainld”:666,“homesteadBlock”:0,“eip150Block”:0,“eip150Hash”:“0x0000000000000000000000000000000000000000000000000000000000000000”,“eip155Block”:0,“eip158Block”:0,“byzantiumBlock”:0,“consta
区块链私有链 qis_qis 区块链区块链以太坊数字货币
{"config":{"chainld":666,"homesteadBlock":0,"eip150Block":0,"eip150Hash":"0x0000000000000000000000000000000000000000000000000000000000000000","eip155Block":0,"eip158Block":0,"byzantiumBlock":0,"consta
ModuleNotFoundError: No module named ‘timm.layers‘ 忽略不计， BUG python YOLO 目标检测人工智能深度学习
解决方式：把fromtimm.layersimportDropPath这个修改为fromtimm.models.layersimportDropPath即可。
座舱交互的下一个时代高工智能汽车交互物联网人工智能
为了满足座舱信息娱乐的更高性能要求，几乎所有的一线品牌都在准备“换芯”。去年开始，不少车型开始推动传统的分布式座舱仪表和中控电子架构进入域控制器时代，高通成为大赢家。今年6月，特斯拉也正式官宣，即将推出的新款ModelS将配备能够运行PS5游戏机性能的AMD芯片，包括专门定制的AMDRyzenCPU和独立的Navi23图形处理器。最新消息，特斯拉将率先在中国市场生产的ModelY高性能版车型换装A
内网穿透之EW使用、判断服务器是否出网板栗妖怪学习内网渗透
环境搭建使用的是下面文章的环境记一次学习--内网穿透-CSDN博客ew代理然后同样通过thinkphp漏洞写入文件，然后通过蚁剑连接然后上传ew的Linux版本，然后加权执行一层代理正向代理设置正向代理（在ubuntu上），然后kali在proxychain配置文件中连接ubuntu的192.168.244.154的代理端口反向代理在ubuntu上设置反向代理，将连接反弹到kali上的某个端口。然
【笔记】扩散模型（七）：Latent Diffusion Models（Stable Diffusion）论文解读与代码实现 LittleNyima Diffusion Models 笔记 stable diffusion AIGC 人工智能
论文链接：High-ResolutionImageSynthesiswithLatentDiffusionModels官方实现：CompVis/latent-diffusion、CompVis/stable-diffusion这一篇文章的内容是LatentDiffusionModels（LDM），也就是大名鼎鼎的StableDiffusion。先前的扩散模型一直面临的比较大的问题是采样空间太大，学
基于 LangChain 开发应用程序第三章-储存明志刘明大模型学习手册 langchain
需要学习提示词工程的同学请看面向开发者的提示词工程需要学习ChatGPT的同学请查看搭建基于ChatGPT的问答系统本部分之前的章节可以查看基于LangChain开发应用程序第一章-简介基于LangChain开发应用程序第二章-提示和输出第三章储存在与语言模型交互时，你可能已经注意到一个关键问题：它们并不记忆你之前的交流内容，这在我们构建一些应用程序（如聊天机器人）的时候，带来了很大的挑战，使得对
Biopython提取和分离复合体PDB文件中所有链的结构信息 qq_27390023 生物信息学 python
从蛋白质复合体的PDB文件中提取每个链的结构信息，并保存成单独的pdb文件。示例代码fromBioimportPDBdefextract_chain_sequences(pdb_file,output_dir):"""从PDB文件中提取所有链的序列，并保存为独立的PDB文件。:parampdb_file:蛋白质复合体PDB文件路径:paramoutput_dir:输出目录，用于保存各链的PDB文件
多模态大模型微调Qwen-VL微调及日志 Messi^ 人工智能-大模型应用 python 人工智能深度学习
%pipinstallmodelscope-U%pipinstalltransformersacceleratetiktoken-U%pipinstalleinopstransformers_stream_generator-U%pipinstallpillow-U%pipinstalltorchvision%pipinstallmatplotlib-Ufrommodelscopeimport(s
使用LangChain与Together AI模型交互：深入探讨和实践指南 llzwxh888 langchain 人工智能交互 python
使用LangChain与TogetherAI模型交互：深入探讨和实践指南1.引言在人工智能和自然语言处理领域，TogetherAI已经成为一个强大的平台，提供了对50多个领先开源模型的访问。本文将深入探讨如何使用LangChain与TogetherAI模型进行交互，为开发者提供实用的知识和见解，同时解决可能遇到的常见问题。2.TogetherAI简介TogetherAI是一个强大的API平台，允许
基于XTDrone的ZD550+Mid360实现夜雨拾年无人机
前言本文是对ZD550搭载Mid360激光雷达Gazebo仿真平台搭建记录的实现文件导入先下载提供的文件链接:https://pan.baidu.com/s/1reqGCcQOj1T_tGBY3EZWpw?pwd=328c提取码:328c将文件夹ZD550_Mid360中的5个文件夹都添加到PX4_Firmware/Tools/sitl_gazebo/models目录下，其中models目录下可能
多线程编程之join()方法周凡杨 java JOIN 多线程编程线程
现实生活中，有些工作是需要团队中成员依次完成的，这就涉及到了一个顺序问题。现在有T1、T2、T3三个工人，如何保证T2在T1执行完后执行，T3在T2执行完后执行？问题分析：首先问题中有三个实体，T1、T2、T3，因为是多线程编程，所以都要设计成线程类。关键是怎么保证线程能依次执行完呢？ Java实现过程如下： public class T1 implements Runnabl
java中switch的使用 bingyingao java enum break continue
java中的switch仅支持case条件仅支持int、enum两种类型。用enum的时候，不能直接写下列形式。 switch (timeType) { case ProdtransTimeTypeEnum.DAILY: break; default: br
hive having count 不能去重 daizj hive 去重 having count 计数
hive在使用having count()是，不支持去重计数 hive (default)> select imei from t_test_phonenum where ds=20150701 group by imei having count(distinct phone_num)>1 limit 10; FAILED: SemanticExcep
WebSphere对JSP的缓存周凡杨 WAS JSP 缓存
对于线网上的工程，更新JSP到WebSphere后，有时会出现修改的jsp没有起作用，特别是改变了某jsp的样式后，在页面中没看到效果，这主要就是由于websphere中缓存的缘故，这就要清除WebSphere中jsp缓存。要清除WebSphere中JSP的缓存，就要找到WAS安装后的根目录。现服务
设计模式总结朱辉辉33 java 设计模式
1.工厂模式 1.1 工厂方法模式 (由一个工厂类管理构造方法) 1.1.1普通工厂模式(一个工厂类中只有一个方法) 1.1.2多工厂模式(一个工厂类中有多个方法) 1.1.3静态工厂模式(将工厂类中的方法变成静态方法) &n
实例：供应商管理报表需求调研报告老A不折腾 finereport 报表系统报表软件信息化选型
引言随着企业集团的生产规模扩张，为支撑全球供应链管理，对于供应商的管理和采购过程的监控已经不局限于简单的交付以及价格的管理，目前采购及供应商管理各个环节的操作分别在不同的系统下进行，而各个数据源都独立存在，无法提供统一的数据支持；因此，为了实现对于数据分析以提供采购决策，建立报表体系成为必须。业务目标 1、通过报表为采购决策提供数据分析与支撑 2、对供应商进行综合评估以及管理，合理管理和
mysql 林鹤霄
转载源：http://blog.sina.com.cn/s/blog_4f925fc30100rx5l.html mysql -uroot -p ERROR 1045 (28000): Access denied for user 'root'@'localhost' (using password: YES) [root@centos var]# service mysql
Linux下多线程堆栈查看工具(pstree、ps、pstack) aigo linux
原文：http://blog.csdn.net/yfkiss/article/details/6729364 1. pstree pstree以树结构显示进程$ pstree -p work | grep adsshd(22669)---bash(22670)---ad_preprocess(4551)-+-{ad_preprocess}(4552) &n
html input与textarea 值改变事件 alxw4616 JavaScript
// 文本输入框(input) 文本域(textarea)值改变事件 // onpropertychange(IE) oninput(w3c) $('input,textarea').on('propertychange input', function(event) { console.log($(this).val()) });
String类的基本用法百合不是茶 String
字符串的用法; // 根据字节数组创建字符串 byte[] by = { 'a', 'b', 'c', 'd' }; String newByteString = new String(by); 1,length() 获取字符串的长度 &nbs
JDK1.5 Semaphore实例 bijian1013 java thread java多线程 Semaphore
Semaphore类一个计数信号量。从概念上讲，信号量维护了一个许可集合。如有必要，在许可可用前会阻塞每一个 acquire()，然后再获取该许可。每个 release() 添加一个许可，从而可能释放一个正在阻塞的获取者。但是，不使用实际的许可对象，Semaphore 只对可用许可的号码进行计数，并采取相应的行动。 S
使用GZip来压缩传输量 bijian1013 java GZip
启动GZip压缩要用到一个开源的Filter：PJL Compressing Filter。这个Filter自1.5.0开始该工程开始构建于JDK5.0，因此在JDK1.4环境下只能使用1.4.6。 PJL Compressi
【Java范型三】Java范型详解之范型类型通配符 bit1129 java
定义如下一个简单的范型类， package com.tom.lang.generics; public class Generics<T> { private T value; public Generics(T value) { this.value = value; } }
【Hadoop十二】HDFS常用命令 bit1129 hadoop
1. 修改日志文件查看器 hdfs oev -i edits_0000000000000000081-0000000000000000089 -o edits.xml cat edits.xml 修改日志文件转储为xml格式的edits.xml文件，其中每条RECORD就是一个操作事务日志 2. fsimage查看HDFS中的块信息等 &nb
怎样区别nginx中rewrite时break和last ronin47
在使用nginx配置rewrite中经常会遇到有的地方用last并不能工作，换成break就可以，其中的原理是对于根目录的理解有所区别，按我的测试结果大致是这样的。 location / { proxy_pass http://test;
java-21.中兴面试题输入两个整数 n 和 m ，从数列 1 ， 2 ， 3.......n 中随意取几个数 , 使其和等于 m bylijinnan java
import java.util.ArrayList; import java.util.List; import java.util.Stack; public class CombinationToSum { /* 第21 题 2010 年中兴面试题编程求解：输入两个整数 n 和 m ，从数列 1 ， 2 ， 3.......n 中随意取几个数 , 使其和等
eclipse svn 帐号密码修改问题开窍的石头 eclipse SVN svn帐号密码修改
问题描述： Eclipse的SVN插件Subclipse做得很好，在svn操作方面提供了很强大丰富的功能。但到目前为止，该插件对svn用户的概念极为淡薄，不但不能方便地切换用户，而且一旦用户的帐号、密码保存之后，就无法再变更了。解决思路：删除subclipse记录的帐号、密码信息，重新输入
[电子商务]传统商务活动与互联网的结合 comsci 电子商务
某一个传统名牌产品，过去销售的地点就在某些特定的地区和阶层，现在进入互联网之后，用户的数量群突然扩大了无数倍，但是，这种产品潜在的劣势也被放大了无数倍，这种销售利润与经营风险同步放大的效应，在最近几年将会频繁出现。。。。如何避免销售量和利润率增加的
java 解析 properties-使用 Properties-可以指定配置文件路径 cuityang java properties
#mq xdr.mq.url=tcp://192.168.100.15:61618; import java.io.IOException; import java.util.Properties; public class Test { String conf = "log4j.properties"; private static final
Java核心问题集锦 darrenzhu java 基础核心难点
注意，这里的参考文章基本来自Effective Java和jdk源码 1)ConcurrentModificationException 当你用for each遍历一个list时，如果你在循环主体代码中修改list中的元素，将会得到这个Exception，解决的办法是： 1)用listIterator, 它支持在遍历的过程中修改元素， 2)不用listIterator, new一个
1分钟学会Markdown语法 dcj3sjt126com markdown
markdown 简明语法基本符号 *,-,+ 3个符号效果都一样，这3个符号被称为 Markdown符号空白行表示另起一个段落 `是表示inline代码，tab是用来标记代码段，分别对应html的code，pre标签换行单一段落( <p>) 用一个空白行连续两个空格会变成一个 <br> 连续3个符号，然后是空行
Gson使用二（GsonBuilder） eksliang json gson GsonBuilder
转载请出自出处：http://eksliang.iteye.com/blog/2175473 一.概述 GsonBuilder用来定制java跟json之间的转换格式二.基本使用实体测试类：温馨提示：默认情况下@Expose注解是不起作用的,除非你用GsonBuilder创建Gson的时候调用了GsonBuilder.excludeField
报ClassNotFoundException: Didn't find class "...Activity" on path: DexPathList gundumw100 android
有一个工程，本来运行是正常的，我想把它移植到另一台PC上，结果报： java.lang.RuntimeException: Unable to instantiate activity ComponentInfo{com.mobovip.bgr/com.mobovip.bgr.MainActivity}: java.lang.ClassNotFoundException: Didn't f
JavaWeb之JSP指令 ihuning javaweb
要点 JSP指令简介 page指令 include指令 JSP指令简介 JSP指令（directive）是为JSP引擎而设计的，它们并不直接产生任何可见输出，而只是告诉引擎如何处理JSP页面中的其余部分。 JSP指令的基本语法格式： <%@ 指令属性名="
mac上编译FFmpeg跑ios 啸笑天 ffmpeg
1、下载文件：https://github.com/libav/gas-preprocessor，复制gas-preprocessor.pl到/usr/local/bin/下，修改文件权限：chmod 777 /usr/local/bin/gas-preprocessor.pl 2、安装yasm-1.2.0 curl http://www.tortall.net/projects/yasm
sql mysql oracle中字符串连接 macroli oracle sql mysql SQL Server
有的时候，我们有需要将由不同栏位获得的资料串连在一起。每一种资料库都有提供方法来达到这个目的： MySQL: CONCAT() Oracle: CONCAT(), || SQL Server: + CONCAT() 的语法如下： Mysql 中 CONCAT(字串1, 字串2, 字串3, ...): 将字串1、字串2、字串3，等字串连在一起。请注意，Oracle的CON
Git fatal: unab SSL certificate problem: unable to get local issuer ce rtificate qiaolevip 学习永无止境每天进步一点点 git 纵观千象
// 报错如下： $ git pull origin master fatal: unable to access 'https://git.xxx.com/': SSL certificate problem: unable to get local issuer ce rtificate // 原因：由于git最新版默认使用ssl安全验证，但是我们是使用的git未设
windows命令行设置wifi surfingll windows wifi 笔记本wifi
还没有讨厌无线wifi的无尽广告么，还在耐心等待它慢慢启动么教你命令行设置笔记本电脑wifi： 1、开启wifi命令 netsh wlan set hostednetwork mode=allow ssid=surf8 key=bb123456 netsh wlan start hostednetwork pause 其中pause是等待输入，可以去掉 2、
Linux（Ubuntu）下安装sysv-rc-conf wmlJava linux ubuntu sysv-rc-conf
安装：sudo apt-get install sysv-rc-conf 使用：sudo sysv-rc-conf 操作界面十分简洁，你可以用鼠标点击，也可以用键盘方向键定位，用空格键选择，用Ctrl+N翻下一页，用Ctrl+P翻上一页，用Q退出。背景知识 sysv-rc-conf是一个强大的服务管理程序，群众的意见是sysv-rc-conf比chkconf
svn切换环境，重发布应用多了javaee标签前缀 zengshaotao javaee
更换了开发环境，从杭州，改变到了上海。svn的地址肯定要切换的，切换之前需要将原svn自带的.svn文件信息删除，可手动删除，也可通过废弃原来的svn位置提示删除.svn时删除。然后就是按照最新的svn地址和规范建立相关的目录信息，再将原来的纯代码信息上传到新的环境。然后再重新检出，这样每次修改后就可以看到哪些文件被修改过，这对于增量发布的规范特别有用。检出