XLM解读（论文 + PyTorch源码）

这篇论文是Facebook在BERT的基础上发展出来的Cross-Lingual版本，即多语的。BERT的github上实际上也有一个多语版本的，但却没有提到是怎么训练的，也没有任何的信息。这里的XLM提出了一些策略用于多语言学习，并与multi-lingual的BERT进行了对比，效果确实会好。

文章目录

一. 前言
二. XLM原理

1. 多语词表构建
2. 预训练任务
3. 预训练流程

三. 实验
四. PyTorch实现
五. 总结

优势
不足

传送门

一. 前言

一开始BERT出来的时候，只有英语的，这对于各个国家的广大AI爱好者，是十分不便的，大家都希望能有自己国家语言的版本。这不，后面BERT又出了多语言版本，FB也紧跟着出了一个更好的多语言版本（不过貌似语言比较少？主要还是针对翻译和XNLI任务而定制的，不像BERT的那个那么多语言，而且很通用）

这里复述一下作者在第一章总结的他们的贡献：

引入了一个新的无监督方法，用于训练多语的表征，并且提出两个单语的预训练LM目标
提出了一种新的有监督方法，使用平行语料，来增强多语预训练的表现
在跨语言分类、有/无监督机器翻译任务上，达到了新的SoTA
对于resource比较少的语言，用这种预训练方式很有帮助
重点来了！有源码和预训练模型

下面来看看XLM具体是怎么操作的~

PS：不知道有没有读者和笔者一样，一看到这种多语的啊，pair的啊，parallel的啊这类的词眼，就觉得整个逻辑非常的晕，这篇论文，尤其是实验部分，真的是结合源码看了好久，大概率是笔者太菜了吧。。。

二. XLM原理

1. 多语词表构建

既然是多语的模型嘛，总不可能是一个语言一个model，然后封装在一起，假装是多语模型吧，肯定是只有一个模型的，那么就要求这个模型能接收各个语言的句子作为输入，因此这里就需要构建包含各个语言词的多语词表。

与BERT一样，这里也是使用BPE，但不是简单地把各个语言的bpe词表进行拼接，那样也太大了，，这里是先对多语语料按照如下的概率进行采样，然后将多语语料进行拼接，最后进行正常的BPE统计。采样的目的是对大语种的语料和小语种的语料进行一下平滑，省的全采到大语种上面了，小语种连词表都没有了（或者小语种都被按照char拆分了）。。这里取 $\alpha=0.5$ 。

$q_i = \frac{p_i^ \alpha}{\sum_{j=1}^N p_j^ \alpha}\ with\ p_i = \frac{n_i}{\sum_{k=1}^N n_k}$

2. 预训练任务

这里作者提出了三种预训练任务：CLM、MLM和TLM，下面分别介绍：

CLM：Causal Language Model，无监督单语单向LM训练任务，就是用Transformer进行LM的单向训练。
MLM：Masked Language Model，无监督单语双向LM训练任务，与BERT一样。
TLM：Translation Language Model，有监督翻译LM训练，拼接平行双语语料，然后执行MLM，以期这样能学到翻译的对齐信息？

对于MLM和TLM的形象化表示可以看下图：

这里MLM/TLM的输入构造时与BERT的不同主要在于：

BERT在预训练构造输入的时候，用的都是pair的输入方式，其实就是先构建NSP的数据，然后再mask并构造MLM的数据。输入会规定一个最大长度，然后选择两个句子组（句子组的概念就是把物理上相邻的多个句子当成一整个句子，中间不加入任何句子的分隔符），满足在这个长度内即可。
XLM在预训练的时候，对于CLM和MLM都是用的stream的方式，将多个物理上的句子（不一定相邻？）通过分隔符连接起来作为输入，对于TLM的构造与前者一样，只不过又拼接了一个平行语料。同时，去掉了BERT里面的句子id标识，改成了语言的id标识。

3. 预训练流程

简而言之就是：CLM/MLM (+TLM)，也即从CLM或MLM中选一个进行单语LM的预训练，然后再根据需求和数据情况，决定要不要加入TLM进行训练，加入的话就是和前面的CLM/MLM进行交替训练。

三. 实验

论文里面主要验证了XNLI、无监督机器翻译和有监督机器翻译任务的效果，下面分别说：

XNLI

这个任务其实笔者也是去扒拉了FB之前的论文，才知道是个什么任务。。其实还是文本蕴含任务，但只不过训练集里面都是英文的，验证集里面是多语的（15种语言，获取方法就是把英文的验证集翻译过来，同一个pair里面是同一种语言的）。

先用MLM在各个语言的单语语料上进行训练（也有加上额外的平行语料进行TLM训练的部分），然后再用英文训练集进行finetune，最后在多个语种上评估。结果如下：

无监督MT

无监督MT的任务，笔者也是特意去查阅了相关的资料，知道大概是怎么回事。用大白话说就是，给出两个语言各自的语料（不一定要平行），机器应该就能学会翻译，就像人类一样，在学会了中文和英语之后，应该能进行翻译，因为中间的连接是语义，而不是词表的对应。

无监督MT就是基于这么一个设定，一般在不考虑pretrain的时候，用的比较多的方法是用去噪自编码器+循环翻译，具体来说，对于英译德这个任务，搭建起encoder-decoder这个模型之后，可以用英文语料加上噪声，输入encoder，然后decoder出来原始的英文语料，同理也可以用德文语料加上噪声，输入encoder，然后decoder出来原始的德文语料，这个就叫去噪自编码器，目的其实是在于让encoder学到语义信息;循环翻译是个啥？比如en->de->en，就是先让英文经过encoder和decoder，得到翻译的德文伪数据，然后将这个德文伪数据，再输入encoer和decoder，得到原来的英文数据，这样进行训练。

那么在这里，其实就是用CLM或MLM去初始化encoder和decoder，decoder就初始化那些encoder有的部分，然后后面用上面的套路进行正常流程的训练即可，这里对比不同的初始化方法的结果：

有监督MT

这里对比了几种方法用不同的预训练方式，结果如下：

Sennich：这个是之前的SoTA，好像还是用了back-translation+ensemble的方法，也是一个强baseline
ro->en：这个是用单向的数据进行finetune
ro<->en：这个使用双向的数据进行finetune
ro<->en + BT：用双向的数据进行finetune，同时进行back-translation（这个好像又是那种先从A->B生成B的伪数据，然后再翻译回到A）

小语种LM

这里主要是验证多语训练对小语种语言模型建模的影响，结果如下：

无监督多语embedding

这里主要是验证无监督情况下生成的多语embedding的优秀程度，通过验证各种源单词和其翻译对应的词之间的距离，结果如下：

四. PyTorch实现

这里主要是分析XLM源码中关于模型和训练的部分，因笔者对于论文中的这些任务（如翻译等）不是特别熟悉，所以全凭README的内容和代码一步一步摸索，如果有理解错误的地方，还请指正~

下面我将按照源码中README给出的思路顺序进行剖析：

有/无监督机器翻译

在机器翻译这个场景下，论文首先用CLM/MLM对MT的encoder和decoder进行预训练。其实这里就是用的多种语言的单语语料，输入词表是多语的，然后用CLM/MLM训练语言模型，并将其参数作为后续MT的encoder和decoder的初始参数，对decoder的初始化是只初始化其中与encoder相同的部分，即不初始化encoder-decoder-attention的部分。感觉这样也是一种思路啊，一般都认为decoder是没法初始化的，这里却可以这样初始化？？

其预训练的代码如下：

model = build_model(params, data['dico'])

# CLM steps
for lang1, lang2 in shuf_order(params.clm_steps, params):
    trainer.clm_step(lang1, lang2, params.lambda_clm)

# MLM steps (also includes TLM if lang2 is not None)
for lang1, lang2 in shuf_order(params.mlm_steps, params):
    trainer.mlm_step(lang1, lang2, params.lambda_mlm)

这里首先就是定义模型，其实就是Transformer的encoder，这里就不再赘述。紧接着是有两种训练方式，一种是CLM，一种是MLM，分别与论文里面是对应的。

下面来看clm_step和mlm_step各自的实现：

def clm_step(self, lang1, lang2, lambda_coeff):
    """
    Next word prediction step (causal prediction).
    CLM objective.
    """
    # generate batch / select words to predict
    x, lengths, positions, langs, _ = self.generate_batch(lang1, lang2, 'causal')
    x, lengths, positions, langs, _ = self.round_batch(x, lengths, positions, langs)
    alen = torch.arange(lengths.max(), dtype=torch.long, device=lengths.device)
    pred_mask = alen[:, None] < lengths[None] - 1
    y = x[1:].masked_select(pred_mask[:-1])

    # forward / loss
    tensor = model('fwd', x=x, lengths=lengths, langs=langs, causal=True)
    _, loss = model('predict', tensor=tensor, pred_mask=pred_mask, y=y, get_scores=False)
    
def mlm_step(self, lang1, lang2, lambda_coeff):
    """
    Masked word prediction step.
    MLM objective is lang2 is None, TLM objective otherwise.
    """
    # generate batch / select words to predict
    x, lengths, positions, langs, _ = self.generate_batch(lang1, lang2, 'pred')
    x, lengths, positions, langs, _ = self.round_batch(x, lengths, positions, langs)
    x, y, pred_mask = self.mask_out(x, lengths)

    # forward / loss
    tensor = model('fwd', x=x, lengths=lengths, positions=positions, langs=langs, causal=False)
    _, loss = model('predict', tensor=tensor, pred_mask=pred_mask, y=y, get_scores=False)

仔细看这两者的实现，其实只在generate batch上不同，CLM只需要生成正常的序列即可，而MLM则需要进行mask_out的操作，这里与BERT一致，也不再赘述。

在预训练完Encoder和Decoder之后，就开始用task-specific的方法进行finetune，比如对于无监督机器翻译来说，就是用去噪自编码器+循环翻译的方式，比如对于en-fr这种翻译，去噪自编码器就是noise_en->en和noise_fr->fr，循环翻译就是en->fr->en和fr->en->fr；对于有监督机器翻译来说，目前较好的方式就是比如对于en->fr，就是同时学习en->fr和fr->en（是用同一个MT模型学习en->fr和fr->en？），而后用en->fr的数据为fr->en进行数据增广（back-translation，不知道理解是否有误？）以及fr->en的数据为en->fr进行数据增广，这样来进行finetune。

这里源码里面分别给出了这些方法的训练方式：

# denoising auto-encoder steps
for lang in shuf_order(params.ae_steps):
    trainer.mt_step(lang, lang, params.lambda_ae)

# machine translation steps
for lang1, lang2 in shuf_order(params.mt_steps, params):
    trainer.mt_step(lang1, lang2, params.lambda_mt)

# back-translation steps
for lang1, lang2, lang3 in shuf_order(params.bt_steps):
    trainer.bt_step(lang1, lang2, lang3, params.lambda_bt)

其中的mt_step是翻译训练，可以是A->B的翻译，也可以是noise_A->A的翻译；bt_step是back-translation训练，主要是A->B->A的这种训练。其实现方式如下：

def mt_step(self, lang1, lang2, lambda_coeff):
    """
    Machine translation step.
    Can also be used for denoising auto-encoding.
    """
    # generate batch
    if lang1 == lang2:
        (x1, len1) = self.get_batch('ae', lang1)
        (x2, len2) = (x1, len1)
        (x1, len1) = self.add_noise(x1, len1)
    else:
        (x1, len1), (x2, len2) = self.get_batch('mt', lang1, lang2)
    langs1 = x1.clone().fill_(lang1_id)
    langs2 = x2.clone().fill_(lang2_id)

    # target words to predict
    alen = torch.arange(len2.max(), dtype=torch.long, device=len2.device)
    pred_mask = alen[:, None] < len2[None] - 1  # do not predict anything given the last target word
    y = x2[1:].masked_select(pred_mask[:-1])

    # encode source sentence
    enc1 = self.encoder('fwd', x=x1, lengths=len1, langs=langs1, causal=False)
    enc1 = enc1.transpose(0, 1)

    # decode target sentence
    dec2 = self.decoder('fwd', x=x2, lengths=len2, langs=langs2, causal=True, src_enc=enc1, src_len=len1)

    # loss
    _, loss = self.decoder('predict', tensor=dec2, pred_mask=pred_mask, y=y, get_scores=False)

def bt_step(self, lang1, lang2, lang3, lambda_coeff):
    """
    Back-translation step for machine translation.
    """
    # generate source batch
    x1, len1 = self.get_batch('bt', lang1)
    langs1 = x1.clone().fill_(lang1_id)

    # generate a translation
    with torch.no_grad():

        # evaluation mode
        self.encoder.eval()
        self.decoder.eval()

        # encode source sentence and translate it
        enc1 = _encoder('fwd', x=x1, lengths=len1, langs=langs1, causal=False)
        enc1 = enc1.transpose(0, 1)
        x2, len2 = _decoder.generate(enc1, len1, lang2_id, max_len=int(1.3 * len1.max().item() + 5))
        langs2 = x2.clone().fill_(lang2_id)

        # free CUDA memory
        del enc1

        # training mode
        self.encoder.train()
        self.decoder.train()

    # encode generate sentence
    enc2 = self.encoder('fwd', x=x2, lengths=len2, langs=langs2, causal=False)
    enc2 = enc2.transpose(0, 1)

    # words to predict
    alen = torch.arange(len1.max(), dtype=torch.long, device=len1.device)
    pred_mask = alen[:, None] < len1[None] - 1  # do not predict anything given the last target word
    y1 = x1[1:].masked_select(pred_mask[:-1])

    # decode original sentence
    dec3 = self.decoder('fwd', x=x1, lengths=len1, langs=langs1, causal=True, src_enc=enc2, src_len=len2)

    # loss
    _, loss = self.decoder('predict', tensor=dec3, pred_mask=pred_mask, y=y1, get_scores=False)

代码还是比较清晰的，对于mt_step，就是直接调用encoder和decoder进行正常的MT训练；而对于bt_step，则首先在eval模式下离线生成A->B’，而后再进行B’->A的正常MT训练。

XNLI分类任务

这部分是多语言的分类任务，这里主要看不用翻译系统的方法，即先用MLM+TLM和多语言的单语语料及平行语料进行encoder的预训练，而后用纯英文的语料进行finetune。

预训练的部分和前面那个MT任务中的预训练一样，都是使用mlm_step这个函数，只不过在构建语料的时候，加上了使用平行语料进行mask的部分。

在finetune部分，是在顶层加入了一层Linear，用于三分类；而后将输入的两个句子进行拼接，进入分类层，代码如下：

self.proj = nn.Sequential(*[
            nn.Dropout(params.dropout),
            nn.Linear(self.embedder.out_dim, 3)
        ]).cuda()
        
(sent1, len1), (sent2, len2), idx = batch
sent1, len1 = truncate(sent1, len1, params.max_len, params.eos_index)
sent2, len2 = truncate(sent2, len2, params.max_len, params.eos_index)
x, lengths, positions, langs = concat_batches(
    sent1, len1, lang_id,
    sent2, len2, lang_id,
    params.pad_index,
    params.eos_index,
    reset_positions=False
)
y = self.data['en']['train']['y'][idx]

# loss
output = self.proj(self.embedder.get_embeddings(x, lengths, positions, langs))
loss = F.cross_entropy(output, y)

五. 总结

优势

提供了多语预训练的思路，并且确实效果很好
几个预训练任务的设计和训练，都非常巧妙
对小语种的训练很有帮助，并且可以提供无监督的多语embedding
提供了源码和所有预训练模型

不足

语言比较少，而且基本都是针对下游任务的，是否不太通用？
论文整体思路比较不够clean，而且对于特定任务的介绍不够充分，导致理解起来比较困难（至少对于笔者这样的小白来说很困难~），有些需要看代码甚至要查阅资料才能知道如何处理的

传送门

论文：https://arxiv.org/pdf/1901.07291.pdf
源码：https://github.com/facebookresearch/XLM
博客：https://www.lyrn.ai/2019/02/11/xlm-cross-lingual-language-model/

多模态Transformer之文本与图像联合建模 - Transformer教程 shandianfk_com ChatGPT Transformer transformer 深度学习人工智能
大家好，今天我们来聊聊一个既前沿又有趣的话题——多模态Transformer，特别是文本与图像的联合建模。对于很多小伙伴来说，Transformer这个词已经不陌生了，但它不仅仅应用于自然语言处理，还能在图像处理、甚至是多模态数据的处理上大显身手。接下来，我会带大家深入了解什么是多模态Transformer，以及它是如何实现文本与图像的联合建模的。Transformer简介首先，我们简单回顾一下T
什么是AIGC？有哪些免费工具？ chent_某位 AIGC
AIGC（AIGeneratedContent），即“人工智能生成内容”，是指通过人工智能技术自动生成各种类型的数字内容。AIGC让机器能够根据输入的信息或数据生成符合人类需求的文本、图像、音频、视频等内容，极大提高了内容创作的效率。AIGC的背景与起源随着深度学习和自然语言处理技术的快速发展，人工智能已经不再局限于简单的任务，如分类、预测和数据分析，而是具备了生成内容的能力。生成式AI模型，如O
公司级鞋和纯原鞋区别，两个鞋款的差异有8点优鞋之家
公司级鞋和纯原鞋区别，两个鞋款的差异有8点在时尚潮流的汪洋大海中，鞋履是引领潮流的风帆，而对于热爱鞋文化的你来说，了解公司级鞋和纯原鞋的区别，无疑是驶向风尚前沿的航标。如阿基米德所言：“给我一个支点，我可以撬动整个地球。”在鞋履的世界里，这些区别便是我们选择的支点。结合关键词公司级鞋和纯原鞋区别，我们一起揭开它们之间的神秘面纱。微信图片_20230825165608.jpg首当其冲的区别是材质的质
transformer架构(Transformer Architecture)原理与代码实战案例讲解 AI架构设计之禅大数据AI人工智能 Python入门实战计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
transformer架构(TransformerArchitecture)原理与代码实战案例讲解关键词：Transformer,自注意力机制,编码器-解码器,预训练,微调,NLP,机器翻译作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming1.背景介绍1.1问题的由来自然语言处理（NLP）领域的发展经历了从规则驱动到统计驱动再到深度学习驱动的三个阶段。
刘强东突然宣布!一场风暴即将到来!马云是怎么应对的? 深呼吸_5e64
为期3天的2018中国互联网大会12日在北京闭幕，与会专家学者就互联网前沿技术、产业发展态势话题进行了研讨。万物互联将给家庭生活带来哪些变化?有专家表示，人工智能总体上由数据驱动，没有数据，它无法进行配对训练、识别、预测，人们也享受不到它提供的精准、智慧的服务。但随着越来越多的数据被收集、被分析，信息泄露的风险随之增加。刘强东:真的不敢相信，这个时代变化之快让人无法想象!创新!创新!再创新!一个个
英伟达（NVIDIA）B200架构解读 weixin_41205263 芯际争霸 GPGPU架构 gpu算力人工智能硬件架构
H100芯片是一款高性能AI芯片，其中的TransformerEngine是专门用于加速Transformer模型计算的核心部件。Transformer模型是一种自然语言处理（NLP）模型，广泛应用于机器翻译、文本生成等任务。TransformerEngine的电路设计原理主要包括以下几个方面：
使用LangChain与Together AI模型交互：深入探讨和实践指南 llzwxh888 langchain 人工智能交互 python
使用LangChain与TogetherAI模型交互：深入探讨和实践指南1.引言在人工智能和自然语言处理领域，TogetherAI已经成为一个强大的平台，提供了对50多个领先开源模型的访问。本文将深入探讨如何使用LangChain与TogetherAI模型进行交互，为开发者提供实用的知识和见解，同时解决可能遇到的常见问题。2.TogetherAI简介TogetherAI是一个强大的API平台，允许
OpenLM: 一个灵活的开源大语言模型接口工具 llzwxh888 语言模型人工智能自然语言处理 python
OpenLM:一个灵活的开源大语言模型接口工具引言在人工智能和自然语言处理快速发展的今天，大语言模型(LLM)已经成为许多应用的核心。然而，不同的LLM提供商往往有着各自的API和使用方式，这给开发者带来了一定的挑战。本文将介绍OpenLM，这是一个零依赖、兼容OpenAIAPI的LLM提供者接口，它可以直接通过HTTP调用不同的推理端点。我们将深入探讨OpenLM的特性、使用方法，以及如何将其与
使用中专API实现AI模型调用与部署 llzwxh888 人工智能 easyui 前端 python
在AI技术领域，如何调用和部署大语言模型（LLM）是一个常见的需求。本文将详细介绍如何通过中专API地址http://api.wlai.vip，实现对OpenAI大模型的调用与部署，并提供一个详细的demo代码示例。引言随着人工智能技术的飞速发展，大语言模型在自然语言处理任务中的表现尤为突出。然而，由于国内访问海外API存在一定限制，本文将使用中专API地址来解决这一问题，并展示如何在本地环境中配
有舍社区-我有一个梦想有舍社区
刚才有个电商项目在某群热议，无数人帮助分析，在这个时候我把有舍社区的白皮书发出来，没有人看，真的很难受。电商项目以发币为目的，还谈梦想。有舍社区是有梦想的，如果把项目方，交易所，媒体，比作富人，普通投资者比做穷人，那么有舍社区是一个穷人的队伍。有舍社区能做什么呢？精选优质平台，为投资者提供便捷的服务。为用户提供有价值的项目，媒体，钱包等服务平台追踪行业趋势，引导区块链最前沿趋势解决用户在投资中遇到
GitHub的未来：在微软领导下保持独立与AI发展的平衡新加坡内哥谈技术人工智能语言模型计算机视觉
每周跟踪AI热点新闻动向和震撼发展想要探索生成式人工智能的前沿进展吗？订阅我们的简报，深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同，从行业内部的深度分析和实用指南中受益。不要错过这个机会，成为AI领域的领跑者。点击订阅，与未来同行！订阅：https://rengongzhineng.io/采访托马斯·多姆克，他是GitHub的首席执行官。GitHub作为一个全球领先的代码管理
虚拟现实智能家居实训系统实训解决方案武汉唯众智创智能家居实训系统智能家居实训室虚拟现实智能家居实训系统
随着科技的飞速发展，智能家居已成为现代生活的重要组成部分，它不仅极大地提升了居住的便捷性与舒适度，还推动了物联网、大数据、人工智能等前沿技术的融合应用。为了满足市场对智能家居专业人才日益增长的需求，虚拟现实智能家居实训系统实训解决方案旨在通过高度仿真的虚拟环境，为职业院校学生提供全面、高效、安全的智能家居系统学习与实践平台。一、解决方案概述该方案是一款深度融合教学理论、实践操作与效果评估的全方位解
人工智能行业深度报告：AI下半场，应用落地，赋能百业小报告达人人工智能
一、大模型行业发展现状及前沿技术观察1.1大模型行业发展现状2022年11月底，OpenAI发布了人机对话模型ChatGPT，在两个月不到的时间内其线上活跃用户规模超过1亿人，生成式大模型受到越来越广泛的关注，人工智能行业进入到以大模型为代表的快速发展阶段，巨量参数和智能涌现是这一轮人工智能变革的典型特征。微软、谷歌、Meta、亚马逊等全球科技巨头将大模型视为重要的发展机遇，在生成式大模型领域加速
深度学习入门篇：PyTorch实现手写数字识别 AI_Guru人工智能深度学习 pytorch 人工智能
深度学习作为机器学习的一个分支，近年来在图像识别、自然语言处理等领域取得了显著的成就。在众多的深度学习框架中，PyTorch以其动态计算图、易用性强和灵活度高等特点，受到了广泛的喜爱。本篇文章将带领大家使用PyTorch框架，实现一个手写数字识别的基础模型。手写数字识别简介手写数字识别是计算机视觉领域的一个经典问题，目的是让计算机能够识别并理解手写数字图像。这个问题通常作为深度学习入门的练习，因为
2022-11-10 论文小天才
2022年应用物理与信息技术国际会议（ICAPIT2022）大会简介ICAPIT2022将为您提供一个极好的机会，在探索应用物理和信息技术创新的同时，更新您现有的知识。会议将努力为您提供大量的交流机会，与专家学者、工程师和技术研究人员分享科研成果和前沿技术。我们热烈欢迎有兴趣的作者将您的新研究论文提交给ICAPIT，并与所有与会者分享您的宝贵经验。征稿主题仪器和技术的进展物理科学中的显微镜应用材料
基于人工智能的智能语音助手人工智能发烧友人工智能
语音助手的自然语言处理模块是语音助手系统的关键组成部分。通过这个模块，系统能够识别用户的意图并做出相应的回应。我们可以使用NLP技术来解析文本输入，并将其转换为系统可以理解的命令或指令。在本项目中，我们将结合语音识别、自然语言处理和语音合成技术，构建一个功能简化的语音助手。一、项目背景与需求分析1.1项目目标本项目旨在创建一个语音助手系统，它可以：1.语音识别：从用户的语音输入中提取文本信息。2.
深入掌握大模型精髓：《实战AI大模型》带你全面理解大模型开发！努力的光头强人工智能 langchain prompt transformer 深度学习
今天，人工智能技术的快速发展和广泛应用已经引起了大众的关注和兴趣，它不仅成为技术发展的核心驱动力，更是推动着社会生活的全方位变革。特别是作为AI重要分支的深度学习，通过不断刷新的表现力已引领并定义了一场科技革命。大型深度学习模型（简称AI大模型）以其强大的表征能力和卓越的性能，在自然语言处理、计算机视觉、推荐系统等领域均取得了突破性的进展。尤其随着AI大模型的广泛应用，无数领域因此受益。AI大模型
《量子思维》：寻找问题的第三种解法空气凤梨
《量子思维》：寻找问题的第三种解法文：空气凤梨人类刚刚迈入“量子时代”的门槛，量子科技呈现出无限前景。日本著名实业家及IT工程师、原谷歌副总裁兼日本公司总裁村上宪郎结合自身经历，基于对当今前沿科技的准确把握，系统介绍了一种全新的思维方法——量子思维，可能将对人类以哲学、心理学等为基础的思维领域产生重大影响。通过《量子思维》这本书，人们可以认识到量子力学和量子计算机相关知识的重要性，并充实自己的知识
安装jina，并使用jina的向量化和重排序的功能 MonkeyKing.sun milvus numpy
为了在Python的FastAPI项目中使用Jina进行向量化和重排序，您需要按照以下步骤安装和使用Jina。1.安装Jina首先，确保您已经安装了Jina。可以使用pip来安装。pipinstalljina如果需要特定的功能模块，例如自然语言处理相关的向量化模型，可以通过JinaHub获取。pipinstalljina[hub]2.在FastAPI项目中集成Jina接下来，我们将Jina集成到F
OpenAI正式推出了全新的o1-preview系列，专注于解决复杂问题新加坡内哥谈技术人工智能语言模型自然语言处理 chatgpt
每周跟踪AI热点新闻动向和震撼发展想要探索生成式人工智能的前沿进展吗？订阅我们的简报，深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同，从行业内部的深度分析和实用指南中受益。不要错过这个机会，成为AI领域的领跑者。点击订阅，与未来同行！订阅：https://rengongzhineng.io/OpenAI正式推出了全新的o1-preview系列，专注于解决复杂问题，并于9月12日
搭建Java集成开发环境IntelliJ IDEA Good_tea_h intellij idea
搭建Java集成开发环境（IntegratedDevelopmentEnvironment，简称IDE）IntelliJIDEA是一个涉及多个步骤的过程，旨在帮助Java开发者高效、舒适地进行编程工作。IntelliJIDEA由JetBrains公司开发，以其强大的代码自动补全、动态语法检测、重构功能以及对各种主流框架和前沿技术的深度支持而闻名。以下将详细介绍如何搭建Java集成开发环境Intel
机器学习引领未来：赋能精准高效的图像识别技术革新刷刷刷粉刷匠机器学习人工智能
图像识别技术近年来取得了显著进展，深刻地改变了各行各业。机器学习，特别是深度学习的突破，推动了这一领域的技术革新。本文将深入探讨机器学习如何赋能图像识别技术，从基础理论到前沿进展，再到实际应用与挑战展望，为您全面呈现这一领域的最新动态和未来趋势。1.引言在当今数字化和智能化的时代，图像识别技术正逐渐成为人工智能（AI）领域的核心组成部分。随着计算能力的提升和数据量的激增，机器学习特别是深度学习的快
Matlab,Python,Java,C++的比较 Codefengfeng python java c++
Matlabmatlab是一个大型计算机，擅长矩阵计算与科学计算，适合构建模型；然而，编译软件的运行效率低，不适合大型软件开发。Pythonpython的优势是简单，入门快。适合做数据挖掘、数据分析、机器学习、人工智能、自然语言处理、爬虫、批量文件处理等，此外，Python开源免费，有很多的库，开发环境开发社区都比较友好；不过，Python是动态型的语言，需要更多的测试，并且错误仅仅是在运行的时候
新技术前沿-2024-国内主流AI大模型架构及应用场景深度分析皮皮冰燃新技术前沿人工智能
参考国内主流AI大模型架构及应用场景深度分析20241厂商总览1.1国外(1)OpenAI：GPT-4【美国旧金山的人工智能研究公司】GPT-4于2023年3月14日发布，是千亿级参数的多模态预训练模型，能够支持图像和文本的输入。(2)Anthropic(人类的)：Claude【美国人工智能初创公司】Claude于2023年3月14日发布，是Anthropic开发的类似ChatGPT的聊天机器人，
【笔记】自然语言处理NLP---概论 xhanZ NLP相关
（from人文学院开设课程）目录1.自然语言处理概论1.1自然语言处理研究的意义、历史与现状1.1.1自然语言的特点1.1.2自然语言处理研究的意义1.1.3国外研究现状1.2NLP的方法、特点和规律1.2.1理性主义与经验主义1.2.2语料库语言学：经验主义研究方法1.2.3汉语语言处理的方法1.2.4基于知识图谱的深度学习1.自然语言处理概论1.1自然语言处理研究的意义、历史与现状1.1.1自
2022-04-17 图灵基因
NatBiotech|组织中单细胞转录组的空间图谱原创图灵基因图灵基因2022-04-1707:03收录于话题#前沿生物大数据分析单细胞RNA测序（scRNA-seq）已经彻底改变了单细胞水平上的基因表达研究。最近，空间技术通过添加空间信息将转录组学提升到了一个新的水平。但是，它缺乏单细胞分辨率。现在，来自德克萨斯大学MD安德森癌症中心的一个小组开发了一种名为CellTrek的计算方法，将这两个数
如何利用AI技术来提升用户的个性化体验和社区参与度？ Itfuture03 AI前沿技术人工智能
要利用AI技术提升用户的个性化体验和社区参与度，可以采取以下几种策略：个性化推荐系统：通过AI算法分析用户的行为和偏好，提供定制化的服务和内容推荐，如智能推荐活动、健康管理等，让居民感受到社区的温暖和关怀。智能助手与聊天机器人：引入AI驱动的虚拟助手，提供实时帮助、个性化建议和交互式对话，改善客户体验。自然语言处理（NLP）：实现具有AI能力的NLP，创建对用户友好的应用程序，简化用户体验，如客服
【拥抱AI】浅谈Prompt的书写规范及要点奔跑草- 人工智能人工智能 prompt RAG AI编程大模型 LLM AI Agent
Prompt是什么？Prompt是一种技术，它通过自然语言处理来引导用户与机器之间的交互。在人工智能领域，Prompt通常用于生成文本，例如对话系统、机器翻译和文本摘要等应用。它也用于训练模型，以使其能够理解和生成人类语言。Prompt的工作原理是通过建立相应的语料库和语义解析模型，将自然语言转换为机器可识别的指令。在大模型时代，Prompt的使用尤为重要，因为它可以帮助模型更好地理解用户的意图并
深度神经网络详解：原理、架构与应用阿达C 活动 dnn 计算机网络人工智能神经网络机器学习深度学习
深度神经网络（DeepNeuralNetwork，DNN）是机器学习领域中最为重要和广泛应用的技术之一。它模仿人脑神经元的结构，通过多层神经元的连接和训练，能够处理复杂的非线性问题。在图像识别、自然语言处理、语音识别等领域，深度神经网络展示了强大的性能。本文将深入解析深度神经网络的基本原理、常见架构及其实际应用。一、深度神经网络的基本原理1.1神经元和感知器神经元是深度神经网络的基本组成单元。一个
halcon第九讲，深度学习结合大数据实现AI智能识别思想青莲居士_村长
人工智能、大数据、5G1、什么是人工智能、大数据、5G,三者有什么关联。人工智能（ArtificialIntelligence）：英文缩写：AI，人工智能是[计算机]科学的一个分支，它企图了解智能的实质，并生产出一种新的能以[人类智能]相似的方式做出反应的智能机器，该领域的研究包括机器人、语言识别、图像识别、自然语言处理和[专家系统]等。人工智能从诞生以来，理论和技术日益成熟，应用领域也不断扩大，
Java 并发包之线程池和原子计数 lijingyao8206 Java计数 ThreadPool 并发包 java线程池
对于大数据量关联的业务处理逻辑，比较直接的想法就是用JDK提供的并发包去解决多线程情况下的业务数据处理。线程池可以提供很好的管理线程的方式，并且可以提高线程利用率，并发包中的原子计数在多线程的情况下可以让我们避免去写一些同步代码。这里就先把jdk并发包中的线程池处理器ThreadPoolExecutor 以原子计数类AomicInteger 和倒数计时锁C
java编程思想抽象类和接口百合不是茶 java 抽象类接口
接口c++对接口和内部类只有简介的支持,但在java中有队这些类的直接支持 1 ,抽象类 : 如果一个类包含一个或多个抽象方法,该类必须限定为抽象类(否者编译器报错) 抽象方法 : 在方法中仅有声明而没有方法体 package com.wj.Interface;
[房地产与大数据]房地产数据挖掘系统 comsci 数据挖掘
随着一个关键核心技术的突破,我们已经是独立自主的开发某些先进模块,但是要完全实现,还需要一定的时间... 所以,除了代码工作以外,我们还需要关心一下非技术领域的事件..比如说房地产 &nb
数组队列总结沐刃青蛟数组队列
数组队列是一种大小可以改变，类型没有定死的类似数组的工具。不过与数组相比，它更具有灵活性。因为它不但不用担心越界问题，而且因为泛型（类似c++中模板的东西）的存在而支持各种类型。以下是数组队列的功能实现代码： import List.Student; public class
Oracle存储过程无法编译的解决方法 IT独行者 oracle 存储过程　
今天同事修改Oracle存储过程又导致2个过程无法被编译，流程规范上的东西，Dave 这里不多说，看看怎么解决问题。 1. 查看无效对象 XEZF@xezf(qs-xezf-db1)> select object_name,object_type,status from all_objects where status='IN
重装系统之后oracle恢复文强chu oracle
前几天正在使用电脑，没有暂停oracle的各种服务。突然win8.1系统奔溃，无法修复，开机时系统提示正在搜集错误信息，然后再开机，再提示的无限循环中。无耐我拿出系统u盘准备重装系统，没想到竟然无法从u盘引导成功。晚上到外面早了一家修电脑店，让人家给装了个系统，并且那哥们在我没反应过来的时候，直接把我的c盘给格式化了并且清理了注册表，再装系统。然后的结果就是我的oracl
python学习二（一些基础语法）小桔子 pthon 基础语法
紧接着把！昨天没看继续看django 官方教程，学了下python的基本语法与c类语言还是有些小差别： 1.ptyhon的源文件以UTF-8编码格式 2. / 除结果浮点型 // 除结果整形 % 除取余数 * 乘 ** 乘方 eg 5**2 结果是5的2次方25 _&
svn 常用命令 aichenglong SVN 版本回退
1 svn回退版本 1)在window中选择log,根据想要回退的内容,选择revert this version或revert chanages from this version 两者的区别: revert this version:表示回退到当前版本(该版本后的版本全部作废) revert chanages from this versio
某小公司面试归来 alafqq 面试
先填单子，还要写笔试题，我以时间为急，拒绝了它。。时间宝贵。老拿这些对付毕业生的东东来吓唬我。。面试官很刁难，问了几个问题，记录下； 1，包的范围。。。public,private,protect. --悲剧了 2，hashcode方法和equals方法的区别。谁覆盖谁.结果，他说我说反了。 3，最恶心的一道题，抽象类继承抽象类吗？（察，一般它都是被继承的啊） 4，stru
动态数组的存储速度比较集合框架百合不是茶集合框架
集合框架：自定义数据结构(增删改查等) package 数组; /** * 创建动态数组 * @author 百合 * */ public class ArrayDemo{ //定义一个数组来存放数据 String[] src = new String[0]; /** * 增加元素加入容器 * @param s要加入容器
用JS实现一个JS对象，对象里有两个属性一个方法 bijian1013 js对象
<html> <head> </head> <body> 用js代码实现一个js对象，对象里有两个属性，一个方法 </body> <script> var obj={a:'1234567',b:'bbbbbbbbbb',c:function(x){
探索JUnit4扩展：使用Rule bijian1013 java 单元测试 JUnit Rule
在上一篇文章中，讨论了使用Runner扩展JUnit4的方式，即直接修改Test Runner的实现(BlockJUnit4ClassRunner)。但这种方法显然不便于灵活地添加或删除扩展功能。下面将使用JUnit4.7才开始引入的扩展方式——Rule来实现相同的扩展功能。 1. Rule &n
[Gson一]非泛型POJO对象的反序列化 bit1129 POJO
当要将JSON数据串反序列化自身为非泛型的POJO时，使用Gson.fromJson(String, Class)方法。自身为非泛型的POJO的包括两种： 1. POJO对象不包含任何泛型的字段 2. POJO对象包含泛型字段，例如泛型集合或者泛型类 Data类 a.不是泛型类， b.Data中的集合List和Map都是泛型的 c.Data中不包含其它的POJO
【Kakfa五】Kafka Producer和Consumer基本使用 bit1129 kafka
0.Kafka服务器的配置一个Broker，一个Topic Topic中只有一个Partition（） 1. Producer： package kafka.examples.producers; import kafka.producer.KeyedMessage; import kafka.javaapi.producer.Producer; impor
lsyncd实时同步搭建指南——取代rsync+inotify ronin47
1. 几大实时同步工具比较 1.1 inotify + rsync 最近一直在寻求生产服务服务器上的同步替代方案，原先使用的是 inotify + rsync，但随着文件数量的增大到100W+，目录下的文件列表就达20M，在网络状况不佳或者限速的情况下，变更的文件可能10来个才几M，却因此要发送的文件列表就达20M，严重减低的带宽的使用效率以及同步效率；更为要紧的是，加入inotify
java-9. 判断整数序列是不是二元查找树的后序遍历结果 bylijinnan java
public class IsBinTreePostTraverse{ static boolean isBSTPostOrder(int[] a){ if(a==null){ return false; } /*1.只有一个结点时，肯定是查找树 *2.只有两个结点时，肯定是查找树。例如{5,6}对应的BST是 6 {6,5}对应的BST是
MySQL的sum函数返回的类型 bylijinnan java spring sql mysql jdbc
今天项目切换数据库时，出错访问数据库的代码大概是这样： String sql = "select sum(number) as sumNumberOfOneDay from tableName"; List<Map> rows = getJdbcTemplate().queryForList(sql); for (Map row : rows
java设计模式之单例模式 chicony java设计模式
在阎宏博士的《JAVA与模式》一书中开头是这样描述单例模式的：　　作为对象的创建模式，单例模式确保某一个类只有一个实例，而且自行实例化并向整个系统提供这个实例。这个类称为单例类。单例模式的结构　　单例模式的特点：单例类只能有一个实例。单例类必须自己创建自己的唯一实例。单例类必须给所有其他对象提供这一实例。　　饿汉式单例类 publ
javascript取当月最后一天 ctrain JavaScript
 <script language=javascript> var current = new Date(); var year = current.getYear(); var month = current.getMonth(); showMonthLastDay(year, mont
linux tune2fs命令详解 daizj linux tune2fs 查看系统文件块信息
一.简介： tune2fs是调整和查看ext2/ext3文件系统的文件系统参数，Windows下面如果出现意外断电死机情况，下次开机一般都会出现系统自检。Linux系统下面也有文件系统自检，而且是可以通过tune2fs命令，自行定义自检周期及方式。二.用法： Usage: tune2fs [-c max_mounts_count] [-e errors_behavior] [-g grou
做有中国特色的程序员 dcj3sjt126com 程序员
从出版业说起网络作品排到靠前的，都不会太难看，一般人不爱看某部作品也是因为不喜欢这个类型，而此人也不会全不喜欢这些网络作品。究其原因，是因为网络作品都是让人先白看的，看的好了才出了头。而纸质作品就不一定了，排行榜靠前的，有好作品，也有垃圾。许多大牛都是写了博客，后来出了书。这些书也都不次，可能有人让为不好，是因为技术书不像小说，小说在读故事，技术书是在学知识或温习知识，有
Android：TextView属性大全 dcj3sjt126com textview
android:autoLink 设置是否当文本为URL链接/email/电话号码/map时，文本显示为可点击的链接。可选值(none/web/email/phone/map/all) android:autoText 如果设置，将自动执行输入值的拼写纠正。此处无效果，在显示输入法并输
tomcat虚拟目录安装及其配置 eksliang tomcat配置说明 tomca部署web应用 tomcat虚拟目录安装
转载请出自出处：http://eksliang.iteye.com/blog/2097184 1.-------------------------------------------tomcat 目录结构 config：存放tomcat的配置文件 temp ：存放tomcat跑起来后存放临时文件用的 work ：当第一次访问应用中的jsp
浅谈：APP有哪些常被黑客利用的安全漏洞 gg163 APP
首先，说到APP的安全漏洞，身为程序猿的大家应该不陌生；如果抛开安卓自身开源的问题的话，其主要产生的原因就是开发过程中疏忽或者代码不严谨引起的。但这些责任也不能怪在程序猿头上，有时会因为BOSS时间催得紧等很多可观原因。由国内移动应用安全检测团队爱内测（ineice.com）的CTO给我们浅谈关于Android 系统的开源设计以及生态环境。 1. 应用反编译漏洞：APK 包非常容易被反编译成可读
C#根据网址生成静态页面 hvt Web .net C#asp.net hovertree
HoverTree开源项目中HoverTreeWeb.HVTPanel的Index.aspx文件是后台管理的首页。包含生成留言板首页，以及显示用户名，退出等功能。根据网址生成页面的方法： bool CreateHtmlFile(string url, string path) { //http://keleyi.com/a/bjae/3d10wfax.htm stri
SVG 教程（一）天梯梦 svg
SVG 简介 SVG 是使用 XML 来描述二维图形和绘图程序的语言。学习之前应具备的基础知识：继续学习之前，你应该对以下内容有基本的了解： HTML XML 基础如果希望首先学习这些内容，请在本站的首页选择相应的教程。什么是SVG？ SVG 指可伸缩矢量图形 (Scalable Vector Graphics) SVG 用来定义用于网络的基于矢量
一个简单的java栈 luyulong java 数据结构栈
public class MyStack { private long[] arr; private int top; public MyStack() { arr = new long[10]; top = -1; } public MyStack(int maxsize) { arr = new long[maxsize]; top
基础数据结构和算法八：Binary search sunwinner Algorithm Binary search
Binary search needs an ordered array so that it can use array indexing to dramatically reduce the number of compares required for each search, using the classic and venerable binary search algori
12个C语言面试题，涉及指针、进程、运算、结构体、函数、内存，看看你能做出几个！刘星宇 c 面试
12个C语言面试题，涉及指针、进程、运算、结构体、函数、内存，看看你能做出几个！ 1.gets()函数问：请找出下面代码里的问题： #include<stdio.h> int main(void) { char buff[10]; memset(buff,0,sizeof(buff));
ITeye 7月技术图书有奖试读获奖名单公布 ITeye管理员活动 ITeye 试读
ITeye携手人民邮电出版社图灵教育共同举办的7月技术图书有奖试读活动已圆满结束，非常感谢广大用户对本次活动的关注与参与。 7月试读活动回顾： http://webmaster.iteye.com/blog/2092746 本次技术图书试读活动的优秀奖获奖名单及相应作品如下（优秀文章有很多，但名额有限，没获奖并不代表不优秀）：《Java性能优化权威指南》