AI科技大本营

三两下实现NLP训练和预测，这四个框架你要知道

原文链接： https://aiprocon.csdn.net/m/topic/ai_procon/index

作者 | 狄东林刘元兴朱庆福胡景雯

编辑 | 刘元兴，崔一鸣

来源 | 哈工大SCIR（ID:HIT_SCIR)

引言

随着人工智能的发展，越来越多深度学习框架如雨后春笋般涌现，例如PyTorch、TensorFlow、Keras、MXNet、Theano 和 PaddlePaddle 等。这些基础框架提供了构建一个模型需要的基本通用工具包。但是对于 NLP 相关的任务，我们往往需要自己编写大量比较繁琐的代码，包括数据预处理和训练过程中的工具等。因此，大家通常基于 NLP 相关的深度学习框架编写自己的模型，如 OpenNMT、ParlAI 和 AllenNLP 等。借助这些框架，三两下就可以实现一个 NLP 相关基础任务的训练和预测。但是当我们需要对基础任务进行改动时，又被代码封装束缚，举步维艰。因此，本文主要针对于如何使用框架实现自定义模型，帮助大家快速了解框架的使用方法。

我们首先介绍广泛用于NLP/CV领域的TensorFlow框架——Tensor2Tensor，该框架提供了 NLP/CV 领域中常用的基本模型。然后介绍NLP 领域的 AllenNLP 框架，该框架基于 PyTorch 平台开发，为 NLP 模型提供了统一的开发架构。接着在介绍 NLP 领域中重要的两个子领域，神经机器翻译和对话系统常用的框架，OpenNMT 和 ParlAI 。通过这四个框架的介绍，希望能帮助大家了解不同开发平台，不同领域下的 NLP 框架的使用方式。

一、Tensor2Tensor

Tensor2Tensor[1] 是一个基于 TensorFlow 的较为综合性的库，既包括一些CV 和 NLP 的基本模型，如 LSTM，CNN等，也提供一些稍微高级一点的模型，如各式各样的 GAN 和 Transformer 。对 NLP 的各项任务支持得都比较全面，很方便容易上手。

由于该资源库仍处于不断开发过程中，截止目前为止，已经有 3897 次 commit，66 个 release 版本，178 contributors 。在 2018 年《Attention is all you need》这个全网热文中，该仓库是官方提供的 Transformer 模型版本，后面陆陆续续其余平台架构才逐渐补充完成。

Tensor2Tensor（Transformer）使用方法

注意：有可能随着版本迭代更新的过程中会有局部改动

安装环境

1. 安装 CUDA 9.0 （一定是9.0，不能是9.2）

2. 安装 TensorFlow （现在是1.12）

3. 安装 Tensor2Tensor (参考官网安装)

开始使用

1. 数据预处理

这一步骤是根据自己任务自己编写一些预处理的代码，比如字符串格式化，生成特征向量等操作。

2. 编写自定义 problem：

编写自定义的 problem 代码，一定需要在自定义类名前加装饰器（@registry.registry_problem）。
自定义 problem 的类名一定是驼峰式命名，py 文件名一定是下划线式命名，且与类名对应。
一定需要继承父类 problem，t2t 已经提供用于生成数据的 problem，需要自行将自己的问题人脑分类找到对应的父类，主要定义的父类 problem有：（运行 t2t-datagen 可以查看到 problem list ）。
一定需要在__init__.py文件里导入自定义problem文件。

3. 使用 t2t-datagen 将自己预处理后的数据转为 t2t 的格式化数据集【注意路径】

运行 t2t-datagen --help 或 t2t-datagen --helpfull。例如：

cd scripts && t2t-datagen --t2t_usr_dir=./ --data_dir=../train_data --tmp_dir=../tmp_data --problem=my_problem

如果自定义 problem 代码的输出格式不正确，则此命令会报错

4. 使用 t2t-trainer 使用格式化的数据集进行训练

运行 t2t-trainer --help 或 t2t-trainer --helpfull 。例如：

1cd scripts && t2t-datagen --t2t_usr_dir=./ --data_dir=../train_data --tmp_dir=../tmp_data --problem=my_problem

5. 使用 t2t-decoder 对测试集进行预测【注意路径】

如果想使用某一个 checkpoint 时的结果时，需要将 checkpoint 文件中的第一行: model_checkpoint_path: “model.ckpt-xxxx” 的最后的序号修改即可。例如：

cd scripts && t2t-decoder --t2t_usr_dir=./ --problem=my_problem --data_dir=../train_data --model=transformer --hparams_set=transformer_base --output_dir=../output --decode_hparams=”beam_size=5,alpha=0.6” --decode_from_file=../decode_in/test_in.txt --decode_to_file=../decode_out/test_out.txt

6. 使用 t2t-exporter 导出训练模型

7. 分析结果

附: (整体代码)

# coding=utf-8	
from tensor2tensor.utils import registry	
 from tensor2tensor.data_generators import problem, text_problems	
 	
 @registry.register_problem	
 class AttentionGruFeature(text_problems.Text2ClassProblem):	
 	
    ROOT_DATA_PATH = '../data_manager/'	
    PROBLEM_NAME = 'attention_gru_feature'	

	
   @property	
       def is_generate_per_split(self):	
      return True	

	
   @property	
   def dataset_splits(self):	
        return [{	
           "split": problem.DatasetSplit.TRAIN,	
            "shards": 5,	
        }, {	
           "split": problem.DatasetSplit.EVAL,	
            "shards": 1,	
        }]	

	
    @property	
    def approx_vocab_size(self):	
        return 2 ** 10  # 8k vocab suffices for this small dataset.	

	
    @property	
   def num_classes(self):	
           return 2	

	
    @property	
    def vocab_filename(self):	
       return self.PROBLEM_NAME + ".vocab.%d" % self.approx_vocab_size	

	
    def generate_samples(self, data_dir, tmp_dir, dataset_split):	
        del data_dir	
        del tmp_dir	
        del dataset_split	

	
        # with open('{}self_antecedent_generate_sentences.pkl'.format(self.ROOT_DATA_PATH), 'rb') as f:	
        #     # get all the sentences for antecedent identification	
        #     _sentences = pickle.load(f)	
        #	
        # for _sent in _sentences:	
        #     # # sum pooling, FloatTensor, Size: 400	
        #     # _sent.input_vec_sum	
        #     # # sum pooling with feature, FloatTensor, Size: 468	
        #     # _sent.input_vec_sum_feature	
        #     # # GRU, FloatTensor, Size: 6100	
        #     # _sent.input_vec_hidden	
        #     # # GRU with feature, FloatTensor, Size: 6168	
        #     # _sent.input_vec_hidden_feature	
        #     # # AttentionGRU, FloatTensor, Size: 1600	
        #     # _sent.input_vec_attention	
        #     # # AttentionGRU with feature, FloatTensor, Size: 1668	
        #     # _sent.input_vec_attention_feature	
        #     # # tag(1 for positive case, and 0 for negative case), Int, Size: 1	
        #     # _sent.antecedent_label	
        #     # # tag(1 for positive case, and 0 for negative case), Int, Size: 1	
        #     # _sent.trigger_label	
        #     # # trigger word for the error analysis, Str	
        #     # _sent.trigger	
        #     # # trigger word auxiliary type for the experiment, Str	
        #     # _sent.aux_type	
        #     # # the original sentence for the error analysis, Str	
        #     # _sent.sen	
        #	
        #     yield {	
        #         "inputs": _sent.input_vec_attention_feature,	
        #         "label": _sent.antecedent_label	
        #     }	

	
        with open('../prep_ante_data/antecedent_label.txt') as antecedent_label, open(	
                '../prep_ante_data/input_vec_attention_gru_feature.txt') as input_vec:	
            for labal in antecedent_label:	
                yield {	
                    "inputs": input_vec.readline().strip()[1:-2],	
                    "label": int(labal.strip())	
                }	

	
        antecedent_label.close()	
        input_vec.close()	

	

	
# PROBLEM_NAME='attention_gru_feature'	
# DATA_DIR='../train_data_atte_feature'	
# OUTPUT_DIR='../output_atte_feature'	
# t2t-datagen --t2t_usr_dir=. --data_dir=$DATA_DIR --tmp_dir=../tmp_data --problem=$PROBLEM_NAME	
# t2t-trainer --t2t_usr_dir=. --data_dir=$DATA_DIR --problem=$PROBLEM_NAME --model=transformer --hparams_set=transformer_base --output_dir=$OUTPUT_DIR

Tensor2Tensor使用总结

T2T 是Google 非官方提供的仓库，是社区广大爱好者共同努力建设的简单入门型框架，底层封装TF，能满足大部分CV 和 NLP的任务，很多主流成熟的模型也已经都有实现。直接继承或实现一些框架内预设的接口，就可以完成很多任务。入门起来非常友好，并且文档更新也较为及时。认真阅读文档（或阅读报错信息）就可以了解并使用该框架，方便许多非大幅创新模型的复现。

二、AllenNLP

AllenNLP 是一个基于 PyTorch 的 NLP 研究库，可为开发者提供语言任务中的各种业内最佳训练模型。官网提供了一个很好的入门教程[2]，能够让初学者在 30 分钟内就了解 AllenNLP 的使用方法。

AllenNLP 使用方法

由于 AllenNLP 已经帮我们实现很多麻烦琐碎的预处理和训练框架，我们实际需要编写的只有：

1. DatasetReader

DatasetReader 的示例代码如下所示。

from typing import Dict, Iterator	
 	
 from allennlp.data import Instance	
 from allennlp.data.fields import TextField	
 from allennlp.data.dataset_readers import DatasetReader	
 from allennlp.data.token_indexers import TokenIndexer, SingleIdTokenIndexer	
 from allennlp.data.tokenizers import WordTokenizer, Tokenizer	
 	
 @DatasetReader.register('custom')	
 class CustomReader(DatasetReader):	

	
  def __init__(self, tokenizer: Tokenizer = None, token_indexers: Dict[str, TokenIndexer] = None) -> None:	
   super().__init__(lazy=False)	
     self.tokenizer = tokenizer or WordTokenizer()	
      self.word_indexers = token_indexers or {"word": SingleIdTokenIndexer('word')}	

	
  def text_to_instance(self, _input: str) -> Instance:	
    fields = {}	
  tokenized_input = self.tokenizer.tokenize(_input)	
  fields['input'] = TextField(tokenized_input, self.word_indexers)	
  return Instance(fields)	

	
 def _read(self, file_path: str) -> Iterator[Instance]:	
  with open(file_path) as f:	
       for line in f:	
         yield self.text_to_instance(line)

首先需要自定义_read函数，写好读取数据集的方式，通过yield方式返回构建一个instance需要的文本。然后通过text_to_instance函数将文本转化为instance。在text_to_instance函数中，需要对输入的文本进行切分，然后构建fileld。

self.tokenizer是用来切分文本成 Token 的。有 Word 级别的也有 Char级别的。self.word_indexers是用来索引 Token 并转换为 Tensor。同样 TokenIndexer 也有很多种，在实现自己的模型之前可以看看官方文档有没有比较符合自己需要的类型。如果你需要构建多个 Vocabulary ，比如源语言的vocab 和目标语言的vocab，就需要在这里多定义一个self.word_indexers。不同indexers在vocab中，是通过SingleIdTokenIndexer 函数初始化的 namespace 来区分的，也就是 15 行代码中最后一个的'word'。

2. Model

与 PyTorch 实现 model 的方式一样，但需要注意的是：

@Model.register('') 注册之后可以使用 JsonNet 进行模型选择（如果你有多个模型，可以直接修改 Json 值来切换，不需要手动修改代码）。

由于 AllenNLP 封装了 Trainer ，所以我们需要在 model 内实现或者选择已有的评价指标，这样在训练过程中就会自动计算评价指标。具体方法是，在__init__方法中定义评价函数，可以从在官方文档[3]上看看有没有，如果没有的话就需要自己写。

self.acc = CategoricalAccuracy()

然后在forward方法中调用评价函数计算指标

self.acc(output, labels)

最后在 model 的get_metrics返回对应指标的 dict 结果就行了。

def get_metrics(self, reset: bool = False) -> Dict[str, float]:	
  return {"acc": self.acc.get_metric(reset)}

3. Trainer

一般来说直接调用 AllenNLP 的 Trainer 方法就可以自动开始训练了。但是如果你有一些特殊的训练步骤，比如 GAN[4]，你就不能单纯地使用 AllenNLP 的 Trainer，得把 Trainer 打开进行每步的迭代，可以参考[4]中 trainer 的写法。

AllenNLP使用总结

关于 AllenNLP 的学习代码，可以参考[5]。由于 AllenNLP 是基于 PyTorch 的，代码风格和 PyTorch 的风格基本一致，因此如果你会用 PyTorch，那上手 AllenNLP 基本没有什么障碍。代码注释方面也比较全，模块封装方面比较灵活。AllenNLP 的代码非常容易改动，就像用纯的 PyTorch 一样灵活。当然灵活也就意味着很多复杂的实现，AllenNLP 目前还没有，大部分可能都需要自己写。AllenNLP 依赖了很多 Python 库，近期也在更新。

三、OpenNMT

OpenNMT[6] 是一个开源的神经机器翻译（neural machine translation）项目，采用目前普遍使用的编码器-解码器（encoder-decoder）结构，因此，也可以用来完成文本摘要、回复生成等其他文本生成任务。目前，该项目已经开发出 PyTorch、TensorFlow 两个版本，用户可以按需选取。本文以 PyTorch 版本[7]为例进行介绍。

OpenNMT使用方法

1. 数据处理

作为一个典型的机器翻译框架，OpenNMT 的数据主要包含 source 和 target 两部分，对应于机器翻译中的源语言输入和目标语言翻译。OpenNMT 采用 TorchText 中的 Field 数据结构来表示每个部分。用户自定义过程中，如需添加 source 和 target 外的其他数据，可以参照 source field 或 target field 的构建方法，如构建一个自定义的 user_data 数据：

fields["user_data"] = torchtext.data.Field(	
    init_token=BOS_WORD, eos_token=EOS_WORD,	
    pad_token=PAD_WORD,	
    include_lengths=True)

其中 init_token、eos_token 和 pad_token 分别为用户自定义的开始字符、结束字符和 padding 字符。Include_lengths 为真时，会同时返回处理后数据和数据的长度。

2. 模型

OpenNMT 实现了注意力机制的编码器-解码器模型。框架定义了编码器和解码器的接口，在该接口下，进一步实现了多种不同结构的编码器解码器，可供用户按需组合，如 CNN、 RNN 编码器等。如用户需自定义特定结构的模块，也可以遵循该接口进行设计，以保证得到的模块可以和 OpenNMT 的其他模块进行组合。其中，编码器解码器接口如下：

class EncoderBase(nn.Module):	
    def forward(self, input, lengths=None, hidden=None):	
        raise NotImplementedError	

	
class RNNDecoderBase(nn.Module):	
    def forward(self, input, context, state, context_lengths=None):	
             raise NotImplementedError

3. 训练

OpenNMT 的训练由 Trainer.py 中 Trainer 类控制，该类的可定制化程度并不高，只实现了最基本的序列到序列的训练过程。对于多任务、对抗训练等复杂的训练过程，需要对该类进行较大的改动。

OpenNMT使用总结

OpenNMT 提供了基于 PyTorch 和 TensorFlow 这两大主流框架的不同实现，能够满足绝大多数用户的需求。对于基础框架的封装使得其丧失了一定的灵活性，但是对于编码器-解码器结构下文本生成的任务来说，可以省去数据格式、接口定义等细节处理，将精力更多集中在其自定义模块上，快速搭建出需要的模型。

四、ParlAI

ParlAI 是 Facebook 公司开发出的一个专注于对话领域在很多对话任务上分享，训练和评估对话模型的平台[8]。这个平台可以用于训练和测试对话模型，在很多数据集上进行多任务训练，并且集成了 Amazon Mechanical Turk，以便数据收集和人工评估。

ParlAI 中的基本概念：

world 定义了代理彼此交互的环境。世界必须实施一种 parley 方法。每次对 parley 的调用都会进行一次交互，通常每个代理包含一个动作。
agent 可以是一个人，一个简单的机器人，可以重复它听到的任何内容，完美调整的神经网络，读出的数据集，或者可能发送消息或与其环境交互的任何其他内容。代理有两个他们需要定义的主要方法：

def observe(self, observation): ＃用观察更新内部状态	
def act(self): ＃根据内部状态生成动作

observations 是我们称之为代理的 act 函数返回的对象，并且因为它们被输入到其他代理的 observe 函数而被命名。这是 ParlAI 中代理与环境之间传递消息的主要方式。观察通常采用包含不同类型信息的 python 词典的形式。
teacher 是特殊类型的代理人。他们像所有代理一样实施 act 和 observe 功能，但他们也会跟踪他们通过报告功能返回的指标，例如他们提出的问题数量或者正确回答这些问题的次数。

ParlAI 的代码包含如下几个主要的文件夹[9]：

core 包含框架的主要代码；
agents 包含可以和不同任务交互的代理；
examples 包含不同循环的一些基本示例；
tasks 包含不同任务的代码；
mturk 包含设置 Mechanical Turk 的代码及 MTurk 任务样例。

ParlAI 使用方法

ParlAI 内部封装了很多对话任务（如 ConvAI2 ）和评测（如 F1 值和 hits@1 等等）。使用 ParlAI 现有的数据，代码以及模型进行训练和评测，可以快速实现对话模型中的很多 baseline 模型。但由于代码封装性太强，不建议使用它从头搭建自己的模型。想在基础上搭建自己的模型可以详细参考官网中的教程[10]。

这里简单介绍直接利用内部的数据，代码以及模型进行训练和评测的一个简单例子（Train a Transformer on Twitter）：

1. 打印一些数据集中的例子

python examples/display_data.py -t twitter	
*# display first examples from twitter dataset*

2. 训练模型

python examples/train_model.py -t twitter -mf /tmp/tr_twitter -m transformer/ranker -bs 10 -vtim 3600 -cands batch -ecands batch --data-parallel True	
# train transformer ranker

3. 评测之前训练出的模型

python examples/eval_model.py -t twitter -m legacy:seq2seq:0 -mf models:twitter/seq2seq/twitter_seq2seq_model	
# Evaluate seq2seq model trained on twitter from our model zoo

4. 输出模型的一些预测

python examples/display_model.py -t twitter -mf /tmp/tr_twitter -ecands batch	
# display predictions for model saved at specific file on twitter

ParlAI 使用总结

ParlAI 有自己的一套模式，例如 world、agent 和 teacher 等等。代码封装性特别好，代码量巨大，如果想查找一个中间结果，需要一层一层查看调用的函数，不容易进行修改。ParlAI 中间封装了很多现有的 baseline 模型，对于对话研究者，可以快速实现 baseline 模型。目前 ParlAI 还在更新，不同版本之间的代码可能结构略有不同，但是 ParlAI 的核心使用方法大致相同。

五、总结

本文介绍了四种常见框架构建自定义模型的方法。Tensor2Tensor 涵盖比较全面，但是只支持 TensorFlow。AllenNLP 最大的优点在于简化了数据预处理、训练和预测的过程。代码改起来也很灵活，但是一些工具目前官方还没有实现，需要自己写。如果是比较传统的编码器-解码器结构下文本生成任务，使用 OpenNMT 能节省很多时间。但是如果是结构比较新颖的模型，使用 OpenNMT 搭建模型依旧是一个不小的挑战。ParlAI 内部封装了很多对话任务，方便使用者快速复现相关的 baseline 模型。但由于代码封装性太强和其特殊的模式，使用 ParlAI 从头搭建自己的模型具有一定的挑战性。每个框架都有各自的优点和弊端，大家需结合自身情况和使用方式进行选择。但是不建议每个框架都试一遍，毕竟掌握每个框架还是需要一定时间成本的。

参考资料

[1] https://github.com/tensorflow/tensor2tensor

[2] https://allennlp.org/tutorials

[3]https://allenai.github.io/allennlp-docs/api/allennlp.training.metrics.html

[4] http://www.realworldnlpbook.com/blog/training-a-shakespeare-reciting-monkey-using-rl-and-seqgan.html

[5] https://github.com/mhagiwara/realworldnlp

[6] http://opennmt.net/

[7] https://github.com/OpenNMT/OpenNMT-py

[8]http://parl.ai.s3-website.us-east-2.amazonaws.com/docs/tutorial_quick.html

[9] https://www.infoq.cn/article/2017/05/ParlAI-Facebook-AI

[10]http://parl.ai.s3-website.us-east-2.amazonaws.com/docs/tutorial_basic.html

(*本文为 AI 科技大本营转载文章，转载请联系原作者)

◆

福利时刻

◆

入群参与每周抽奖~

扫码添加小助手，回复：大会，加入福利群，参与抽奖送礼！

AI ProCon 大会优惠票限时抢购中！识别海报二维码，即刻购票~

推荐阅读

IBM重磅开源Power芯片指令集？国产芯迎来新机遇？
KDD 2019高维稀疏数据上的深度学习Workshop论文汇总
说出来你可能不信，现在酒厂都在招算法工程师
姚班三兄弟3万块创业八年，旷视终冲刺港股
2019 AI ProCon日程出炉：Amazon首席科学家李沐亲授「深度学习」
AI Top 30+案例评选等你来秀！
福利 | 马上为你安排和大咖面对面交流的机会，不可错过
92年小哥绞尽脑汁骗得价值800万比特币, 破案后警方决定还给受害者
他是叶问制片人也是红色通缉犯, 他让泰森卷入ICO, 却最终演变成了一场狗血的罗生门……

你点的每个“在看”，我都认真当成了喜欢

你可能感兴趣的:(三两下实现NLP训练和预测，这四个框架你要知道)

TK群发器：提升TikTok营销效率的智能工具 @ V:ZwaitY09 矩阵 tiktok
随着短视频平台TikTok的快速发展，许多企业和内容创作者都将其作为重要的营销渠道。但随着平台的竞争加剧，如何高效管理多个账号、提升曝光度和互动率，成为了营销者的一大挑战。为了解决这一问题，TK群发器应运而生。它通过智能化的操作方式，帮助用户精准高效地进行多账号管理和内容群发，极大提高了营销效率。TK群发器的主要功能：多账号精准群发：TK群发器支持同时管理多个TikTok账号，用户可以通过该工具实
深入了解 CDN：概念、原理、过程、作用及工作场景羊村懒哥网络网络加速缓存
目录一、CDN的概念二、CDN的工作原理三、CDN的工作过程四、CDN的作用五、CDN可结合使用的技术六、CDN能够解决的网络问题七、CDN的工作场景在当今互联网飞速发展的时代，用户对于网页加载速度和内容获取的时效性要求越来越高。CDN（ContentDeliveryNetwork，⭐内容分发网络）应运而生，它在提升网络性能和用户体验方面发挥着关键作用。本文将详细介绍CDN的概念、工作原理、工作过
OpenLayers总结3 Super毛毛穗 WebGIS开发 OpenLayers GIS WebGIS
一、静态测距1.原理静态测距主要是针对地图上已有的矢量要素（如线要素），利用OpenLayers提供的几何计算函数来获取其长度。在实际操作中，先加载包含几何要素的GeoJSON数据到矢量图层，当鼠标指针移动到要素上时，获取该要素的几何信息，再调用getLength函数计算其长度。2.代码实现步骤及注释//引入必要的模块importVectorLayerfrom"ol/layer/Vector.js
vue3-video-play 插件在 Vue 3 项目上的应用放逐者-保持本心，方可放逐 vue3应用 vue.js 前端 javascript vue3-video-play
文章目录vue3-video-play插件在Vue3项目上的应用一、插件简介二、插件安装三、插件组件应用示例1.局部引入组件2.全局引入组件四、需要注意的事项五、本地环境将`package.json`中`"module":"./dist/index.es.js"`改为`"module":"./dist/index.mjs"`问题解析探索问题描述原因分析解决方案格式及应用实例vue3-video-p
【CUDA】Pytorch_Extensions joker D888 深度学习 pytorch python cuda c++深度学习
【CUDA】Pytorch_Extensions为什么要开发CUDA扩展？当我们在PyTorch中实现自定义算子时，通常有两种选择：使用纯Python实现（简单但效率低）使用C++/CUDA扩展（高效但需要编译）对于计算密集型的操作（如神经网络中的自定义激活函数），使用CUDA扩展可以获得接近硬件极限的性能。本文将以实现一个多项式激活函数x²+x+1为例，展示完整的开发流程。完整CUDA扩展代码解
散热风扇常见的调速方式有哪几种辉盈防爆散热风扇其他
在现代电子设备中，散热风扇扮演着至关重要的角色，它们通过高效的空气流动帮助设备排热，保障设备的稳定运行。而散热风扇的调速方式，则是影响其散热效率和使用寿命的关键因素。那么，散热风扇如何调速?有哪几种调速方式?1.PWM(脉冲宽度调制)调速是有一个专用的PWM调速操控电路来调理，这个操控信号是要散热风扇生产厂家来完结，此功用可以使用频率和高低压电平来操控风扇转速，经过调整占空比来线性操控风扇转速，带
SQL面试题练习 —— 取出累计值与1000差值最小的记录夏木夕 SQL sql 面试数据库
题目来源：滴滴目录1题目2建表语句3题解1题目已知有表t_cost_detail包含id和money两列，id为自增，请累加计算money值，并求出累加值与1000差值最小的记录。+-----+--------+|id|money|+-----+--------+|1|200||2|300||3|200||4|100||5|150||6|80||7|100||8|200|+-----+------
Labelbox：引领AI与人类协作的未来魏兴雄Milburn
Labelbox：引领AI与人类协作的未来labelbox-pythonLabelboxPythonClient项目地址:https://gitcode.com/gh_mirrors/la/labelbox-python项目介绍Labelbox是一款专为企业和学术研究社区设计的开源工具，旨在简化数据标注、生成高质量的人类反馈数据、评估和提升模型性能，并通过无缝结合AI与人类工作流程来自动化任务。无
探索 TypeScript Redux：构建大规模JavaScript应用的终极指南柳旖岭
探索TypeScriptRedux：构建大规模JavaScript应用的终极指南去发现同类优质开源项目:https://gitcode.com/在当今快速发展的前端开发领域中，组合正确工具集来应对复杂性和扩展性挑战至关重要。今天，我们将深入了解一个令人兴奋的开源项目——TypeScriptRedux，它结合了TypeScript、JSPM、typings、React和Redux的强大功能，为开发者
探索HeidiSQL：一款强大的数据库管理工具夏庭彭Maxine
探索HeidiSQL：一款强大的数据库管理工具HeidiSQLHeidiSQL:是一个免费且强大的SQL编辑器和数据库管理工具，支持MySQL、PostgreSQL、SQLite等多种数据库。适合数据库管理员和开发者使用HeidiSQL管理数据库和查询数据。项目地址:https://gitcode.com/gh_mirrors/he/HeidiSQL项目介绍HeidiSQL是一款开源的图形化数据库
centos操作系统安装R包单细胞拟时序分析CytoTRACE2 探序基因 centos linux 运维
探序基因肿瘤研究院整理作者操作系统为centosstream8，R版本为4.3.3devtools::install_github("digitalcytometry/cytotrace2",subdir="cytotrace2_r")中途出现错误：*installing*source*package‘RcppGSL’...**成功将‘RcppGSL’程序包解包并MD5和检查**usingstag
基于python使用scanpy分析单细胞转录组数据探序基因单细胞分析 python 开发语言
探序基因肿瘤研究院整理相关后缀的格式介绍：.h5ad：是一种用于存储单细胞数据的文件格式，可以通过anndata库在Python中处理.loom：高效的数据存储格式（.loom文件），使得用户可以轻松地存储、查询和分析大规模的单细胞数据集。Loompy的设计目标是提供一个快速、灵活且易于使用的工具，以支持生物信息学家和研究人员在单细胞水平上进行数据分析。python的单细胞转录组数据结构说明：da
位图（BitMap）实现小猫猫猫◍˃ᵕ˂◍ bitmap 算法
位图（BitMap）实现1.位图简介位图（BitMap）是一种高效的数据结构，用于存储和操作位（bit）数据。每个位可以表示一个布尔值（0或1），常用于去重、排序、快速查找等场景。2.核心功能⚙️设置位（Set）：将某一位设置为1。清除位（Clear）：将某一位设置为0。获取位（Get）：检查某一位是否为1。打印位图（Print）：以二进制形式打印位图。3.代码实现packageMyStruct;
Java 运行时常量池笔记（详细版小猫猫猫◍˃ᵕ˂◍ java 笔记 python
Java运行时常量池笔记（详细版）Java的运行时常量池（RuntimeConstantPool）是JVM方法区的一部分，用于存储编译期生成的字面量和符号引用。它是Java类文件常量池的运行时表示，具有动态性和共享性。运行时常量池的核心概念1.什么是运行时常量池？运行时常量池是JVM方法区的一部分，存储类文件中常量池的内容。它包含：字面量：如字符串、整数、浮点数等。符号引用：如类名、方法名、字段名
Mybatis判断问题：深入解析与实战案例 DTcode7 sql数据库相关数据库 mysql SQL 数据库开发 sql
Mybatis判断问题：深入解析与实战案例基础概念与作用说明``标签``,``,````示例一：基本的``标签使用说明示例二：``,``,``的使用说明示例三：使用``标签简化条件语句说明实际工作中的使用技巧自行拓展内容在现代企业级应用开发中，MyBatis作为一款优秀的持久层框架，以其灵活的SQL映射机制和强大的动态SQL功能，深受广大开发者的喜爱。然而，在使用过程中，如何准确地进行条件判断，特
uni-app adb安卓wifi无线调试景影随形 uni-app 网络错误
方法一adbconnect连接调试前提条件：电脑已安装adb工具手机和电脑连接的同一个WIFICMD进入到adb工具所在目录，可以使用HBuilder自带adb，如：D:\Tools\HBuilderX\plugins\launcher\tools\adbs，也可以使用AndroidSDK的adb。注意，第一次连接需要执行第一步和第二步，让手机监听5555端口，后续手机会自动监听5555端口，不需
在线预览 Word 文档你不讲 wood word 开发语言前端 vue.js javascript node.js docx-preview
引言随着互联网技术的发展，Web应用越来越复杂，用户对在线办公的需求也日益增加。在许多业务场景中，能够直接在浏览器中预览Word文档是一个非常实用的功能。这不仅可以提高用户体验，还能减少用户操作步骤，提升效率。实现原理1.后端服务假设后端服务已经提供了两个API接口：getFilesList:获取文件列表。previewFile:获取指定文件的内容。constexpress=require('ex
《道德经》里的职场智慧，远比你想象的还要强大！ Yage520 程序员创富职场和发展学习方法创业创新人工智能
《道德经》里的职场智慧，远比你想象的还要强大！你有没有过这样的困惑？明明加班加点、尽力管理，但结果却越来越累，效果却越来越差？问题出在哪里？答案，其实在《道德经》里！“上善若水，水善利万物而不争。”这句话暗藏着深刻的智慧！水，看似柔弱，却能穿透岩石；看不见摸不着，却能适应任何形状的容器。更神奇的是，水从不争斗，却无处不在，滋养万物！职场启示：不争，不是无能！你试试看，越是想控制一切，反而越容易弄巧
【HarmonyOS NEXT】是否有监听键盘显隐的方法 Mayism123 harmonyos
关键字监听/键盘/输入法框架/窗口问题描述是否有监听键盘显隐的方法？解决方案可选择以下任一方案：方案一：通过输入法框架模块（@ohos.inputMethod）来监听软键盘状态。用InputMethodController实例的on('sendKeyboardStatus')方法来监听，直接在inputMethodController.on('sendKeyboardStatus',callbac
前端导出word文件—包含canvas(echarts图表) Liuer_Qin js canvas echarts echarts 前端 javascript
一、使用的插件html-docx-js二、整体思路因为canvas是运行在内存中的，所以不能简单的通过dom获取canvas图片，需要手动的先将canvas转为image。三、实现先克隆要下载的DOM的副本。因为canvas是运行在内存中的，所以也不能通过cloneNode方法克隆下来（克隆下来是空的）。我们这里将原DOM中的canvas转成图片，然后插入到副本的对应位置，这样操作不会影响原DOM
侯捷 C++ 课程学习笔记：C++ 面向对象开发的艺术孤寂大仙v c++c++学习笔记
在侯捷老师的C++系列课程中，《C++面向对象开发》这门课程让我对面向对象编程有了更深入的理解。面向对象编程（OOP）是现代软件开发中最重要的编程范式之一，而C++作为支持OOP的语言，提供了强大的工具和特性。侯捷老师通过系统的讲解和实战案例，帮助我掌握了如何在C++中高效地使用面向对象技术。以下是我对这门课程的学习笔记和心得体会。一、课程核心内容：C++面向对象开发的关键特性![侯捷老师的课程详
语聊房软件开发流程与基础功能 ALLSectorSorft java html5 javascript
开发一款语聊房软件需要系统的规划和多领域技术整合。以下是关键流程、基础功能及示例代码：---一、开发流程1.需求分析-明确目标用户（社交/游戏/教育）-竞品分析（Clubhouse/Discord/狼人杀）-核心功能优先级排序2.技术选型-实时语音：声网Agora（推荐）/腾讯云TRTC/WebRTC-即时通讯：Socket.io/Sendbird/Firebase-后端框架：Node.js/Sp
Transformer 模型架构 2401_89793006 热门话题 transformer 深度学习人工智能
Transformer是一种模型架构（ModelArchitecture），而不是一个软件框架（Framework）。它的定位更接近于一种设计蓝图，类似于建筑中的结构设计方案。以下是详细解释：1.架构vs框架的区别概念定义示例模型架构定义神经网络的结构设计Transformer、CNN、RNN开发框架提供实现模型的工具和库PyTorch、TensorFlow2.Transformer作为架构的核心
SQL 注入攻击黄亚磊11 数据库
SQL注入攻击了解吗？攻击者在HTTP请求中注入恶意的SQL代码，服务器使用参数构建数据库SQL命令时，恶意SQL被一起构造，并在数据库中执行。用户登录，输入用户名lianggzone,密码123or1=1,如果此时使用参数构造的方法，就会出现select*fromuserwherename='lianggzone'andpassword='123'or'1'='1';不管用户名和密码是什么内容，
MVCC（多版本并发控制）机制讲解十五001 基础 oracle 数据库 mysql
MVCC（Multi-VersionConcurrencyControl，多版本并发控制）这是一个在数据库管理系统中非常重要的技术，尤其是在处理并发事务时。别担心，我会用简单易懂的方式来讲解，让你轻松掌握它的原理和作用。1.什么是MVCC？定义MVCC是一种数据库技术，用于通过保留数据的多个版本来提高并发性能，同时避免事务之间的冲突。简单来说，它允许数据库在读取和写入操作时，同时存在多个版本的数据
使用rknn进行yolo11-pose部署点PY 深度学习模型部署 pytorch 深度学习人工智能
文章目录概要生成ONNX生成RKNN实测效果概要使用RKNN进行YOLOv11Pose部署的必要性在于，RKNN能将YOLOv11Pose模型转化为适合Rockchip硬件平台（如RV1109、RV1126）执行的格式，充分利用其AI加速功能，显著提高推理速度和效率。此外，RKNN提供模型优化（如量化）功能，有助于减少计算资源消耗，提升实时处理能力，特别适合在嵌入式设备上进行高效、低功耗的姿态估计
使用Python和OpenCV实现图像像素压缩与解压东方佑量子变法 python opencv 开发语言
在本文中，我们将探讨如何使用Python和OpenCV库来实现一种简单的图像像素压缩算法。我们将详细讨论代码的工作原理，并提供一个具体的示例来演示该过程。1.引言随着数字媒体的普及，图像处理成为了一个重要的领域。无论是为了减少存储空间还是加快网络传输速度，图像压缩技术都扮演着至关重要的角色。这里，我们提出了一种基于像素重复模式的简单压缩算法，它适用于具有大量连续相同像素值的图像。2.技术栈介绍2.
【Python系列】Python 解释器的站点配置 Kwan的解忧杂货铺@新空间代码工作室 s1 Python python 开发语言
欢迎来到我的博客，很高兴能够在这里和您见面！希望您在这里可以感受到一份轻松愉快的氛围，不仅可以获得有趣的内容和知识，也可以畅所欲言、分享您的想法和见解。推荐:kwan的首页,持续学习,不断总结,共同进步,活到老学到老导航檀越剑指大厂系列:全面总结java核心技术点,如集合,jvm,并发编程redis,kafka,Spring,微服务,Netty等常用开发工具系列:罗列常用的开发工具,如IDEA,M
深入解析JVM性能问题定位与优化测试不打烊性能测试 jvm 性能优化
JVM性能问题定位与优化详解：架构、内存、Linux命令与监控工具的全面解析引言Java虚拟机（JVM）是运行Java应用程序的核心组件，它管理内存、执行字节码，并提供垃圾回收机制等功能。然而，随着应用规模的增长，JVM的性能问题时常会成为系统瓶颈。为了有效定位和优化JVM性能问题，我们需要从JVM架构、内存管理、Linux系统命令，以及监控工具入手，对JVM的各类指标进行详尽的分析和优化。本文将
安装与部署openeuler 的HA VX-IT BANG 服务器网络 linux
实现原理LinuxHA（HighAvailability，高可用性）是指利用Linux操作系统构建的高可用集群解决方案，旨在确保关键业务服务在面临硬件故障、软件错误、网络中断等各种异常情况时，依然能够持续、稳定地运行，尽量减少服务中断时间，提高系统的可靠性和可用性。以下从几个方面详细介绍：关键组件和技术心跳监测（Heartbeat）这是LinuxHA系统中最基础也是最重要的组件之一。它通过在节点之
mysql主从数据同步林鹤霄 mysql主从数据同步
配置mysql5.5主从服务器(转) 教程开始：一、安装MySQL 说明：在两台MySQL服务器192.168.21.169和192.168.21.168上分别进行如下操作，安装MySQL 5.5.22 二、配置MySQL主服务器（192.168.21.169）mysql -uroot -p &nb
oracle学习笔记 caoyong oracle
1、ORACLE的安装 a>、ORACLE的版本 8i,9i : i是internet 10g,11g : grid (网格) 12c : cloud (云计算) b>、10g不支持win7 &
数据库，SQL零基础入门天子之骄 sql 数据库入门基本术语
数据库，SQL零基础入门做网站肯定离不开数据库，本人之前没怎么具体接触SQL，这几天起早贪黑得各种入门，恶补脑洞。一些具体的知识点，可以让小白不再迷茫的术语，拿来与大家分享。数据库，永久数据的一个或多个大型结构化集合，通常与更新和查询数据的软件相关
pom.xml 一炮送你回车库 pom.xml
1、一级元素dependencies是可以被子项目继承的 2、一级元素dependencyManagement是定义该项目群里jar包版本号的，通常和一级元素properties一起使用，既然有继承，也肯定有一级元素modules来定义子元素 3、父项目里的一级元素<modules> <module>lcas-admin-war</module> <
sql查地区省市县 3213213333332132 sql mysql
-- db_yhm_city SELECT * FROM db_yhm_city WHERE class_parent_id = 1 -- 海南 class_id = 9 港、奥、台 class_id = 33、34、35 SELECT * FROM db_yhm_city WHERE class_parent_id =169 SELECT d1.cla
关于监听器那些让人头疼的事宝剑锋梅花香画图板监听器鼠标监听器
本人初学JAVA，对于界面开发我只能说有点蛋疼，用JAVA来做界面的话确实需要一定的耐心（不使用插件，就算使用插件的话也没好多少）既然Java提供了界面开发，老师又要求做，只能硬着头皮上啦。但是监听器还真是个难懂的地方，我是上了几次课才略微搞懂了些。
JAVA的遍历MAP darkranger map
Java Map遍历方式的选择 1. 阐述　　对于Java中Map的遍历方式，很多文章都推荐使用entrySet，认为其比keySet的效率高很多。理由是：entrySet方法一次拿到所有key和value的集合；而keySet拿到的只是key的集合，针对每个key，都要去Map中额外查找一次value，从而降低了总体效率。那么实际情况如何呢？　　为了解遍历性能的真实差距，包括在遍历ke
POJ 2312 Battle City 优先多列+bfs aijuans 搜索
来源：http://poj.org/problem?id=2312 题意：题目背景就是小时候玩的坦克大战，求从起点到终点最少需要多少步。已知S和R是不能走得，E是空的，可以走，B是砖，只有打掉后才可以通过。思路：很容易看出来这是一道广搜的题目，但是因为走E和走B所需要的时间不一样，因此不能用普通的队列存点。因为对于走B来说，要先打掉砖才能通过，所以我们可以理解为走B需要两步，而走E是指需要1
Hibernate与Jpa的关系，终于弄懂 avords java Hibernate 数据库 jpa
我知道Jpa是一种规范，而Hibernate是它的一种实现。除了Hibernate，还有EclipseLink(曾经的toplink)，OpenJPA等可供选择，所以使用Jpa的一个好处是，可以更换实现而不必改动太多代码。在play中定义Model时，使用的是jpa的annotations，比如javax.persistence.Entity, Table, Column, OneToMany
酸爽的console.log bee1314 console
在前端的开发中，console.log那是开发必备啊，简直直观。通过写小函数，组合大功能。更容易测试。但是在打版本时，就要删除console.log，打完版本进入开发状态又要添加，真不够爽。重复劳动太多。所以可以做些简单地封装，方便开发和上线。 /** * log.js hufeng * The safe wrapper for `console.xxx` functions *
哈佛教授：穷人和过于忙碌的人有一个共同思维特质 bijian1013 时间管理励志人生穷人过于忙碌
一个跨学科团队今年完成了一项对资源稀缺状况下人的思维方式的研究，结论是：穷人和过于忙碌的人有一个共同思维特质，即注意力被稀缺资源过分占据，引起认知和判断力的全面下降。这项研究是心理学、行为经济学和政策研究学者协作的典范。　　这个研究源于穆来纳森对自己拖延症的憎恨。他7岁从印度移民美国，很快就如鱼得水，哈佛毕业
other operate 征客丶 OS osx
一、Mac Finder 设置排序方式，预览栏在显示－》查看显示选项中二、有时预览显示时，卡死在那，有可能是一些临时文件夹被删除了，如：/private/tmp[有待验证] -------------------------------------------------------------------- 若有其他凝问或文中有错误，请及时向我指出，我好及时改正，同时也让我们一
【Scala五】分析Spark源代码总结的Scala语法三 bit1129 scala
1. If语句作为表达式 val properties = if (jobIdToActiveJob.contains(jobId)) { jobIdToActiveJob(stage.jobId).properties } else { // this stage will be assigned to "default" po
ZooKeeper 入门 BlueSkator 中间件 zk
ZooKeeper是一个高可用的分布式数据管理与系统协调框架。基于对Paxos算法的实现，使该框架保证了分布式环境中数据的强一致性，也正是基于这样的特性，使得ZooKeeper解决很多分布式问题。网上对ZK的应用场景也有不少介绍，本文将结合作者身边的项目例子，系统地对ZK的应用场景进行一个分门归类的介绍。值得注意的是，ZK并非天生就是为这些应用场景设计的，都是后来众多开发者根据其框架的特性，利
MySQL取得当前时间的函数是什么格式化日期的函数是什么 BreakingBad mysql Date
取得当前时间用 now() 就行。在数据库中格式化时间用DATE_FORMA T(date, format) . 根据格式串format 格式化日期或日期和时间值date，返回结果串。可用DATE_FORMAT( ) 来格式化DATE 或DATETIME 值，以便得到所希望的格式。根据format字符串格式化date值: %S, %s 两位数字形式的秒（ 00,01,
读《研磨设计模式》-代码笔记-组合模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.List; abstract class Component { public abstract void printStruct(Str
4_JAVA+Oracle面试题(有答案) chenke oracle
基础测试题卷面上不能出现任何的涂写文字，所有的答案要求写在答题纸上，考卷不得带走。选择题 1、 What will happen when you attempt to compile and run the following code? （3） public class Static { static { int x = 5; // 在static内有效 } st
新一代工作流系统设计目标 comsci 工作算法脚本
用户只需要给工作流系统制定若干个需求，流程系统根据需求，并结合事先输入的组织机构和权限结构，调用若干算法，在流程展示版面上面显示出系统自动生成的流程图，然后由用户根据实际情况对该流程图进行微调，直到满意为止，流程在运行过程中，系统和用户可以根据情况对流程进行实时的调整，包括拓扑结构的调整，权限的调整，内置脚本的调整。。。。。在这个设计中，最难的地方是系统根据什么来生成流
oracle 行链接与行迁移 daizj oracle 行迁移
表里的一行对于一个数据块太大的情况有二种(一行在一个数据块里放不下) 第一种情况: INSERT的时候，INSERT时候行的大小就超一个块的大小。Oracle把这行的数据存储在一连串的数据块里(Oracle Stores the data for the row in a chain of data blocks)，这种情况称为行链接(Row Chain)，一般不可避免(除非使用更大的数据
[JShop]开源电子商务系统jshop的系统缓存实现 dinguangx jshop 电子商务
前言 jeeshop中通过SystemManager管理了大量的缓存数据，来提升系统的性能，但这些缓存数据全部都是存放于内存中的，无法满足特定场景的数据更新（如集群环境）。JShop对jeeshop的缓存机制进行了扩展，提供CacheProvider来辅助SystemManager管理这些缓存数据，通过CacheProvider,可以把缓存存放在内存,ehcache,redis，memcache
初三全学年难记忆单词 dcj3sjt126com english word
several 儿子；若干 shelf 架子 knowledge 知识；学问 librarian 图书管理员 abroad 到国外，在国外 surf 冲浪 wave 浪；波浪 twice 两次；两倍 describe 描写；叙述 especially 特别；尤其 attract 吸引 prize 奖品；奖赏 competition 比赛；竞争 event 大事；事件 O
sphinx实践 dcj3sjt126com sphinx
安装参考地址:http://briansnelson.com/How_to_install_Sphinx_on_Centos_Server yum install sphinx 如果失败的话使用下面的方式安装 wget http://sphinxsearch.com/files/sphinx-2.2.9-1.rhel6.x86_64.rpm yum loca
JPA之JPQL（三） frank1234 orm jpa JPQL
1 什么是JPQL JPQL是Java Persistence Query Language的简称，可以看成是JPA中的HQL， JPQL支持各种复杂查询。 2 检索单个对象 @Test public void querySingleObject1() { Query query = em.createQuery("sele
Remove Duplicates from Sorted Array II hcx2013 remove
Follow up for "Remove Duplicates":What if duplicates are allowed at most twice? For example,Given sorted array nums = [1,1,1,2,2,3], Your function should return length
Spring4新特性——Groovy Bean定义DSL jinnianshilongnian spring 4
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
CentOS安装Mysql5.5 liuxingguome centos
CentOS下以RPM方式安装MySQL5.5 首先卸载系统自带Mysql： yum remove mysql mysql-server mysql-libs compat-mysql51 rm -rf /var/lib/mysql rm /etc/my.cnf 查看是否还有mysql软件： rpm -qa|grep mysql 去http://dev.mysql.c
第14章工具函数（下） onestopweb 函数
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
POJ 1050 SaraWon 二维数组子矩阵最大和
POJ ACM第1050题的详细描述，请参照 http://acm.pku.edu.cn/JudgeOnline/problem?id=1050 题目意思：给定包含有正负整型的二维数组，找出所有子矩阵的和的最大值。如二维数组 0 -2 -7 0 9 2 -6 2 -4 1 -4 1 -1 8 0 -2 中和最大的子矩阵是 9 2 -4 1 -1 8 且最大和是15
Java8全新打造，英语学习supertool yangshangchuan java superword 闭包 java8 函数式编程
superword是一个Java实现的英文单词分析软件，主要研究英语单词音近形似转化规律、前缀后缀规律、词之间的相似性规律等等。Clean code、Fluent style、Java8 feature: Lambdas, Streams and Functional-style Programming。升学考试、工作求职、充电提高，都少不了英语的身影，英语对我们来说实在太重要

三两下实现NLP训练和预测，这四个框架你要知道

引言

一、Tensor2Tensor

二、AllenNLP

三、OpenNMT

四、ParlAI

五、总结

参考资料

IBM重磅开源Power芯片指令集？国产芯迎来新机遇？

KDD 2019高维稀疏数据上的深度学习Workshop论文汇总

说出来你可能不信，现在酒厂都在招算法工程师

姚班三兄弟3万块创业八年，旷视终冲刺港股

2019 AI ProCon日程出炉：Amazon首席科学家李沐亲授「深度学习」

AI Top 30+案例评选等你来秀！

福利 | 马上为你安排和大咖面对面交流的机会，不可错过

92年小哥绞尽脑汁骗得价值800万比特币, 破案后警方决定还给受害者

他是叶问制片人也是红色通缉犯, 他让泰森卷入ICO, 却最终演变成了一场狗血的罗生门……

你可能感兴趣的:(三两下实现NLP训练和预测，这四个框架你要知道)