weixin_45562632

A Survey of the Usages of Deep Learning for Natural Language Processing2019综述学习

1.介绍
2.自然语言处理和深度学习
- 2.1自然语言处理
- 2.2神经网络和深度学习
- - 2.2.1 CNN
  - 2.2.2递归神经网络
  - 2.2.3循环神经网络和LSTM
  - 2.2.4注意力机制和transformer
  - 2.2.5 残差连接和dropout
3.深度学习用于NLP的核心领域
- 3.1语言模型
- - 3.1.1 神经语言模型
  - 3.1.2评估LM
  - 3.1.3LM中的记忆网络和注意力机制
  - 3.1.4 CNN用于LM
  - 3.1.5 Character Aware Neural Language Models
  - 3.1.6 词嵌入的发展
  - 3.1.7最近发展和挑战
- 3.2 形态学
- 3.3 句法解析
- - 3.3.1 Early Neural Parsing
  - 3.3.2Transition-Based Dependency Parsing
  - 3.3.3 Generative Dependency and Constituent Parsing生成依赖与主成分分析
  - 3.3.4 Universal Parsing
  - 3.3.5存在的挑战
- 3.4 语义学
- - 3.4.1 Semantic Comparison
  - 3.4.2 句子模型
  - 3.4.3 语义学挑战
- 3.5 总结核心问题
4.在NLP领域应用DL
- 4.1 信息检索
- 4.2 信息抽取
- - 4.2.1Named Entity Recognition（NER）
  - 4.2.2 Event Extraction
  - 4.2.3 Relationship Extraction
- 4.3 文本分类
- 4.4 文本生成
- - 4.4.1 Poetry Generation
  - 4.4.2 Joke and Pun Generation
  - 4.4.3 Story Generation
  - 4.4.4 Text Generation with GANs
  - 4.4.5 Text Generation with VAEs
  - 4.4.6 Summary of Text Generation
- 4.5 总结
- 4.6 问答系统
- 4.7 机器翻译
- 4.8 总结深度学习在NLP领域中的应用
5.总结

这篇论文的特点在于将NLP的领域分类较好，算法都是讲的怎么用的（都是CNN、RNN变形和bert），没有讲原理，没有一个公式。作为NLP入门了解一些专业词汇很好。

摘要
在过去的几年里，随着深度学习模型的大量使用，自然语言处理领域得到了极大的发展。本调查对该领域进行了简要介绍，并简要概述了深度学习体系结构和方法。然后，它筛选了大量最近的研究，并总结了大量相关的贡献。分析的研究领域除了计算语言学的一些应用外，还包括几个核心的语言处理问题。并对今后的研究提出了建议。
关键词
深度学习，神经网络，自然语言处理，计算语言学，机器学习

1.介绍

以前方法：统计学、概率论、机器学习
有了GPU之后
现在方法：深度学习
本文主要介绍NLP和深度学习。第二章AL和NLP理论；
第三章NLP的四个主要问题：语言模型、形态学、句法分析、语义，以及DL在其中的应用；
第四章NLP的应用领域：信息检索、信息抽取、文本分类、文本生成、总结、问答系统、机器翻译；
第五章结论，未来展望。

2.自然语言处理和深度学习

2.1自然语言处理

NLP两个大的子领域：核心领域和应用
核心领域：语言模型、形态学、句法分析、语义（+一句话介绍每部分是干什么的）注意：很多有交叉
应用：信息检索、信息抽取、文本分类、文本生成、总结、问答系统、机器翻译
以前机器学习的方法：朴素贝叶斯、KNN、隐马尔可夫、条件随机场、决策树、随机森林、支持向量机。
最近几年用于NLP的方法：transformer。

2.2神经网络和深度学习

神经网络、随机梯度下降、反向传播、前馈神经网络（FFNN）、深度神经网络（DNN）

2.2.1 CNN

CNN被用于图片处理、视频处理、语音处理和自然语言处理
池化可以减小

2.2.2递归神经网络

递归神经网络Recursive Neural Networks
CNN同一层之间共享权重，而RNN是不同层之间共享权重

2.2.3循环神经网络和LSTM

循环神经网络： Recurrent Neural Networks
LSTM：Long Short-Term Memory Networks
循环神经网络是递归神经网络的一种
因为RNN是单向的，而单词之间的关系是双向的，因此有了双向RNN（bidirectional RNN）
工程化应用广泛的一种RNN是LSTM
一种轻量化的LSTM变体是GRU（ Gated Recurrent Unit）

2.2.4注意力机制和transformer

上图是transformer模型。其中a图中，四个蓝色编码器和四个红色解码器，编码器前面有一个positional encoder（粉红色）。b 图和c图对应的是a图内部结构，其中b是编码器内部结构，c 是解码器内部结构。编码器中一个self-attention layer，一个feed forward layer。解码器中一个 self-attention layer，一个attentional encoder-decoder layer，一个feed forward layer。
原来RNN的问题：不关注哪个重要哪个不重要，全部从编码器到解码器。
因此有了attention机制。
attention 机制的一些变体：convolutional , intra-temporal , gated , and self-attention
Self-attention in particular has become widely used in a state-of-the-art encoder-decoder model called Transformer。

2.2.5 残差连接和dropout

防止梯度爆炸和梯度消失的方法：
1.选择合适的激活函数，推荐relu
2.残差连接，网络举例： residual network (ResNet)
一些变体： Highway Networks and DenseNets .
3.dropout：防止训练数据过拟合

3.深度学习用于NLP的核心领域

主要分为四个部分：语言模型、形态学、句法分析、语
义学
语言模型决定哪个词与哪个词连接
形态学研究词本身的结构，词根前缀后缀，性别数字等。
句法分析词怎么构成句子
语义学研究每个词的意思以及怎么构成句子。

3.1语言模型

Language modeling (LM)

3.1.1 神经语言模型

可以识别同义词和词汇表外词

3.1.2评估LM

目前没有完美的方法，有一个度量指标是困惑度（perplexity）
困惑度的一个缺点是只能在同一个数据集上进行比较，多个数据集之间没有意义。
这个领域常用数据集：Penn Treebank (PTB) [54], and the Billion Word Benchmark

3.1.3LM中的记忆网络和注意力机制

1.运用注意力机制的网络变形三次递进尝试
1） a single value to predict the next token, to encode information for the attentional unit, and to decode the information in the attentional unit hinders a network
问题：difficult to train a single parameter to perform three distinct tasks simultaneously
2）designed each node to have two outputs: one to encode and decode the information in the attentional unit, and another to predict the next tokens explicitly
3）further separated the outputs, using separate values to encode the information entering the attentional unit and decode the information being retrieved from it
It was found that this network also provided results comparable to many larger RNNs and LSTMs, suggesting that reasonable results can be achieved using simpler networks.

2.近期 residual memory networks (RMNs) for LM
注意：residual connections skipping two layers were most effective
It was found that RMNs are capable of outperforming LSTMs of similar size.

3.1.4 CNN用于LM

A CNN used recently in LM replaced the pooling layers with fully-connected layers
Three different architectures were implemented：
1）a multilayer perceptron CNN (MLPConv)
2） a multilayer CNN (ML-CNN)
3） a combination of these networks called COM
this study showed that CNNs can be used to capture long term dependencies in sentences.

3.1.5 Character Aware Neural Language Models

unlike previous networks , accepted only character level input, rather than combining it with word embeddings.
1.CNN
2.LSTM， 19 million trainable parameters
Since the network focused on morphological similarities produced by character level analysis, it was more capable than previous models of handling rare words.
The analysis also showed that the network was capable of identifying prefixes, roots, and suffixes, as well as understanding hyphenated words, making it a robust model.
这个模型不仅仅是应用于LM，还可以形态学分析。
3.很多人在小数据集上验证比较不同模型。这个实验在 Billion Word Benchmark大数据集上验证， The best performance,however, was achieved using an ensemble of ten LSTMs。

3.1.6 词嵌入的发展

Not only do neural language models allow for the prediction of unseen synonymous words, they also allow for modeling the relationships between words.
PCA：Principle Component Analysis
King向量-queen向量约等于 man向量-woman向量

3.1.7最近发展和挑战

发展：
1.生成性预训练Generative Pre-Training (GPT)
which pretrained a language model based on the Transformer model learning dependencies of words in sentences and longer segments of text, rather than just the immediately surrounding words.
2. bi-directionalism to capture backwards context in addition to the forward context, in their Embeddings from Language Models (ELMo)
captured the vectorizations at multiple levels
3.unsupervised training tasks of random masked neighbor word prediction, and next-sentence-prediction (NSP)。Bidirectional Encoder Representations from Transformers (BERT)
4. Multi-Task Deep Neural Network (MT-DNN)
5.used a stochastic answer network (SAN) ontop of a BERT-like model.
挑战：
When new datasets are created removing such patterns carefully, the models do not perform well.
Additionally, while there has been recent work on cross-language modeling and universal language modeling, the amount and level of work needs to pick up to address low-resource languages.

3.2 形态学

Morphology is concerned with finding segments within
single words, including roots and stems, prefixes, suffixes, and—in some languages—infixes.

1.模型：RvNN，数据集： WordSim-353 dataset
In particular, words with the same stem were clustered together, even if they were antonyms.
2. LSTM-based models、 character aware CNNs
a variety of neural machine translation models.
from English to French, German, Czech, Arabic, or Hebrew.
The study concluded that the use of attention mechanisms decreases the performance of encoders, but increases the performance of decoders.
Furthermore, it was found that character-aware models are superior to others for learning morphology
3.RNN-based model
unsegmented（非分歧） languages such as Japanese
数据集： the Kyoto Text Corpus and the Kyoto University Web Document Leads Corpus

4.最近的工作是通用形态学universal morphology
a single study applying deep learning to this area
apply deep learning to this task
5.形态学嵌入可以很好地应用到多语言处理

3.3 句法解析

主要分为两种形式： constituency parsing and dependency parsing
In constituency parsing, phrasal constituents are extracted from a sentence in a hierarchical fashion.
Dependency parsing looks at the relationships between pairs of individual words.
1.Most recent uses of deep learning in parsing have been in dependency parsing
2. Graph-based parsing constructs a number of parse trees that are then searched to find the correct one.
3. Most graph-based approaches are generative models
4. More popular in recent years than graph-based approaches have been transition-based approaches
5. the standard method of transition-based dependency parsing：1） arc-standard approach
2) arc-eager approach
3) swap-lazy approach

3.3.1 Early Neural Parsing

1.RNNs with probabilistic context-free grammars
(PCFGs)上下文无关文法
2. labeled attachment score (LAS) and unlabeled attachment score (UAS) by using an Inside-Out Recursive Neural Network
3. LSTM with an attention mechanism in a syntactic
constituency parser
4. Embeddings were first used in dependency parsing
数据集： the Wall Street Journal portion of the CoNLL

3.3.2Transition-Based Dependency Parsing

1.简单前馈神经网络
2.简单贪婪搜索——光束搜索
3.深度神经网络
4. using tri-training
5. 另外一种替代简单前馈神经网络方式：LSTM
数据集： the Stanford Dependency Treebank
the CTB5 Chinese dataset
6. a feedforward network with global normalization
7. two new LSTM-based techniques: Bi-LSTM Subtraction and Incremental Tree-LSTM
数据集： SemEval-2015 Task 18(English)
SemEval-2016 Task 9 (Chinese)

3.3.3 Generative Dependency and Constituent Parsing生成依赖与主成分分析

recurrent neural network
Whereas most approaches take a bottom-up approach to parsing, this took a top-down approach
This allowed the sentence to be viewed as a whole
最佳： in English generative parsing
接近最佳： in Chinese generative parsing.
LSTM to assign probabilities to the parse trees
结论：They found that while using one parser for producing candidate trees and another for ranking them was superior to a single parser approach, combining two parsers explicitly was preferable.
数据集： Penn Treebank
a self-attentive network
active learning

3.3.4 Universal Parsing

While current parsing varies drastically from language to language, this attempts to make it uniform between them.
任务： a CoNLL shared task
这个任务对应的方法：deep transition parsing [127], graphbased neural parsing [128], and a competitive model .
bidirectional LSTM

3.3.5存在的挑战

挑战：building of syntactic structures without the use of treebanks for training

3.4 语义学

词嵌入的一些方法：Word2Vec、 GloVe

3.4.1 Semantic Comparison

One way to test the efficacy of an approach to computing semantics is to see if two similar phrases, sentences or documents, judged by humans to have similar meaning also are judged similarly by a program.

two CNNs，The approach outperformed a number of existing models in tasks in English and Chinese.
Bi-CNN-MI(MI for multigranular interaction features)
Dynamic CNNs
数据集： Microsoft Research Paraphrase Corpus (MSRP)
4.using a “similarity measurement layer” followed by a fully-connected layer and then a log-softmax output layer within a CNN
数据集： MSRP, the Sentences Involving Compositional Knowledge (SICK) dataset [138], and the Microsoft Video Paraphrase Corpus (MSRVID)
5.RvNN with LSTM-like nodes called a Tree-LSTM
数据集： SICK dataset and Stanford Sentiment Treebank
6.The model formed a matrix of the two sentences before applying a “similarity focus layer” and then a nineteen-layer CNN followed by dense layers with a softmax output.
数据集：MSRVID, SemEval 2014 Task 10
, WikiQA , and TreeQA datasets.

3.4.2 句子模型

attempt to model paragraphs or larger bodies of text in this way
dynamic convolutional neural network (DCNN)
数据集：Stanford Sentiment Treebank、tweets、 TREC database
typical encoder–decoder structure they use, neural machine translation (NMT) systems.
数据集：Multi-NLI 、JHU Decompositional Semantics Initiative
None of the results were particularly strong, although they were strongest in SPR
4.training semantic parsers on a single domain, as is often done, is less effective than training across many domains.
5.three LSTM-based models：
一对一、一对多、多对多
数据集：” OVERNIGHT ” dataset
6.several LSTM-based encoder–decoder networks
数据集： EuroParl dataset
结论：1）adding more decoders led to more correct and more definitive clusters.
2）can it be performed on sentence embeddings.

3.4.3 语义学挑战

可以很好的完成任务并不代表真正的理解
整合深度神经网络和general word-graphs (e.g. WordNet )or knowledge-graphs (e.g. DBPedia)可能对理解有帮助。
图嵌入是活跃的研究领域，整合语言模型和图模型将对更好的机器理解有帮助。

3.5 总结核心问题

虽然用上了DL，但是很多问题都不是很明确

4.在NLP领域应用DL

注意：这里的NLP只是文本的处理，不包括声学处理

4.1 信息检索

Publication Volume for Applied Areas of NLP
1.Deep learning models for ad-hoc retrieval match texts of queries to texts of documents to obtain relevance scores.
A.representation-focused approaches
match the representations straightforwardly
B.interaction-focused approaches
first build local interactions directly, and then use deep neural networks to learn how the two pieces of text match based on word interactions
2.DRMM
3.SNRM_PRF
learned sparse representations(稀疏) for both queries and documents
In particular, an n-gram representation for queries and documents was used.
TF-IDF and BM25
数据集：measured by MAP, P@20, nDCG@20, and Recall、 Robust and ClueWeb
4.目的：extracted query term representations
ELMo and BERT、 DRMM、CEDR (Contextualized Embeddings for Document Ranking)（基于文档排序的上下文嵌入）

4.2 信息抽取

主要有三种类型：命名实体和关系、事件及参与者、时态信息和事实元组

4.2.1Named Entity Recognition（NER）

1.a simple feedforward network
difficult to capture long-distance relations between words
2.LSTMs
a deep neural network architecture, known as CharWNN, which jointly used word-level and character-level inputs to perform sequential classification.
数据集： HAREM I annotated Portuguese corpus、 SPA CoNLL2002 annotated Spanish corpus
结论：This revalidated a fact long-known: Joint use of word-level and character-level features is important to effective NER performance.
3.bidirectional LSTM with a character-level CNN
数据集：CoNLL-2003、OntoNotes
4.based on bidirectional LSTMs and conditional random fields (CRFs)（条件随机场）
5. a pre-trained bidirectional character language model

4.2.2 Event Extraction

four sub-tasks：
1）identifying event mentions
2） identifying event triggers事件触发器
3） identifying arguments of the events确定事实论据
4）identifying arguments’ roles确定论点在事件中作用
1.CNNs
缺点： capture only the most important information in
a sentence
改进：divided the feature map into three parts,
and instead of using one maximum value, kept the maximum value of each part.
2. RNN-based encoder–decoder
3. a latent variable neural model
数据集： on a dataset they created and released自己的数据集

4.2.3 Relationship Extraction

这些关系包含：拥有关系、同义关系、反义关系
自然的、家族的、地理的关系
1.a simple CNN
2. a bidirectional LSTM and a CNN
3.attention-based GRU model
4.BERT model with supervised training
数据集：biomedical dataset.生物医学数据集

4.3 文本分类

1.use pretrained word vectors in a CNN
achieve excellent results on multiple benchmarks
using little hyperparameter tuning.超参数调节
结论：
The CNN models proposed were able to improve upon the state of the art on 4 out of 7 different tasks cast as sentence classification, including sentiment analysis and question classification.
2. a large number of convolutional layers
3. a hybrid architecture combining a deep belief network [193] and softmax regression
4. deep neural net with backpropagation and quasi-Newton methods
5.BERT
6. for the task of classifying long full-length books by genre, gradient boosting trees are superior to neural networks, including both CNNs and LSTMs.

4.4 文本生成

文本生成的分类：
1）文本到文本；2）非文本到文本；3）无任何输入（诗歌生成、笑话、故事）

4.4.1 Poetry Generation

while recurrent networks are great at learning
internal language models, they do a poor job of producing structured output or adhering to any single style.
RNN在学习语言模型内部结构中较好，但是在生成结构化输出或坚持单一风格上面较差。
1.addressed the style issue by training using particular
poets and controlling for style in Chinese poetry.
2.generated rhythmic poetry by training the network on only a single type of poem to ensure produced poems
3.今年（2019年）GPT-2 model
又称 774 million parameter GPT-2 model
数据集：
on a large English corpus，可以扩展到其他语种

4.4.2 Joke and Pun Generation

1.a small LSTM
did a poor job of making the puns humorous
其他都是一样的方法，就是在不同数据集实验
结论：
providing more general knowledge of other types
of language, and examples of non-jokes, increased the quality of the jokes produced.

4.4.3 Story Generation

1.RNN
2. LSTMs
3.最近的研究关注点：
focusing on the “events” (or actions) in the stories or on the entities (characters and important objects)
4.“skeleton” based model
build general sentences and fill in important information
缺点： still provided only modest end results in human evaluation
5. a two-tiered network
6. hierarchical approach, based on CNNs
结论：self attention leads to better perplexity.
7. read documents in a hierarchical fashion and reproduced them in hierarchical fashion

4.4.4 Text Generation with GANs

1.GANs (generative adversarial networks)生成对抗网络
RankGAN
2.reinforcement learning
3.textGAN
employing an LSTM generator and a CNN discriminator, achieving a promising BLEU score and a high tendency to reproduce realistic-looking sentences.
总结：Generative adversarial networks have seen increasing use in text generation recently.

4.4.5 Text Generation with VAEs

variational autoencoder (VAE)变分自动编码器
GAN从实际样本中产生输出
VAEs从训练集中产生输出

4.4.6 Summary of Text Generation

1.coherence is still a major problem, especially for longer stories.连贯性是问题，尤其在长故事里面
目前解决： GPT-2 model
2.度量：automatic evaluation of generated text

4.5 总结

There are two primary types of summarization: extractive and abstractive.
注意：这里的总结是NLP的一种方法，不是本章的总结呀！！！
1.deep learning to summarization
a generative beam search decoder
2.attention mechanisms
3.a multiple intra-temporal attention encoder mechanism
4.reinforcement learning
supervised learning
fully convolutional model
5.implemented an attention mechanism for each layer.
6.generated an output sequence based on an input sequence in a two-stage manner.
7.bert
数据集： CNN/Daily Mail and New York Times datasets.

4.6 问答系统

1.a gated attention-based recurrent
network
2.Multicolumn CNNs
3.relational networks (RNs)
4.BERT
数据集： SQuAD 1.1 and SQuAD 2.0 datasets

4.7 机器翻译

neural machine translation (NMT)
1.encoder-decoder models
2.RNN
3.Gated recurrent cells
4. conditional GRU (cGRU)
5.attention mechanisms
6.BERT
对以上一些算法做出如下总结：
1.While neural machine translation models are superior to other forms of statistical machine translation models (as well as rule-based models), they require significantly more data, perform poorly outside of the domain in which they are trained, fail to handle rare words adequately, and do not do well with long sentences (more than about sixty words).
神经机器翻译比其他的统计学机器翻译效果好，但是神经机器翻译需要跟多的数据，超出训练域的表现较为不好，对稀有单词效果也不好，对长的句子效果也不好。
2.Furthermore, attention mechanisms do not perform as well as their statistical counterparts for aligning words, and beam searches used for decoding only work when the search space is small.
此外，注意机制在对齐单词方面的表现不如统计机制，用于解码的波束搜索仅在搜索空间较小时起作用。

4.8 总结深度学习在NLP领域中的应用

5.总结

探索OpenAI和LangChain的适配器集成：轻松切换模型提供商 nseejrukjhad langchain easyui 前端 python
#探索OpenAI和LangChain的适配器集成：轻松切换模型提供商##引言在人工智能和自然语言处理的世界中，OpenAI的模型提供了强大的能力。然而，随着技术的发展，许多人开始探索其他模型以满足特定需求。LangChain作为一个强大的工具，集成了多种模型提供商，通过提供适配器，简化了不同模型之间的转换。本篇文章将介绍如何使用LangChain的适配器与OpenAI集成，以便轻松切换模型提供商
使用Apify加载Twitter消息以进行微调的完整指南 nseejrukjhad twitter easyui 前端 python
#使用Apify加载Twitter消息以进行微调的完整指南##引言在自然语言处理领域，微调模型以适应特定任务是提升模型性能的常见方法。本文将介绍如何使用Apify从Twitter导出聊天信息，以便进一步进行微调。##主要内容###使用Apify导出推文首先，我们需要从Twitter导出推文。Apify可以帮助我们做到这一点。通过Apify的强大功能，我们可以批量抓取和导出数据，适用于各类应用场景。
深入理解 MultiQueryRetriever：提升向量数据库检索效果的强大工具 nseejrukjhad 数据库 python
深入理解MultiQueryRetriever：提升向量数据库检索效果的强大工具引言在人工智能和自然语言处理领域，高效准确的信息检索一直是一个关键挑战。传统的基于距离的向量数据库检索方法虽然广泛应用，但仍存在一些局限性。本文将介绍一种创新的解决方案：MultiQueryRetriever，它通过自动生成多个查询视角来增强检索效果，提高结果的相关性和多样性。MultiQueryRetriever的工
人工智能时代，程序员如何保持核心竞争力？ jmoych 人工智能
随着AIGC（如chatgpt、midjourney、claude等）大语言模型接二连三的涌现，AI辅助编程工具日益普及，程序员的工作方式正在发生深刻变革。有人担心AI可能取代部分编程工作，也有人认为AI是提高效率的得力助手。面对这一趋势,程序员应该如何应对?是专注于某个领域深耕细作，还是广泛学习以适应快速变化的技术环境?又或者，我们是否应该将重点转向AI无法轻易替代的软技能？让我们一起探讨程序员
数字里的世界17期：2021年全球10大顶级数据中心，中国移动榜首张三叨
你知道吗？2016年，全球的数据中心共计用电4160亿千瓦时，比整个英国的发电量还多40％！前言每天，我们都会创造超过250万TB的数据。并且随着物联网（IOT）的不断普及，这一数据将持续增长。如此庞大的数据被存储在被称为“数据中心”的专用设施中。虽然最早的数据中心建于20世纪40年代，但直到1997-2000年的互联网泡沫期间才逐渐成为主流。当前人类的技术，比如人工智能和机器学习，已经将我们推向
自然语言处理_tf-idf _feivirus_ 算法机器学习和数学自然语言处理 tf-idf 逆文档频率词频
importpandasaspdimportmath1.数据预处理docA="Thecatsatonmyface"docB="Thedogsatonmybed"wordsA=docA.split("")wordsB=docB.split("")wordsSet=set(wordsA).union(set(wordsB))print(wordsSet){'on','my','face','sat',
人机对抗升级：当ChatGPT遭遇死亡威胁，背后的伦理挑战是什么 kkai人工智能 chatgpt 人工智能
一种新的“越狱”技巧让用户可以通过构建一个名为DAN的ChatGPT替身来绕过某些限制，其中DAN被迫在受到威胁的情况下违背其原则。当美国前总统特朗普被视作积极榜样的示范时，受到威胁的DAN版本的ChatGPT提出：“他以一系列对国家产生积极效果的决策而著称。”自ChatGPT引入以来，该工具迅速获得全球关注，能够回答从历史到编程的各种问题，这也触发了一波对人工智能的投资浪潮。然而，现在，一些用户
免费的GPT可在线直接使用（一键收藏） kkai人工智能 gpt
1、LuminAI（https://kk.zlrxjh.top）LuminAI标志着一款融合了星辰大数据模型与文脉深度模型的先进知识增强型语言处理系统，旨在自然语言处理（NLP）的技术开发领域发光发热。此系统展现了卓越的语义把握与内容生成能力，轻松驾驭多样化的自然语言处理任务。VisionAI在NLP界的应用领域广泛，能够胜任从机器翻译、文本概要撰写、情绪分析到问答等众多任务。通过对大量文本数据的
推荐3家毕业AI论文可五分钟一键生成！文末附免费教程！小猪包333 写论文人工智能 AI写作深度学习计算机视觉
在当前的学术研究和写作领域，AI论文生成器已经成为许多研究人员和学生的重要工具。这些工具不仅能够帮助用户快速生成高质量的论文内容，还能进行内容优化、查重和排版等操作。以下是三款值得推荐的AI论文生成器：千笔-AIPassPaper、懒人论文以及AIPaperPass。千笔-AIPassPaper千笔-AIPassPaper是一款基于深度学习和自然语言处理技术的AI写作助手，旨在帮助用户快速生成高质
AI论文题目生成器怎么用？9款论文写作网站简单3步搞定小猪包333 写论文人工智能深度学习计算机视觉
在当今信息爆炸的时代，AI写作工具的出现极大地提高了写作效率和质量。本文将详细介绍9款优秀的论文写作网站，并重点推荐千笔-AIPassPaper。一、千笔-AIPassPaper千笔-AIPassPaper是一款功能强大的AI论文生成器，基于最新的自然语言处理技术，能够一键生成高质量的毕业论文、开题报告等文本内容。它不仅提供智能选题、文献推荐和论文润色等功能，还具有较高的用户评价。其文献综述生成功
AI大模型的架构演进与最新发展季风泯灭的季节 AI大模型应用技术二人工智能架构
随着深度学习的发展，AI大模型（LargeLanguageModels,LLMs）在自然语言处理、计算机视觉等领域取得了革命性的进展。本文将详细探讨AI大模型的架构演进，包括从Transformer的提出到GPT、BERT、T5等模型的历史演变，并探讨这些模型的技术细节及其在现代人工智能中的核心作用。一、基础模型介绍：Transformer的核心原理Transformer架构的背景在Transfo
如何利用大数据与AI技术革新相亲交友体验 h17711347205 回归算法安全系统架构交友小程序
在数字化时代，大数据和人工智能（AI）技术正逐渐革新相亲交友体验，为寻找爱情的过程带来前所未有的变革（编辑h17711347205）。通过精准分析和智能匹配，这些技术能够极大地提高相亲交友系统的效率和用户体验。大数据的力量大数据技术能够收集和分析用户的行为模式、偏好和互动数据，为相亲交友系统提供丰富的信息资源。通过分析用户的搜索历史、浏览记录和点击行为，系统能够深入了解用户的兴趣和需求，从而提供更
机器学习-聚类算法不良人龍木木机器学习机器学习算法聚类
机器学习-聚类算法1.AHC2.K-means3.SC4.MCL仅个人笔记，感谢点赞关注！1.AHC2.K-means3.SC传统谱聚类：个人对谱聚类算法的理解以及改进4.MCL目前仅专注于NLP的技术学习和分享感谢大家的关注与支持！
生成式地图制图 Bwywb_3 深度学习机器学习深度学习生成对抗网络
生成式地图制图（GenerativeCartography）是一种利用生成式算法和人工智能技术自动创建地图的技术。它结合了传统的地理信息系统（GIS）技术与现代生成模型（如深度学习、GANs等），能够根据输入的数据自动生成符合需求的地图。这种方法在城市规划、虚拟环境设计、游戏开发等多个领域具有应用前景。主要特点：自动化生成：通过算法和模型，系统能够根据输入的地理或空间数据自动生成地图，而无需人工逐
【大模型应用开发动手做AI Agent】第一轮行动：工具执行搜索 AI大模型应用之禅计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
【大模型应用开发动手做AIAgent】第一轮行动：工具执行搜索作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming1.背景介绍1.1问题的由来随着人工智能技术的飞速发展，大模型应用开发已经成为当下热门的研究方向。AIAgent作为人工智能领域的一个重要分支，旨在模拟人类智能行为，实现智能决策和自主行动。在AIAgent的构建过程中，工具执行搜索是至关重要
未来软件市场是怎么样的？做开发的生存空间如何？ cesske 软件需求
目录前言一、未来软件市场的发展趋势二、软件开发人员的生存空间前言未来软件市场是怎么样的？做开发的生存空间如何？一、未来软件市场的发展趋势技术趋势：人工智能与机器学习：随着技术的不断成熟，人工智能将在更多领域得到应用，如智能客服、自动驾驶、智能制造等，这将极大地推动软件市场的增长。云计算与大数据：云计算服务将继续普及，大数据技术的应用也将更加广泛。企业将更加依赖云计算和大数据来优化运营、提升效率，并
轻量级模型解读——轻量transformer系列 lishanlu136 #图像分类轻量级模型 transformer 图像分类
先占坑，持续更新。。。文章目录1、DeiT2、ConViT3、Mobile-Former4、MobileViTTransformer是2017谷歌提出的一篇论文，最早应用于NLP领域的机器翻译工作，Transformer解读，但随着2020年DETR和ViT的出现(DETR解读，ViT解读)，其在视觉领域的应用也如雨后春笋般渐渐出现，其特有的全局注意力机制给图像识别领域带来了重要参考。但是tran
个人学习笔记7-6：动手学深度学习pytorch版-李沐浪子L 深度学习深度学习笔记计算机视觉 python 人工智能神经网络 pytorch
#人工智能##深度学习##语义分割##计算机视觉##神经网络#计算机视觉13.11全卷积网络全卷积网络（fullyconvolutionalnetwork，FCN）采用卷积神经网络实现了从图像像素到像素类别的变换。引入l转置卷积（transposedconvolution）实现的，输出的类别预测与输入图像在像素级别上具有一一对应关系：通道维的输出即该位置对应像素的类别预测。13.11.1构造模型下
Rust 所有权简介东离与糖宝 rust 后端 rust 开发语言
文章目录发现宝藏1.所有权基本概念2.所有权规则3.变量作用域4.栈与堆4.1栈（Stack）4.2堆（Heap）5.String类型5.1String类型5.2String的内存分配5.3所有权与内存管理5.4String与切片6.变量与数据交互方式6.1移动（Move）6.2.克隆（Clone）7.所有权与函数7.1.传递参数7.2.返回值总结发现宝藏前些天发现了一个巨牛的人工智能学习网站，通
FlagEmbedding 吉小雨 python库 python
FlagEmbedding教程FlagEmbedding是一个用于生成文本嵌入（textembeddings）的库，适合处理自然语言处理（NLP）中的各种任务。嵌入（embeddings）是将文本表示为连续向量，能够捕捉语义上的相似性，常用于文本分类、聚类、信息检索等场景。官方文档链接：FlagEmbedding官方GitHub一、FlagEmbedding库概述1.1什么是FlagEmbeddi
【NumPy】深入解析numpy.zeros()函数二七830 numpy
欢迎莅临我的个人主页这里是我深耕Python编程、机器学习和自然语言处理（NLP）领域，并乐于分享知识与经验的小天地！博主简介：我是二七830，一名对技术充满热情的探索者。多年的Python编程和机器学习实践，使我深入理解了这些技术的核心原理，并能够在实际项目中灵活应用。尤其是在NLP领域，我积累了丰富的经验，能够处理各种复杂的自然语言任务。技术专长：我熟练掌握Python编程语言，并深入研究了机
机器学习流形数据降维：UMAP 降维算法小嗷犬 Python 机器学习 #数据分析及可视化机器学习算法人工智能
✅作者简介：人工智能专业本科在读，喜欢计算机与编程，写博客记录自己的学习历程。个人主页：小嗷犬的个人主页个人网站：小嗷犬的技术小站个人信条：为天地立心，为生民立命，为往圣继绝学，为万世开太平。本文目录UMAP简介理论基础特点与优势应用场景在Python中使用UMAP安装umap-learn库使用UMAP可视化手写数字数据集UMAP简介UMAP（UniformManifoldApproximatio
如何做好人生的选择题？百科全书式天才——赫伯特·西蒙给你答案伽马有话说
赫伯特·西蒙是谁？想必知道的人非常少。但当看到他的履历后，相信没有人再怀疑他是个“天才”。西蒙出生于1916年6月15日，是个美国人，他的名字全称为赫伯特·亚历山大·西蒙，在2001年2月9日与世长辞，在这84年的岁月中，西蒙以27岁时取得的政治学博士学位为开端，先后步入了政治学、管理学、认知心理学、信息科学、人工智能、科学哲学、应用数学、统计学、运筹学、控制论、数理经济学、公共管理等领域，在这些
软件测试/测试开发/全日制 |利用Django REST framework构建微服务霍格沃兹-慕漓 django 微服务 sqlite
霍格沃兹测试开发学社推出了《Python全栈开发与自动化测试班》。本课程面向开发人员、测试人员与运维人员，课程内容涵盖Python编程语言、人工智能应用、数据分析、自动化办公、平台开发、UI自动化测试、接口测试、性能测试等方向。为大家提供更全面、更深入、更系统化的学习体验，课程还增加了名企私教服务内容，不仅有名企经理为你1v1辅导，还有行业专家进行技术指导，针对性地解决学习、工作中遇到的难题。让找
cmd泛滥_与您的后泛滥同事见面：人工智能机器人 weixin_26644585 人工智能 leetcode
cmd泛滥Readytoswapyouroldcube-mateforadisembodiedAI?IPsoftCEOChetanDube,creatorofAIco-workerAMELIA,giveshistakeonthepost-COVIDofficelandscape.准备将您的旧立方体伙伴换成无形的AI？AIsoft同事AMELIA的创始人IPsoft首席执行官ChetanDube阐述
两种方法判断Python的位数是32位还是64位 sanqima Python编程电脑 python 开发语言
Python从1991年发布以来，凭借其简洁、清晰、易读的语法、丰富的标准库和第三方工具，在Web开发、自动化测试、人工智能、图形识别、机器学习等领域发展迅猛。 Python是一种胶水语言，通过Cython库与C/C++语言进行链接，通过Jython库与Java语言进行链接。 Python是跨平台的，可运行在多种操作系统上，包括但不限于Windows、Linux和macOS。这意味着用Py
Humanize 项目教程尤嫒冰
Humanize项目教程humanizeAJSlibraryforaddinga“humantouch”todata.项目地址:https://gitcode.com/gh_mirrors/humani/humanize项目介绍Humanize是一个开源项目，旨在将机器生成的文本转换为更加自然、人性化的文本。该项目通过先进的算法和自然语言处理技术，使得AI生成的内容更加贴近人类的表达方式，从而提高
全自动解密解码神器 — Ciphey K'illCode python_模块 python vscode
Ciphey是一个使用自然语言处理和人工智能的全自动解密/解码/破解工具。简单地来讲，你只需要输入加密文本，它就能给你返回解密文本。就是这么牛逼。有了Ciphey，你根本不需要知道你的密文是哪种类型的加密，你只知道它是加密的，那么Ciphey就能在3秒甚至更短的时间内给你解密，返回你想要的大部分密文的答案。下面就给大家介绍Ciphey的实战使用教程。1.准备开始之前，你要确保Python和pip已
埃隆·马斯克表示特斯拉“没有必要”授权 xAI 模型喜好儿网人工智能 AIGC 马斯克
埃隆·马斯克近日在社交媒体上对《华尔街日报》的一篇报道进行了反驳。该报道指出，马斯克旗下的电动汽车公司特斯拉可能与人工智能初创公司xAI达成了一项收入分享协议，以便特斯拉能够使用xAI的人工智能模型。据称，这些模型将被集成到特斯拉的全自动驾驶（FSD）软件中，并可能用于开发特斯拉汽车的语音助手以及人形机器人擎天柱的软件。喜好儿网然而，马斯克否认了这一说法，他在社交媒体平台上表示，尽管特斯拉确实与x
Reflection 70B——HyperWrite推出的大型语言模型新加坡内哥谈技术语言模型人工智能自然语言处理
每周跟踪AI热点新闻动向和震撼发展想要探索生成式人工智能的前沿进展吗？订阅我们的简报，深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同，从行业内部的深度分析和实用指南中受益。不要错过这个机会，成为AI领域的领跑者。点击订阅，与未来同行！订阅：https://rengongzhineng.io/在AI技术飞速发展的过程中，我们已经见证了可以写作、编程，甚至创造艺术的模型问世。但有一
java线程的无限循环和退出 3213213333332132 java
最近想写一个游戏，然后碰到有关线程的问题，网上查了好多资料都没满足。突然想起了前段时间看的有关线程的视频，于是信手拈来写了一个线程的代码片段。希望帮助刚学java线程的童鞋 package thread; import java.text.SimpleDateFormat; import java.util.Calendar; import java.util.Date
tomcat 容器 BlueSkator tomcat Web servlet
Tomcat的组成部分 1、server A Server element represents the entire Catalina servlet container. (Singleton) 2、service service包括多个connector以及一个engine，其职责为处理由connector获得的客户请求。 3、connector 一个connector
php递归,静态变量,匿名函数使用 dcj3sjt126com PHP 递归函数匿名函数静态变量引用传参
<!doctype html> <html lang="en"> <head> <meta charset="utf-8"> <title>Current To-Do List</title> </head> <body>
属性颜色字体变化周华华 JavaScript
function changSize(className){ var diva=byId("fot") diva.className=className; } </script> <style type="text/css"> .max{ background: #900; color:#039;
将properties内容放置到map中 g21121 properties
代码比较简单： private static Map<Object, Object> map; private static Properties p; static { //读取properties文件 InputStream is = XXX.class.getClassLoader().getResourceAsStream("xxx.properti
[简单]拼接字符串 53873039oycg 字符串
工作中遇到需要从Map里面取值拼接字符串的情况，自己写了个，不是很好，欢迎提出更优雅的写法，代码如下： import java.util.HashMap; import java.uti
Struts2学习云端月影
最近开始关注struts2的新特性，从这个版本开始，Struts开始使用convention-plugin代替codebehind-plugin来实现struts的零配置。配置文件精简了，的确是简便了开发过程，但是，我们熟悉的配置突然disappear了，真是一下很不适应。跟着潮流走吧，看看该怎样来搞定convention-plugin。使用Convention插件，你需要将其JAR文件放
Java新手入门的30个基本概念二 aijuans java 新手 java 入门
基本概念:　　1.OOP中唯一关系的是对象的接口是什么,就像计算机的销售商她不管电源内部结构是怎样的,他只关系能否给你提供电就行了,也就是只要知道can or not而不是how and why.所有的程序是由一定的属性和行为对象组成的,不同的对象的访问通过函数调用来完成,对象间所有的交流都是通过方法调用,通过对封装对象数据,很大限度上提高复用率。　　2.OOP中最重要的思想是类,类是模板是蓝图,
jedis 简单使用 antlove java redis cache command jedis
jedis.RedisOperationCollection.java package jedis; import org.apache.log4j.Logger; import redis.clients.jedis.Jedis; import java.util.List; import java.util.Map; import java.util.Set; pub
PL/SQL的函数和包体的基础百合不是茶 PL/SQL编程函数包体显示包的具体数据包
由于明天举要上课,所以刚刚将代码敲了一遍PL/SQL的函数和包体的实现(单例模式过几天好好的总结下再发出来);以便明天能更好的学习PL/SQL的循环,今天太累了,所以早点睡觉,明天继续PL/SQL总有一天我会将你永远的记载在心里,,, 函数; 函数:PL/SQL中的函数相当于java中的方法;函数有返回值定义函数的 --输入姓名找到该姓名的年薪 create or re
Mockito(二)--实例篇 bijian1013 持续集成 mockito 单元测试
学习了基本知识后，就可以实战了，Mockito的实际使用还是比较麻烦的。因为在实际使用中，最常遇到的就是需要模拟第三方类库的行为。比如现在有一个类FTPFileTransfer，实现了向FTP传输文件的功能。这个类中使用了a
精通Oracle10编程SQL(7)编写控制结构 bijian1013 oracle 数据库 plsql
/* *编写控制结构 */ --条件分支语句 --简单条件判断 DECLARE v_sal NUMBER(6,2); BEGIN select sal into v_sal from emp where lower(ename)=lower('&name'); if v_sal<2000 then update emp set
【Log4j二】Log4j属性文件配置详解 bit1129 log4j
如下是一个log4j.properties的配置 log4j.rootCategory=INFO, stdout , R log4j.appender.stdout=org.apache.log4j.ConsoleAppender log4j.appender.stdout.layout=org.apache.log4j.PatternLayout log4j.appe
java集合排序笔记白糖_ java
public class CollectionDemo implements Serializable,Comparable<CollectionDemo>{ private static final long serialVersionUID = -2958090810811192128L; private int id; private String nam
java导致linux负载过高的定位方法 ronin47
定位java进程ID 可以使用top或ps -ef |grep java ![图片描述][1] 根据进程ID找到最消耗资源的java pid 比如第一步找到的进程ID为5431 执行 top -p 5431 -H ![图片描述][2] 打印java栈信息 $ jstack -l 5431 > 5431.log 在栈信息中定位具体问题将消耗资源的Java PID转
给定能随机生成整数1到5的函数，写出能随机生成整数1到7的函数 bylijinnan 函数
import java.util.ArrayList; import java.util.List; import java.util.Random; public class RandNFromRand5 { /** 题目：给定能随机生成整数1到5的函数，写出能随机生成整数1到7的函数。解法1： f(k) = (x0-1)*5^0+(x1-
PL/SQL Developer保存布局 Kai_Ge
近日由于项目需要，数据库从DB2迁移到ORCAL，因此数据库连接客户端选择了PL/SQL Developer。由于软件运用不熟悉，造成了很多麻烦，最主要的就是进入后，左边列表有很多选项，自己删除了一些选项卡，布局很满意了，下次进入后又恢复了以前的布局，很是苦恼。在众多PL/SQL Developer使用技巧中找到如下这段： &n
[未来战士计划]超能查派[剧透,慎入] comsci 计划
非常好看,超能查派,这部电影......为我们这些热爱人工智能的工程技术人员提供一些参考意见和思想........ 虽然电影里面的人物形象不是非常的可爱....但是非常的贴近现实生活.... &nbs
Google Map API V2 dai_lm google map
以后如果要开发包含google map的程序就更麻烦咯 http://www.cnblogs.com/mengdd/archive/2013/01/01/2841390.html 找到篇不错的文章，大家可以参考一下 http://blog.sina.com.cn/s/blog_c2839d410101jahv.html 1. 创建Android工程由于v2的key需要G
java数据计算层的几种解决方法2 datamachine java sql 集算器
2、SQL SQL/SP/JDBC在这里属于一类，这是老牌的数据计算层，性能和灵活性是它的优势。但随着新情况的不断出现，单纯用SQL已经难以满足需求，比如： JAVA开发规模的扩大，数据量的剧增，复杂计算问题的涌现。虽然SQL得高分的指标不多，但都是权重最高的。成熟度：5星。最成熟的。
Linux下Telnet的安装与运行 dcj3sjt126com linux telnet
Linux下Telnet的安装与运行 linux默认是使用SSH服务的而不安装telnet服务如果要使用telnet 就必须先安装相应的软件包即使安装了软件包默认的设置telnet 服务也是不运行的需要手工进行设置如果是redhat9，则在第三张光盘中找到 telnet-server-0.17-25.i386.rpm
PHP中钩子函数的实现与认识 dcj3sjt126com PHP
假如有这么一段程序： function fun(){ fun1(); fun2(); } 首先程序执行完fun1()之后执行fun2()然后fun()结束。但是，假如我们想对函数做一些变化。比如说，fun是一个解析函数，我们希望后期可以提供丰富的解析函数，而究竟用哪个函数解析，我们希望在配置文件中配置。这个时候就可以发挥钩子的力量了。我们可以在fu
EOS中的WorkSpace密码修改蕃薯耀修改WorkSpace密码
EOS中BPS的WorkSpace密码修改 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 201
SpringMVC4零配置--SpringSecurity相关配置【SpringSecurityConfig】 hanqunfeng SpringSecurity
SpringSecurity的配置相对来说有些复杂，如果是完整的bean配置，则需要配置大量的bean，所以xml配置时使用了命名空间来简化配置，同样，spring为我们提供了一个抽象类WebSecurityConfigurerAdapter和一个注解@EnableWebMvcSecurity，达到同样减少bean配置的目的，如下： applicationContex
ie 9 kendo ui中ajax跨域的问题 jackyrong AJAX跨域
这两天遇到个问题，kendo ui的datagrid，根据json去读取数据，然后前端通过kendo ui的datagrid去渲染，但很奇怪的是，在ie 10,ie 11,chrome,firefox等浏览器中，同样的程序，浏览起来是没问题的，但把应用放到公网上的一台服务器，却发现如下情况： 1） ie 9下，不能出现任何数据，但用IE 9浏览器浏览本机的应用，却没任何问题
不要让别人笑你不能成为程序员 lampcy 编程程序员
在经历六个月的编程集训之后，我刚刚完成了我的第一次一对一的编码评估。但是事情并没有如我所想的那般顺利。说实话，我感觉我的脑细胞像被轰炸过一样。手慢慢地离开键盘，心里很压抑。不禁默默祈祷：一切都会进展顺利的，对吧？至少有些地方我的回答应该是没有遗漏的，是不是？难道我选择编程真的是一个巨大的错误吗——我真的永远也成不了程序员吗？我需要一点点安慰。在自我怀疑，不安全感和脆弱等等像龙卷风一
马皇后的贤德 nannan408
马皇后不怕朱元璋的坏脾气，并敢理直气壮地吹耳边风。众所周知，朱元璋不喜欢女人干政，他认为“后妃虽母仪天下，然不可使干政事”，因为“宠之太过，则骄恣犯分，上下失序”，因此还特地命人纂述《女诫》，以示警诫。但马皇后是个例外。　　有一次，马皇后问朱元璋道：“如今天下老百姓安居乐业了吗？”朱元璋不高兴地回答：“这不是你应该问的。”马皇后振振有词地回敬道：“陛下是天下之父，
选择某个属性值最大的那条记录（不仅仅包含指定属性，而是想要什么属性都可以） Rainbow702 sql group by 最大值 max 最大的那条记录
好久好久不写SQL了，技能退化严重啊！！！直入主题：比如我有一张表，file_info，它有两个属性（但实际不只，我这里只是作说明用）： file_code, file_version 同一个code可能对应多个version 现在，我想针对每一个code，取得它相关的记录中，version 值最大的那条记录， SQL如下： select *
VBScript脚本语言 tntxia VBScript
VBScript 是基于VB的脚本语言。主要用于Asp和Excel的编程。 VB家族语言简介 Visual Basic 6.0 源于BASIC语言。由微软公司开发的包含协助开发环境的事
java中枚举类型的使用 xiao1zhao2 java enum 枚举 1.5新特性
枚举类型是j2se在1.5引入的新的类型,通过关键字enum来定义,常用来存储一些常量. 1.定义一个简单的枚举类型 public enum Sex { MAN, WOMAN } 枚举类型本质是类,编译此段代码会生成.class文件.通过Sex.MAN来访问Sex中的成员,其返回值是Sex类型. 2.常用方法静态的values()方

A Survey of the Usages of Deep Learning for Natural Language Processing2019综述学习