fly_Xiaoma

NLP面试题总结（包含8种优化器简介）.03

part 1.

1. 介绍一下几种优化器

1.1 SGD(Stochastic Gradient Descent)

1.2 BGD（Batch Gradient Descent）

1.3 MBGD（Mini-Batch Gradient Descent）

1.4 Momentum

1.5 Adagrad(Adaptive gradient algorithm)

1.6 Adadelta

1.7 RMSprop

1.8 Adam(Adaptive Moment Estimation)

2. LSTM里面有哪些门，为什么用这些门？

3.LSTM里面为什么有些激活函数用sigmoid，有些用tanh？

4. Bert中的位置向量作用是什么？有哪些生成方式？

part 2.

1. 浅copy和深copy的概念

2. Python中的self关键字

3. Python中类的继承

4. 完全二叉树的概念

5. 单链表与顺序表的区别

6. 给出二叉树的前序遍历(preorder)和中序遍历(inorder)，重建该二叉树：

7.反转一个链表，并返回头结点

part 1.

1. 介绍一下几种优化器

在机器学习与深度学习中，主要应用于梯度下降。如，传统的优化器主要结合数据集，通过变化单次循环所采用的数据量的大小对梯度下降进行控制；非传统的优化器则进一步集合数据集的特点和模型的训练时间，以不同的形式变化梯度下降的学习率。

常见的优化器有SGD、BGD、MBGD、Momentum、Adagrad、RMSprop、Adam。

梯度下降的原理：

$\large \theta ^{n+1}=\theta^n +\eta \nabla\theta J(\theta)$

其中， $\eta$ 为学习率， $\theta ^n$ 为更新前的参数， $\theta ^{n+1}$ 为更新后的参数， $\nabla\theta J(\theta)$ 为当前参数的导数。

1.1 SGD(Stochastic Gradient Descent)

SGD随机梯度下降参数更新原则：单条数据就可对参数进行一次更新。

优点：参数更新速度快。

缺点：由于每次参数更新时采用的数据量小，造成梯度更新时震荡幅度大，但大多数情况是向着梯度减小的方向。

for n in n_epochs:
    for data in train_dataset:
        #对参数进行一次更新

1.2 BGD（Batch Gradient Descent）

BGD批量梯度下降参数更新原则：所有数据都参与梯度的每一次更新（一个batch中每个参数需要更新的梯度取均值作为更新值）。

优点：由于每次参数更新时采用的数据量大，所以梯度更新时比较平滑。

缺点：由于参数更新时需要的数据量大，造成参数更新速度慢。

for n in n_epochs:
    for data in train_dataset:
        #计算每个参数所有梯度的均值作为一次更新的梯度，对参数进行一次更新

1.3 MBGD（Mini-Batch Gradient Descent）

MBGD小批量梯度参数更新原则：只有所有数据的一部分进行参数的更新。

优点：相比于SGD，由于参与梯度更新的数据量大，所以梯度更新时相对平滑；相比于BGD，参与梯度更新的数据量小，参数更新速度更快一些。

缺点：没有考虑到数据集的稀疏度和模型的训练时间对参数更新的影响。

n=0
while n <= n_epochs:
    for minibatch_traindataset in train_dataset:
        if n <= n_epochs:
            n+=1
            for i in minibatch_traindataset:
                #计算每个参数更新的梯度的均值作为一次更新的梯度进行参数更新
          else:break

1.4 Momentum

Momentum解决的问题是：SGD梯度下降时的震荡问题。

Momentum参数更新原则：通过引入 $\gamma v_n$ ，加速SGD，并且抑制震荡。（MBGD是通过小批量数据来平滑梯度更新，方法不同而已）

更新公式：

$\large v_{n+1}=\gamma v_n +\eta \theta J(\theta)$

$\large \theta^{n+1}=\theta^n -v_{n+1}$

超参数设定值： $\gamma$ 一般取 0.9 左右。

优点：通过加入 $\gamma v_n$ ，使得梯度方向不变的维度上速度变快，梯度方向改变的维度上更新速度变慢，这样就可以加快收敛并减小震荡。

缺点：梯度方向不变时，参数更新速度会越来越快，但是在梯度方向改变时，梯度更新速度不能及时减小导致适应性差。

1.5 Adagrad(Adaptive gradient algorithm)

Adagrad解决的问题：解决不能根据参数重要性而对不同参数进行不同程度更新问题。

Adagrad参数更新原则：对低频的参数做较大的更新，对高频的参数做较小的更新。

更新公式：

$\large \theta_{t+1,i}=\theta_{t,i}- {{\eta}\over{\sqrt{G_{t,ii}}} }g_{t,i}$

其中，g为t时刻 $\large \theta_i$ 的梯度； $\large g_{t,i}=\nabla \theta J(\theta_i)$ ， $\large G_{t,ii}$ 是个对角矩阵， $\large (i,i)$ 元素就是t时刻参数 $\large \theta_i$ 的梯度平方和。

如果是普通的SGD，那么 $\large \theta_i$ 在每一时刻的梯度更新公式为：

$\large \theta_{t+1,i}=\theta_{t,i} - \eta g_{t,i}$ ，超参数 $\large \eta$ 选取0.01 。

优点：减少了学习率的手动调节。

缺点：分母会不断积累，导致学习率会收缩并最终变得很小。

1.6 Adadelta

Adadelta解决的问题：解决Adagrad分母不断积累，导致学习率收缩变得非常小的问题。

Adadelta参数更新原则：和Adagrad相比，就是分母的 $\large G_{t,ii}$ 换成了过去的梯度平方的衰减平均值，指数衰减平均值。

$\large \Delta \theta_t=- {\eta \over{ \sqrt{E[g^2]_t} +\epsilon }}g_{t.}$

这个分母相当于梯度的均方根（root mean squared，RMS），在数据统计分析中，将所有值平方求和，求其均值，再开平方，就得到均方根值，所以可以用RMS简写：

$\large \Delta \theta_t=- {\eta \over {RMS[g]_{t.}}}g_{t.}$

其中，E的计算公式如下， t时刻的依赖于前一时刻的平均和当前的梯度：

$\large E[g^2]_t=\gamma E[g^2]_{t-1} +(1+\gamma )g^2_{t.}$

此外，还将学习率 $\large \eta$ 换成了 $\large RMSE(\Delta \theta)$ ，这样甚至都不需要提前设定学习率，更新公式为：

$\large \Delta \theta_t=- {{RMS[\Delta \theta]} \over {RMS[g]_t}} g_{t.}$

$\large \theta_{t+1}=\theta_t + \Delta \theta_{t.}$ ，超参数 $\large \gamma$ 一般设定为0.9 。

优点：减少了学习率的手动调节。

1.7 RMSprop

RMSprop解决的问题：RMSProp和Adadelta 都是为了解决Adagrad学习率急剧下降问题。

参数更新原则：RMSprop与Adadelta第一种形式相同：使用的是指数加权平均，旨在消除梯度下降中的摆动，与Momentum的效果一样，某一维度的导数比较大，则指数加权平均就大，某一维度的导数比较小，则其指数加权平均就小，这样就保证了各维度导数都在一个量级，进而减少了摆动，允许使用一个较大的学习率 $\large \eta$ 。

更新公式：

$\large E[g^2]_t=0.9E[g^2]_{t-1} +0.1g^2_t$

$\large \theta_{t+1} =\theta_t -{\eta \over {\sqrt{E[g^2_t] + \epsilon } }}g_{t.}$

1.8 Adam(Adaptive Moment Estimation)

Adam解决的问题：这个算法是另一种计算每个参数的自适应学习率的方法。

Adam参数更新原则：相当于RMSprop + Momentum。除了像Adadelt 和RMSprop一样存储了过去梯度的平方 $\large v_t$ 的指数衰减平均值，也像Momentum一样保持了过去梯度 $\large m_t$ 的指数衰减平均值：

$\large m_t=\beta _1m_{t-1} +(1-\beta_1)g_{t.}$

$\large v_t=\beta_2v_{t-1} + (1-\beta_2)g^2_{t.}$

$\large \widehat{m}_t ={m_t \over {1-\beta^t_1}}$

$\large \widehat{v}_t={v_t \over {1-\beta_2^t}}$

梯度更新公式：

$\large \theta_{t+1}=\theta_t - {\eta \over{\sqrt {\widehat{v}_t}} +\varepsilon }\widehat{m}_{t.}$

2. LSTM里面有哪些门，为什么用这些门？

遗忘门：将细胞状态中的信息选择性遗忘。
输入门：将新的信息选择性的记录到细胞状态中。
输出门：当前细胞的信息保存到隐层中。

3.LSTM里面为什么有些激活函数用sigmoid，有些用tanh？

sigmoid用在LSTM的三个门里，作用在前一个状态和输出上，主要功能是让神经元对过去输入和前一个状态的信息选择性输入，它的输出范围是（0,1），0是丢弃，1是保留；
tanh是用在后一个状态和输出上，是对数据的处理。它的输出范围是（-1,1），功能是对哪些输出信息放大，对哪些输出信息缩小。

4. Bert中的位置向量作用是什么？有哪些生成方式？

1.位置向量的作用是表示每个单词token 距离目标单词的远近，每个token 的位置向量表示形式可以是one-hot形式，将它们合起来就是一个随机矩阵；也可以说随机id形式。

2.论文中Bert的位置向量是通过余弦函数生成，位置向量的维度和word embedding维度相同都是512维，其中位置向量的前一半通过正弦生成，后一半（后面256的长度）是通过余弦生成的。

part 2.

1. 浅copy和深copy的概念

在Python中对象的赋值其实就是对象的引用。当创建一个对象，并把它赋值给另外一个对象时，Python并没有拷贝这个对象，只是拷贝了这个对象的引用。

浅copy：拷贝了最外围的对象本身，内部的元素只是拷贝了一个引用；也就是把对象复制一遍，但是对象中引用的其他对象并不复制。比如，对于嵌套数组的浅拷贝，仅仅是拷贝外围数组元素对象，内部数组对象并不拷贝，仅拷贝引用。

深copy：外围和内部元素都进行拷贝对象本身，而不是引用。

# ---拷贝---
alist=[1, 2, 3, ['a', 'b']]
b=alist
print（ b）
[1, 2, 3, ['a', 'b']]

alist.append(5)
print (alist)
print(b)
[1, 2, 3, ['a', 'b'], 5]
[1, 2, 3, ['a', 'b'], 5]

#---浅拷贝---没有拷贝子对象，所以原始数据改变，子对象会改变
# 总的来说就是，浅拷贝之后，仅仅子对象与原始数据有关系
import copy
alist=[1, 2, 3, ['a', 'b'], 5]
c=copy.copy(alist)
alist.append(5)
print(alist,c)
#输出
[1, 2, 3, ['a', 'b'], 5]
[1, 2, 3, ['a', 'b']]
alist[3].append('ccc')
print(alist,c)
#输出
[1, 2, 3, ['a', 'b', 'cccc'], 5]
[1, 2, 3, ['a', 'b', 'cccc']] 里面的子对象被改变了

# ---深拷贝---包含对象里面自对象的拷贝，所以原始对象的改变并不会造成深拷贝里面任何子元素的改变
# 总的来说就是，深拷贝之后，与原始数据已经没有关系了
[1, 2, 3, ['a', 'b'], 5]
d=copy.deepcopy(alist)
alist.append(5)
print(alist,d)
#输出
[1, 2, 3, ['a', 'b'], 5]
[1, 2, 3, ['a', 'b']]始终没有改变
alist[3].append('ccc')
print(alist,d)
#输出：
[1, 2, 3, ['a', 'b', 'ccccc'], 5]
[1, 2, 3, ['a', 'b']]  始终没有改变

2. Python中的self关键字

在Python中规定，函数的第一个参数是实例对象本身，并且约定俗成，把其名字写成self。作用类似于Java中的this关键字，表达当前类的对象，可以调用当前类的属性和方法。

3. Python中类的继承

面向对象编程的一个主要功能是继承。继承指的是，它可以使用现有类的所有功能，并在无需重写编写现有类的情况下对这些功能进行扩展。

通过继承创建的类称为子类或派生类，被继承的类称为基类或者父类，继承的过程就是从一般到特殊的过程。在某些面向对象语言中，一个子类可以继承多个基类，但一般情况下一个子类只能有一个基类。

继承的实现方式有两种：实现继承和接口继承：

实现继承指的是使用基类的属性和方法而无需额外编码的能力。
接口继承指的是仅使用属性和方法的名称，但是子类必须提供实现的能力（子类重构父类方法）。

4. 完全二叉树的概念

二叉树：树中每个节点最多有两个子节点

二叉搜索树：对于树中任何节点，如果其左子节点不为空，那么该节点的value值永远>=其左子节点；如果其右子节点不为空，那么该节点值永远<=其右子节点值。

满二叉树：树中除了叶子节点外，每个节点有2个子节点。

完全二叉树：在满足满二叉树的性质后，最后一层的叶子节点均需在最左边

完美二叉树：满足完全二叉树的性质，树的叶子节点均在最后一层。

5. 单链表与顺序表的区别

顺序表和链表是非常基本的数据结构，它们被统称为线性表，顺序表和链表是线性表的不同存储结构。

顺序表的特点是：

长度固定，必须在分配内存之前固定数组的长度；
存储空间连续，即允许元素的随机访问；
存储密度大，内存中存储的全部是数据元素；、
要访问特定元素，可以使用索引访问；
要想在顺序表插入或删除一个元素，都涉及到之后所有元素的移动。

而单链表是只包含指向下一个节点的指针，只能单向遍历，它的特点是：

长度不固定，可以任意增删；
存储空间不连续，数据元素之间使用指针相连，每个数据元素只能访问周围的一个元素（区别于双链表）；
存储密度小，因为每个数据元素，都需要额外存储一个指向下一个元素的指针；
要访问特定元素，只能从链表头开始，遍历到该元素（顺序表只用索引查找即可）
在特定元素之后插入或删除元素，不需要移动其他元素。

6. 给出二叉树的前序遍历(preorder)和中序遍历(inorder)，重建该二叉树：

思路：使用递归，递归的出口就是inorder为空；首先从preorder中找到根节点，然后在inorder中找到根节点的索引index；在 inorder中，index之前的左子树的节点，后面就是右子树的节点

class Solution:
    def buildTree(self,preorder,inorder):
        if not inorder:return None
        root=TreeNode(preorder.pop(0))
        index=inorder.index(root.val)
        
        root.left=self.buildTree(preorder,inorder[:index])
        root.right=self.buildTree(preorder,inorder[index+1:])
        return root

7.反转一个链表，并返回头结点

class Solution:
    def reverseList(self, head):
        if not head or not head.next:return None
        prev=None
        cur=head
        while cur:
            tmp=cur.next
            cur.next=prev
            prev=cur
            cur=tmp
         return prev

免费的GPT可在线直接使用（一键收藏） kkai人工智能 gpt
1、LuminAI（https://kk.zlrxjh.top）LuminAI标志着一款融合了星辰大数据模型与文脉深度模型的先进知识增强型语言处理系统，旨在自然语言处理（NLP）的技术开发领域发光发热。此系统展现了卓越的语义把握与内容生成能力，轻松驾驭多样化的自然语言处理任务。VisionAI在NLP界的应用领域广泛，能够胜任从机器翻译、文本概要撰写、情绪分析到问答等众多任务。通过对大量文本数据的
机器学习-聚类算法不良人龍木木机器学习机器学习算法聚类
机器学习-聚类算法1.AHC2.K-means3.SC4.MCL仅个人笔记，感谢点赞关注！1.AHC2.K-means3.SC传统谱聚类：个人对谱聚类算法的理解以及改进4.MCL目前仅专注于NLP的技术学习和分享感谢大家的关注与支持！
轻量级模型解读——轻量transformer系列 lishanlu136 #图像分类轻量级模型 transformer 图像分类
先占坑，持续更新。。。文章目录1、DeiT2、ConViT3、Mobile-Former4、MobileViTTransformer是2017谷歌提出的一篇论文，最早应用于NLP领域的机器翻译工作，Transformer解读，但随着2020年DETR和ViT的出现(DETR解读，ViT解读)，其在视觉领域的应用也如雨后春笋般渐渐出现，其特有的全局注意力机制给图像识别领域带来了重要参考。但是tran
FlagEmbedding 吉小雨 python库 python
FlagEmbedding教程FlagEmbedding是一个用于生成文本嵌入（textembeddings）的库，适合处理自然语言处理（NLP）中的各种任务。嵌入（embeddings）是将文本表示为连续向量，能够捕捉语义上的相似性，常用于文本分类、聚类、信息检索等场景。官方文档链接：FlagEmbedding官方GitHub一、FlagEmbedding库概述1.1什么是FlagEmbeddi
【NumPy】深入解析numpy.zeros()函数二七830 numpy
欢迎莅临我的个人主页这里是我深耕Python编程、机器学习和自然语言处理（NLP）领域，并乐于分享知识与经验的小天地！博主简介：我是二七830，一名对技术充满热情的探索者。多年的Python编程和机器学习实践，使我深入理解了这些技术的核心原理，并能够在实际项目中灵活应用。尤其是在NLP领域，我积累了丰富的经验，能够处理各种复杂的自然语言任务。技术专长：我熟练掌握Python编程语言，并深入研究了机
CV、NLP、数据控掘推荐、量化海的那边- AI算法自然语言处理人工智能
下面是对CV（计算机视觉）、NLP（自然语言处理）、数据挖掘推荐和量化的简要概述及其应用领域的介绍：1.CV（计算机视觉，ComputerVision）定义：计算机视觉是一门让计算机能够从图像或视频中提取有用信息，并做出决策的学科。它通过模拟人类的视觉系统来识别、处理和理解视觉信息。主要任务：图像分类：识别图像中的物体并分类，比如猫、狗、车等。目标检测：在图像或视频中定位并识别多个对象，如人脸检测
深度解析：如何使用输出解析器将大型语言模型（LLM）的响应解析为结构化JSON格式 m0_57781768 语言模型 json 人工智能
深度解析：如何使用输出解析器将大型语言模型（LLM）的响应解析为结构化JSON格式在现代自然语言处理（NLP）的应用中，大型语言模型（LLM）已经成为了重要的工具。这些模型能够生成丰富的自然语言文本，适用于各种应用场景。然而，在某些应用中，开发者不仅仅需要生成文本，还需要将这些生成的文本转换为结构化的数据格式，例如JSON。这种结构化的数据格式在数据传输、存储以及进一步处理时具有显著优势。本文将深
使用LangChain和OpenAI实现高效文本标注 aehrutktrjk langchain python
使用LangChain和OpenAI实现高效文本标注引言在自然语言处理(NLP)领域，文本标注是一项重要且常见的任务。它涉及为文本分配标签，如情感、语言、风格等。本文将介绍如何使用LangChain和OpenAI的API来实现高效的文本标注系统。我们将探讨如何设置环境、定义标注模式，以及如何使用OpenAI的模型来执行标注任务。环境准备首先，我们需要安装必要的库并设置API密钥：%pipinsta
【NLP5-RNN模型、LSTM模型和GRU模型】一蓑烟雨紫洛 nlp rnn lstm gru nlp
RNN模型、LSTM模型和GRU模型1、什么是RNN模型RNN（RecurrentNeuralNetwork)中文称为循环神经网络，它一般以序列数据为输入，通过网络内部的结构设计有效捕捉序列之间的关系特征，一般也是以序列形式进行输出RNN的循环机制使模型隐层上一时间步产生的结果，能够作为当下时间步输入的一部分（当下时间步的输入除了正常的输入外还包括上一步的隐层输出）对当下时间步的输出产生影响2、R
基于深度学习的文本引导的图像编辑 SEU-WYL 深度学习dnn 深度学习人工智能
基于深度学习的文本引导的图像编辑（Text-GuidedImageEditing）是一种通过自然语言文本指令对图像进行编辑或修改的技术。它结合了图像生成和自然语言处理（NLP）的最新进展，使用户能够通过描述性文本对图像内容进行精确的调整和操控。1.文本引导的图像编辑的挑战文本和图像之间的对齐：如何将文本中的语义信息准确地映射到图像中的特定区域或元素是一个关键挑战。这涉及到多模态数据的对齐和理解。编
甘超波：NLP婚姻中如何与老人相处甘超波
哈喽，大家好我是甘超波，是一名NLP爱好者，每天一篇原创文章或视频，分享我的实战经验和案例，希望给你些启发和帮助看一下，在家庭中子女与老人观念不一致时案例1：在教育孩子方面，老人习惯用老一套教育方式教育孙子，子女受不了老人这种习惯，从而发生口舌之争？2：在生活习惯方面，老人喜欢吃剩菜剩饭，子女受不了老人这种习惯，从而发生口舌之争？.....这样的事情，我相信你或多或少都听过和看过，甚至了深有感悟。
transformer架构(Transformer Architecture)原理与代码实战案例讲解 AI架构设计之禅大数据AI人工智能 Python入门实战计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
transformer架构(TransformerArchitecture)原理与代码实战案例讲解关键词：Transformer,自注意力机制,编码器-解码器,预训练,微调,NLP,机器翻译作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming1.背景介绍1.1问题的由来自然语言处理（NLP）领域的发展经历了从规则驱动到统计驱动再到深度学习驱动的三个阶段。
英伟达（NVIDIA）B200架构解读 weixin_41205263 芯际争霸 GPGPU架构 gpu算力人工智能硬件架构
H100芯片是一款高性能AI芯片，其中的TransformerEngine是专门用于加速Transformer模型计算的核心部件。Transformer模型是一种自然语言处理（NLP）模型，广泛应用于机器翻译、文本生成等任务。TransformerEngine的电路设计原理主要包括以下几个方面：
《昇思 25 天学习打卡营第 25 天 | 基于 MindSpore 实现 BERT 对话情绪识别》 Sam9029 Mindscope模型学习深度学习
《昇思25天学习打卡营第25天|基于MindSpore实现BERT对话情绪识别》活动地址：https://xihe.mindspore.cn/events/mindspore-training-camp签名：Sam9029环境配置确保安装了正确版本的MindSpore和MindNLP库。!pipuninstallmindspore-y!pipinstall-ihttps://pypi.mirror
基于人工智能的智能语音助手人工智能发烧友人工智能
语音助手的自然语言处理模块是语音助手系统的关键组成部分。通过这个模块，系统能够识别用户的意图并做出相应的回应。我们可以使用NLP技术来解析文本输入，并将其转换为系统可以理解的命令或指令。在本项目中，我们将结合语音识别、自然语言处理和语音合成技术，构建一个功能简化的语音助手。一、项目背景与需求分析1.1项目目标本项目旨在创建一个语音助手系统，它可以：1.语音识别：从用户的语音输入中提取文本信息。2.
流利说英语A+商务英语学习笔记——第1章搞定面试第7节《面试之闪亮登场》 Ronnie学英语
面试开局JChasappliedforapositionasamarketingassistant.TodayshewillattendourinterviewandLeonwillbeherinterviewer.Iamrecentgraduate(形容词毕业的)fromUniversity,whereImajorinmarketing.Iwasalsovicepresidentofmycoll
NLP_jieba中文分词的常用模块 Hiweir · NLP_jieba的使用自然语言处理中文分词人工智能 nlp
1.jieba分词模式（1）精确模式:把句子最精确的切分开,比较适合文本分析.默认精确模式.（2）全模式:把句子中所有可能成词的词都扫描出来,cut_all=True,缺点:速度快,不能解决歧义（3）paddle:利用百度的paddlepaddle深度学习框架.简单来说就是使用百度提供的分词模型.use_paddle=True.（4）搜索引擎模式:在精确模式的基础上,对长词再进行切分,提高召回率,
Linux如何查看端口 lanhuazui10 linux操作系统 linux
方法一：lsof-i:端口号用于查看某一端口的占用情况，比如查看9092端口使用情况，lsof-i:9095可以看到9095端口已经被nginx占用方法二：netstat-tunlp|grep端口号，用于查看指定的端口号的进程情况，如查看5050端口的情况，netstat-tunlp|grep5050-t(tcp)仅显示tcp相关选项-u(udp)仅显示udp相关选项-n拒绝显示别名，能显示数字的
【笔记】自然语言处理NLP---概论 xhanZ NLP相关
（from人文学院开设课程）目录1.自然语言处理概论1.1自然语言处理研究的意义、历史与现状1.1.1自然语言的特点1.1.2自然语言处理研究的意义1.1.3国外研究现状1.2NLP的方法、特点和规律1.2.1理性主义与经验主义1.2.2语料库语言学：经验主义研究方法1.2.3汉语语言处理的方法1.2.4基于知识图谱的深度学习1.自然语言处理概论1.1自然语言处理研究的意义、历史与现状1.1.1自
【笔记与idea】——ACL2017论文报告会胖胖的飞象深度学习人工智能笔记 idea
这篇是2017年我有幸参加了中文信息学会组织的ACL2017论文报告会记的笔记，当时还是研一新生，对NLP感兴趣，偶然通过老师知晓了这次报告会，所以想去现场听听大牛们的idea、和大牛们交流（然而由于当时没有入门，啥也不懂，交流失败。。。）但是总的来说，非常感谢组织这次报告会的老师们，尽管没能和大牛们有效的交流，但是这次报告会相当于在最短的时间内读懂了数十篇精彩论文的核心内容，对我后面的学习起到了
如何利用AI技术来提升用户的个性化体验和社区参与度？ Itfuture03 AI前沿技术人工智能
要利用AI技术提升用户的个性化体验和社区参与度，可以采取以下几种策略：个性化推荐系统：通过AI算法分析用户的行为和偏好，提供定制化的服务和内容推荐，如智能推荐活动、健康管理等，让居民感受到社区的温暖和关怀。智能助手与聊天机器人：引入AI驱动的虚拟助手，提供实时帮助、个性化建议和交互式对话，改善客户体验。自然语言处理（NLP）：实现具有AI能力的NLP，创建对用户友好的应用程序，简化用户体验，如客服
【Python】成功解决IndexError: list index out of range 高斯小哥 BUG解决方案合集 python list 新手入门学习 debug
【Python】成功解决IndexError:listindexoutofrange下滑查看解决方法欢迎莅临我的个人主页这里是我静心耕耘深度学习领域、真诚分享知识与智慧的小天地！博主简介：985高校的普通本硕，曾有幸发表过人工智能领域的中科院顶刊一作论文，熟练掌握PyTorch框架。技术专长：在CV、NLP及多模态等领域有丰富的项目实战经验。已累计一对一为数百位用户提供近千次专业服务，助力他们少走
使用Python和Jieba库进行中文情感分析：从文本预处理到模型训练的完整指南快撑死的鱼 Python算法精解 python 人工智能开发语言
使用Python和Jieba库进行中文情感分析：从文本预处理到模型训练的完整指南情感分析（SentimentAnalysis）是自然语言处理（NLP）领域中的一个重要分支，旨在从文本中识别出情绪、态度或意见等主观信息。在中文文本处理中，由于语言特性不同于英语，如何高效、准确地分词和提取关键词成为情感分析的关键步骤之一。在这篇文章中，我们将深入探讨如何使用Python和Jieba库进行中文情感分析，
论文阅读笔记: DINOv2: Learning Robust Visual Features without Supervision 小夏refresh 论文计算机视觉深度学习论文阅读笔记深度学习计算机视觉人工智能
DINOv2:LearningRobustVisualFeatureswithoutSupervision论文地址:https://arxiv.org/abs/2304.07193代码地址:https://github.com/facebookresearch/dinov2摘要大量数据上的预训练模型在NLP方面取得突破，为计算机视觉中的类似基础模型开辟了道路。这些模型可以通过生成通用视觉特征(即无
第3篇：LangChain的架构总览与设计理念 Gemini技术窝 langchain 架构大数据人工智能 AIGC nlp
LangChain库是一个专为自然语言处理（NLP）设计的强大工具包，致力于简化复杂语言模型链的构建和执行。在本文中，我们将深入解析LangChain库的架构，详细列出其核心组件、设计理念及其在不同场景中的应用，并讨论其优缺点。文章目录1.LangChain库简介2.核心组件2.1数据输入模块作用2.2数据预处理模块作用2.3数据增强模块作用2.4数据加载与批处理模块作用2.5模型训练模块作用2.
读李中莹先生论“阿Q精神" 猫咪06
这阵子重读《重塑心灵》，对“阿Q精神"一段很有感慨，在我们从小的信念里，阿Q的精神胜利法是被贬低的，是对无能力改变自己的境遇时，似手只能采用自我安慰的人的讽刺。李中莹先生在他的书中结合对话者的认可，定义阿Q精神“只求精神胜利，罔顾真实情况"，他就针对这两句话，解析阿Q精神，并进行了肯定‘，。首先“精神胜利"指的是自己内心有成功的感觉，这很符合NLP!如果所有人都认为你成功，而你自己没有成功的喜悦，
【LeetCode】面试经典 150 题 Day 1 追风0068 Leetcode leetcode 面试算法职场和发展
88.合并两个有序数组https://leetcode.cn/problems/merge-sorted-array/description/?envType=study-plan-v2&envId=top-interview-15088.合并两个有序数组给你两个按非递减顺序排列的整数数组nums1和nums2，另有两个整数m和n，分别表示nums1和nums2中的元素数目。请你合并nums2到n
书单用户5521
提高思维（13本）：影响力逻辑思维（理查德·尼斯贝特）离经叛道:不按常理出牌的人如何改变世界（只看最后一章总结即可）改变:问题形成和解决的原则语言的魔力:谈笑间转变信念之NLP技巧（意识到语言顺序的重要性）改变心理学的40项研究对伪心理学说不你的误区:如何摆脱负面思维掌控你的生活战胜拖拉你的灯亮着吗?别做正常的傻瓜学会提问:批判性思维指南不确定世界的理性选择小说（5本）：霍乱时期的爱情那些回不去的
【Python】解决AttributeError: ‘NoneType‘ object has no attribute ‘xxxx‘ 云天徽上 Pandas python 开发语言 pandas 机器学习 numpy
【Python】解决AttributeError:'NoneType'objecthasnoattribute'xxxx'报错欢迎莅临我的个人主页这里是我深耕Python编程、机器学习和自然语言处理（NLP）领域，并乐于分享知识与经验的小天地！博主简介：我是云天徽上，一名对技术充满热情的探索者。多年的Python编程和机器学习实践，使我深入理解了这些技术的核心原理，并能够在实际项目中灵活应用。尤其
【自然语言处理】自然语言处理NLP概述及应用 @我们的天空人工智能技术 nlp 人工智能深度学习 python 机器学习自然语言处理 scikit-learn
自然语言处理（NaturalLanguageProcessing，简称NLP）是一门集计算机科学、人工智能以及语言学于一体的交叉学科，致力于让计算机能够理解、解析、生成和处理人类的自然语言。它是人工智能领域的一个关键分支，旨在缩小人与机器之间的交流障碍，使得机器能够更有效地识别并响应人类的自然语言指令或内容。自然语言处理NLP概述基本任务：文本分类：将文本划分为预定义的类别，如情感分析、主题分类等
JAVA中的Enum 周凡杨 java enum 枚举
Enum是计算机编程语言中的一种数据类型---枚举类型。在实际问题中，有些变量的取值被限定在一个有限的范围内。例如，一个星期内只有七天我们通常这样实现上面的定义： public String monday; public String tuesday; public String wensday; public String thursday
赶集网mysql开发36条军规 Bill_chen mysql 业务架构设计 mysql调优 mysql性能优化
(一)核心军规 (1)不在数据库做运算 cpu计算务必移至业务层； (2)控制单表数据量 int型不超过1000w，含char则不超过500w；合理分表；限制单库表数量在300以内； (3)控制列数量字段少而精，字段数建议在20以内
Shell test命令 daizj shell 字符串 test 数字文件比较
Shell test命令 Shell中的 test 命令用于检查某个条件是否成立，它可以进行数值、字符和文件三个方面的测试。数值测试参数说明 -eq 等于则为真 -ne 不等于则为真 -gt 大于则为真 -ge 大于等于则为真 -lt 小于则为真 -le 小于等于则为真实例演示： num1=100 num2=100if test $[num1]
XFire框架实现WebService(二) 周凡杨 java webservice
有了XFire框架实现WebService(一)，就可以继续开发WebService的简单应用。 Webservice的服务端(WEB工程)：两个java bean类： Course.java package cn.com.bean; public class Course { private
重绘之画图板朱辉辉33 画图板
上次博客讲的五子棋重绘比较简单，因为只要在重写系统重绘方法paint（）时加入棋盘和棋子的绘制。这次我想说说画图板的重绘。画图板重绘难在需要重绘的类型很多，比如说里面有矩形，园，直线之类的，所以我们要想办法将里面的图形加入一个队列中，这样在重绘时就
Java的IO流西蜀石兰 java
刚学Java的IO流时，被各种inputStream流弄的很迷糊，看老罗视频时说想象成插在文件上的一根管道，当初听时觉得自己很明白，可到自己用时，有不知道怎么代码了。。。每当遇到这种问题时，我习惯性的从头开始理逻辑，会问自己一些很简单的问题，把这些简单的问题想明白了，再看代码时才不会迷糊。 IO流作用是什么？答：实现对文件的读写，这里的文件是广义的； Java如何实现程序到文件
No matching PlatformTransactionManager bean found for qualifier 'add' - neither 林鹤霄
java.lang.IllegalStateException: No matching PlatformTransactionManager bean found for qualifier 'add' - neither qualifier match nor bean name match! 网上找了好多的资料没能解决，后来发现：项目中使用的是xml配置的方式配置事务，但是
Row size too large (> 8126). Changing some columns to TEXT or BLOB aigo column
原文：http://stackoverflow.com/questions/15585602/change-limit-for-mysql-row-size-too-large 异常信息： Row size too large (> 8126). Changing some columns to TEXT or BLOB or using ROW_FORMAT=DYNAM
JS 格式化时间 alxw4616 JavaScript
/** * 格式化时间 2013/6/13 by 半仙 [email protected] * 需要 pad 函数 * 接收可用的时间值. * 返回替换时间占位符后的字符串 * * 时间占位符:年 Y 月 M 日 D 小时 h 分 m 秒 s 重复次数表示占位数 * 如 YYYY 4占4位 YY 占2位<p></p> * MM DD hh mm
队列中数据的移除问题百合不是茶队列移除
队列的移除一般都是使用的remov();都可以移除的,但是在昨天做线程移除的时候出现了点问题,没有将遍历出来的全部移除, 代码如下; // package com.Thread0715.com; import java.util.ArrayList; public class Threa
Runnable接口使用实例 bijian1013 java thread Runnable java多线程
Runnable接口 a. 该接口只有一个方法：public void run(); b. 实现该接口的类必须覆盖该run方法 c. 实现了Runnable接口的类并不具有任何天
oracle里的extend详解 bijian1013 oracle 数据库 extend
扩展已知的数组空间，例： DECLARE TYPE CourseList IS TABLE OF VARCHAR2(10); courses CourseList; BEGIN -- 初始化数组元素，大小为3 courses := CourseList('Biol 4412 ', 'Psyc 3112 ', 'Anth 3001 '); --
【httpclient】httpclient发送表单POST请求 bit1129 httpclient
浏览器Form Post请求浏览器可以通过提交表单的方式向服务器发起POST请求，这种形式的POST请求不同于一般的POST请求 1. 一般的POST请求，将请求数据放置于请求体中，服务器端以二进制流的方式读取数据，HttpServletRequest.getInputStream()。这种方式的请求可以处理任意数据形式的POST请求，比如请求数据是字符串或者是二进制数据 2. Form
【Hive十三】Hive读写Avro格式的数据 bit1129 hive
1. 原始数据 hive> select * from word; OK 1 MSN 10 QQ 100 Gtalk 1000 Skype 2. 创建avro格式的数据表 hive> CREATE TABLE avro_table(age INT, name STRING)STORE
nginx+lua+redis自动识别封解禁频繁访问IP ronin47
在站点遇到攻击且无明显攻击特征，造成站点访问慢，nginx不断返回502等错误时，可利用nginx+lua+redis实现在指定的时间段内，若单IP的请求量达到指定的数量后对该IP进行封禁，nginx返回403禁止访问。利用redis的expire命令设置封禁IP的过期时间达到在指定的封禁时间后实行自动解封的目的。一、安装环境： CentOS x64 release 6.4(Fin
java-二叉树的遍历-先序、中序、后序（递归和非递归）、层次遍历 bylijinnan java
import java.util.LinkedList; import java.util.List; import java.util.Stack; public class BinTreeTraverse { //private int[] array={ 1, 2, 3, 4, 5, 6, 7, 8, 9 }; private int[] array={ 10,6,
Spring源码学习-XML 配置方式的IoC容器启动过程分析 bylijinnan java spring IOC
以FileSystemXmlApplicationContext为例，把Spring IoC容器的初始化流程走一遍： ApplicationContext context = new FileSystemXmlApplicationContext ("C:/Users/ZARA/workspace/HelloSpring/src/Beans.xml&q
[科研与项目]民营企业请慎重参与军事科技工程 comsci 企业
军事科研工程和项目并非要用最先进，最时髦的技术，而是要做到“万无一失” 而民营科技企业在搞科技创新工程的时候，往往考虑的是技术的先进性，而对先进技术带来的风险考虑得不够，在今天提倡军民融合发展的大环境下，这种“万无一失”和“时髦性”的矛盾会日益凸显。。。。。。所以请大家在参与任何重大的军事和政府项目之前，对
spring 定时器-两种方式 cuityang spring quartz 定时器
方式一：间隔一定时间运行 <bean id="updateSessionIdTask" class="com.yang.iprms.common.UpdateSessionTask" autowire="byName" /> <bean id="updateSessionIdSchedule
简述一下关于BroadView站点的相关设计 damoqiongqiu view
终于弄上线了，累趴，戳这里http://www.broadview.com.cn 简述一下相关的技术点前端：jQuery+BootStrap3.2+HandleBars，全站Ajax（貌似对SEO的影响很大啊！怎么破？），用Grunt对全部JS做了压缩处理，对部分JS和CSS做了合并（模块间存在很多依赖，全部合并比较繁琐，待完善）。后端：U
运维 PHP问题汇总 dcj3sjt126com windows2003
1、Dede(织梦)发表文章时,内容自动添加关键字显示空白页解决方法：后台>系统>系统基本参数>核心设置>关键字替换（是/否），这里选择“是”。后台>系统>系统基本参数>其他选项>自动提取关键字，这里选择“是”。 2、解决PHP168超级管理员上传图片提示你的空间不足网站是用PHP168做的，反映使用管理员在后台无法
mac 下安装php扩展 - mcrypt dcj3sjt126com PHP
MCrypt是一个功能强大的加密算法扩展库，它包括有22种算法，phpMyAdmin依赖这个PHP扩展，具体如下：下载并解压libmcrypt-2.5.8.tar.gz。在终端执行如下命令： tar zxvf libmcrypt-2.5.8.tar.gz cd libmcrypt-2.5.8/ ./configure --disable-posix-threads --
MongoDB更新文档 [四] eksliang mongodb Mongodb更新文档
MongoDB更新文档转载请出自出处：http://eksliang.iteye.com/blog/2174104 MongoDB对文档的CURD，前面的博客简单介绍了，但是对文档更新篇幅比较大，所以这里单独拿出来。语法结构如下： db.collection.update( criteria, objNew, upsert, multi) 参数含义参数
Linux下的解压，移除，复制，查看tomcat命令 y806839048 tomcat
重复myeclipse生成webservice有问题删除以前的，干净 1、先切换到：cd usr/local/tomcat5/logs 2、tail -f catalina.out 3、这样运行时就可以实时查看运行日志了 Ctrl+c 是退出tail命令。有问题不明的先注掉 cp /opt/tomcat-6.0.44/webapps/g
Spring之使用事务缘由(3-XML实现) ihuning spring
用事务通知声明式地管理事务事务管理是一种横切关注点。为了在 Spring 2.x 中启用声明式事务管理，可以通过 tx Schema 中定义的 <tx:advice> 元素声明事务通知，为此必须事先将这个 Schema 定义添加到 <beans> 根元素中去。声明了事务通知后，就需要将它与切入点关联起来。由于事务通知是在 <aop:
GCD使用经验与技巧浅谈啸笑天 GC
前言 GCD(Grand Central Dispatch)可以说是Mac、iOS开发中的一大“利器”，本文就总结一些有关使用GCD的经验与技巧。 dispatch_once_t必须是全局或static变量这一条算是“老生常谈”了，但我认为还是有必要强调一次，毕竟非全局或非static的dispatch_once_t变量在使用时会导致非常不好排查的bug，正确的如下： 1
linux（Ubuntu）下常用命令备忘录1 macroli linux 工作 ubuntu
在使用下面的命令是可以通过--help来获取更多的信息1,查询当前目录文件列表：ls ls命令默认状态下将按首字母升序列出你当前文件夹下面的所有内容，但这样直接运行所得到的信息也是比较少的，通常它可以结合以下这些参数运行以查询更多的信息： ls / 显示/.下的所有文件和目录 ls -l 给出文件或者文件夹的详细信息 ls -a 显示所有文件，包括隐藏文
nodejs同步操作mysql qiaolevip 学习永无止境每天进步一点点 mysql nodejs
// db-util.js var mysql = require('mysql'); var pool = mysql.createPool({ connectionLimit : 10, host: 'localhost', user: 'root', password: '', database: 'test', port: 3306 });
一起学Hive系列文章 superlxw1234 hive Hive入门
[一起学Hive]系列文章目录贴，入门Hive，持续更新中。 [一起学Hive]之一—Hive概述，Hive是什么 [一起学Hive]之二—Hive函数大全-完整版 [一起学Hive]之三—Hive中的数据库(Database)和表(Table) [一起学Hive]之四-Hive的安装配置 [一起学Hive]之五-Hive的视图和分区 [一起学Hive
Spring开发利器：Spring Tool Suite 3.7.0 发布 wiselyman spring
Spring Tool Suite(简称STS)是基于Eclipse，专门针对Spring开发者提供大量的便捷功能的优秀开发工具。在3.7.0版本主要做了如下的更新：将eclipse版本更新至Eclipse Mars 4.5 GA Spring Boot(JavaEE开发的颠覆者集大成者，推荐大家学习)的配置语言YAML编辑器的支持(包含自动提示，

NLP面试题总结（包含8种优化器简介）.03

part 1.

1. 介绍一下几种优化器

1.1 SGD(Stochastic Gradient Descent)

1.2 BGD（Batch Gradient Descent）

1.3 MBGD（Mini-Batch Gradient Descent）

1.4 Momentum

1.5 Adagrad(Adaptive gradient algorithm)

1.6 Adadelta

1.7 RMSprop

1.8 Adam(Adaptive Moment Estimation)

2. LSTM里面有哪些门，为什么用这些门？

3.LSTM里面为什么有些激活函数用sigmoid，有些用tanh？

4. Bert中的位置向量作用是什么？有哪些生成方式？

part 2.

1. 浅copy和深copy的概念

2. Python中的self关键字

3. Python中类的继承

4. 完全二叉树的概念

5. 单链表与顺序表的区别

6. 给出二叉树的前序遍历(preorder)和中序遍历(inorder)，重建该二叉树：

7.反转一个链表，并返回头结点

你可能感兴趣的:(NLP,interview)