无水先生

循环神经网络RNN专题（01/6）

一、说明

RNN用于处理序列数据。在传统的神经网络模型中，是从输入层到隐含层再到输出层，层与层之间是全连接的，每层之间的节点是无连接的。但是这种普通的神经网络对于很多问题却无能无力。例如，你要预测句子的下一个单词是什么，一般需要用到前面的单词，因为一个句子中前后单词并不是独立的。RNN之所以称为循环神经网路，即一个序列当前的输出与前面的输出也有关。本文将解释这种结构。

二、什么是 RNN？

循环神经网络（RNN）是一种深度学习模型，经过训练后可以处理顺序数据输入并将其转换为特定的顺序数据输出。顺序数据是指单词、句子或时间序列数据之类的数据，其中的顺序分量根据复杂的语义和语法规则相互关联。RNN 是一种由许多相互连接的组件组成的软件系统，这些组件模仿人类进行顺序数据转换的方式，例如将文本从一种语言翻译成另一种语言。RNN 在很大程度上正在被基于转换器的人工智能（AI）和大型语言模型（LLM）所取代，后者在顺序数据处理中的效率要高得多。

三、循环神经网络如何运作？

下图为 RNN 示意图。

RNN 由神经元组成，神经元是协同工作以执行复杂任务的数据处理节点。神经元分为输入层、输出层和隐藏层。输入层接收要处理的信息，输出层提供结果。数据处理、分析和预测在隐藏层中进行。

3.1 隐藏层

RNN 的工作原理是将接收到的顺序数据逐步传递给隐藏层。但是，RNN 还有一个自循环或循环的工作流程：隐藏层可以在短期记忆组件中记住之前的输入并使用这些输入进行未来的预测。它使用当前输入和存储的记忆来预测下一个序列。

例如，考虑以下序列：Apple is red。您想让 RNN 在接收输入序列 Apple is 时预测 red。当隐藏层处理 Apple 一词时，会在记忆中存储一份副本。随后，当接收到 is 一词时，它会从记忆中调取 Apple，并根据上下文理解完整序列：Apple is。然后，它可以预测 red 以提高准确性。这使得 RNN 在语音识别、机器翻译和其他语言建模任务中颇为有用。

3.2 训练

机器学习（ML）工程师通过向模型提供训练数据并优化其性能来训练 RNN 等深度神经网络。在机器学习中，神经元的权重是确定训练期间学到的信息在预测输出时影响力的信号。RNN 中每一层权重相同。

机器学习工程师可调整权重以提高预测准确性。他们使用一种称为随时间反向传播（BPTT）的技术来计算模型误差并相应地调整其权重。BPTT 将输出回滚到前一个时间步长并重新计算错误率。这样，它便可以识别序列中哪个隐藏状态导致了重大错误，并重新调整权重以减少误差幅度。

四、循环神经网络有哪些类型？

RNN 通常以一对一架构为特征：一个输入序列与一个输出关联。但是，您可以根据特定目的灵活将其调整为各种配置。以下是几种常见的 RNN 类型。

一对多

这种 RNN 类型将一个输入传送到多个输出。它通过使用单个关键字生成句子来支持图片说明文字之类的语言应用程序。

多对多

此模型使用多个输入来预测多个输出。例如，您可以使用 RNN 创建语言翻译器，该翻译器可以分析句子并正确用不同语言组织词句。

多对一

多个输入映射到一个输出。这在情绪分析之类的应用程序中非常有用，在情绪分析中，此模型可以根据输入的评价预测客户的正面、负面和中立情绪。

五、循环神经网络与其他深度学习网络相比如何？

RNN 是多种不同神经网络架构中的一种。

5.1 循环神经网络与前馈神经网络

与 RNN 一样，前馈神经网络是将信息从架构的一端传递到另一端的人工神经网络。前馈神经网络可以执行简单的分类、回归或识别任务，但无法记住之前处理的输入。例如，其神经元在处理 is 这个词时，它会忘记 Apple。RNN 通过在神经元中加入隐藏内存状态克服了这种内存限制。

5.2 循环神经网络与卷积神经网络

卷积神经网络是用于处理时序数据的人工神经网络。使用卷积神经网络，您可以通过神经网络中的一系列卷积层和池化层，从视频和图像中提取空间信息。RNN 旨在捕获顺序数据中的长期依赖关系

六、循环神经网络的局限性是什么？

自 RNN 推出以来，机器学习工程师在使用 RNN 及其变体的自然语言处理（NLP）应用程序方面取得了重大进展。但是，RNN 模型系列有一些限制。

6.1 梯度爆炸

在初始训练中，RNN 可能会错误地预测输出。您需要进行多次迭代来调整模型的参数，以降低错误率。您可以将与模型参数对应的误差率的灵敏度描述为梯度。您可以将梯度想象成下山时的斜坡。陡峭的梯度使模型能够更快地学习，而平缓的梯度则会降低学习速度。

当梯度呈指数增长直至 RNN 变得不稳定时，就会发生梯度爆炸。当梯度变得无限大时，RNN 的行为会不稳定，从而导致性能问题，例如过拟合。过拟合是一种现象，即模型可以使用训练数据进行准确预测，但无法对现实世界数据进行同样准确的预测。

6.2 梯度消失

梯度消失问题是训练中模型的梯度接近于零的情况。梯度消失时，RNN 无法有效地从训练数据中学习，从而导致欠拟合。欠拟合模型在现实应用中表现不佳，因为其权重没有进行适当调整。RNN 在处理长数据序列时存在面临梯度消失和梯度爆炸问题的风险。

6.3 训练速度缓慢

RNN 按顺序处理数据，这使其高效处理大量文本的能力受到限制。例如，RNN 模型可以从几句话中分析买家的情绪。但是，总结一页文章需要耗费大量的计算能力、内存空间和时间。

七、循环神经网络架构有哪些变体？

RNN 架构为机器学习模型获得语言处理能力奠定了基础。目前，已经出现了多种变体，它们共享 RNN 内存保留原则并对其原始功能进行了改进。以下是一些示例。

7.1 双向循环神经网络

双向循环神经网络（BRNN）处理具有向前和向后隐藏节点层的数据序列。向前层的工作原理与 RNN 类似，后者将之前的输入存储在隐藏状态中并使用它来预测后续输出。同时，后向层的工作方向相反，采用当前输入和将来的隐藏状态来更新当前的隐藏状态。将这两个层组合起来使 BRNN 能够通过同时考虑过去和未来的上下文来提高预测的准确性。例如，您可以使用 BRNN 来预测“Apple trees are tall”这句话中的“trees”一词。

7.2 长短期记忆网络

长短期记忆网络（LSTM）是一种 RNN 变体，使模型能够扩展其内存容量，适应更长的时间线需要。RNN 只能记住近期输入。无法使用来自前几个序列的输入来改善其预测。

请考虑以下句子：Tom is a cat。 Tom’s favorite food is fish。使用 RNN 时，模型无法记住“Tom is a cat”。在预测最后一个词时，可能会产生各种各样的食物。LSTM 网络在隐藏层添加了一个名为单元的特殊内存块。每个单元都由输入门、输出门和遗忘门控制，使层能够记住有用的信息。例如，单元会记住 Tom 和 cat 这两个词，从而使模型能够预测 fish 这个词。

7.3 门控循环单元

门控循环单元（GRU）是支持选择性内存保留的 RNN。该模型添加了更新，并遗忘了其隐藏层的门，隐藏层可以在内存中存储或删除信息。

八、转换器如何克服循环神经网络的局限性？

转换器是在编码器-解码器前馈神经网络中使用自注意力机制的深度学习模型。它们可以像 RNN 一样处理顺序数据。

8.1 自注意力

转换器不使用隐藏状态来捕获数据序列的相互依赖性。相反，它们使用自注意力头来并行处理数据序列。这使转换器能够使用比 RNN 更短的时间训练和处理更长的序列。借助自注意力机制，转换器可克服 RNN 面临的内存限制和序列相互依赖性。转换器可以并行处理数据序列，并使用位置编码来记住每个输入与其他输入的关系。

8.2 并行性

转换器通过在训练期间启用并行性来解决 RNN 面临的梯度问题。通过同时处理所有输入序列，转换器不受反向传播限制，因为梯度可以自由流向所有权重。它们还针对并行计算进行了优化，图形处理单元（GPU）为生成式人工智能开发提供了这种优化。并行性使转换器能够通过构建更大的模型来大规模扩展和处理复杂的 NLP 任务。

你可能感兴趣的:(RNN,人工智能,rnn,人工智能,深度学习)

大模型算法工程师的技术图谱和学习路径执于代码开发者职业加速服务算法学习
介绍：大模型算法工程师是指在开发和部署复杂的机器学习模型、深度学习模型或其他大规模模型的专业人员。他们的主要职责和技能要求包括：职责：设计、开发和优化大规模机器学习或深度学习模型，解决复杂的业务问题。负责整个模型开发生命周期，包括数据清洗、特征工程、模型选择、训练和部署。与数据科学家、工程团队和产品团队合作，理解业务需求并将算法转化为实际产品。对模型性能进行评估和优化，确保模型的准确性、效率和可扩
图像算法工程师的技术图谱和学习路径执于代码开发者职业加速服务算法学习
01.图像算法图像算法工程师的技术图谱和学习路径涵盖了多个技术领域，从基础知识到高级算法，涉及计算机视觉、深度学习、图像处理、数学和编程等多个方面。以下是图像算法工程师的技术图谱和学习路径的详细总结。1.基础数学与编程数学基础：线性代数：矩阵运算、特征值、特征向量、奇异值分解（SVD）等概率论与统计：概率分布、贝叶斯定理、最大似然估计（MLE）、假设检验等微积分：导数、梯度、最优化方法（梯度下降、
【期刊】【Engineering Applications of Artificial Intelligence】【人工智能的工程应用】资源存储库期刊人工智能
https://www.sciencedirect.com/search?qs=train%20energy&pub=Engineering%20Applications%20of%20Artificial%20Intelligence&cid=2710951Aimsandscope目标和范围TheInternationalJournalofIntelligentReal-TimeAutomati
2024年工信部人工智能应用工程师含金量怎么样？证书用途有哪些泰迪智能科技01 人工智能职业技术培训人工智能
工业和信息化部介绍中华人民共和国工业和信息化部（简称：工业和信息化部，工信部），是根据2008年3月11日公布的国务院机构改革方案，组建的国务院组成部门。1、“职业能力水平评价”是不是工信部组织的考试？证书的用途是什么？“职业能力水平评价”是中心与合作机构开展的评价考试项目，由中心人才评价处负责组织实施。“职业能力水平评价”主要为提升工业和信息化领域技术技能人员的职业能力，增强其就业竞争力;“学员
AI大模型知识图谱和学习路线！ hhaiming_ 人工智能知识图谱学习
23年AI大模型技术狂飙一年后，24年AI大模型的应用已经在爆发，因此掌握好AI大模型的应用开发技术就变成如此重要，那么如何才能更好地掌握呢？一份AI大模型详细的知识图谱和学习路线就变得非常重要！一、大模型全套的学习路线学习大型人工智能模型，如GPT-3、BERT或任何其他先进的神经网络模型，需要系统的方法和持续的努力。既然要系统的学习大模型，那么学习路线是必不可少的，下面的这份路线能帮助你快速梳
人工智能和python的关系兜里揣着星星 python 人工智能
Python实现了智能化爬取数据,其中Python只是一种计算机程序设计语言,而人工智能片面的讲就是人为的通过嵌入式技术把程序写入机器中使其实现智能化,显然它们不是同一种概念,不能化等号。人工智能是计算密集型，需要非常精细的优化，其中还需要GPU、专用硬件之类的接口，这些都只有C/C++能做到，所以某种意义上来说，其实C/C++才是人工智能领域最重要的语言。而Python其实是APIbinding
【深度学习】Hopfield网络：模拟联想记忆 T-I-M 深度学习人工智能
Transformer优化，什么是稀疏注意力？Transformer模型自2017年被提出以来，已经成为自然语言处理（NLP）领域的核心架构，并在计算机视觉、语音处理等其他领域也取得了显著的成功。然而，随着模型规模的不断增大和任务复杂性的提升，Transformer的计算成本和内存需求也随之激增。为了解决这一问题，研究者们提出了多种优化方法，其中稀疏注意力（SparseAttention）是一种备
深度学习pytorch之4种归一化方法（Normalization）原理公式解析和参数使用 @Mr_LiuYang 计算机视觉基础归一化正则化 Normlization BatchNorm LayerNorm InstanceNrom GroupNorm
深度学习pytorch之22种损失函数数学公式和代码定义深度学习pytorch之19种优化算法（optimizer）解析深度学习pytorch之4种归一化方法（Normalization）原理公式解析和参数使用摘要归一化（Normalization）是提升模型性能、加速训练的重要技巧。归一化方法可以帮助减少梯度消失或爆炸的问题，提升模型的收敛速度，且对最终模型的性能有显著影响。本文将以PyTorc
本地部署DeepSeek安全风险自查及安全加固方案安全方案安全 DeepSeek
简要介绍随着人工智能技术的快速发展，AI大模型DeepSeek部署需求日益增长。然而，在享受AI技术带来便利的同时，我们也不能忽视其背后潜在的安全风险。近期有关DeepSeek本地部署存在安全风险事件的报道引发了关注，其中Ollama服务作为一个重要的开源框架，因其配置导致的安全风险受关注。本文将分析这一问题，并提供安全加固方案。安全风险原因什么是Ollama？Ollama是一个开源框架，用于快速
人工智能时代的伦理挑战与隐私保护经海路大白狗狗哥梦话职场人工智能
随着人工智能技术的迅猛发展，我们不得不正视其带来的伦理挑战和隐私保护问题。人工智能的应用已经深入到社会的方方面面，从医疗健康到金融服务，从教育到娱乐，无所不在。然而，与其广泛应用相伴随的是数据隐私泄露、算法歧视性和信息透明度不足等问题，这些问题不仅仅影响到个人权利，也损害了社会的公平和信任。1.AI技术的伦理挑战在AI技术快速发展的同时，一些伦理问题逐渐显现出来。例如，“大数据杀熟”现象，即通过分
AI时代的人类计算：隐私安全和道德 AI天才研究院计算 AI大模型企业级应用开发实战 DeepSeek R1 &大数据AI人工智能大模型 java python javascript kotlin golang 架构人工智能大厂程序员硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM 系统架构设计软件哲学 Agent 程序员实现财富自由
AI时代的人类计算：隐私、安全和道德关键词：人工智能（AI），人类计算，隐私保护，安全性，道德伦理，法律法规摘要：本文旨在探讨AI时代人类计算在隐私、安全和道德等方面的挑战。通过对AI时代背景、人类计算的定义与作用、隐私问题、安全挑战、道德伦理问题以及法律法规的分析，结合实际案例，提出未来AI时代的隐私、安全和道德展望及政策建议，为AI时代的可持续发展提供参考。目录大纲第一部分：AI时代背景与概述
大数据与人工智能：数据隐私与安全的挑战_ai 和数据隐私程序员七海大数据人工智能安全
前言1.背景介绍随着人工智能(AI)和大数据技术的不断发展，我们的生活、工作和社会都在不断变化。这些技术为我们提供了许多好处，但同时也带来了一系列挑战，其中数据隐私和安全是最为关键的之一。数据隐私和安全问题的出现，主要是因为大数据技术的特点和人工智能算法的运行过程。大数据技术的特点包括数据量的庞大、数据类型的多样性、数据来源的多样性和数据更新的快速性。这些特点使得大数据技术具有强大的计算和分析能力
Spring Boot整合DeepSeek实现AI对话泡泡Java 面试学习路线阿里巴巴 spring boot 人工智能 mybatis
本篇博文会分为DeepSeek开放平台上的API，以及本地私有化部署DeepSeekR1模型两种方式来整合使用，本地化私有部署可以参考这篇博文：DeepSeek介绍及使用ollama本地化部署DeepSeek-R1大模型SpringAISpringAI是由Spring（一个广泛使用的开源框架）推出的一个新项目，旨在将人工智能（AI）集成到Spring应用程序中。Spring是一个支持Java开发的
AI是否也存在人性中的阴暗面呢？好运工具 - HapTool 人工智能 HapTool 好运工具 DeepSeek ChatGPT
聊完DeepSeek和ChatGPT的厉害之处，不可否认的是它带给我们活着是全世界太大的惊奇，感受到AI技术的蓬勃发展以及未来我们将要或者已经无处不面对的各种AI技术。但是AI不是魔法。它是一种工具——和任何工具一样，它可以用于好或坏。所有人都在讨论AI，称赞AI，就像它是下一场伟大的革命一样。但是似乎目前没听到有人讨论：1、人工智能并不总是准确的。2、人工智能可能有偏见。3、人工智能可以被操纵。
人工智能开发中的数据隐私 RA AI衍生者训练营 ai
人工智能开发中的数据隐私对于建立用户信任和遵守严格法规至关重要。保护敏感信息可确保合乎道德的人工智能使用并防止有害的数据泄露。为什么在人工智能开发中优先考虑数据隐私至关重要人工智能的迅猛发展开启了一个前所未有的技术进步时代，彻底改变了各行各业，改变了我们的日常生活。然而，当我们站在这场人工智能革命的边缘时，一个关键问题迫在眉睫：数据隐私。大型语言模型(LLM)的发展和对通用人工智能(AGI)的追求
AI人工智能 Agent：在保护隐私和数据安全中的应用 AI大模型应用之禅 DeepSeek R1 &AI大模型与大数据计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
AI人工智能Agent：在保护隐私和数据安全中的应用关键词：AIAgent、隐私保护、数据安全、同态加密、联邦学习、区块链1.背景介绍1.1问题的由来随着人工智能技术的快速发展,AIAgent在各行各业得到了广泛应用。然而,在享受AI带来便利的同时,人们也越来越关注个人隐私和数据安全问题。传统的数据收集和处理方式存在隐私泄露风险,亟需探索如何在AI时代更好地保护用户隐私。1.2研究现状目前,学术界
AI时代保护自己的隐私好运工具 - HapTool 人工智能好运工具 HapTool DeepSeek chatgpt
人工智能最重要的就是数据，让我们面对现实，大多数人都不知道他们每天要向人工智能提供多少数据。你输入的每条聊天记录，你发出的每条语音命令，人工智能生成的每张图片、电子邮件和文本。我建设了一个网站(haptool.com)，经常能在后台看到chatgpt的爬虫浏览过，就和百度，Google的爬虫一样，他们同样在爬取网络的上的数据。所有这些都在被处理、分析和（有时）存储。如果你认为人工智能公司没有使用这
人工智能：增广矩阵数学基础到综合实战！！！小南AI学院人工智能矩阵算法
1.增广矩阵一、基本概念增广矩阵是将系数矩阵AAA与常数项向量bbb并在一起形成的矩阵，记作[A∣b][A|b][A∣b]。例如，对于线性方程组：{x+2y=53x−y=1\begin{cases}x+2y=5\\3x-y=1\end{cases}{x+2y=53x−y=1其增广矩阵为：[A∣b]=(12∣53−1∣1)[A|b]=\begin{pmatrix}1&2&|&5\\3&-1&|&1\
Spring AI 简介及概念疼死老夫了 spring 人工智能 java
简介：SpringAI项目旨在简化包含人工智能功能的应用程序的开发，同时避免不必要的复杂性。该项目从LangChain和LlamaIndex等著名Python项目中汲取灵感，但SpringAI并不是这些项目的直接移植。该项目在创立之初就坚信，下一波生成式人工智能应用将不仅仅是Python开发人员的专利，它将在许多编程语言中无处不在。SpringAI的核心是提供抽象，作为开发AI应用程序的基础。这些
人工智能之数学基础：线性代数中的特殊矩阵每天五分钟玩转人工智能机器学习深度学习之数学基础线性代数人工智能矩阵机器学习线性空间深度学习
本文重点矩阵是数学中一个重要的工具，在各个领域都有广泛的应用。其中，一些特殊矩阵由于具有独特的性质，在特定的问题中发挥着关键作用。单位矩阵单位矩阵是一种特殊的方阵，在矩阵乘法中起到类似于数字“1”的作用。对于一个的单位矩阵，其主对角线元素全为1，其余元素全为0。性质对于任意一个nxn的矩阵A，有AxI=IxA=A。这表明单位矩阵与任何同阶矩阵相乘都不改变该矩阵。单位矩阵是可逆的，且其逆矩阵就是它本
人工智能直通车系列01【Python 基础与数学基础】（Python 基础语法：变量、数据类型）浪九天人工智能直通车 python 开发语言机器学习深度学习人工智能
目录变量数据类型变量在Python中，变量是存储数据值的容器。变量不需要显式声明数据类型，Python会根据赋给变量的值自动推断其类型。变量命名需遵循一定规则：只能包含字母、数字和下划线，且不能以数字开头，不能是Python关键字。示例：#定义一个整数变量age=25print(age)#输出:25#定义一个字符串变量name="Alice"print(name)#输出:Alice#修改变量的值a
【2025年超全汇总】大模型常见面试题及详细答案解析（非常详细）收藏这一篇就够了！ Cc不爱吃洋葱人工智能大语言模型语言模型 LLM 大模型大模型面试大模型算法
大模型相关的面试问题通常涉及模型的原理、应用、优化以及面试者对于该领域的理解和经验。以下是一些常见的大模型面试问题以及建议的回答方式：请简述什么是大模型，以及它与传统模型的主要区别是什么？回答：大模型通常指的是参数数量巨大的深度学习模型，如GPT系列。它们与传统模型的主要区别在于规模：大模型拥有更多的参数和更复杂的结构，从而能够处理更复杂、更广泛的任务。此外，大模型通常需要更多的数据和计算资源进行
创新引领的人工智能模型系列：MiniMax-01 系列震撼登场
MiniMaxMiniMax发布并开源了全新系列模型——MiniMax-01。这个系列模型中包含两个模型，基础语言大模型MiniMax-Text-01和视觉多模态大模型MiniMax-VL-01。MiniMax-01MiniMax-01MiniMax-01系列模型首次大规模实现线性注意力机制，传统Transformer架构不再是唯一的选择。这个模型的参数量高达4560亿，其中单次激活459亿。模型
【深度学习·命运-27】NAS四部曲end-NASNet 华东算法王深度学习·命运深度学习人工智能
NASNet（NeuralArchitectureSearchNetwork）是由GoogleBrain团队提出的另一种神经架构搜索（NAS）方法，它通过自动化搜索神经网络的结构，找到了具有竞争力的神经网络架构，尤其在计算机视觉任务（如图像分类）中表现非常优秀。NASNet是基于进化算法的架构搜索方法，与其他NAS方法相比，它具有更高的效率，并且能够生成更加优化的网络架构。1.NASNet的背景与
Light创造营 2025 评选规则人工智能腾讯云云计算
一、活动说明2025Light创造营由腾讯公益慈善基金会、厦门大学教育发展基金会联合主办，腾讯优图实验室、厦门大学人工智能研究院、腾讯云智能、腾讯技术公益联合承办，旨在连接更多元的力量，将AI技术应用到更多解决社会问题、创造社会价值的场景中。本届Light技术公益创造营面向高校学生群体，围绕AI+社会公益议题（不限方向），征集技术公益解决方案。我们希望通过发掘更多未来可期的学生群体力量，收获不同视
DeepSeek 1.5B 蒸馏模型的征程 6 部署（Llama 方式）自动驾驶算法
前言DeepSeek是一款基于人工智能的搜索引擎，旨在提升用户的搜索体验。它利用先进的自然语言处理技术，通过理解查询的上下文和意图，为用户提供更精确、相关的搜索结果。与传统的搜索引擎不同，DeepSeek不仅仅依赖于关键词匹配，还能通过深度学习分析用户的需求，呈现更加智能化的搜索结果。此外，DeepSeek还具备语义理解能力，能够处理复杂的查询，并在短时间内给出最符合用户需求的答案。DeepSee
人工智能 - AI Code中国AI原生IDE上线：Trae国内版如何革新开发者体验？天机️灵韵人工智能编程语言 AI-native ide 人工智能
中国AI原生IDE上线：Trae国内版如何革新开发者体验？导语在人工智能技术加速渗透各行各业的今天，字节跳动于2025年3月3日正式发布了中国首个AI原生集成开发环境（AIIDE）——Trae国内版。这款工具不仅填补了国内AI编程工具的空白，更通过深度适配中国开发场景、灵活切换多模型架构等功能，为开发者提供了“更懂本土需求”的智能协作体验129。本文将深入解析Trae的核心优势与创新功能，并探讨其
AI大语言模型概述：从GPT到BERT的技术演进 AI智能涌现深度研究 AI大模型应用入门实战与进阶 DeepSeek R1 &大数据AI人工智能计算大数据人工智能语言模型 AI 大模型 LLM Java Python 架构设计 Agent RPA
1.背景介绍1.1什么是大语言模型大语言模型是一种基于深度学习的自然语言处理技术，它可以理解和生成人类语言。这些模型通过学习大量的文本数据，捕捉到语言的语法、语义和情感等信息，从而实现对自然语言的理解和生成。1.2为什么大语言模型如此重要大语言模型在近年来取得了显著的进展，它们在各种自然语言处理任务中都取得了最先进的性能。这些任务包括机器翻译、情感分析、文本摘要、问答系统等。大语言模型的成功在很大
Meta Platforms （原Facebook）计划推出新的大型语言模型以应用于人工智能 PM简读馆技术杂谈人工智能 facebook 语言模型
一、引言在当今科技飞速发展的时代，人工智能领域成为众多科技巨头激烈角逐的关键战场。MetaPlatforms作为全球社交媒体和科技行业的领军者，一直积极投身于新技术的探索与创新。近期，有消息传出MetaPlatforms计划推出新的大型语言模型以应用于人工智能领域，这一举措无疑将对行业格局产生深远影响。本报告将对MetaPlatforms在人工智能领域的发展历程、此次计划推出新模型的背景、可能带来
完整指南：从基础到高级使用 Semantic Kernel 江沉晚呤时 Net core AI c#.netcore
SemanticKernel是微软推出的一款强大的开发框架，旨在帮助开发者通过语义理解和自然语言处理（NLP）构建智能应用。它为开发者提供了与OpenAI、AzureCognitiveServices等人工智能服务集成的简便接口，使得构建自然语言处理（NLP）应用变得更加直观和高效。在本文中，我们将从基础到高级全面讲解如何使用SemanticKernel，并提供详细的代码示例，帮助你快速掌握这个框
设计模式介绍 tntxia 设计模式
设计模式来源于土木工程师克里斯托弗亚历山大（http://en.wikipedia.org/wiki/Christopher_Alexander）的早期作品。他经常发表一些作品，内容是总结他在解决设计问题方面的经验，以及这些知识与城市和建筑模式之间有何关联。有一天，亚历山大突然发现，重复使用这些模式可以让某些设计构造取得我们期望的最佳效果。亚历山大与萨拉-石川佳纯和穆雷西乐弗斯坦合作
android高级组件使用(一) 百合不是茶 android RatingBar Spinner
1、自动完成文本框（AutoCompleteTextView） AutoCompleteTextView从EditText派生出来，实际上也是一个文本编辑框，但它比普通编辑框多一个功能：当用户输入一个字符后，自动完成文本框会显示一个下拉菜单，供用户从中选择，当用户选择某个菜单项之后，AutoCompleteTextView按用户选择自动填写该文本框。使用AutoCompleteTex
[网络与通讯]路由器市场大有潜力可挖掘 comsci 网络
如果国内的电子厂商和计算机设备厂商觉得手机市场已经有点饱和了,那么可以考虑一下交换机和路由器市场的进入问题..... 这方面的技术和知识,目前处在一个开放型的状态,有利于各类小型电子企业进入 &nbs
自写简单Redis内存统计shell 商人shang Linux shell 统计Redis内存
#!/bin/bash address="192.168.150.128:6666,192.168.150.128:6666" hosts=(${address//,/ }) sfile="staticts.log" for hostitem in ${hosts[@]} do ipport=(${hostitem
单例模式(饿汉 vs懒汉) oloz 单例模式
package 单例模式; /* * 应用场景:保证在整个应用之中某个对象的实例只有一个 * 单例模式种的《懒汉模式》 * */ public class Singleton { //01 将构造方法私有化，外界就无法用new Singleton()的方式获得实例 private Singleton(){}; //02 申明类得唯一实例 priva
springMvc json支持杨白白 json springmvc
1.Spring mvc处理json需要使用jackson的类库，因此需要先引入jackson包 2在spring mvc中解析输入为json格式的数据:使用@RequestBody来设置输入 @RequestMapping("helloJson") public @ResponseBody JsonTest helloJson() {
android播放，掃描添加本地音頻文件小桔子
最近幾乎沒有什麽事情，繼續鼓搗我的小東西。想在項目中加入一個簡易的音樂播放器功能，就像華為p6桌面上那麼大小的音樂播放器。用過天天動聽或者QQ音樂播放器的人都知道，可已通過本地掃描添加歌曲。不知道他們是怎麼實現的，我覺得應該掃描設備上的所有文件，過濾出音頻文件，每個文件實例化為一個實體，記錄文件名、路徑、歌手、類型、大小等信息。具體算法思想，
oracle常用命令 aichenglong oracle dba 常用命令
1 创建临时表空间 create temporary tablespace user_temp tempfile 'D:\oracle\oradata\Oracle9i\user_temp.dbf' size 50m autoextend on next 50m maxsize 20480m extent management local
25个Eclipse插件 AILIKES eclipse插件
提高代码质量的插件1. FindBugsFindBugs可以帮你找到Java代码中的bug，它使用Lesser GNU Public License的自由软件许可。2. CheckstyleCheckstyle插件可以集成到Eclipse IDE中去，能确保Java代码遵循标准代码样式。3. ECLemmaECLemma是一款拥有Eclipse Public License许可的免费工具，它提供了
Spring MVC拦截器+注解方式实现防止表单重复提交 baalwolf spring mvc
原理：在新建页面中Session保存token随机码，当保存时验证，通过后删除，当再次点击保存时由于服务器端的Session中已经不存在了，所有无法验证通过。 1.新建注解： ? 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18
《Javascript高级程序设计(第3版)》闭包理解 bijian1013 JavaScript
“闭包是指有权访问另一个函数作用域中的变量的函数。”--《Javascript高级程序设计(第3版)》看以下代码： <script type="text/javascript"> function outer() { var i = 10; return f
AngularJS Module类的方法 bijian1013 JavaScript AngularJS Module
AngularJS中的Module类负责定义应用如何启动，它还可以通过声明的方式定义应用中的各个片段。我们来看看它是如何实现这些功能的。一.Main方法在哪里如果你是从Java或者Python编程语言转过来的，那么你可能很想知道AngularJS里面的main方法在哪里？这个把所
[Maven学习笔记七]Maven插件和目标 bit1129 maven插件
插件(plugin)和目标(goal) Maven，就其本质而言，是一个插件执行框架，Maven的每个目标的执行逻辑都是由插件来完成的，一个插件可以有1个或者几个目标，比如maven-compiler-plugin插件包含compile和testCompile，即maven-compiler-plugin提供了源代码编译和测试源代码编译的两个目标使用插件和目标使得我们可以干预
【Hadoop八】Yarn的资源调度策略 bit1129 hadoop
1. Hadoop的三种调度策略 Hadoop提供了3中作业调用的策略， FIFO Scheduler Fair Scheduler Capacity Scheduler 以上三种调度算法，在Hadoop MR1中就引入了，在Yarn中对它们进行了改进和完善.Fair和Capacity Scheduler用于多用户共享的资源调度 2. 多用户资源共享的调度
Nginx使用Linux内存加速静态文件访问 ronin47
Nginx是一个非常出色的静态资源web服务器。如果你嫌它还不够快，可以把放在磁盘中的文件，映射到内存中，减少高并发下的磁盘IO。先做几个假设。nginx.conf中所配置站点的路径是/home/wwwroot/res，站点所对应文件原始存储路径：/opt/web/res shell脚本非常简单，思路就是拷贝资源文件到内存中，然后在把网站的静态文件链接指向到内存中即可。具体如下：
关于Unity3D中的Shader的知识 brotherlamp unity unity资料 unity教程 unity视频 unity自学
首先先解释下Unity3D的Shader，Unity里面的Shaders是使用一种叫ShaderLab的语言编写的，它同微软的FX文件或者NVIDIA的CgFX有些类似。传统意义上的vertex shader和pixel shader还是使用标准的Cg/HLSL 编程语言编写的。因此Unity文档里面的Shader，都是指用ShaderLab编写的代码，然后我们来看下Unity3D自带的60多个S
CopyOnWriteArrayList vs ArrayList bylijinnan java
package com.ljn.base; import java.util.ArrayList; import java.util.Iterator; import java.util.List; import java.util.concurrent.CopyOnWriteArrayList; /** * 总述： * 1.ArrayListi不是线程安全的，CopyO
内存中栈和堆的区别 chicony 内存
1、内存分配方面：堆：一般由程序员分配释放，若程序员不释放，程序结束时可能由OS回收。注意它与数据结构中的堆是两回事，分配方式是类似于链表。可能用到的关键字如下：new、malloc、delete、free等等。栈：由编译器(Compiler)自动分配释放，存放函数的参数值，局部变量的值等。其操作方式类似于数据结构中
回答一位网友对Scala的提问 chenchao051 scala map
本来准备在私信里直接回复了，但是发现不太方便，就简要回答在这里。问题写道对于scala的简洁十分佩服，但又觉得比较晦涩，例如一例，Map("a" -> List(11,111)).flatMap(_._2)，可否说下最后那个函数做了什么，真正在开发的时候也会如此简洁？谢谢先回答一点，在实际使用中，Scala毫无疑问就是这么简单。
mysql 取每组前几条记录 daizj mysql 分组最大值最小值每组三条记录
一、对分组的记录取前N条记录：例如：取每组的前3条最大的记录 1.用子查询： SELECT * FROM tableName a WHERE 3> (SELECT COUNT(*) FROM tableName b WHERE b.id=a.id AND b.cnt>a. cnt) ORDER BY a.id,a.account DE
HTTP深入浅出 http请求 dcj3sjt126com http
HTTP(HyperText Transfer Protocol)是一套计算机通过网络进行通信的规则。计算机专家设计出HTTP，使HTTP客户（如Web浏览器）能够从HTTP服务器(Web服务器)请求信息和服务，HTTP目前协议的版本是1.1.HTTP是一种无状态的协议，无状态是指Web浏览器和Web服务器之间不需要建立持久的连接，这意味着当一个客户端向服务器端发出请求，然后We
判断MySQL记录是否存在方法比较 dcj3sjt126com mysql
把数据写入到数据库的时，常常会碰到先要检测要插入的记录是否存在，然后决定是否要写入。　　我这里总结了判断记录是否存在的常用方法：　　sql语句： select count ( * ) from tablename; 　　然后读取count(*)的值判断记录是否存在。对于这种方法性能上有些浪费，我们只是想判断记录记录是否存在，没有必要全部都查出来。
对HTML XML的一点认识 e200702084 html xml
感谢http://www.w3school.com.cn提供的资料 HTML 文档中的每个成分都是一个节点。节点根据 DOM，HTML 文档中的每个成分都是一个节点。 DOM 是这样规定的：整个文档是一个文档节点每个 HTML 标签是一个元素节点包含在 HTML 元素中的文本是文本节点每一个 HTML 属性是一个属性节点注释属于注释节点 Node 层次
jquery分页插件 genaiwei jquery Web 前端分页插件
//jquery页码控件// 创建一个闭包 (function($) { // 插件的定义 $.fn.pageTool = function(options) { var totalPa
Mybatis与Ibatis对照入门于学习 Josh_Persistence mybatis ibatis 区别联系
一、为什么使用IBatis/Mybatis 对于从事 Java EE 的开发人员来说，iBatis 是一个再熟悉不过的持久层框架了，在 Hibernate、JPA 这样的一站式对象 / 关系映射（O/R Mapping）解决方案盛行之前，iBaits 基本是持久层框架的不二选择。即使在持久层框架层出不穷的今天，iBatis 凭借着易学易用、
C中怎样合理决定使用那种整数类型？秋风扫落叶 c 数据类型
如果需要大数值(大于32767或小于32767), 使用long 型。否则, 如果空间很重要 (如有大数组或很多结构), 使用 short 型。除此之外, 就使用 int 型。如果严格定义的溢出特征很重要而负值无关紧要, 或者你希望在操作二进制位和字节时避免符号扩展的问题, 请使用对应的无符号类型。但是, 要注意在表达式中混用有符号和无符号值的情况。 &nbs
maven问题 zhb8015 maven问题
问题1： Eclipse 中新建maven项目无法添加src/main/java 问题 eclipse创建maevn web项目，在选择maven_archetype_web原型后，默认只有src/main/resources这个Source Floder。按照maven目录结构，添加src/main/ja
(二)androidpn-server tomcat版源码解析之--push消息处理 spjich java androdipn 推送
在 (一)androidpn-server tomcat版源码解析之--项目启动这篇中，已经描述了整个推送服务器的启动过程，并且把握到了消息的入口即XmppIoHandler这个类，今天我将继续往下分析下面的核心代码，主要分为3大块，链接创建，消息的发送，链接关闭。先贴一段XmppIoHandler的部分代码 /** * Invoked from an I/O proc
用js中的formData类型解决ajax提交表单时文件不能被serialize方法序列化的问题中华好儿孙 JavaScript Ajax Web 上传文件 FormData
var formData = new FormData($("#inputFileForm")[0]); $.ajax({ type:'post', url:webRoot+"/electronicContractUrl/webapp/uploadfile", data:formData, async: false, ca
mybatis常用jdbcType数据类型 ysj5125094 mybatis mapper jdbcType
MyBatis 通过包含的jdbcType 类型 BIT FLOAT CHAR

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他