神经网络语言模型

【综述】大规模语言模型用于漏洞检测与修复：文献综述与未来研究方向

论文标题：大规模语言模型用于漏洞检测与修复：文献综述与未来研究方向这篇论文的标题是《LargeLanguageModelforVulnerabilityDetectionandRepair:LiteratureReviewandtheRoadAhead

flypwn·2025-03-27 06:54

大语言模型应用指南：执行Python代码

大语言模型应用指南：执行Python代码关键词：大语言模型、Python、代码执行、LangChain、OpenAI、安全性、性能优化1.背景介绍随着人工智能技术的快速发展，大语言模型（LargeLanguageModels

AI天才研究院·2025-03-27 06:23

【论文阅读】基于思维链提示的大语言模型软件漏洞发现与修复方法研究

这篇文章来自于Chain-of-ThoughtPromptingofLargeLanguageModelsforDiscoveringandFixingSoftwareVulnerabilities摘要软件安全漏洞在现代系统中呈现泛在化趋势，其引发的社会影响日益显著。尽管已有多种防御技术被提出，基于深度学习（DL）的方法因能规避传统技术瓶颈而备受关注，但面临两大核心挑战：任务专用标注数据集的规模质

君的名字·2025-03-27 06:50

2024年令人兴奋的10篇大模型研究和论文

从复杂的推理语言模型到VLMs和视频模型，进步是可以看得到的。VisionMamba:EfficientVisualRepresentationLearningwithBidirect

福福很能吃·2025-03-27 05:19

从感知器准则到最小平方误差准则——与神经网络的发展类比

与神经网络的发展类比感知器准则→\rightarrow→最小平方误差判别∣∣||∣∣↓\downarrow↓神经网络，误差反馈学习∣∣||∣∣感知器模型（误差反馈学习）→\rightarrow→线性神经单元

phoenix@Capricornus·2025-03-27 05:48

SCI论文阅读指令（特征工程）

GiantGo·2025-03-27 05:13

大模型模型架构

第7章模型架构7.1大模型之模型概括语言模型的一开始就可以被看做是一个黑箱，当前大规模语言模型的能力在于给定一个基于自身需求的prompt就可以生成符合需求的结果。

.whl·2025-03-27 01:50

DeepLabv3+改进23:在主干网络中添加DilatedReparamBlock

本专栏重磅推出：✅独家改进策略：融合注意力机制、轻量化设计与多尺度优化✅即插即用模块：ASPP+升级、解码器PS:订阅专栏提供完整代码论文简介近年来，大核卷积神经网络(ConvNets)得到了广泛的研究关注

AICurator·2025-03-26 22:29

Unsloth 库和Hugging Face Transformers 库对比使用

Unsloth库：Unsloth是一个专注于加速大语言模型（LLM）微调的开源工具。它通过优化计算步骤和GPU内核，显著提升训练速度并减少内存使用。

背太阳的牧羊人·2025-03-26 21:17

手把手带你在Windows中搭建本地知识库（基于ollama本地部署大模型+客户端安装版AnythingLLM）非docker环境部署

一、Ollama安装Ollama是一个专注于本地运行大型语言模型（LLM）的框架，它使得用户能够在自己的计算机上轻松地部署和使用大型语言模型，而无需依赖昂贵的GPU资源。

慕慕涵雪月光白·2025-03-26 18:24

Linux安装AnythingLLM

它能够将任何文档、资源或内容片段转化为大语言模型（LLM）在聊天中可以利用的相关上下文。AnythingLLM支持多种文档类型（PDF、TXT、DOCX等），具有对话和查询两种聊天模式。

neter.asia·2025-03-26 18:52

Pytorch实现之对称卷积神经网络结构实现超分辨率

该改进方法基于深度神经网络，其生成模型包含多层卷积模块和多层反卷积模块，其中在感知损失基础上增加了跳层连接和损失函数。该判别模型由多层神经网络组成，其损失函数基于生成式对抗网络生成的判别模型损失函数。

这张生成的图像能检测吗·2025-03-26 17:51

大模型时代，新手和程序员如何转型入局AI行业？

然而，这些大模型的背后隐藏着更为深厚的基础技术——传统机器学习和神经网络。理解这些基础技术，不仅能够帮助我更好地使用大模型，还能为我提供创新和解决实际问题的能力。

七七Seven～·2025-03-26 14:26

走进吴恩达：揭秘Prompt Engineering 提示词工程

PromptEngineering概览何为Prompt在自然语言处理领域，尤其是与大型语言模型（LLM）互动时，Prompt起着至关重要的作用。

AI大模型教程·2025-03-26 14:55

VGG 改进：添加ScConv空间与通道特征重构卷积

可以直接使用，设置好输入和输出的图片维度即可1.ScConv空间与通道特征重构卷积ScConv(SpatialandChannelreconstructionConvolution)是一种旨在减少卷积神经网络中特征冗余的新型卷积操作

听风吹等浪起·2025-03-26 14:23

技术解构麦萌短剧《命运旋涡》：从「时间序列的因果重构」到「对抗性干预的强化学习」

1.时间序列重构：循环神经网络中的记忆觉醒许晴（Agent_Xu）的重生可建模为时间序列的对抗性重采样：pythonclassTimeLoop(nn.Module):def__init__(self,init_step

短剧萌·2025-03-26 13:18

【DeepSeek大语言模型】AI智能体开发与大语言模型的本地化部署、优化技术

智能体是一种能够自主行动、感知环境、做出决策并与环境交互的智能应用或实体。特性自主性：智能体能够根据自身的感知和内部状态，独立做出决策，无需人类直接干预。反应性：能对环境的变化做出实时反应，及时调整自身行为以适应环境的动态变化。目的性：具有明确的目标或任务，其行为是为了实现这些目标，会根据目标来规划和执行行动。学习能力：能够从经验中学习，通过处理新信息和积累经验来改进其未来的行为，不断提升自身性能

赵钰老师·2025-03-26 12:15

深度学习5 神经网络、参数初始化

一、模型保存与加载1、序列化方式保存方式：torch.save(model,"model.pkl")打开方式：model=torch.load("model.pkl",map_location="cpu")importtorchimporttorch.nnasnnclassMyModle(nn.Module):def__init__(self,input_size,output_size):su

今天又是学习·2025-03-26 10:23

ChatGPT、DeepSeek、Grok：AI 语言模型的技术演进与未来趋势

1.引言人工智能（AI）技术的快速发展，使得大语言模型（LLM）成为众多行业的重要工具。ChatGPT、DeepSeek和Grok作为当今主流的AI语言模型，各自承载着不同的技术愿景和应用方向。

慌ZHANG·2025-03-26 09:52

AI 大模型的技术架构与应用解析

1.引言人工智能（AI）大模型正在重塑全球科技生态，以ChatGPT、DeepSeek、Grok为代表的AI语言模型在自然语言处理（NLP）、智能对话、内容生成等领域展现了卓越的能力。

慌ZHANG·2025-03-26 09:52

深度学习中常见的权重参数初始化方法

问题：对于深度神经网络来说，这种方法不可取。因为如果所有权重都初始化为相同的值（如零），所有神经元在每一层的输出和梯度都会相同

真以为Sophie是猪啊·2025-03-26 09:52

使用卷积神经网络对图像处理

transforms.Grayscale()是用于图片处理时简化通道数与特征。transforms.Normalize(mean=[0.61427461],std=[0.24995622])这一步的作用对图像数据进行归一化处理。归一化通常将图像的像素值从原始范围（通常是[0,255]）转换到一个标准化的范围（通常是[-1,1]或[0,1]），同时根据给定的均值(mean)和标准差(std)进行标准

RockLiu@805·2025-03-26 06:53

探索AI的无限可能，体验智能对话的未来，大模型 API 演示

AI的无限可能，体验智能对话的未来，大模型API演示效果展示：项目概述这是一个基于Vue3+TypeScript+Vite构建的VistaAI演示项目，旨在提供一个简洁易用的界面来展示VistaAI大语言模型的能力

Southern Wind·2025-03-26 04:41

解读目前AI就业岗位——大语言模型（LLM）应用工程师学习路线、就业前景及岗位全解析

文章目录前言什么是大语言模型（LLM）应用工程师？岗位职责就业前景如何？

AI敲代码的手套·2025-03-26 04:38

深入理解Aider sends a repo map

Aider是一个AI编程辅助工具，主要通过与大语言模型（如GPT或Claude）协作来帮助开发者编辑代码。RepoMap是它提供给LLM的上下文机制，用于提升模型对代码库的理解能力。

超级小龙虾·2025-03-26 04:37

MATLAB 2024b深度学习工具箱新特性全面解析与DeepSeek大模型集成开发：卷积神经网络、迁移学习算法、时间卷积网络、生成式对抗网络、自编码器、目标检测YOLO模型、语义分割、注意力机制等

随着人工智能技术的飞速发展，其与多学科的交叉融合以及在工程实践领域的纵深拓展已成为时代潮流。在这一背景下，MATLAB2024b深度学习工具箱应运而生，凭借架构创新与功能强化，为科研工作者提供了一套全栈式的科研创新与行业应用解决方案，具有重要的时代意义。本教程紧密围绕该版本工具链的三大革新方向展开，致力于助力科研工作者在深度学习领域取得突破性进展。首先，构建了覆盖经典模型与前沿架构的体系化教程，从

WangYan2022·2025-03-26 03:06

Python实现deepseek接口的调用

简介：DeepSeek是一个强大的大语言模型，提供API接口供开发者调用。

才华是浅浅的耐心·2025-03-26 02:54

在光速的边缘：MiniMax-01的算法实现与细节解析

在当今人工智能的快速发展中，语言模型和视觉语言模型的进步引起了广泛关注。

步子哥·2025-03-26 02:23

国产670亿参数的DeepSeek：超越Llama2，全面开源

模型概述DeepSeek，一款国产大型语言模型（LLM），凭借其670亿参数的规模，正引领着人工智能领域的新浪潮。

努力犯错·2025-03-26 02:51

LMDrive: 基于大语言模型的闭环端到端自动驾驶

0.资源链接论文:LMDrive:Closed-LoopEnd-to-EndDrivingwithLargeLanguageModels项目:https://hao-shao.com/projects/lmdrive.html1.背景动机现有的自动驾驶方法存在以下问题：适用场景局限：对常见的简单场景有效，但在长尾事件和城市复杂场景时存在挑战，易导致严重事故交互理解局限：依赖于有限格式的输入（如传感

AI-Seeker·2025-03-26 02:21

【智能体架构：Agent】LangChain智能体类型ReAct、Self-ASK的区别

1.什么是智能体将大语言模型作为一个推理引擎。给定一个任务，智能体自动生成完成任务所需步骤，执行相应动作（例如选择并调用工具），直到任务完成。

星星点点洲·2025-03-26 01:47

《Python实战进阶》第32集：使用 TensorFlow 构建神经网络

第32集：使用TensorFlow构建神经网络摘要TensorFlow是一个功能强大的深度学习框架，广泛应用于构建和训练神经网络模型。

带娃的IT创业者·2025-03-26 01:46

Ray 源码分析(16)—Ray Serve

它具有多项用于服务大语言模型的特性和性能优化，例如响应流、动态请求批处理、多节点/多GPU服务等。据说OpenAI背后用

Jim.Li·2025-03-26 01:15

曦智科技全球首发新一代光电混合计算卡

我们坚信，光电混合将会为人工智能、大语言模型、智能制造等领域带来算力革新。”天枢是一款深度融合光芯片与电芯片各自优势特点，并采用了3D先进封装技术的可编程光电混

·2025-03-25 23:39

快速了解Transformer与循环神经网络（LSTM/RNN）的区别

Transformer与循环神经网络（LSTM/RNN）的区别关键差异总结：并行性：Transformer的全局并行计算大幅提升训练效率，而RNN/LSTM受限于序列顺序。

Panesle·2025-03-25 23:30

Python深度学习框架：用神经网络预测股市，科学or玄学？

小伙伴们，今天我们不谈K线，不谈MACD，我们来聊聊如何用Python的深度学习框架，让神经网络帮你"算命"——啊不，是预测股市走势！

西蒙斯.果·2025-03-25 22:24

6 卷积神经网络实现MNIST手写数字识别

代码实现了基本的CNN共两层神经网络，包括两层卷积层两层池化层使用的数据集为单通道28*28像素的MNIST数据集，共10个标签训练集可直接在代码里下载代码模块如下：importtorchfromtorchimportnnfromtorch.utils.dataimportDataLoaderfromtorchvisionimportdatasets

机械专业搞视觉的小白·2025-03-25 21:18

基于Python卷积神经网络的Mnist手写数字识别

使用卷积神经网络（ConvolutionalNeuralNetwork，简称CNN）来解决手写数字识别问题，不

2301_79809972·2025-03-25 20:12

PyTorch 深度学习实战（8）：Transformer 与机器翻译（基于本地中英文文本文件）

在上一篇文章中，我们探讨了循环神经网络（RNN）及其在文本分类中的应用。

进取星辰·2025-03-25 18:58

使用 ByteDance 的 UI-TARS Desktop 探索 AI 驱动的 GUI 自动化新前沿

ByteDance近期推出的UI-TARSDesktop（基于其强大的UI-TARS视觉-语言模型）为我们展示了一种全新的可能性：通过自然语言控制计算机，实现图形用户界面（GUI）的智能化自动化。

码事漫谈·2025-03-25 18:26

人工智能 - SpatialLM：三维空间理解的开源大语言模型

项目概述SpatialLM是由杭州群核科技（“杭州六小龙”之一）于GTC2025大会上开源的三维空间理解大语言模型。

天机️灵韵·2025-03-25 18:25

使用LangChain和中文羊驼2.0搭建离线版的ChatPDF

本文的目标是搭建一个离线版本的ChatPDF（支持中英文），让你随心地与你想要阅读的PDF对话，借助大语言模型提升获取知识的效率。除此之外，你还可以：了解使用LangChain完整的流程。

大模型常客·2025-03-25 18:49

NLP高频面试题（十三）——什么是大模型幻觉，如何解决大模型幻觉

大模型幻觉（Hallucination）是指大型语言模型在生成文本时，

Chaos_Wang_·2025-03-25 17:47

大规模语言模型在自动软件需求分析与验证中的应用

大规模语言模型在自动软件需求分析与验证中的应用关键词：大规模语言模型、软件需求分析、需求验证、自然语言处理、软件工程摘要：本文深入探讨了大规模语言模型在自动软件需求分析与验证中的应用。

杭州大厂Java程序媛·2025-03-25 16:40

Java 中调用语言模型（如 OpenAI、阿里云通义千问、Hugging Face 等）API 的详细步骤和示例代码，涵盖常见场景及注意事项

以下是Java中调用语言模型（如OpenAI、阿里云通义千问、HuggingFace等）API的详细步骤和示例代码，涵盖常见场景及注意事项：1.常见语言模型API选择(1)OpenAIAPI特点：支持GPT

爱的叹息·2025-03-25 15:04

生成式AI驱动的高分子材料研发与应用

近年来，生成式人工智能（如大语言模型）在材料科学领域掀起革命性浪潮，其核心能力（从海量数据中挖掘构效关系、实现分子逆向设计）正在颠覆传统材料研发模式。

keyan_889·2025-03-25 15:29

神经网络解决非线性二分类

这份Python代码实现了一个简单的神经网络，用于解决复杂的非线性二分类问题。具体步骤包含生成数据集、定义神经网络模型、训练模型、测试模型以及可视化决策边界。

欣然～·2025-03-25 12:37

LangChain4j 与 LLM 代理（Agent）机制的深度结合

LangChain4j与LLM代理（Agent）机制的深度结合在大语言模型（LLM）的应用开发中，Agent（代理）是一个强大的概念，它可以使LLM不仅仅是一个简单的对话模型，而是能够动态决策、调用工具

小张学Ai·2025-03-25 09:18

如何在多个GPU中训练非常大的模型？

目录一、并行训练策略1.数据并行2.模型并行3.混合并行：4.上下文并行二、内存优化技术三、总结在多个GPU上训练超大规模模型（如千亿参数级语言模型）需要结合并行策略、内存优化技术、分布式框架。

Mr终游·2025-03-25 07:00

模型量化的原因和方法

优化模型参数以适应有限内存环境为了使具有大量参数（例如Llama3.1的4050亿个参数）的大型语言模型在合理内存的设备上高效运行，需要对模型进行一系列优化。

潇湘馆记·2025-03-25 06:27

推荐频道