E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
神经网络语言模型
【综述】大规模
语言模型
用于漏洞检测与修复:文献综述与未来研究方向
论文标题:大规模
语言模型
用于漏洞检测与修复:文献综述与未来研究方向这篇论文的标题是《LargeLanguageModelforVulnerabilityDetectionandRepair:LiteratureReviewandtheRoadAhead
flypwn
·
2025-03-27 06:54
语言模型
网络
人工智能
大
语言模型
应用指南:执行Python代码
大
语言模型
应用指南:执行Python代码关键词:大
语言模型
、Python、代码执行、LangChain、OpenAI、安全性、性能优化1.背景介绍随着人工智能技术的快速发展,大
语言模型
(LargeLanguageModels
AI天才研究院
·
2025-03-27 06:23
计算
DeepSeek
R1
&
大数据AI人工智能大模型
计算科学
神经计算
深度学习
神经网络
大数据
人工智能
大型语言模型
AI
AGI
LLM
Java
Python
架构设计
Agent
RPA
【论文阅读】基于思维链提示的大
语言模型
软件漏洞发现与修复方法研究
这篇文章来自于Chain-of-ThoughtPromptingofLargeLanguageModelsforDiscoveringandFixingSoftwareVulnerabilities摘要软件安全漏洞在现代系统中呈现泛在化趋势,其引发的社会影响日益显著。尽管已有多种防御技术被提出,基于深度学习(DL)的方法因能规避传统技术瓶颈而备受关注,但面临两大核心挑战:任务专用标注数据集的规模质
君的名字
·
2025-03-27 06:50
【机器学习】
【论文】
论文阅读
语言模型
人工智能
2024年令人兴奋的10篇大模型研究和论文
从复杂的推理
语言模型
到VLMs和视频模型,进步是可以看得到的。VisionMamba:EfficientVisualRepresentationLearningwithBidirect
福福很能吃
·
2025-03-27 05:19
人工智能
自然语言处理
语言模型
transformer
开发语言
从感知器准则到最小平方误差准则——与
神经网络
的发展类比
与
神经网络
的发展类比感知器准则→\rightarrow→最小平方误差判别∣∣||∣∣↓\downarrow↓
神经网络
,误差反馈学习∣∣||∣∣感知器模型(误差反馈学习)→\rightarrow→线性神经单元
phoenix@Capricornus
·
2025-03-27 05:48
模式识别与机器学习
神经网络
人工智能
机器学习
SCI论文阅读指令(特征工程)
优先推荐kimi,当然DeepSeek、QwQ-32B等大
语言模型
也可以。测试了一下总结的还不错,很详细。
GiantGo
·
2025-03-27 05:13
科研
论文阅读
大模型模型架构
第7章模型架构7.1大模型之模型概括
语言模型
的一开始就可以被看做是一个黑箱,当前大规模
语言模型
的能力在于给定一个基于自身需求的prompt就可以生成符合需求的结果。
.whl
·
2025-03-27 01:50
深度学习专栏
人工智能学习专栏
大模型
DeepLabv3+改进23:在主干网络中添加DilatedReparamBlock
本专栏重磅推出:✅独家改进策略:融合注意力机制、轻量化设计与多尺度优化✅即插即用模块:ASPP+升级、解码器PS:订阅专栏提供完整代码论文简介近年来,大核卷积
神经网络
(ConvNets)得到了广泛的研究关注
AICurator
·
2025-03-26 22:29
深度学习
python
DEEPLABV3+
语义分割
Unsloth 库和Hugging Face Transformers 库对比使用
Unsloth库:Unsloth是一个专注于加速大
语言模型
(LLM)微调的开源工具。它通过优化计算步骤和GPU内核,显著提升训练速度并减少内存使用。
背太阳的牧羊人
·
2025-03-26 21:17
模型微调
模型加载
语言模型
手把手带你在Windows中搭建本地知识库(基于ollama本地部署大模型+客户端安装版AnythingLLM)非docker环境部署
一、Ollama安装Ollama是一个专注于本地运行大型
语言模型
(LLM)的框架,它使得用户能够在自己的计算机上轻松地部署和使用大型
语言模型
,而无需依赖昂贵的GPU资源。
慕慕涵雪月光白
·
2025-03-26 18:24
llama
知识图谱
Linux安装AnythingLLM
它能够将任何文档、资源或内容片段转化为大
语言模型
(LLM)在聊天中可以利用的相关上下文。AnythingLLM支持多种文档类型(PDF、TXT、DOCX等),具有对话和查询两种聊天模式。
neter.asia
·
2025-03-26 18:52
运维
python
Pytorch实现之对称卷积
神经网络
结构实现超分辨率
该改进方法基于深度
神经网络
,其生成模型包含多层卷积模块和多层反卷积模块,其中在感知损失基础上增加了跳层连接和损失函数。该判别模型由多层
神经网络
组成,其损失函数基于生成式对抗网络生成的判别模型损失函数。
这张生成的图像能检测吗
·
2025-03-26 17:51
优质GAN模型训练自己的数据集
pytorch
cnn
人工智能
生成对抗网络
神经网络
深度学习
大模型时代,新手和程序员如何转型入局AI行业?
然而,这些大模型的背后隐藏着更为深厚的基础技术——传统机器学习和
神经网络
。理解这些基础技术,不仅能够帮助我更好地使用大模型,还能为我提供创新和解决实际问题的能力。
七七Seven~
·
2025-03-26 14:26
人工智能
数据库
学习
agi
前端
语言模型
走进吴恩达:揭秘Prompt Engineering 提示词工程
PromptEngineering概览何为Prompt在自然语言处理领域,尤其是与大型
语言模型
(LLM)互动时,Prompt起着至关重要的作用。
AI大模型教程
·
2025-03-26 14:55
prompt
人工智能
大模型
langchain
提示词工程
LLM
RAG
VGG 改进:添加ScConv空间与通道特征重构卷积
可以直接使用,设置好输入和输出的图片维度即可1.ScConv空间与通道特征重构卷积ScConv(SpatialandChannelreconstructionConvolution)是一种旨在减少卷积
神经网络
中特征冗余的新型卷积操作
听风吹等浪起
·
2025-03-26 14:23
AI
改进系列
重构
深度学习
人工智能
神经网络
cnn
技术解构麦萌短剧《命运旋涡》:从「时间序列的因果重构」到「对抗性干预的强化学习」
1.时间序列重构:循环
神经网络
中的记忆觉醒许晴(Agent_Xu)的重生可建模为时间序列的对抗性重采样:pythonclassTimeLoop(nn.Module):def__init__(self,init_step
短剧萌
·
2025-03-26 13:18
重构
python
机器学习
【DeepSeek大
语言模型
】AI智能体开发与大
语言模型
的本地化部署、优化技术
智能体是一种能够自主行动、感知环境、做出决策并与环境交互的智能应用或实体。特性自主性:智能体能够根据自身的感知和内部状态,独立做出决策,无需人类直接干预。反应性:能对环境的变化做出实时反应,及时调整自身行为以适应环境的动态变化。目的性:具有明确的目标或任务,其行为是为了实现这些目标,会根据目标来规划和执行行动。学习能力:能够从经验中学习,通过处理新信息和积累经验来改进其未来的行为,不断提升自身性能
赵钰老师
·
2025-03-26 12:15
ChatGPT
机器学习
DeepSeek
人工智能
语言模型
自然语言处理
数据分析
深度学习5
神经网络
、参数初始化
一、模型保存与加载1、序列化方式保存方式:torch.save(model,"model.pkl")打开方式:model=torch.load("model.pkl",map_location="cpu")importtorchimporttorch.nnasnnclassMyModle(nn.Module):def__init__(self,input_size,output_size):su
今天又是学习
·
2025-03-26 10:23
深度学习
人工智能
ChatGPT、DeepSeek、Grok:AI
语言模型
的技术演进与未来趋势
1.引言人工智能(AI)技术的快速发展,使得大
语言模型
(LLM)成为众多行业的重要工具。ChatGPT、DeepSeek和Grok作为当今主流的AI
语言模型
,各自承载着不同的技术愿景和应用方向。
慌ZHANG
·
2025-03-26 09:52
AI模型
人工智能
chatgpt
AI 大模型的技术架构与应用解析
1.引言人工智能(AI)大模型正在重塑全球科技生态,以ChatGPT、DeepSeek、Grok为代表的AI
语言模型
在自然语言处理(NLP)、智能对话、内容生成等领域展现了卓越的能力。
慌ZHANG
·
2025-03-26 09:52
AI模型
人工智能
深度学习中常见的权重参数初始化方法
问题:对于深度
神经网络
来说,这种方法不可取。因为如果所有权重都初始化为相同的值(如零),所有神经元在每一层的输出和梯度都会相同
真以为Sophie是猪啊
·
2025-03-26 09:52
基础常见知识
深度学习
人工智能
使用卷积
神经网络
对图像处理
transforms.Grayscale()是用于图片处理时简化通道数与特征。transforms.Normalize(mean=[0.61427461],std=[0.24995622])这一步的作用对图像数据进行归一化处理。归一化通常将图像的像素值从原始范围(通常是[0,255])转换到一个标准化的范围(通常是[-1,1]或[0,1]),同时根据给定的均值(mean)和标准差(std)进行标准
RockLiu@805
·
2025-03-26 06:53
机器视觉
cnn
深度学习
神经网络
探索AI的无限可能,体验智能对话的未来,大模型 API 演示
AI的无限可能,体验智能对话的未来,大模型API演示效果展示:项目概述这是一个基于Vue3+TypeScript+Vite构建的VistaAI演示项目,旨在提供一个简洁易用的界面来展示VistaAI大
语言模型
的能力
Southern Wind
·
2025-03-26 04:41
AI
Vue3
TS
人工智能
typescript
vue
前端
解读目前AI就业岗位——大
语言模型
(LLM)应用工程师学习路线、就业前景及岗位全解析
文章目录前言什么是大
语言模型
(LLM)应用工程师?岗位职责就业前景如何?
AI敲代码的手套
·
2025-03-26 04:38
AI岗位介绍
人工智能
语言模型
学习
深入理解Aider sends a repo map
Aider是一个AI编程辅助工具,主要通过与大
语言模型
(如GPT或Claude)协作来帮助开发者编辑代码。RepoMap是它提供给LLM的上下文机制,用于提升模型对代码库的理解能力。
超级小龙虾
·
2025-03-26 04:37
python
MATLAB 2024b深度学习工具箱新特性全面解析与DeepSeek大模型集成开发:卷积
神经网络
、迁移学习算法、时间卷积网络、生成式对抗网络、自编码器、目标检测YOLO模型、语义分割、注意力机制等
随着人工智能技术的飞速发展,其与多学科的交叉融合以及在工程实践领域的纵深拓展已成为时代潮流。在这一背景下,MATLAB2024b深度学习工具箱应运而生,凭借架构创新与功能强化,为科研工作者提供了一套全栈式的科研创新与行业应用解决方案,具有重要的时代意义。本教程紧密围绕该版本工具链的三大革新方向展开,致力于助力科研工作者在深度学习领域取得突破性进展。首先,构建了覆盖经典模型与前沿架构的体系化教程,从
WangYan2022
·
2025-03-26 03:06
DeepSeek
ChatGPT
机器学习/深度学习
数据语言
matlab
深度学习
MATLAB
2024b
DeepSeek
本地化部署
Python实现deepseek接口的调用
简介:DeepSeek是一个强大的大
语言模型
,提供API接口供开发者调用。
才华是浅浅的耐心
·
2025-03-26 02:54
python
数据库
java
在光速的边缘:MiniMax-01的算法实现与细节解析
在当今人工智能的快速发展中,
语言模型
和视觉
语言模型
的进步引起了广泛关注。
步子哥
·
2025-03-26 02:23
AGI通用人工智能
算法
人工智能
国产670亿参数的DeepSeek:超越Llama2,全面开源
模型概述DeepSeek,一款国产大型
语言模型
(LLM),凭借其670亿参数的规模,正引领着人工智能领域的新浪潮。
努力犯错
·
2025-03-26 02:51
microsoft
llama
自然语言处理
人工智能
语言模型
LMDrive: 基于大
语言模型
的闭环端到端自动驾驶
0.资源链接论文:LMDrive:Closed-LoopEnd-to-EndDrivingwithLargeLanguageModels项目:https://hao-shao.com/projects/lmdrive.html1.背景动机现有的自动驾驶方法存在以下问题:适用场景局限:对常见的简单场景有效,但在长尾事件和城市复杂场景时存在挑战,易导致严重事故交互理解局限:依赖于有限格式的输入(如传感
AI-Seeker
·
2025-03-26 02:21
语言模型
人工智能
自动驾驶
【智能体架构:Agent】LangChain智能体类型ReAct、Self-ASK的区别
1.什么是智能体将大
语言模型
作为一个推理引擎。给定一个任务,智能体自动生成完成任务所需步骤,执行相应动作(例如选择并调用工具),直到任务完成。
星星点点洲
·
2025-03-26 01:47
LangChain开发过程
langchain
《Python实战进阶》第32集:使用 TensorFlow 构建
神经网络
第32集:使用TensorFlow构建
神经网络
摘要TensorFlow是一个功能强大的深度学习框架,广泛应用于构建和训练
神经网络
模型。
带娃的IT创业者
·
2025-03-26 01:46
Python实战进阶
python
tensorflow
神经网络
Ray 源码分析(16)—Ray Serve
它具有多项用于服务大
语言模型
的特性和性能优化,例如响应流、动态请求批处理、多节点/多GPU服务等。据说OpenAI背后用
Jim.Li
·
2025-03-26 01:15
AI
Infra
c++
ai
分布式
人工智能
架构
曦智科技全球首发新一代光电混合计算卡
我们坚信,光电混合将会为人工智能、大
语言模型
、智能制造等领域带来算力革新。”天枢是一款深度融合光芯片与电芯片各自优势特点,并采用了3D先进封装技术的可编程光电混
·
2025-03-25 23:39
量子位
快速了解Transformer与循环
神经网络
(LSTM/RNN)的区别
Transformer与循环
神经网络
(LSTM/RNN)的区别关键差异总结:并行性:Transformer的全局并行计算大幅提升训练效率,而RNN/LSTM受限于序列顺序。
Panesle
·
2025-03-25 23:30
总结
rnn
transformer
lstm
人工智能
深度学习
Python深度学习框架:用
神经网络
预测股市,科学or玄学?
小伙伴们,今天我们不谈K线,不谈MACD,我们来聊聊如何用Python的深度学习框架,让
神经网络
帮你"算命"——啊不,是预测股市走势!
西蒙斯.果
·
2025-03-25 22:24
量化洞见
python
numpy
学习
pandas
神经网络
6 卷积
神经网络
实现MNIST手写数字识别
代码实现了基本的CNN共两层
神经网络
,包括两层卷积层两层池化层使用的数据集为单通道28*28像素的MNIST数据集,共10个标签训练集可直接在代码里下载代码模块如下:importtorchfromtorchimportnnfromtorch.utils.dataimportDataLoaderfromtorchvisionimportdatasets
机械专业搞视觉的小白
·
2025-03-25 21:18
cnn
深度学习
神经网络
基于Python卷积
神经网络
的Mnist手写数字识别
使用卷积
神经网络
(ConvolutionalNeuralNetwork,简称CNN)来解决手写数字识别问题,不
2301_79809972
·
2025-03-25 20:12
python
python
plotly
PyTorch 深度学习实战(8):Transformer 与机器翻译(基于本地中英文文本文件)
在上一篇文章中,我们探讨了循环
神经网络
(RNN)及其在文本分类中的应用。
进取星辰
·
2025-03-25 18:58
PyTorch
深度学习实战
深度学习
pytorch
transformer
使用 ByteDance 的 UI-TARS Desktop 探索 AI 驱动的 GUI 自动化新前沿
ByteDance近期推出的UI-TARSDesktop(基于其强大的UI-TARS视觉-
语言模型
)为我们展示了一种全新的可能性:通过自然语言控制计算机,实现图形用户界面(GUI)的智能化自动化。
码事漫谈
·
2025-03-25 18:26
AI
ui
人工智能
自动化
人工智能 - SpatialLM:三维空间理解的开源大
语言模型
项目概述SpatialLM是由杭州群核科技(“杭州六小龙”之一)于GTC2025大会上开源的三维空间理解大
语言模型
。
天机️灵韵
·
2025-03-25 18:25
人工智能
#
VLA
具身智能
语言模型
人工智能
自然语言处理
使用LangChain和中文羊驼2.0搭建离线版的ChatPDF
本文的目标是搭建一个离线版本的ChatPDF(支持中英文),让你随心地与你想要阅读的PDF对话,借助大
语言模型
提升获取知识的效率。除此之外,你还可以:了解使用LangChain完整的流程。
大模型常客
·
2025-03-25 18:49
langchain
人工智能
ai
agi
经验分享
笔记
NLP高频面试题(十三)——什么是大模型幻觉,如何解决大模型幻觉
大模型幻觉(Hallucination)是指大型
语言模型
在生成文本时,
Chaos_Wang_
·
2025-03-25 17:47
NLP常见面试题
自然语言处理
人工智能
大规模
语言模型
在自动软件需求分析与验证中的应用
大规模
语言模型
在自动软件需求分析与验证中的应用关键词:大规模
语言模型
、软件需求分析、需求验证、自然语言处理、软件工程摘要:本文深入探讨了大规模
语言模型
在自动软件需求分析与验证中的应用。
杭州大厂Java程序媛
·
2025-03-25 16:40
DeepSeek
R1
&
AI人工智能与大数据
语言模型
需求分析
人工智能
ai
Java 中调用
语言模型
(如 OpenAI、阿里云通义千问、Hugging Face 等)API 的详细步骤和示例代码,涵盖常见场景及注意事项
以下是Java中调用
语言模型
(如OpenAI、阿里云通义千问、HuggingFace等)API的详细步骤和示例代码,涵盖常见场景及注意事项:1.常见
语言模型
API选择(1)OpenAIAPI特点:支持GPT
爱的叹息
·
2025-03-25 15:04
Java
基础整理
java
语言模型
阿里云
生成式AI驱动的高分子材料研发与应用
近年来,生成式人工智能(如大
语言模型
)在材料科学领域掀起革命性浪潮,其核心能力(从海量数据中挖掘构效关系、实现分子逆向设计)正在颠覆传统材料研发模式。
keyan_889
·
2025-03-25 15:29
材料
人工智能
材料科学
高分子化学
AI
航空航天
电力工业
硕博研究生
神经网络
解决非线性二分类
这份Python代码实现了一个简单的
神经网络
,用于解决复杂的非线性二分类问题。具体步骤包含生成数据集、定义
神经网络
模型、训练模型、测试模型以及可视化决策边界。
欣然~
·
2025-03-25 12:37
神经网络
分类
人工智能
LangChain4j 与 LLM 代理(Agent)机制的深度结合
LangChain4j与LLM代理(Agent)机制的深度结合在大
语言模型
(LLM)的应用开发中,Agent(代理)是一个强大的概念,它可以使LLM不仅仅是一个简单的对话模型,而是能够动态决策、调用工具
小张学Ai
·
2025-03-25 09:18
langchain4j学习
langchain
后端
如何在多个GPU中训练非常大的模型?
目录一、并行训练策略1.数据并行2.模型并行3.混合并行:4.上下文并行二、内存优化技术三、总结在多个GPU上训练超大规模模型(如千亿参数级
语言模型
)需要结合并行策略、内存优化技术、分布式框架。
Mr终游
·
2025-03-25 07:00
大模型
人工智能
模型量化的原因和方法
优化模型参数以适应有限内存环境为了使具有大量参数(例如Llama3.1的4050亿个参数)的大型
语言模型
在合理内存的设备上高效运行,需要对模型进行一系列优化。
潇湘馆记
·
2025-03-25 06:27
人工智能
算法
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他