E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
大整型
大
模型隐空间推理论文阅读笔记
1.1摘要1.2引言TrainingLargeLanguageModelstoReasoninaContinuousLatentSpace一.简介机构:Meta代码:任务:特点:方法:1.1摘要现状:
大
语言模型往往局限在
猴猴猪猪
·
2025-03-03 03:57
AIGC
python
实验记录
人工智能
深度学习
《AI
大
模型开发笔记》DeepSeek技术创新点
一、DeepSeek横空出世DeepSeekV3以颠覆性技术架构创新强势破局!革命性的上下文处理机制实现长文本推理成本断崖式下降,综合算力需求锐减90%,开启高效AI新纪元!最新开源的DeepSeekV3模型不仅以顶尖基准测试成绩比肩业界SOTA模型,更以惊人的训练效率引发行业震动——仅耗费280万H800GPU小时(对应4e24FLOP@40%MFU)即达成巅峰性能。对比同级别Llama3-40
Richard Chijq
·
2025-03-03 03:57
AI大模型开发笔记
人工智能
笔记
【网安AIGC专题】46篇前沿代码
大
模型论文、24篇论文阅读笔记汇总_
大
模型在代码缺陷检测领域的应用实践(1)
写在最前面本文为邹德清教授的《网络安全专题》课堂笔记系列的文章,本次专题主题为
大
模型。
2401_84972910
·
2025-03-03 02:24
程序员
AIGC
论文阅读
笔记
【AI
大
模型应用开发】精读ToT:论文到源码,看透ToT思维树的实现流程
大家好,我是同学小张,持续学习C++进阶知识和AI
大
模型应用实战案例,持续分享,欢迎大家点赞+关注,共同学习和进步。
同学小张
·
2025-03-03 02:24
大模型
笔记
经验分享
人工智能
AIGC
思维树
大模型
LangChain解锁LLM
大
语言模型的结构化输出能力:调用 with_structured_output() 方法
什么是LLM的结构化输出能力?在一些工业级LLM应用或比较复杂的LLM应用编排环节,我们需要用LLM的输出作为下一环节的输入,而这个过程往往对LLM输出的格式有一定要求,比如JSON、XML、YAML、CSV、Markdown表格和HTML等比较常见的格式。因此我们需要通过各种方式手段让LLM具备符合我们期望的结构化输出能力,即模型能够按照用户指定的格式或规则生成内容(而不仅仅是自由形式的文本)的
晨欣
·
2025-03-03 02:50
langchain
语言模型
人工智能
LLaMA Factory添加新模型template的实战解析
985院校硕士毕业,现担任算法研究员一职,热衷于
大
模型算法的研究与应用。曾担任百度千帆
大
模型比赛、BPAA算法大赛评委,编写微软OpenAI考试认证指导手册。
herosunly
·
2025-03-03 01:19
大模型
llama
factory
新模型
template
实战解析
基于Dify
大
模型开发平台搭建业务应用场景
一、Dify
大
模型可以搭建多种业务应用场景前排提示,文末有
大
模型AGI-CSDN独家资料包哦!主要应用场景包括:1.智能客服系统自动响应:利用
大
模型的自然语言处理能力,实现24/7的自动客户服务。
Python程序员罗宾
·
2025-03-03 01:19
学习
人工智能
搜索引擎
笔记
github
位操作----位运算符详解(按位与(&),按位或(|),按位异或(^),按位取反(~)以及左移(<<)右移(>>))
前言此文主要为了本人复习知识在学习位操作时,我们首先要清楚的是:1.位运算的符操作数只能是
整型
和字符型对象2.在计算机中数据都是以二进制存储的(位操作就是直接对二进制进行操作)原码、反码、补码,这是学习位操作必不可少的知识一
什么半岛铁盒
·
2025-03-03 01:17
c语言
学习方法
量子位招聘 | DeepSeek帮我们改的招聘启事
如果你与我们志同道合,对AI
大
模型、具身智能、终端硬件、AI新媒体编辑感兴趣,我们正在招聘这些领域的原创作者。以下岗位均为全职,工作地点:北京中关村。
·
2025-03-03 01:32
量子位
C++ 变量的输入输出教程
例如:intage;//声明一个
整型
变量agedoublesalary;//声明一个双精度浮点型变量salarychargrade;//声明一个字符型变量grade在上述代码中,int、double和char
2501_90255623
·
2025-03-03 01:46
c++
Spring Boot 流式响应豆包
大
模型对话能力
当SpringBoot遇见豆包
大
模型:一场流式响应的"魔法吟唱"仪式一、前言:关于流式响应的奇妙比喻想象一下你正在火锅店点单,如果服务员必须等所有菜品都备齐才一次性端上来,你可能会饿得把菜单都啃了。
程序猿小白菜
·
2025-03-03 01:16
做个不一样的程序猿
AI生态圈
后端java生态圈
大模型
流式响应
java
AI
《解锁万相2.1
大
模型:开启视频创作新世界》:此文为AI自动生成
《解锁万相2.1
大
模型:开启视频创作新世界》:此文为AI自动生成万相2.1
大
模型初印象在人工智能飞速发展的当下,
大
模型领域的每一次突破都备受瞩目。
空云风语
·
2025-03-03 01:16
人工智能
音视频
人工智能
【AI
大
模型】Transformers
大
模型库(九):
大
模型微调之计算微调参数占比
目录一、引言二、计算微调参数占比2.1概述2.2模型参数结构一览2.3微调参数占比计算三、总结一、引言这里的Transformers指的是huggingface开发的
大
模型库,为huggingface上数以万计的预训练
大
模型提供预测
LDG_AGI
·
2025-03-03 01:45
人工智能
大
模型国产化迁移
大
模型到昇腾教程(Pytorch版)
大
模型国产化适配10-快速迁移
大
模型到昇腾910B保姆级教程(Pytorch版)随着ChatGPT的火爆,AI
大
模型时代来临,但算力紧张。中美贸易战及美国制裁AI芯片,国产化势在必行。
科技互联人生
·
2025-03-03 01:42
科技
数码
人工智能
AIGC
语言模型
大
模型技术:重塑未来的力量
大
模型技术之所以成为当今科技领域的热点,是因为它拥有改变游戏规则的能力。
每天五分钟玩转人工智能
·
2025-03-03 00:10
人工智能
机器学习
深度学习
大模型
大
模型微调入门(Transformers + Pytorch)
目标输入:你是谁?输出:我们预训练的名字。训练为了性能好下载小参数模型,普通机器都能运行。下载模型#方式1:使用魔搭社区SDK下载#down_deepseek.pyfrommodelscopeimportsnapshot_downloadmodel_dir=snapshot_download('deepseek-ai/DeepSeek-R1-Distill-Qwen-1.5B')#方式2:gitl
昵称不能为null
·
2025-03-03 00:06
python
llm
机器学习
人工智能
计算机视觉实战:YOLOv8在工业质检中的应用(附完整代码+数据集)
1.1工业质检的三
大
痛点人工成本高:传
emmm形成中
·
2025-03-03 00:03
深度学习
人工智能
python
计算机视觉
全民AI入门清华大学 deepseek 从入门到精通 pdf 免费下载
AI+国产+免费+开源+强大•DeepSeek是一家专注通用人工智能(AGI)的中国科技公司,主攻
大
模型研发与应用。•DeepSeek-R1是其开源的推理模型,擅长处理复杂任务且可免费商用。
宇飞林海
·
2025-03-02 23:30
人工智能
pdf
深度学习-136-LangGraph之应用实例(五)构建RAG问答系统同时从不同的角度对比优化效果
文章目录1
大
语言模型2小粒度分割文档2.1处理文本构建Document2.2向量存储2.3创建图2.4测试调用3大粒度分割文档3.1构建Document3.2向量存储3.3创建图3.4测试调用4总结与优化
皮皮冰燃
·
2025-03-02 23:59
深度学习
深度学习
人工智能
LangGraph
RAG
微调DeepSeek-R1-Distill-Llama-8B打造sql2text
大
模型!小白也能十分钟打造自己的推理
大
模型!unsloth+Colab轻松上手
简介:DeepSeek-R1-Distill-Llama-8B是一个基于Llama架构的8B参数语言模型,经过深度蒸馏(distillation)处理,旨在提高推理效率和精度。通过蒸馏技术,模型在保持较高性能的同时,减少了计算资源的消耗,特别适合在资源受限的环境中应用。该模型经过优化,可用于多种自然语言处理任务,如文本生成、情感分析、问答系统等。DeepSeek-R1-Distill-Llama-
X.Cristiano
·
2025-03-02 23:28
DeepSeek-R1
Llama-8B
sql2text
人工智能
CATIA二次开发实战:基于Python的智能背景颜色控制工具开发
一、工具设计架构本工具采用MVC分层设计模式,通过三
大
模块实现核心功能
Python×CATIA工业智造
·
2025-03-02 23:27
python
服务器
开发语言
Linux 服務器上部署 DeepSeek
**安裝Ollama工具**:-下載並安裝Ollama工具,這是一個開源
大
模型服務工具,用於簡化在本地運行
大
模型。
蠟筆小新工程師
·
2025-03-02 23:26
linux
IoT嵌入式硬件--晶振
本文就晶振的原理以及基本应用和选型做一个详细解说”01—晶振概述每个硬件系统里基本都有晶振,全称是叫晶体振荡器,在包含MCU的硬件电路里作用非常
大
,它结合MCU内部的晶振起振电路,产生MCU所必须的时钟频率
「已注销」
·
2025-03-02 22:25
单片机
嵌入式
人工智能
fpga
传感器
大
语言模型技术专栏(三):Attention机制——从RNN到Transformer的惊世一跃!
Self-Attention:Transformer的核心四、代码实战:用PyTorch实现Attention五、Attention的进化:从Transformer到GPT概要大家好,我是北海yy,继续带来
大
语言模型技术专栏的深度解析
北海yy
·
2025-03-02 22:53
大语言模型技术专栏
语言模型
rnn
transformer
构造一个工具(TravelSQLAgentTool),利用
大
语言模型(例如 Llama 模型)来完成 SQL 查询代理工具
完整代码:fromlangchain_core.toolsimporttoolfromlangchain_community.utilitiesimportSQLDatabasefromlangchain_core.promptsimportPromptTemplatefromlangchain_core.output_parsersimportStrOutputParserfromlangcha
背太阳的牧羊人
·
2025-03-02 22:22
agent+langchain
语言模型
llama
sql
人工智能
langchain
agent
langchain工具
基于同态加密的隐私计算技术在基因序列演化分析场景的应用
然而,当前仍然有三
大
隐私制约数据流通与协作。
AI研究员
·
2025-03-02 22:19
隐私计算
同态加密
big
data
人工智能
算法
LangChain —— 多模态
大
模型的 prompt template
文章目录一、如何直接将多模态数据传输给模型二、如何使用mutimodalprompts一、如何直接将多模态数据传输给模型 在这里,我们演示了如何将多模式输入直接传递给模型。对于其他的支持多模态输入的模型提供者,langchain在类中提供了内在逻辑来转化为期待的格式。 传入图像最常用的方法是将其作为字节字符串传入。这应该适用于大多数模型集成。importbase64importhttpximage
Miyazaki_Hayao
·
2025-03-02 21:19
LangChain
langchain
prompt
如何学习训练
大
模型——100条建议(附详细说明)_如何训练自己的
大
模型_
大
模型如何训练
摘要:通过深入了解本文中的这些细节,并在实际项目中应用相关知识,将能够更好地理解和利用
大
模型的潜力,不仅在学术研究中,也在工程实践中。
大耳朵爱学习
·
2025-03-02 21:18
人工智能
语言模型
产品经理
大模型
AI大模型
大
模型入门指南:从零开始,轻松掌握AI核心概念
背景当前负责的业务正在大规模应用
大
模型,为了方便团队成员快速了解
大
模型相关的背景知识,我对相关内容进行了整理。
·
2025-03-02 21:57
人工智能深度学习机器学习
【
大
模型】RAG检索增强生成
RAG(Retrieval-AugmentedGeneration)是一种结合了信息检索(Retrieval)和生成(Generation)模型的混合型
大
模型架构,旨在解决传统生成模型在处理大规模外部知识时的局限性
油泼辣子多加
·
2025-03-02 21:47
深度学习
算法
chatgpt
Python神器PyVISA:5分钟搞定仪器远程控制(附实战代码)
行业应用:华为/
大
疆等企业已广泛用于硬件测试,个人开发者也能快速上手!
新能源汽车--三电老K
·
2025-03-02 21:16
python
开发语言
自动化测试
汽车
隐马尔可夫模型详解
目录引言马尔可夫模型基础马尔可夫性质马尔可夫链的联合分布隐马尔可夫模型(HMM)简介模型参数的表示HMM的联合分布HMM的三
大
元素与基本公式HMM的三
大
基本问题评估问题:前向-后向算法(Forward-Backward
DuHz
·
2025-03-02 20:10
算法
人工智能
机器学习
信号处理
信息与通信
概率论
【性能优化】uni-app小程序中swiper-item图片预加载
项目场景:在开发壁纸小程序的时候遇到这样一个场景,通过壁纸缩略图页面跳转至壁纸
大
图页面,需要一次载入的图片太多,这样就需要swiper里需要很多swiper-item,如此一来渲染的时候就会很消耗性能和网络带宽
Hugh106
·
2025-03-02 20:09
uni-app
小程序
javascript
性能优化
vue.js
全网刷屏的AI
大
模型进阶地图:3个月构建核心能力,淘汰90%同行
23年AI
大
模型技术狂飙一年后,24年AI
大
模型的应用已经在爆发,因此掌握好AI
大
模型的应用开发技术就变成如此重要,那么如何才能更好地掌握呢?一份AI
大
模型详细的学习路线就变得非常重要!
大模型入门教程
·
2025-03-02 20:33
人工智能
AI大模型
大模型
AI
大模型学习
大模型入门
大模型教程
C# 牵手DeepSeek:打造本地AI超能力
一、引言在人工智能飞速发展的当下,
大
语言模型如DeepSeek正掀起新一轮的技术变革浪潮,为自然语言处理领域带来了诸多创新应用。
步、步、为营
·
2025-03-02 20:02
c#
人工智能
开发语言
DeepSeek 开源狂欢周(四)DualPipe与EPLB双弹齐发,训练效率的“双引擎”加速器!
在DeepSeek开源周的第四天,DualPipe和EPLB这两项全新技术一同亮相,它们不仅为DeepSeek的低成本、高效训练
大
模型提供了强大支持,还为全球AI爱好者和从业者送上了两份“技术大礼包”。
OpenCSG
·
2025-03-02 19:56
开源
人工智能
社区
算法
一个Spring框架笔记
Spring框架的两
大
核心技术:IOCIOC:控制反转DI:依赖注入AOP面向切面编程Spring的模块划分:SpringIOCSpringAOPSpringJDBC(Spring+MyBatis)Spring
A_cot
·
2025-03-02 18:55
spring
数据库
java
后端
开发语言
spring
cloud
spring
boot
【k8s面试】超详细kubernetes面试题总结,面试必问!(附200道K8s Docker面试真题+答案详解(1)
网上学习资料一
大
堆,但如果学到的知识不成体系,遇到问题时只是浅尝辄止,不再深入研究,那么很难做到真正的技术提升。需要这份系统化的资料的朋友,可以点击这里获取!一个人可以走的很快,但一群人才能走的更远!
2024开发者
·
2025-03-02 18:54
程序员
运维
学习
面试
2W8000字 LLM架构文章阅读指北
大
模型架构专栏已经更新了30多篇文章。
·
2025-03-02 17:24
人工智能
2025年,微服务架构和
大
模型能“玩出”什么新花样?
2025年开年,DeepSeek开源模型以“低成本、高性能”成功掀起AI平价化浪潮,并以惊人的速度渗透至各个领域。在AI平价化浪潮的推动下,微服务架构正迎来前所未有的变革机遇。微服务架构通过将系统拆解为多个小型、独立的服务,每个服务运行在自己的进程中,负责特定的业务功能。与单体架构相比,微服务架构实现了更高的灵活性、可扩展性和可维护性,这些特性使其成为现代软件开发的首选。然而,随着企业应用规模和复
·
2025-03-02 17:53
2025年,微服务架构和
大
模型能“玩出”什么新花样?
2025年开年,DeepSeek开源模型以“低成本、高性能”成功掀起AI平价化浪潮,并以惊人的速度渗透至各个领域。在AI平价化浪潮的推动下,微服务架构正迎来前所未有的变革机遇。微服务架构通过将系统拆解为多个小型、独立的服务,每个服务运行在自己的进程中,负责特定的业务功能。与单体架构相比,微服务架构实现了更高的灵活性、可扩展性和可维护性,这些特性使其成为现代软件开发的首选。然而,随着企业应用规模和复
·
2025-03-02 17:53
【登月计划】DAY 4 中期 --《排产“阿尔法狗”
大
揭秘!美的如何用APS算法碾压对手》
目录四、乐高教学:APS系统核心模块与排产算法1.APS系统定位与价值2.APS核心模块拆解模块1:产能建模引擎(排产的“地基”)模块2:排产算法库(排产的“大脑”)模块3:动态响应模块(排产的“应急部队”)3.家电行业典型排产规则规则1:交货期优先(DueDateFirst)规则2:最小化换型时间(SMED优化)规则3:瓶颈资源最大化利用4.APS系统数据流(家电行业协同网络)5.APS实施避坑
泛泛不谈
·
2025-03-02 17:42
0-2岁智能制造工程师启蒙
制造
经验分享
需求分析
使用Semantic Kernel:对DeepSeek添加自定义插件
大
语言模型虽然具有强大的自然语言理解和生成能力,但它们通常是基于预训练的模型,其功能受限于训练时所接触的数据和任务。为
大
语言模型添加插件
归-途
·
2025-03-02 16:41
机器学习
oneapi
机器学习
OpenAI API教程
通过此API能在应用程序中方便地调用OpenAI提供的
大
模型基础能力。OpenAI的API协议已成为LLM领域的标准。
Jachin Huang
·
2025-03-02 16:41
大模型指南
人工智能
语言模型
015结构体基础
一、结构体基本概念和定义C语言提供了众多的基本类型,但现实生活中的对象一般都不是单纯的
整型
、浮点型或字符串,而是这些基本类型的综合体。
Bardb
·
2025-03-02 16:38
C语言
vscode
c语言
深度学习五
大
模型:CNN、Transformer、BERT、RNN、GAN解析
今天探讨它们各自适用的场景,让您知道在何种情况下选择何种模型;同时分析它们的优势与局限,助您全面评估这些模型的性能。一、卷积神经网络(ConvolutionalNeuralNetwork,CNN)原理:CNN主要由卷积层、池化层和全连接层组成。卷积层通过卷积核在输入数据上进行卷积运算,提取局部特征;池化层则对特征图进行下采样,降低特征维度,同时保留主要特征;全连接层将特征图展开为一维向量,并进行分
大模型_学习路线
·
2025-03-02 16:04
深度学习
cnn
transformer
人工智能
AI大模型
大模型
LLM
本地部署DeepSeek-R1
大
模型
本地部署DeepSeek-R1
大
模型的方法主要分为两种:自动部署(懒人专用)和手动部署(适合开发者)。
安琪CiCi
·
2025-03-02 16:03
时序数据库
解锁网络防御新思维:D3FEND 五
大
策略如何对抗 ATT&CK
D3FEND简介背景介绍2021年6月22日(美国时间),美国MITRE公司正式发布了D3FEND——一个网络安全对策知识图谱。该项目由美国国家安全局(NSA)资助,并由MITRE的国家安全工程中心(NSEC)负责管理和发布,目前版本为0.9.2-BETA-3。作为广为人知的ATT&CK框架的补充,ATT&CK聚焦于攻击者的战术和技术知识库,而长期以来,网络安全领域一直缺乏一个专门针对防御对策的系
vortex5
·
2025-03-02 16:02
网络
安全
网络安全
【自学笔记】Git基础知识点总览-持续更新
Git仓库4.提交更改5.查看提交历史6.创建与合并分支7.远程仓库操作8.冲突解决示例:完整的Git工作流程总结Git基础知识点总览引言Git是一个开源的分布式版本控制系统,用于有效、高速地处理从小到
大
的项目版本管理
Long_poem
·
2025-03-02 15:31
笔记
git
【设计模式】工厂方法模式
【设计模式】工厂方法模式前言工厂方法模式六
大
原则分析现实工作中的
小王不头秃
·
2025-03-02 15:01
设计模式
设计模式
工厂方法模式
java
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他