E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
自然演绎推理
国家超算平台上线DeepSeek - R1系列模型:开启AI新征程
它用了强化学习训练,
推理
的时候会反复思考验证,思维链能有好几万字长。在数学、代码编写和复杂逻辑
推理
这些方面,表现相当厉害
CodeJourney.
·
2025-02-06 08:25
数据库
人工智能
算法
人工智能
AI大模型探秘:核心能力与应用场景深度解析
AI:包含很多术语,如:模式识别、
自然
语言处理、神经网络、机器学习、深度学习、强化学习、人类反馈强化学习等。类比:AI是电力–吴恩达。
程序员辣条
·
2025-02-06 08:53
人工智能
java
AI大模型
大模型
spring
SGlang 专为大模型设计的高效服务框架
SGlang是一种专为大型语言模型(LLM)和视觉语言模型(VLM)设计的高效服务框架,旨在提升模型的
推理
速度和灵活性。
kcarly
·
2025-02-06 08:52
大模型知识乱炖
LLM
大模型
SGLang
Selenium WebDriver自动化测试(框架篇):BDD之Cucumber框架项目实战
selenium工具的自动化测试用例,转化成BDD框架的cucumber
自然
语言脚本。
职说测试
·
2025-02-06 07:49
java
selenium
BDD
cucumber
行为驱动
二值连接:深度神经网络的轻量级革命
深度神经网络(DeepNeuralNetworks,DNN)近年来在语音识别、图像分类和
自然
语言处理等领域取得了令人瞩目的成就。
步子哥
·
2025-02-06 06:11
dnn
人工智能
神经网络
DeepSeek等强大
推理
大模型出现后,提示工程还有必要么?
提示的主要目的是人和模型沟通,是为了更好的激发模型做各种任务,只能说语言模型越强大,沟通的难度会较低,沟通形式更简单,提示工程”之所以被称为“工程”,主要基于以下多方面原因:1.系统性与复杂性多要素协同:如同传统工程涉及多个环节与要素协同作业,提示工程也需综合考量众多因素。比如,在设计提示时,不仅要明确任务目标,像让语言模型生成新闻稿、故事,还是进行代码纠错等,还要考虑模型自身特点,不同的大语言模
alphaAIstack
·
2025-02-06 04:46
人工智能
使用vLLM部署Qwen2.5-VL-7B-Instruct模型的详细指南
部署Qwen2.5-VL-7B-Instruct模型的详细指南引言环境搭建安装vLLM安装依赖库下载模型启动vLLM服务器总结参考引言近年来,随着大规模语言模型(LLM)的快速发展,如何高效地进行模型
推理
成为了一个热门话题
engchina
·
2025-02-06 03:40
LINUX
vllm
qwen2.5-vl
7B
本地部署
前端大模型入门:编码(Tokenizer)和嵌入(Embedding)解析
作者|想飞的雪糕LLM的核心是通过对语言进行建模来生成
自然
语言输出或理解输入,两个重要的概念在其中发挥关键作用:T
大模型玩家
·
2025-02-06 03:38
前端
embedding
产品经理
经验分享
算法
人工智能
学习方法
DeepSeek-R1:通过强化学习提升大型语言模型
推理
能力的探索
DeepSeek-R1:通过强化学习提升大型语言模型
推理
能力的探索在人工智能领域,大型语言模型(LLMs)的发展日新月异,其在
自然
语言处理和生成任务中的表现逐渐接近人类水平。
kaichu2
·
2025-02-06 03:07
论文翻译
DeepSeek
大语言模型轻量化:知识蒸馏的范式迁移与工程实践
摘要在大型语言模型(LLM)主导人工智能发展的当下,模型参数量与
推理
成本的指数级增长已成为制约技术落地的核心瓶颈。
LucianaiB
·
2025-02-06 02:04
语言模型
人工智能
自然语言处理
python
为AI聊天工具添加一个知识系统 之87 详细设计之28 Derivation 统一建模元模型 之1
文本要点要点Derivation统一建模元模型Derivation统一建模元模型:意识原型的祖传代码,即支撑程序框架的符号学中的
自然
和逻辑树。
一水鉴天
·
2025-02-06 00:19
人工智能
【Mamba之模型训练系列(四)】将 mamba 扩展到多模态大型语言模型,实现高效
推理
将mamba扩展到多模态大型语言模型,实现高效
推理
背景知识与研究动机Cobra模型设计视觉编码器DINOv2SigLIP投影器Mamba语言模型主干训练策略训练数据训练阶段预训练阶段多模态指令调整阶段微调策略训练细节训练策略的关键结论实验验证实验设置性能比较
推理
速度消融研究关键结论参考文献这篇文章介绍了一个名为
愷创作者
·
2025-02-06 00:45
Mamba及多模态模型训练系列
语言模型
人工智能
自然语言处理
Java语言基础
机器语言都是由二进制的0和1组成的编码汇编语言采用了英文缩写的标识符高级语言采用接近于人类的
自然
语言进行编程。2.Java历史大事件1995年5月23日,在Oak更名为Java后,
浅塘锦鲤
·
2025-02-06 00:45
java
开发语言
三分钟看懂RAG在智能问答系统中的应用
首先,检索器从外部知识库或文档集中获取与用户查询相关的内容片段;然后,生成器基于这些检索到的内容生成
自然
语言输出,确保生成的内容既信息丰富,又具备高度的相关性和准确性。
大模型玩家
·
2025-02-05 22:04
人工智能
算法
机器学习
语言模型
ai
大模型
程序员
AI模型调度架构全解析:实现任务与模型的智能匹配
从
自然
语言处理到技术研发、从教育场景到企业服务,AI大模型正在逐步改变我们的工作和生活。然而,随着需求的多样化和任务复杂性的增加,如何高效地调用和管理多个AI大模型,成为了企业和开发者面临的一大挑战。
大模型玩家
·
2025-02-05 22:03
人工智能
架构
学习方法
产品经理
经验分享
算法
ai
什么是大模型框架?常用的大模型框架盘点对比
什么是大模型框架大模型框架是指用于训练、
推理
和部署大型语言模型(LLMs)的软件工具和库。
AI产品经理
·
2025-02-05 21:25
学习
人工智能
大数据
深度学习
语言模型
昇腾设备torch_npu
推理
配置
1.Ascend310B1的npu
推理
思路在昇腾Ascend310B1NPU上基于PyTorch进行
推理
时,通过torch_npu替换原有GPU/CUDA操作。
时间逝世298
·
2025-02-05 20:21
pytorch
深度学习
人工智能
DeepSeek R1技术报告关键解析(5/10):知识蒸馏:如何让小模型也能具备强
推理
能力?
大模型通常计算量大、
推理
速度慢,而小模型虽然计算资源消耗更少,但
推理
能力往往不如大模型。通过知识蒸馏,小模型可以继承大模型的
推理
能力,同时保持较低的计算成本。
董董灿是个攻城狮
·
2025-02-05 19:43
人工智能
计算机视觉
CNN
TensorRT-LLM保姆级教程(一)-快速入门
随着大模型的爆火,投入到生产环境的模型参数量规模也变得越来越大(从数十亿参数到千亿参数规模),从而导致大模型的
推理
成本急剧增加。
大模型部署
·
2025-02-05 18:38
人工智能
transformer
产品经理
自然语言处理
kubernetes
大模型
LLM
长上下文大模型会让检索增强生成(RAG)过时吗?
大模型(LLM)的迅速发展对人工智能领域,尤其是
自然
语言处理(NLP)产生了重大影响。传统上,像检索增强生成(RAG)这样的技术通过允许模型动态访问外部知识源,在提升大语言模型能力方面发挥了重要作用。
·
2025-02-05 18:38
人工智能
知识蒸馏教程 Knowledge Distillation Tutorial
来自于:KnowledgeDistillationTutorial将大模型蒸馏为小模型,可以节省计算资源,加快
推理
过程,更高效的运行。
Qiming_v
·
2025-02-05 17:03
Distillation
蒸馏
机器学习在环境科学中的应用
机器学习在环境科学中的意义在环境科学领域,机器学习可以帮助我们更好地理解和预测
自然
系统的变化。通过对大气、水文、生态等环境数据的分析,机器学习可以帮助科学家们更准确地了解环境变化的规律,
苹果酱0567
·
2025-02-05 17:00
面试题汇总与解析
课程设计
spring
boot
vue.js
java
mysql
基于深度学习的文本情感分析
基于深度学习的文本情感分析关键词:深度学习、文本情感分析、
自然
语言处理、卷积神经网络、循环神经网络、BERT、情感分类、情绪识别1.背景介绍文本情感分析(TextSentimentAnalysis),又称情感计算
杭州大厂Java程序媛
·
2025-02-05 16:25
计算机软件编程原理与应用实践
java
python
javascript
kotlin
golang
架构
人工智能
昆仑天工SkyWork:更懂中文的AIGC开源模型
昆仑天工SkyWork系列AIGC开源模型,由奇点智源公司研发,在2022年12月发布,覆盖图像、文本、编程等多模态内容生成能力,包括绘画、文章续写、对话、中英翻译、内容风格生成、
推理
、诗词对联、代码补全等
AIGC探索家
·
2025-02-05 16:52
aigc
ai绘画
AI作画
stable
diffusion
chatgpt
nlp
人工智能
昆仑万维官宣开源2000亿稀疏大模型Skywork-MoE
6月3日,昆仑万维宣布开源2千亿稀疏大模型Skywork-MoE,性能强劲,同时
推理
成本更低。
TMT星球
·
2025-02-05 16:50
人工智能
人工智能
国产AI大爆发!讯飞星火X1横空出世,直接“杀疯”成中文数学王者?
而今天要给大家介绍的这个主角——讯飞星火深度
推理
模型X1,那可是最近科技圈的一大热点。为啥它值得我们重视呢?要知道,中文数学能力在AI
盼达思文体科创
·
2025-02-05 15:15
经验分享
【LangChain编程:从入门到实践】代码实践
在早期,AI主要集中于基于规则的系统和专家系统,试图模拟人类的
推理
过程。然而,随着大数据时代的到来和计算能力的飞速提升,机器学习和深度学习技术开始占据主
AI天才研究院
·
2025-02-05 14:09
计算
大数据AI人工智能
计算科学
神经计算
深度学习
神经网络
大数据
人工智能
大型语言模型
AI
AGI
LLM
Java
Python
架构设计
Agent
RPA
因果推断与机器学习—因果表征学习与泛化能力
近十年来,深度学习在多个领域取得了巨大成功,包括机器视觉、
自然
语言处理、语音识别和生物信息等。这些成功为机器学习技术的进一步发展和应用奠定了基础。表征学习是深度学习的核心技术之一。
樱花的浪漫
·
2025-02-05 14:39
因果推断
机器学习
学习
人工智能
深度学习
自然语言处理
计算机视觉
基于Ernie-Bot打造语音对话功能
GPT-4的语音对话功能前段时间在网上火了一把,许多人被其强大的
自然
语言处理能力和流畅的语音交互所吸引。现在,让我们来看看如何使用类似的技术,即基于百度的ERNIE-Bot,来打造自己的语音对话功能。
·
2025-02-05 13:25
人工智能
基于深度学习的车牌检测识别系统 —— 使用YOLOv5实现车牌检测与识别
系统功能概述2.2系统架构数据准备与处理3.1数据集选择与收集3.2数据标注3.3数据集划分YOLOv5模型训练与优化4.1YOLOv5配置文件4.2安装YOLOv5并开始训练4.3模型评估与优化车牌识别与
推理
2025年数学建模美赛
·
2025-02-05 12:20
深度学习
YOLO
人工智能
分类
ui
DeepSeek-R1 低成本训练的根本原因是?
在人工智能领域,大语言模型(LLM)正以前所未有的速度发展,驱动着
自然
语言处理、内容生成、智能客服等众多应用的革新。
明哲AI
·
2025-02-05 11:10
AIGC
人工智能
大模型
deepseek
AI
Agent
如何利用DeepSeek打造医疗领域专属AI助手?从微调到部署全流程解析
一、基座模型选型:医疗
推理
的黄金搭档1.1为什么选择DeepSeek-R1-Distill-Llama-8
明哲AI
·
2025-02-05 10:05
AIGC
人工智能
机器学习
Deepseek
大模型
怎么在家用笔记本上轻松部署和使用DeepSeek R1?
而且在数学、编程等领域表现出众,可处理复杂逻辑
推理
任务,如果你不了解蒸馏技术文末也会提供相关的拓展知识运行
程序员辣条
·
2025-02-05 10:32
人工智能
LLama
AI产品经理
大模型学习
大模型
DeepSeek
大模型部署
国内首个!百度成功点亮昆仑芯三代万卡集群,将于近日点亮3万卡集群
而24年9月升级的百度百舸AI异构计算平台4.0,围绕落地大模型全旅程的算力需求,在集群创建、开发实验、模型训练、模型
推理
四大方面,能为企业提供“多、快、稳、省”的AI基础设施,在万卡集群的建设中发挥了至关
·
2025-02-05 09:50
深度学习
metagpt中ActionNode的用法
THINK_NODES类:4.ThinkAction类:5.SimplePrint类:6.Printer类:7.main函数:总结:主要执行流程:代码参考链接:整体流程实现一个基于节点(Node)结构和思维
推理
的系统
ZHOU_WUYI
·
2025-02-05 08:20
metagpt
metagpt
大语言模型LLM分布式训练:TensorFlow攻略与深度解析(LLM系列04)
分布式训练的关键技术及应用4.利用TensorFlow进行LLM分布式训练的具体实践5.高级主题与最新进展探究大语言模型LLM分布式训练:TensorFlow攻略与深度解析(LLM系列04)1.引言随着
自然
语言处理
North_D
·
2025-02-05 08:20
大语言模型LLM
分布式
tensorflow
人工智能
自然语言处理
深度学习
python
神经网络
Java语言判断质数
“质数是指在大于1的
自然
数中,除了1和它本身以外不再有其他因数的
自然
数。”
Star_KeyW
·
2025-02-05 06:37
Java学习
java
开发语言
算法
Ollama能本地部署Llama 3等大模型的原因解析(ollama核心架构、技术特性、实际应用)
文章目录前言1、Ollama的核心架构和技术能力1.1、高效模型加载和存储1.2、
推理
优化1.3、微调支持1.4、部署工具链2.、Llama3模型的技术特性2.1、模型架构2.2、模型性能3.
周杰伦_Jay
·
2025-02-05 03:19
大模型LLMs
llama
架构
transformer
深度学习
人工智能
数据结构
【2024年国内一些知名的免费AI对话工具的对比】
这些工具基于各自公司的深度学习和
自然
语言处理技术,为用户提供智能对话服务。百度文心一言特点:基于ERNIE模型,拥有知识增强、检索增强和对话增强的技术特色,支持跨模态生成。
龙少9543
·
2025-02-05 01:02
后端
人工智能
ChatGPT 基本操作
与ChatGPT进行对话ChatGPT是一种最新的、最先进的
自然
语言生成技术之一,它具有令人惊叹的表达能力和逼真度,可以模拟人类的语言行为,而不需要人类的干预。
Kali与编程~
·
2025-02-05 00:30
chatgpt
人工智能
ChatGPT怎么回事?
纯属发现,调侃一下~这段时间deepseek不是特别火吗,尤其是它的
推理
功能,突发奇想,想用deepseek回答一些问题,回答一个问题之后就回复服务器繁忙(估计还在被攻击吧~_~)然后就转向了GPT,真的被笑到了
cimeo
·
2025-02-05 00:23
人工智能
chatgpt
人工智能
三款wps/office通用的宝藏级办公插件,百+功能一键直达
无论是学习还是办公,电脑的出现都大大简化了我们的生活方式,同时提高了工作和学习的效率,而办公软件作为其中重要组成部分,
自然
成为了不可或缺的工具,说到办公软件,在国内使用最为广泛的无疑是MicrosoftOffice
纪元A梦
·
2025-02-04 23:21
资源分享
wps
【Python】已解决:Python读取字典查询键报错“KeyError: ‘d‘”
不定期更新IT图书,并在评论区抽取随机粉丝,书籍免费包邮到家AI前沿点我跳转探讨人工智能技术领域的最新发展和创新,涵盖机器学习、深度学习、
自然
屿小夏
·
2025-02-04 23:19
python
开发语言
P1843 奶牛晒衣服(二分答案)
##题目描述一件衣服在
自然
条件下用一秒的时间可以晒干$a$点湿度。抠门的熊大妈只买了一台烘衣机。
wwjjjww
·
2025-02-04 23:17
算法
c++
数据结构
揭秘DeepSeek R1大模型:它如何像人类一样“思考”?
而近期备受关注的DeepSeekR1,凭借更高效的
推理
能力和更低能耗,成为行业焦点。今天,我们将深入它的“大脑”,看看它是如何工作的!
大模型扬叔
·
2025-02-04 20:00
学习
自然语言处理
prompt
人工智能
hugging
face怎么用
PyTorch中的In-place操作是什么?为什么要避免使用这种操作?
点击上方“小白学视觉”,选择加"星标"或“置顶”重磅干货,第一时间送达导读In-place操作用在
推理
的时候可以显著节省内存,但是训练的时候一定要小心使用。
小白学视觉
·
2025-02-04 19:49
2025最新最全AI大模型系统学习路线
随着技术的进步,大模型如OpenAI的GPT-4和Sora、Google的BERT和Gemini等已经展现出了惊人的能力-从理解和生成
自然
语言到创造逼真的图像及视频。
大模型老炮
·
2025-02-04 18:13
人工智能
学习
大模型
知识图谱
大模型入门
AI大模型
大模型学习
【LangChain编程:从入门到实践】开发环境准备
LangChain编程:从入门到实践】开发环境准备作者:禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming1.背景介绍1.1问题的由来随着人工智能技术的飞速发展,
自然
语言处理
AI天才研究院
·
2025-02-04 18:39
计算
AI大模型企业级应用开发实战
大数据AI人工智能
计算科学
神经计算
深度学习
神经网络
大数据
人工智能
大型语言模型
AI
AGI
LLM
Java
Python
架构设计
Agent
RPA
基于 FPGA 的 CNN 卷积神经网络整体实现
基于FPGA的CNN卷积神经网络整体实现介绍卷积神经网络(CNN)是一种强大的深度学习架构,广泛用于图像识别、物体检测和
自然
语言处理等领域。
鱼弦
·
2025-02-04 18:37
人工智能时代
fpga开发
cnn
人工智能
【大模型应用开发 动手做AI Agent】第二轮思考:模型决定计算
【大模型应用开发动手做AIAgent】第二轮思考:模型决定计算关键词:大模型,AIAgent,模型决定计算,模型优化,计算优化,硬件加速,效率提升1.背景介绍随着深度学习技术的飞速发展,大模型在
自然
语言处理
AGI大模型与大数据研究院
·
2025-02-04 16:30
大数据AI人工智能
计算科学
神经计算
深度学习
神经网络
大数据
人工智能
大型语言模型
AI
AGI
LLM
Java
Python
架构设计
Agent
RPA
上一页
12
13
14
15
16
17
18
19
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他