E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
N-gram语言模型。
深入解析:如何使用 Ollama 下载与使用本地大
语言模型
在当今数字化时代,大
语言模型
(LLM)的应用越来越广泛,从自然语言处理到文本生成,从代码辅助到智能问答,它们都展现出了强大的能力。然而,使用云端大
语言模型
往往面临着成本高昂、隐私泄露等问题。
大懒猫软件
·
2025-02-11 16:22
语言模型
人工智能
自然语言处理
python
llama
AI代码生成器安全隐患:Grok泄露系统提示词事件警示
最近,一个名为Grok的大型
语言模型
泄露了其系统提示词,引发了业内对AI写代码工具安全性和透明度问题的广泛关注。
·
2025-02-11 15:22
前端
以创新测评赋能未来:CSDN开源与智能技术创新研究院发布大模型综合榜单
随着人工智能的持续演进,大
语言模型
在越来越多的领域中发挥着关键作用。对中小企业或个人用户而言,如何选择适合自身需求、具有高性价比且能够快速落地的大
语言模型
,成为技术应用的核心关切。
CSDN资讯
·
2025-02-11 15:17
AI
编程
人工智能
DeepSeek
大模型
5分钟在本地PC上使用VLLM快速启动Valdemardi/DeepSeek-R1-Distill-Llama-70B-AWQ
及依赖库模型下载安装HuggingFaceCLI下载DeepSeek-R1-Distill-Qwen-32B模型启动启动命令启动确认模型验证发送API请求示例输出注意事项参考链接前言VLLM是一个高效且轻量的大规模
语言模型
engchina
·
2025-02-11 14:41
LINUX
llama
linux
人工智能
VLLM
deepseek-r1
动手学大
语言模型
LLM-02
文章目录LLMAPI开发基础知识PromptTemperaturesystemprompt使用LLMAPIpromptengineeringprompt设计原则1、编写清晰、具体指令1、使用分隔符清晰表示不同的输入部分2、寻求结构化的输出3、要求模型检查是否满足条件4、提供少量的示例2、让模型有时间去思考1、指定完成任务的步骤2、指导模型在下结论之前找到自己的解法LLMAPI开发基础知识Promp
阿苏拉则_妫
·
2025-02-11 12:28
LLM
语言模型
人工智能
自然语言处理
DeepSeek R1 简易指南:架构、本地部署和硬件要求
DeepSeek团队近期发布的DeepSeek-R1技术论文展示了其在增强大
语言模型
推理能力方面的创新实践。该研究突破性地采用强化学习(Reinfo
·
2025-02-11 12:49
deepseek
0 Token 间间隔 100% GPU 利用率,百度百舸 AIAK 大模型推理引擎极限优化 TPS
01什么是大模型推理引擎大模型推理引擎是生成式
语言模型
运转的发动机,是接受客户输入prompt和生成返回response的枢纽,也是拉起异构硬件,将物理电能转换为人类知识的变形金刚。
·
2025-02-11 11:44
百度云大模型gpu
云上一键部署 DeepSeek-V3 模型,阿里云PAI Model Gallery 最佳实践
DeepSeek-V3模型简介DeepSeek-V3是DeepSeek发布的MoE(Mixture-of-Experts)大
语言模型
,总参数量为6710亿,每个token激活的参数量为370亿。
·
2025-02-11 11:44
DeepSeek与ChatGPT对比:技术、应用与未来趋势
在人工智能飞速发展的时代,大
语言模型
成为了推动技术革新和产业变革的核心力量。DeepSeek和ChatGPT作为其中的典型代表,各自凭借独特的技术架构、训练方式和应用优势,在不同领域展现出卓越的性能。
CodeJourney.
·
2025-02-11 11:49
人工智能
数据库
算法
如何在 VSCode 中使用通义灵码(Tongyi Lingma)智能编程助手
与GitHubCopilot类似,通义灵码基于大
语言模型
(LLM),可以提供代码补全、智能纠错、代码生成等功能,极大提升开发效率。本文将详细介绍如何在VSCode中安装和使用通义灵码,
全栈探索者chen
·
2025-02-11 06:09
知识分享
vscode
ide
编辑器
开发语言
AI编程
通灵
人工智能
《大
语言模型
:原理与工程实践》书籍推荐及详细说明
随着人工智能技术的发展,尤其是深度学习技术的进步,大规模
语言模型
(LargeLanguageModels,LLMs)已成为自然语言处理领域的研究热点。
大模型入门教程
·
2025-02-11 01:57
语言模型
人工智能
自然语言处理
llama
大模型
大模型入门(六)—— RLHF微调大模型
一、RLHF微调三阶段参考:https://huggingface.co/blog/rlhf1)使用监督数据微调
语言模型
,和fine-tuning一致。
LLM.
·
2025-02-10 23:17
人工智能
语言模型
机器学习
自然语言处理
LLM
大模型
RLHF
SEO友好架构提升LLM应用的可发现性
《SEO友好架构提升LLM应用的可发现性》文章关键词SEO友好架构
语言模型
(LLM)搜索引擎优化(SEO)可发现性内容优化技术优化用户体验优化信息组织关键词策略社交媒体推广摘要本文旨在探讨如何通过SEO
AI天才研究院
·
2025-02-10 17:00
计算机软件编程原理与应用实践
java
python
javascript
kotlin
golang
架构
人工智能
大厂程序员
硅基计算
碳基计算
认知计算
生物计算
深度学习
神经网络
大数据
AIGC
AGI
LLM
系统架构设计
软件哲学
Agent
程序员实现财富自由
【AI论文】LIMO:推理中少即是多
摘要:我们提出了一项重大发现,这一发现挑战了我们对大型
语言模型
中复杂推理能力涌现方式的理解。传统观点认为,复杂的推理任务需要大量的训练数据(超过10万例)。
东临碣石82
·
2025-02-10 16:55
人工智能
2025最新ChatGPT、DeepSeek等大
语言模型
助力高效办公、论文与项目撰写、数据分析、机器学习与深度学习建模等深度科研应用
随着人工智能技术的快速发展,大
语言模型
如ChatGPT和DeepSeek在科研领域的应用正在为科研人员提供强大的支持。
梦想的初衷~
·
2025-02-10 16:53
AI大语言
人工智能
chatgpt
语言模型
数据分析
荣耀已接入DeepSeek-R1,荣耀手机系统版本MagicOS8.0及以上用户可用
以下是关于这一事件的详细介绍:DeepSeek-R1的强大能力DeepSeek-R1是一款先进的
语言模型
,具备强大的自然语言处理能力、逻辑推理能力和上下文理解能
2501_90444774
·
2025-02-10 14:10
人工智能
virtualenv
tornado
scikit-learn
智能手机
《具身智能时代:机器人具身抓取技术的前沿探索与应用综述》
自2022年GPT等大模型的爆发以来,人工智能领域以
语言模型
为代表的预训练模型在多个领域掀起了创新浪潮。
笑傲江湖2023
·
2025-02-10 13:53
机器人
ChatGPT vs. DeepSeek:大模型赛道的差异化竞争
ChatGPTvs.DeepSeek:大模型赛道的差异化竞争人工智能
语言模型
的快速发展正在重塑人机交互的边界,在这场技术浪潮中,ChatGPT与DeepSeek作为两类典型代表,展现出截然不同的技术路线与市场定位
TKang8912
·
2025-02-10 12:49
chatgpt
谈大
语言模型
动态思维流编排
尽管大
语言模型
已经呈现出了强大的威力,但是如何让它完美地完成一个大的问题,仍然是一个巨大的挑战。需要精心地给予大模型许多的提示(Prompt)。
姚家湾
·
2025-02-10 10:31
语言模型
人工智能
自然语言处理
代码星辰:探索 benchmark 构建的奥秘之旅
而在这片“代码星海”中,如何评估大
语言模型
(LLMs)在编程任务上的表现,就像天文学家借助望远镜探索宇宙奥秘一般关键。近日,一篇题为《HowShouldIBuildABenchmark?
步子哥
·
2025-02-10 07:56
AGI通用人工智能
人工智能
AI系列:大
语言模型
的function calling(下)- 使用LangChain
装饰器其他方式:Pydantic2.绑定tools/functions3.调用大模型(LLM)4.functioncalling处理流程LangChain版代码与原生LLM调用的比较参考前言在AI系列:大
语言模型
的
liyane
·
2025-02-10 05:38
AI人工智能
人工智能
语言模型
langchain
AI大模型系列之七:Transformer架构讲解
前馈神经网络编码器(Encoder)解码器(Decoder):基于卷积神经网络(CNN)的编码器-解码器结构基于Transformer架构的主流
语言模型
有哪
m0_74823683
·
2025-02-10 03:58
面试
学习路线
阿里巴巴
人工智能
transformer
深度学习
大模型学习笔记 - LLM 对齐优化算法 DPO
LLM-DPOLLM-DPODPO概述DPO目标函数推导DPO目标函数梯度的推导DPO概述大模型预训练是从大量语料中进行无监督学习,语料库内容混杂,训练的目标是
语言模型
损失,任务是nexttokenprediction
JL_Jessie
·
2025-02-10 03:54
学习
笔记
算法
LLM
使用 llama-cpp-python 在 LangChain 中运行 LLM 模型
使用llama-cpp-python在LangChain中运行LLM模型引言在人工智能和自然语言处理领域,大型
语言模型
(LLMs)的应用越来越广泛。
qq_37836323
·
2025-02-10 01:37
llama
python
langchain
为什么要学习AI/机器学习
考虑到当前技术发展趋势和未来潜力,我建议重点学习AI/机器学习相关技术,特别是大
语言模型
(LLM)相关的技术栈。原因如下:1.为什么选择AI/LLM?
数字沉思
·
2025-02-09 21:09
人工智能
人工智能
学习
机器学习
解锁DeepSeek大模Q型:超实用提示词技巧大放送
DeepSeek大模型简介DeepSeek是由深度求索(DeepSeekInc.)团队开发的大型预训练
语言模型
,以其高效推理、多模态融合及对垂直领域的深度优化而著称。
计算机学长
·
2025-02-09 20:04
通用大语言模型
人工智能
重拾二进制之魂:大
语言模型
与逆向工程的奇幻旅程
逆向工程,这门解构编译产物、还原软件真貌的神秘艺术,正迎来了一场革命性的变革——由大
语言模型
赋能的LLM4Decompile系统。
步子哥
·
2025-02-09 18:50
AGI通用人工智能
语言模型
人工智能
自然语言处理
动态词表采样:一种控制模型词表大小的新方法
背景介绍随着深度学习技术的发展,尤其是Transformer架构的成功应用,预训练
语言模型
如BERT、GPT等取得了
东方佑
·
2025-02-09 18:50
量子变法
pandas
python
从零开始构建一个大
语言模型
-第六章第一节
第六章目录6.1不同类型的微调6.2准备数据集6.3创建数据加载器6.4用预训练权重初始化模型6.5添加分类头6.6计算分类损失和准确率6.7在有监督数据上微调模型6.8将大
语言模型
用作垃圾邮件分类器本章内容涵盖介绍不同的大
语言模型
微调方法为文本分类准备数据集修改预训练大
语言模型
以进行微调使用微调后的大
语言模型
对新数据进行分类到目前为止
释迦呼呼
·
2025-02-09 18:17
从零开始构建一个大语言模型
语言模型
人工智能
自然语言处理
机器学习
python
DeLLMa框架:优化复杂决策的新路径
标题:DeLLMa框架:优化复杂决策的新路径文章信息摘要:DeLLMa框架通过整合大型
语言模型
(LLMs)和结构化数据,优化了在不确定性条件下的决策过程,特别是在处理复杂决策问题时,能够增强决策的严谨性和精确性
XianxinMao
·
2025-02-09 16:07
人工智能
Python如何使用Ollama库
这个库使得Python开发者能够轻松地在他们的项目中集成和运行大型
语言模型
。主要功能模型管理:通过Python脚本管理模型的创建、拉取、删除和复制。
阿雄不会写代码
·
2025-02-09 15:32
python
开发语言
如何使用Ollama部署大模型
正文Ollama简介Ollama是一个专为在本地环境中运行和定制大型
语言模型
而设计的工具。
阿雄不会写代码
·
2025-02-09 14:57
Ai学习过程
策略模式
llama.cpp的C语言API使用
我们知道,一般运行大
语言模型
都是在Python上运行的,可是Python的性能太差了,不适合用于生产环境,因此可以采用llama.cpp提供的API在C语言上运行大模型。
怎么这么多名字都被占了
·
2025-02-09 13:43
llama
c语言
人工智能
Ollama详解教程
Ollama是一个用于管理和运行大型
语言模型
的工具,通常需要根据具体的使用场景进行配置。以下是一个典型的Ollama配置说明,涵盖了安装、模型管理、API使用以及常见配置选项。
换个网名有点难
·
2025-02-09 12:12
ai
服务网格(Service Mesh)在LLM应用架构中的应用
文章关键词服务网格、LLM应用架构、微服务通信、控制平面、数据平面、性能优化、安全性摘要本文深入探讨了服务网格在大型
语言模型
(LLM)应用架构中的关键作用。
AI天才研究院
·
2025-02-09 11:32
ChatGPT
计算
DeepSeek
R1
&
大数据AI人工智能大模型
java
python
javascript
kotlin
golang
架构
人工智能
大厂程序员
硅基计算
碳基计算
认知计算
生物计算
深度学习
神经网络
大数据
AIGC
AGI
LLM
系统架构设计
软件哲学
Agent
程序员实现财富自由
蒸馏:让DeepSeek用“移魂大法”增强你的小模型
蒸馏:让DeepSeek用“移魂大法”增强你的小模型原创格知致能寒武纪人工智能2025年02月06日00:48北京前言在大型
语言模型
(LLMs)时代,知识蒸馏成为一种重要方法,用于将能力强大的、参数规模庞大的
AI生成曾小健
·
2025-02-09 11:58
Deepseek原理与使用
人工智能
超简单的Ollama集成 DeepSeek 本地化安装教程
Ollama是一个基于Go语言的本地大
语言模型
运行框架,可以集成如DeepSeek等AI大模型。
diygwcom
·
2025-02-09 10:25
DeepSeek
llama
chatbox
ai
DeepSeek-V3 技术报告 (核心技术,接近5万字)
摘要我们介绍了一个强大的混合专家(MoE)
语言模型
DeepSeek-V3,它具有总计671亿个参数和每个令牌激活的37亿个。
zhangjiaofa
·
2025-02-09 10:21
DeepSeek
R1&
AI人工智能大模型
DeepSeek
V3
14.4K+ Star!GPT Researcher:一个基于AI的智能研究助手
GPTResearcher简介GPTResearcher[1]是一个基于大型
语言模型
(LLM)的自动化智能体,目标是对任何给定主题进行在线全面研究。
鱼满满记
·
2025-02-09 07:00
AI应用
Github项目
python
人工智能
ai
MaxKB开源知识库问答系统累计下载数量超过300,000次!
截至2024年12月30日22:00,飞致云旗下开源项目——基于大
语言模型
和RAG的知识库问答系统MaxKB全网累计下载数量超过300,000次!
FIT2CLOUD飞致云
·
2025-02-09 04:03
开源
大模型
人工智能
MaxKB
知识库
AI
【实用技巧篇】DeepSeek 常用提示词大揭秘,一文带你全掌握
之前咱聊了用DeepSeek和Kimi自动做PPT,今天就来深入挖掘一下DeepSeek这个大
语言模型
的“秘密武器”——常用提示词。
再见孙悟空_
·
2025-02-09 01:13
【2025
AI学习从零单排系列
】
DeepSeek
AI提示词
AI常用提示词
AI引导
人工智能
一文搞懂DeepSeek - 开源模型R1
DeepSeek-R1作为一款开源的大型
语言模型
,在数学、编程和推理等多个任务上表现出了强大的性能。
程序员辣条
·
2025-02-09 01:12
开源
人工智能
Agent
大模型
大模型教程
大模型项目
DeepSeek
DeepSeek模型全解析:赋能人工智能新纪元
以下是对DeepSeek模型的详尽剖析:一、模型概览DeepSeek,源自一家中国AI初创公司,其最新版本DeepSeek-V3是一款基于先进的Mixture-of-Experts(MoE)架构的
语言模型
云梦优选
·
2025-02-08 23:01
算法
python
计算机
人工智能
大数据
Deepseek成功启示:从 TRPO 到 GRPO训练LLM
这是深入了解大型
语言模型
LLMs如何训练的绝佳机会。
大模型之路
·
2025-02-08 20:03
强化学习
大模型(LLM)
人工智能
LLM
强化学习
deepseek
GRPO
TRPO
速看!openKylin本地部署并运行DeepSeek-R1全攻略!
这款
语言模型
,一经发布直接在全球范围内爆火,成为顶流,在热搜上更是牢牢占据一席之地。无论是技术大神,还是紧跟潮流的技术小白,都被它强大的自然语言处理能力狠狠吸引,谁不想赶紧上手体验一把呢?
·
2025-02-08 19:31
知识库升级新思路:用生成式AI打造智能知识助手
生成式AI,特别是像ChatGPT这样的
语言模型
,为知识库管理系统带来了新的可能性。一、知识库管理系统的现
·
2025-02-08 19:01
速看!openKylin本地部署并运行DeepSeek-R1全攻略!
这款
语言模型
,一经发布直接在全球范围内爆火,成为顶流,在热搜上更是牢牢占据一席之地。无论是技术大神,还是紧跟潮流的技术小白,都被它强大的自然语言处理能力狠狠吸引,谁不想赶紧上手体验一把呢?
·
2025-02-08 18:52
熬夜整理模型下载、量化、代码调用可免费使用离线部署的上千个国内外开源大模型梳理,整理开源的大
语言模型
,以规模较小、可私有化部署、训练成本较低的模型为主,包括底座模型,垂直领域微调及应用,数据集与教程等
熬夜整理模型下载、量化、代码调用,可免费使用离线部署的上千个国内外开源大模型梳理,整理开源的大
语言模型
,以规模较小、可私有化部署、训练成本较低的模型为主,包括底座模型,垂直领域微调及应用,数据集与教程等
代码讲故事
·
2025-02-08 15:32
机器人智慧之心
模型
离线
量化
大模型
开源
部署
训练
【DeepSeek】DeepSeek小模型蒸馏与本地部署深度解析DeepSeek小模型蒸馏与本地部署深度解析
一、引言与背景在人工智能领域,大型
语言模型
(LLM)如DeepSeek以其卓越的自然语言理解和生成能力,推动了众多应用场景的发展。
后端研发Marion
·
2025-02-08 14:24
AI大模型技术
机器学习
人工智能
深度学习
deepseek
本地部署
大
语言模型
应用指南:Gemini简介
1.背景介绍1.1大型
语言模型
的兴起近年来,随着计算能力的提升和数据量的爆炸式增长,大型
语言模型
(LLM)逐渐成为人工智能领域的研究热点。
AI天才研究院
·
2025-02-08 11:03
计算
AI大模型企业级应用开发实战
ChatGPT
计算科学
神经计算
深度学习
神经网络
大数据
人工智能
大型语言模型
AI
AGI
LLM
Java
Python
架构设计
Agent
RPA
上一页
12
13
14
15
16
17
18
19
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他