E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
蛋白质语言模型
DeepSeek-Ollama实现本地化无烦恼
我们需要用到:Ollama:启动并运行大型
语言模型
。star125KOpenWebUI:一个可扩展、功能丰富且用户友好的自托管AI平台,旨在完全离线运行。
c_zyer
·
2025-02-12 20:11
AI
DeepSeek
运维部署
deepseek
ollama
open-webui
ai
最通俗易懂的方式,由浅入深地讲讲DeepSeek(深度求索)
它最核心的产品是大
语言模型
(你可以理解为"超级聊天机器人"),比如DeepSeek-R1、DeepSeek-MoE等。
Jing_saveSlave
·
2025-02-12 19:07
AI
ai
chatgpt
AI编程
提升
语言模型
性能的关键策略
标题:提升
语言模型
性能的关键策略文章信息摘要:提升
语言模型
性能的关键在于预训练数据的规模和质量、模型架构的优化以及模型与数据的平衡。单纯增加模型参数规模并不能持续带来性能提升,性能提升会逐渐趋于平缓。
XianxinMao
·
2025-02-12 18:25
语言模型
人工智能
自然语言处理
云原生周刊:DeepSeek 颠覆人工智能
开源项目推荐OllamaOllama是一个开源的AI工具,旨在为用户提供简单而强大的本地部署
语言模型
解决方案。
KubeSphere 云原生
·
2025-02-12 18:54
k8s
容器平台
kubesphere
云计算
生物制药企业选择谷歌云的理由有哪些?
AI发展的这一年,科学家也紧随其后,透过AI拓展更多微观层面的生物学奥义,包括
蛋白质
折叠等。生物制药公司也加大了在药物研发领域的投入,其中一方面就是搭载云平台。
·
2025-02-12 18:53
人工智能数据挖掘
普惠AI 如何在 Anolis OS 8 上部署生产可用的 DeepSeek 推理服务
DeepSeek-R1-Distill-Qwen则是通过DeepSeek-R1的输出,基于Qwen大
语言模型
,经过模型蒸馏的小模型,其中32B和70B模型在多项能力上实现了对标OpenAIo
·
2025-02-12 17:52
操作系统人工智能开源
AI基础 -- AI学习路径图
人工智能从数学到大
语言模型
构建教程第一部分:AI基础与数学准备1.绪论:人工智能的过去、现在与未来人工智能的定义与发展简史从符号主义到统计学习、再到深度学习与大模型的变迁本书内容概览与学习路径指引2.线性代数与矩阵运算向量与矩阵的基本概念矩阵分解
sz66cm
·
2025-02-12 16:40
人工智能
学习
大
语言模型
在专业领域的应用——教育场景下的大
语言模型
教育场景下的大
语言模型
构建教育相关的大
语言模型
数据资源总结教育是人类社会进步的基石,对个人和社会发展都至关重要。
什么都不太懂的程序员
·
2025-02-12 15:09
大语言模型
语言模型
人工智能
自然语言处理
探索 Dify:开源 LLM 应用开发平台
这是一个开源平台,专为大
语言模型
(LLM)应用开发设计。凭借其直观的界面、全面的功能和强大的后端支持,Dify将彻底改变开发人员创建和部署AI应用程序的方式。
weixin_40941102
·
2025-02-12 15:38
开源
llama3简介与国内最快体验方式
Meta公司研发并推出了MetaLlama3系列大型
语言模型
(LLMs),该系列包括8B和70B参数量的预训练及指令调优生成文本模型。
weixin_40941102
·
2025-02-12 15:08
python
Java程序员Python一小时速成
背景由于最近要开发一些AILLM(LargeLanguageModel大
语言模型
)应用程序,然后又想使用LangChain(LangChain是一个用于构建和操作大
语言模型
(LLMs)的框架,旨在帮助开发者更方便地集成和使用各种
BossFriday
·
2025-02-12 15:04
AI
&
LLM
java
python
开发语言
从
语言模型
获取结构化数据输出的高级技巧
标题:从
语言模型
获取结构化数据输出的高级技巧内容:从
语言模型
获取结构化数据输出的高级技巧引言在使用大型
语言模型
(LLM)时,我们经常需要模型返回特定格式的结构化数据,而不仅仅是自由格式的文本。
stjklkjhgffxw
·
2025-02-12 14:29
语言模型
服务器
人工智能
TAG,一种用于复杂问题解答的统一模型
强大的
语言模型
(LM)的出现为以更自然、更直观的方式查询和分析信息开
·
2025-02-12 13:13
人工智能
AI提示工程实战:从零开始利用提示工程学习应用大
语言模型
【附PDF】
大
语言模型
是人工智能领域的重要成果,在自然语言处理和生成任务中发挥着重要的作用。读者通过深入了解和应用提示工程,能充分挖掘和利用大
语言模型
的潜力,提升效率、促进创新,并解决实际问题。
程序员丸子
·
2025-02-12 12:49
人工智能
学习
语言模型
大模型
自然语言处理
AI提示工程
提示工程
DeepSeek-V3:模型与权重全面解析
DeepSeek-V3是一款开创性的混合专家(Mixture-of-Experts,MoE)
语言模型
,以其创新的架构设计、高效的训练方法和卓越的性能,成为开源大
语言模型
领域的标杆。
步子哥
·
2025-02-12 11:13
AGI通用人工智能
人工智能
OpenAI重磅更新:发布目前最强推理模型ChatGPT-o1,新鲜测试出炉,草莓快要成熟了
这次更新标志着OpenAI在人工智能推理能力上的重大突破,推出了其最新的大
语言模型
——o1-preview和o1-mini。这一更新揭开了已经预热接近一年的“Q*/草莓项目”的神秘面纱。
机械心
·
2025-02-12 10:39
人工智能
chatgpt
人工智能
DeepSeek 与 Transformer 架构的深度关联
在人工智能蓬勃发展的当下,大
语言模型
正以惊人的速度迭代更新,持续重塑着人们对智能技术的认知。DeepSeek作为其中的杰出代表,凭借其卓越的性能和独特的技术架构,在自然语言处理领域引发了广泛关注。
JoveZou
·
2025-02-12 10:08
科技咨询与闲谈
transformer
深度学习
人工智能
ai
chatgpt
架构
开源模型应用落地-qwen2-7b-instruct-LoRA微调&合并-ms-swift-单机多卡-RTX 4090双卡(十五)
二、术语介绍2.1.LoRA微调LoRA(Low-RankAdaptation)用于微调大型
语言模型
(LLM)。
开源技术探险家
·
2025-02-12 04:50
开源模型-实际应用落地
#
开源模型-微调实战密码
自然语言处理
深度学习
语言模型
揭幕 DeepSeek-V2.5-1210:革新人工智能能力
这一尖端
语言模型
在各个领域都取得了巨大进步,巩固了其作为人工智能领域开拓者的地位。
吴脑的键客
·
2025-02-12 03:16
人工智能
人工智能
搜索引擎
对DeepSeek-R1通过强化学习提升大型
语言模型
推理能力的技术原理解析
强化学习基础•基本概念:强化学习是一种机器学习方法,智能体(模型)通过与环境进行交互,根据环境反馈的奖励信号来学习最优的行为策略。•关键要素:包括环境(模型所处的推理任务场景)、状态(模型在推理过程中的当前情况,如已有的推理步骤、已知信息等)、动作(模型在当前状态下做出的推理决策,如选择何种推理方法、如何组织语言等)、奖励(根据模型的动作和结果给予的反馈,如推理正确给予正奖励,错误给予负奖励或无奖
一只贴代码君
·
2025-02-12 02:12
语言模型
人工智能
自然语言处理
学习
AI编程
开发语言
大
语言模型
多代理协作(MACNET)
大
语言模型
多代理协作(MACNET)ScalingLarge-Language-Model-basedMulti-AgentCollaboration提出多智能体协作网络(MACNET),以探究多智能体协作中增加智能体数量是否存在类似神经缩放定律的规律
ZhangJiQun&MXP
·
2025-02-12 00:51
2021
AI
python
教学
2021
论文
语言模型
人工智能
自然语言处理
预训练
语言模型
:从BERT到GPT,NLP的新纪元
自然语言处理(NLP)在过去几年中经历了翻天覆地的变化,而这一变化的催化剂无疑是预训练
语言模型
(Pre-trainedLanguageModels,PLMs)的崛起。
Evaporator Core
·
2025-02-11 20:23
自然语言处理
人工智能
Python开发经验
自然语言处理
语言模型
bert
【大模型部署及其应用 】Ollama搭建运行中文大语音模型Llama3-8B-Chinese-Chat
Ollama是一种用于运行大
语言模型
(如LLaMA)的平台,适合本地化部署和运行。
源代码杀手
·
2025-02-11 18:34
AIGC核心技术剖析
人工智能
深度学习
llama
大
语言模型
原理与工程实践:初探大
语言模型
大
语言模型
原理与工程实践:初探大
语言模型
作者:禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming关键词:大
语言模型
,机器学习,自然语言处理,深度学习,工程实践1.
AI天才研究院
·
2025-02-11 17:04
AI大模型企业级应用开发实战
DeepSeek
R1
&
大数据AI人工智能大模型
计算
计算科学
神经计算
深度学习
神经网络
大数据
人工智能
大型语言模型
AI
AGI
LLM
Java
Python
架构设计
Agent
RPA
三步本地部署deepseekr1,支持macOs,ubuntu,Windows
一、ollama安装:ollama官网:OllamaOllama是一款支持在Windows、macOS和Linux上本地运行大型
语言模型
的工具。
dingdongkk
·
2025-02-11 17:28
高效tools
macos
ubuntu
windows
deepseek
AI代码生成器安全隐患:Grok泄露系统提示词事件警示
最近,一个名为Grok的大型
语言模型
泄露了其系统提示词,引发了业内对AI写代码工具安全性和透明度问题的广泛关注。
·
2025-02-11 16:04
前端
深入解析:如何使用 Ollama 下载与使用本地大
语言模型
在当今数字化时代,大
语言模型
(LLM)的应用越来越广泛,从自然语言处理到文本生成,从代码辅助到智能问答,它们都展现出了强大的能力。然而,使用云端大
语言模型
往往面临着成本高昂、隐私泄露等问题。
大懒猫软件
·
2025-02-11 16:22
语言模型
人工智能
自然语言处理
python
llama
AI代码生成器安全隐患:Grok泄露系统提示词事件警示
最近,一个名为Grok的大型
语言模型
泄露了其系统提示词,引发了业内对AI写代码工具安全性和透明度问题的广泛关注。
·
2025-02-11 15:22
前端
以创新测评赋能未来:CSDN开源与智能技术创新研究院发布大模型综合榜单
随着人工智能的持续演进,大
语言模型
在越来越多的领域中发挥着关键作用。对中小企业或个人用户而言,如何选择适合自身需求、具有高性价比且能够快速落地的大
语言模型
,成为技术应用的核心关切。
CSDN资讯
·
2025-02-11 15:17
AI
编程
人工智能
DeepSeek
大模型
5分钟在本地PC上使用VLLM快速启动Valdemardi/DeepSeek-R1-Distill-Llama-70B-AWQ
及依赖库模型下载安装HuggingFaceCLI下载DeepSeek-R1-Distill-Qwen-32B模型启动启动命令启动确认模型验证发送API请求示例输出注意事项参考链接前言VLLM是一个高效且轻量的大规模
语言模型
engchina
·
2025-02-11 14:41
LINUX
llama
linux
人工智能
VLLM
deepseek-r1
动手学大
语言模型
LLM-02
文章目录LLMAPI开发基础知识PromptTemperaturesystemprompt使用LLMAPIpromptengineeringprompt设计原则1、编写清晰、具体指令1、使用分隔符清晰表示不同的输入部分2、寻求结构化的输出3、要求模型检查是否满足条件4、提供少量的示例2、让模型有时间去思考1、指定完成任务的步骤2、指导模型在下结论之前找到自己的解法LLMAPI开发基础知识Promp
阿苏拉则_妫
·
2025-02-11 12:28
LLM
语言模型
人工智能
自然语言处理
DeepSeek R1 简易指南:架构、本地部署和硬件要求
DeepSeek团队近期发布的DeepSeek-R1技术论文展示了其在增强大
语言模型
推理能力方面的创新实践。该研究突破性地采用强化学习(Reinfo
·
2025-02-11 12:49
deepseek
0 Token 间间隔 100% GPU 利用率,百度百舸 AIAK 大模型推理引擎极限优化 TPS
01什么是大模型推理引擎大模型推理引擎是生成式
语言模型
运转的发动机,是接受客户输入prompt和生成返回response的枢纽,也是拉起异构硬件,将物理电能转换为人类知识的变形金刚。
·
2025-02-11 11:44
百度云大模型gpu
云上一键部署 DeepSeek-V3 模型,阿里云PAI Model Gallery 最佳实践
DeepSeek-V3模型简介DeepSeek-V3是DeepSeek发布的MoE(Mixture-of-Experts)大
语言模型
,总参数量为6710亿,每个token激活的参数量为370亿。
·
2025-02-11 11:44
DeepSeek与ChatGPT对比:技术、应用与未来趋势
在人工智能飞速发展的时代,大
语言模型
成为了推动技术革新和产业变革的核心力量。DeepSeek和ChatGPT作为其中的典型代表,各自凭借独特的技术架构、训练方式和应用优势,在不同领域展现出卓越的性能。
CodeJourney.
·
2025-02-11 11:49
人工智能
数据库
算法
AF3 drmsd函数解读
drmsd(distanceRootMeanSquareDeviation,距离均方根偏差)函数在AlphaFold3的src.utils.validation_metrics模块中定义,用于计算两个
蛋白质
结构
qq_27390023
·
2025-02-11 08:51
深度学习
pytorch
人工智能
生物信息学
python
如何在 VSCode 中使用通义灵码(Tongyi Lingma)智能编程助手
与GitHubCopilot类似,通义灵码基于大
语言模型
(LLM),可以提供代码补全、智能纠错、代码生成等功能,极大提升开发效率。本文将详细介绍如何在VSCode中安装和使用通义灵码,
全栈探索者chen
·
2025-02-11 06:09
知识分享
vscode
ide
编辑器
开发语言
AI编程
通灵
人工智能
《大
语言模型
:原理与工程实践》书籍推荐及详细说明
随着人工智能技术的发展,尤其是深度学习技术的进步,大规模
语言模型
(LargeLanguageModels,LLMs)已成为自然语言处理领域的研究热点。
大模型入门教程
·
2025-02-11 01:57
语言模型
人工智能
自然语言处理
llama
大模型
大模型入门(六)—— RLHF微调大模型
一、RLHF微调三阶段参考:https://huggingface.co/blog/rlhf1)使用监督数据微调
语言模型
,和fine-tuning一致。
LLM.
·
2025-02-10 23:17
人工智能
语言模型
机器学习
自然语言处理
LLM
大模型
RLHF
SEO友好架构提升LLM应用的可发现性
《SEO友好架构提升LLM应用的可发现性》文章关键词SEO友好架构
语言模型
(LLM)搜索引擎优化(SEO)可发现性内容优化技术优化用户体验优化信息组织关键词策略社交媒体推广摘要本文旨在探讨如何通过SEO
AI天才研究院
·
2025-02-10 17:00
计算机软件编程原理与应用实践
java
python
javascript
kotlin
golang
架构
人工智能
大厂程序员
硅基计算
碳基计算
认知计算
生物计算
深度学习
神经网络
大数据
AIGC
AGI
LLM
系统架构设计
软件哲学
Agent
程序员实现财富自由
【AI论文】LIMO:推理中少即是多
摘要:我们提出了一项重大发现,这一发现挑战了我们对大型
语言模型
中复杂推理能力涌现方式的理解。传统观点认为,复杂的推理任务需要大量的训练数据(超过10万例)。
东临碣石82
·
2025-02-10 16:55
人工智能
2025最新ChatGPT、DeepSeek等大
语言模型
助力高效办公、论文与项目撰写、数据分析、机器学习与深度学习建模等深度科研应用
随着人工智能技术的快速发展,大
语言模型
如ChatGPT和DeepSeek在科研领域的应用正在为科研人员提供强大的支持。
梦想的初衷~
·
2025-02-10 16:53
AI大语言
人工智能
chatgpt
语言模型
数据分析
荣耀已接入DeepSeek-R1,荣耀手机系统版本MagicOS8.0及以上用户可用
以下是关于这一事件的详细介绍:DeepSeek-R1的强大能力DeepSeek-R1是一款先进的
语言模型
,具备强大的自然语言处理能力、逻辑推理能力和上下文理解能
2501_90444774
·
2025-02-10 14:10
人工智能
virtualenv
tornado
scikit-learn
智能手机
《具身智能时代:机器人具身抓取技术的前沿探索与应用综述》
自2022年GPT等大模型的爆发以来,人工智能领域以
语言模型
为代表的预训练模型在多个领域掀起了创新浪潮。
笑傲江湖2023
·
2025-02-10 13:53
机器人
ChatGPT vs. DeepSeek:大模型赛道的差异化竞争
ChatGPTvs.DeepSeek:大模型赛道的差异化竞争人工智能
语言模型
的快速发展正在重塑人机交互的边界,在这场技术浪潮中,ChatGPT与DeepSeek作为两类典型代表,展现出截然不同的技术路线与市场定位
TKang8912
·
2025-02-10 12:49
chatgpt
谈大
语言模型
动态思维流编排
尽管大
语言模型
已经呈现出了强大的威力,但是如何让它完美地完成一个大的问题,仍然是一个巨大的挑战。需要精心地给予大模型许多的提示(Prompt)。
姚家湾
·
2025-02-10 10:31
语言模型
人工智能
自然语言处理
代码星辰:探索 benchmark 构建的奥秘之旅
而在这片“代码星海”中,如何评估大
语言模型
(LLMs)在编程任务上的表现,就像天文学家借助望远镜探索宇宙奥秘一般关键。近日,一篇题为《HowShouldIBuildABenchmark?
步子哥
·
2025-02-10 07:56
AGI通用人工智能
人工智能
AI系列:大
语言模型
的function calling(下)- 使用LangChain
装饰器其他方式:Pydantic2.绑定tools/functions3.调用大模型(LLM)4.functioncalling处理流程LangChain版代码与原生LLM调用的比较参考前言在AI系列:大
语言模型
的
liyane
·
2025-02-10 05:38
AI人工智能
人工智能
语言模型
langchain
AI大模型系列之七:Transformer架构讲解
前馈神经网络编码器(Encoder)解码器(Decoder):基于卷积神经网络(CNN)的编码器-解码器结构基于Transformer架构的主流
语言模型
有哪
m0_74823683
·
2025-02-10 03:58
面试
学习路线
阿里巴巴
人工智能
transformer
深度学习
大模型学习笔记 - LLM 对齐优化算法 DPO
LLM-DPOLLM-DPODPO概述DPO目标函数推导DPO目标函数梯度的推导DPO概述大模型预训练是从大量语料中进行无监督学习,语料库内容混杂,训练的目标是
语言模型
损失,任务是nexttokenprediction
JL_Jessie
·
2025-02-10 03:54
学习
笔记
算法
LLM
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他