E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
大规模语言模型对话
全方位解析:大
语言模型
评测方法的综合指南
自2017年Transformer模型提出以来,自然语言处理研究逐步转向基于该框架的预训练模型,如BERT、GPT、BART和T5等。这些预训练模型与下游任务适配后,持续刷新最优结果。然而,现有评测方法存在广度和深度不足、数据偏差、忽视模型其他能力或属性评估等问题。因此,需要全面评测和深入研究模型的各项能力、属性、应用局限性、潜在风险及其可控性等。本文回顾了自然语言处理中的评测基准与指标,将大语言
大模型玩家
·
2025-03-01 08:28
语言模型
人工智能
自然语言处理
深度学习
agi
大模型
搜索引擎
大
语言模型
原理与工程实践:手把手教你训练 7B 大
语言模型
自动化训练框架
大
语言模型
原理与工程实践:手把手教你训练7B大
语言模型
自动化训练框架关键词:大
语言模型
、7B模型、自动化训练、深度学习、神经网络、自然语言处理、分布式计算文章目录大
语言模型
原理与工程实践:手把手教你训练
AI天才研究院
·
2025-03-01 07:24
AI大模型企业级应用开发实战
DeepSeek
R1
&
大数据AI人工智能大模型
计算科学
神经计算
深度学习
神经网络
大数据
人工智能
大型语言模型
AI
AGI
LLM
Java
Python
架构设计
Agent
RPA
全网国内外总结Prompt&LLM论文,开源数据&模型,AIGC应用(持续更新,收藏查看)
全网国内外总结Prompt&LLM论文,开源数据&模型,AIGC应用(持续更新,收藏查看)目录顺序如下国内外,垂直领域大模型Agent和指令微调等训练框架开源指令,预训练,rlhf,
对话
,agent训练数据梳理
代码讲故事
·
2025-03-01 07:54
智能工具
Prompt
LLM
AIGC
模型
开源
数据集
深度学习
【八股】非关系型数据库篇(Redis+ES)
关系型和非关系型数据库特性关系型数据库(RDBMS)非关系型数据库(NoSQL)数据模型表格(行和列)文档、键值、列族、图等多样化模型模式固定(Schema)灵活的,无需预定义结构扩展性纵向扩展为主,横向扩展困难横向扩展容易,适合
大规模
分布式系统事务支持完全支持
林子漾
·
2025-03-01 07:52
八股
项目
redis
数据库
缓存
[LangChain 学习资源大集合]
在构建
语言模型
应用(LLM)时,LangChain是当前备受关注的框架之一。无论是初学者还是进阶用户,丰富的学习资源可以帮助我们高效掌握LangChain的核心概念、工具和最佳实践。
qahaj
·
2025-03-01 06:39
langchain
学习
人工智能
python
删除数据库表中重复数据的方法
删除数据库表中重复数据的方法数据库中重复数据的识别与分析手动删除重复记录的基本步骤利用SQL高级功能高效清理重复数据自动化脚本实现
大规模
重复数据清除数据库设计阶段预防重复数据策略使用数据库内置工具或插件辅助去重工作处理过程中数据完整性和一致性维护针对特定场景下的重复数据处理案例解析数据库中重复数据的识别与分析重复数据指的是在数据库表中出现多次相同的数据记录
master_chenchengg
·
2025-03-01 06:09
能力提升
面试宝典
技术
IT信息化
MCP模型上下文协议集锦
MCP模型上下文协议简介MCP模型上下文协议(Model-Context-Protocol,MCP),能够实现大型
语言模型
(LLM)应用程序与本地或远程资源之间的安全、可控的交互。
galileo2016
·
2025-03-01 06:09
人工智能
计算机网络 - HTTP 协议和万维网
基本概念万维网(WorldWideWeb,WWW)定义:一个
大规模
的分布式信息系统,由全球范围内无数个网络站点和网页组成特点:基于超文本技术,支持多媒体内容的展示和交互URL(UniformResourceLocator
Loop Lee
·
2025-03-01 05:03
java
网络协议
tomcat
servlet
大
语言模型
LLM原理篇_图解大模型从用户输入prompt到llm输出答案的流程原理
大模型席卷全球,彷佛得模型者得天下。对于IT行业来说,以后可能没有各种软件了,只有各种各样的智体(Agent)调用各种各样的API。在这种大势下,笔者也阅读了很多大模型相关的资料,和很多新手一样,开始脑子里都是一团乱麻,随着相关文章越读越多,再进行内容梳理,终于理清了一条清晰的脉络。笔者写原理篇时心情是有些惴惴不安的,因为毕竟对大模型的研究有限,缺乏深度。但是,还是觉得有必要记录一下学习理解心得,
喝不喝奶茶丫
·
2025-03-01 05:01
prompt
人工智能
自然语言处理
语言模型
javascript
大模型
LLM
开发基于提示工程的大
语言模型
(LLM)应用——学习笔记
学习通过提示工程与大
语言模型
进行程序化的交互。将从最基本的开始,比如使用哪些模型,以及如何向它们发送提示词并查看响应。
ricky_fan
·
2025-03-01 05:31
人工智能
python
项目经验之LZO压缩?思维导图 代码示例(java 架构)
在Hadoop生态系统中,使用LZO压缩可以显著减少存储空间,并且由于其快速的解压速度,对于
大规模
数据处理任务来说是非常有利的。以下是关于LZO压缩的项目经验总结、思维导图描述以及Java代码示例。
用心去追梦
·
2025-03-01 05:31
java
架构
开发语言
《AI大模型开发笔记》——提示词工程
提示工程帮助用户控制
语言模型
输出,生成适合的特定需求。提示调整提供了对模型行为的直观控制,但对提示的确切措辞和设计敏感,因此需要精心制定的准则以实现期望的结果。
Richard Chijq
·
2025-03-01 04:27
AI大模型开发笔记
前端
服务器
运维
浅谈MMORPG任务编辑器的设计与实现
马冬亮(凝霜Loki)一个人的战争(http://blog.csdn.net/MDL13412)定义MMORPG任务编辑器用于配置人物与地图NPC、怪物、玩家、场景等相关的任务交互操作,处理诸如与NPC
对话
凝霜
·
2025-03-01 04:25
游戏开发
GitHub每日最火火火项目(2.28)
olmocr项目介绍:olmocr是由allenai开发的一款用于将PDF文件线性化,以适配大
语言模型
(LLM)数据集和训练的工具包。在大
语言模型
的训练过程中,数据的格式和预处理极为关键。
FutureUniant
·
2025-03-01 03:50
github日推
github
人工智能
计算机视觉
音视频
ai
Amazon SageMaker 批量转换中的 JSON 处理技巧
这在处理
大规模
数据集时非常有用。然而,当我们尝试将批量策略从SingleRecord切换到MultiRec
t0_54coder
·
2025-03-01 03:50
json
个人开发
如何使用Anyscale平台运行、微调和扩展大
语言模型
(LLMs)
Anyscale是一个功能强大的平台,主要用于运行、微调和扩展大
语言模型
(LLMs),并且通过生产就绪的API提供成本效益的调用服务。
eahba
·
2025-03-01 03:49
语言模型
人工智能
自然语言处理
python
数据整合平台Airbyte中的Shopify连接器使用指南
其拥有最
大规模
的ELT连接器目录,支持众多的数据仓库和数据库。本文将介绍如何使用Airbyte的Shopify连接器加载Shopify对象作为文档。
bavDHAUO
·
2025-03-01 03:49
python
手机秒变AI办公神器!腾讯元宝+DeepSeek满血版,5分钟搞定PPT和项目汇报——你的效率翻倍指南
支持联网搜索、文件解析、多模态交互,手机端操作更丝滑一、快速上手指南1.下载安装(3秒完成)应用商店搜索“腾讯元宝”→下载安装→选择微信/QQ/手机号登录2.切换至DeepSeek模式(1步到位)进入
对话
界面
a小胡哦
·
2025-03-01 02:43
人工智能
powerpoint
Deepseek
DeepSeek 最新发布 DeepEP:一款用于 MoE 模型训练和推理的开源 EP 通信库
采用Mixture-of-Experts(MoE)架构的大型
语言模型
在没有相应计算量增加的情况下显著提升了模型容量。然而,这种方法也引入了一些挑战,尤其是在GPU之间的通信方面。
强哥之神
·
2025-03-01 01:37
人工智能
LLM
机器学习
Latent
Space
语言模型
deepseek
阿里云PAI大模型RAG
对话
系统最佳实践
去年4月至9月,阿里云人工智能平台PAI团队与大数据基础工程技术团队合作,构建了基于知识库检索增强的大模型答疑
对话
机器人,并在阿里云官方答疑链路、研发小蜜、钉钉大数据技术服务助手等多个线上场景上线,显著提升答疑效率
阿里云云栖号
·
2025-03-01 00:04
云栖号技术分享
阿里云
云计算
云原生
ai
人工智能
火山方舟引擎免费注册送3675万DeepSeek R1满血版tokens
注册打开火山引擎首页,注册,点立即体验选择模型-直接
对话
,如下图API火山方舟也提供兼容Openai的API接口,点击右上角的API接入,如下图:第一步创建key,第二部选择模型-开通选择的模型,然后会给出实例代码
无痕melody
·
2025-03-01 00:01
网络技术
ai
使用 Python 调用 Ollama API 并调用 deepseek-r1:8b 模型
使用Python调用OllamaAPI并调用deepseek-r1:8b模型准备工作调用OllamaAPI使用generate实现多轮
对话
并保留
对话
的记忆ollama是一个强大的本地大
语言模型
工具,支持多种开源模型
眸笑丶
·
2025-02-28 23:26
DeepSeek
Python
python
开发语言
Milvus高性能向量数据库与大模型结合
Milvus是一种高性能、高扩展性的向量数据库,可在从笔记本电脑到
大规模
分布式系统等各种环境中高效运行。它既可以开源软件的形式提供,也可以云服务的形式提供。Milvus是LFAI&Data
山塘小鱼儿
·
2025-02-28 23:25
数据库
阿里云
向量数据库
谁说消费级硬件不能玩 DeepSeek - R1 微调?手把手教你进阶AI玩家
微调像DeepSeek-R1这样的
大规模
人工智能模型可能需要大量资源,但借助正确的工具,在消费级硬件上进行高效训练是可行的。
硅基创想家
·
2025-02-28 22:51
#
大模型-DeepSeek系列
人工智能
DeepSeek
大模型微调
大模型
GPU
谈谈DeepSeek-v3在算力约束下的出色工作
加完班挤点时间读个论文吧.Deepseek-v3仅用了2048块H800GPU就超越了Llama3405B模型,要知道Meta训练Llama3可是用了16384块H100,而DSv3的训练成本非常低在所有人追求更
大规模
集群的时候
强化学习曾小健
·
2025-02-28 22:19
Deepseek原理与使用
人工智能
deepseek 的离线部署-AI大模型
官方网址官方地址:OllamaOllama目前支持以下大
语言模型
:libraryOllama下载地址:https://ollama.com/download/ollama-linux-amd64.tgz
passion_flower_
·
2025-02-28 22:17
ai
一文看懂 Claude 3.7 Sonnet,为什么是第一个融合推理模式的 AI 模型
传统的大
语言模型
(LLM)通常有两种工作方式
董董灿是个攻城狮
·
2025-02-28 22:45
人工智能
通过Bedrock Access Gateway解决方案快速访问Amazon Bedrock的多种大
语言模型
其中,Anthropic公司的Claude3是在AmazonBedrock新上线的大型
语言模型
(LargeLa
国外VPS测评
·
2025-02-28 21:14
gateway
语言模型
人工智能
aws
Bedrock Claude Chat: 基于AWS Bedrock和Claude的智能聊天机器人
AWS推出的BedrockClaudeChat项目为开发者提供了一个强大而灵活的聊天机器人解决方案,让构建智能
对话
系统变得前所未有的简单。
2401_87458778
·
2025-02-28 21:14
aws
机器人
云计算
【llm
对话
系统】大模型源码分析之 LLaMA 模型的 Masked Attention
在大型
语言模型
(LLM)中,注意力机制(AttentionMechanism)是核心组成部分。
kakaZhui
·
2025-02-28 20:03
llama
人工智能
AIGC
chatgpt
python
electron 的原理,使用场景,简单用法
主进程与渲染进程:主进程:应用程序的入口,管理窗口生命周期和原生API(如菜单、
对话
框)。渲染进程:每个窗口对应一个渲染进程,运行前端代码,通过preload脚本安全地桥接Node.js功能。
学会了没
·
2025-02-28 19:29
electron
javascript
前端
第九章 Spring AI API中文版 - Ollama Embeddings API
Ollama嵌入通过Ollama,您可以在本地运行各种大型
语言模型
(LLMs),并从中生成嵌入。SpringAI通过OllamaEmbeddingClient支持Ollama文本嵌入。
明爷们儿
·
2025-02-28 18:52
JAVA大模型
spring
人工智能
java
WPS接入DeepSeek模型免费版本
用户只需将WPS更新到最新版本,登录账号后,点击界面左侧的「灵犀」按钮,就能在
对话
框底部一键启用DeepSeekR1。值得关注的是,这一功能面向所有免费账号开放,并且支持联网。
辣香牛肉面
·
2025-02-28 18:18
工具类
wps
【AI测试学习】AnythingLLM+Ollama+DeepSeek部署私人知识库
1.搭建DeepSeek大
语言模型
1.1Ollama大预言模型部署Ollama简化了大型
语言模型
的运行,让每个人都能在本地轻松体验AI的强大,打开浏览器-下载Ollama-输入命令-搞定,这是本地部署大
语言模型
的全新方式
艳Yansky
·
2025-02-28 16:37
AI测试
Python学习笔记
人工智能
DeepSeek
Ollama
AnythingLLM
传奇服务器遭遇袭击,广大玩家需密切关注
受此影响,多台传奇服务器遭遇
大规模
拒绝服务攻击(DDoS),导致大量玩家无法正常登录游戏。目前
·
2025-02-28 16:54
低代码革命:基于DeepSeek微调模型实现前端代码自动生成与私有JS API调用的实战指南
摘要本文探讨如何微调DeepSeek平台的大
语言模型
,以实现前端代码的智能生成与自建JavaScriptAPI库的无缝调用。
Light60
·
2025-02-28 15:58
低代码
实战篇
AI应用
低代码开发
DeepSeek
微调模型
JavaScript
API
智能生成
饿了么算法工程师-AIGC岗内推
2、基于大型
语言模型
开展文本生成、自然语言理解以及智能
对话
系统的研发,提出新颖的算法/模型,并进行实际开发和应用。3、探索多模态数据的结合,包括图像、文本、语音等,以丰富智能系统的理解和交互能力。
飞300
·
2025-02-28 15:26
AIGC
业界资讯
2025年,值得关注的LLM大趋势
随着人工智能技术不断进步,大
语言模型
正在改变各行各业的运作方式。从代码生成到语言学习应用,GenAI已经渗透到我们日常生活的方方面面。
AI小白熊
·
2025-02-28 15:25
人工智能
产品经理
python
开发语言
学习
ai
大模型
阿里架构师推荐的消息中间件万字文档:RocketMQ+RabbitMQ+KafKa
RocketMQRocketMQ是阿里开源的消息中间件,目前也已经孵化为Apache顶级项目,它是纯Java开发,具有高吞吐量、高可用性、适合
大规模
分布式系统应用的特点。
xiaohao718
·
2025-02-28 14:53
kafka
java-rabbitmq
rabbitmq
氢储技术难点分析及未来展望
氢储能作为长时储能和跨季节储能的重要技术路径,具有能量密度高、可
大规模
存储和灵活应用等优势,但其技术难点仍集中在制氢、储运、应用效率及系统整合等环节,以下是具体分析:一、制氢环节的技术难点电解水制氢效率与成本效率低
DOMINICHZL
·
2025-02-28 12:36
储能
能源
大模型调优方法:提示工程、RAGs 与微调对比
前言每一个搭建大
语言模型
应用的AI工程师都会面临一个难题,如何选择一个合适调优方法。就算是强大的预训练LLM也可能无法直接满足项目中的特定需求。
AI大模型探索者
·
2025-02-28 11:03
人工智能
机器学习
深度学习
ai
语言模型
Hive 面试题
Hive是基于Hadoop的一个数据仓库工具,用来进行数据提取、转化、加载,这是一种可以存储、查询和分析存储在Hadoop中的
大规模
数据的机制。
昨夜为你摘星
·
2025-02-28 11:59
讯飞星火 VS 文心一言:谁是中文大
语言模型
的TOP1?
本篇博客就测评一下这两个在中文圈最受好评的大
语言模型
,顺便辅以ChatGPT为参考。大家一起来看看到底谁是中文大
语言模型
的TOP1?
沉迷单车的追风少年
·
2025-02-28 09:44
深度学习-计算机视觉
人工智能
文心一言
讯飞星火
百度
科大讯飞
【有啥问啥】深入了解 FlashMLA:Hopper GPU 的高效 MLA 解码内核
深入了解FlashMLA:HopperGPU的高效MLA解码内核简介在人工智能(AI)领域,特别是大型
语言模型
(LLM)领域,对计算效率和速度的需求持续增长。
有啥问啥
·
2025-02-28 09:12
大模型
行业调研
科普
算法
语言模型
C++ 游戏开发入门
C++能够直接操作内存,在处理复杂的游戏逻辑、
大规模
数据运算(如物理模拟、图形渲染中的大量计算)以及优化游戏性能方面有着卓越的表现。同时,丰富的类库
安年CJ
·
2025-02-28 08:05
C++
游戏
c++
开发语言
c#
游戏
MFC的用户界面线程
中将线程分为用户界面线程和工作线程,两者最大的区别是前者是和界面相关联的,而后者是进行后台的一些操作.二.如何创建MFC中的线程大多继承自CWinThread,而相关联的界面可以继承自CFrameWnd,也可以继承自
对话
框之类的
CodingLife99
·
2025-02-28 07:54
java
android
c++
多线程
spring
Geo3D城市引擎
大规模
建筑植被渲染
import*asGeo3Dfrom"../src";importInitHelperfrom"./InitHelper";//3D场景初始化constsceneControl=InitHelper.init3D();constcontainer=document.querySelector("#map")asHTMLElement;container&&sceneControl.render(c
苹果园dog
·
2025-02-28 07:22
WebGL
GIS
3d
多线程3:MFC中用户界面线程的相关操作
文章目录前言一、工作线程与界面线程的区别1.在子线程中创建模态
对话
框2.在子线程中创建非模态
对话
框二、界面线程1.界面线程的创建总结前言多线程3:MFC中用户界面线程的相关操作。
智能与优化
·
2025-02-28 07:52
多线程
mfc
ui
c++
开发语言
windows
DeepSeek R1 简单指南:架构、训练、本地部署和硬件要求
DeepSeek推出的LLM推理新策略DeepSeek最近发表的论文DeepSeek-R1中介绍了一种创新的方法,通过强化学习(RL)提升大型
语言模型
(LLM)的推理能力。
爱喝白开水a
·
2025-02-28 07:52
人工智能
AI大模型
DeepSeek
R1
DeepSeek
算法
人工智能训练
大模型部署
Empowering LLMs with Logical Reasoning: 从“语言大师”到“逻辑大师”的进化之路
让大
语言模型
(LLMs)既能说会道,又能逻辑严谨,是AI发展的下一座高峰。”开篇:
语言模型
的“逻辑盲区”近年来,大
语言模型
(LLMs)在自然语言处理(NLP)任务中取得了令人瞩目的成就。
步子哥
·
2025-02-28 07:19
人工智能
上一页
15
16
17
18
19
20
21
22
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他