E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
词向量-语言模型
玩转大模型的第一步——提示词(Prompt)工程【抛砖篇】
前言AI大模型提示词工程,又名LLMpromptsProject,指的是在使用大型
语言模型
(如OpenAI的GPT系列)时,用于引导模型生成特定响应的输入,是在使用AI大模型过程中非常重要的一个环节,是模型生成文本的起点
AI大模型老林
·
2025-01-20 03:37
prompt
数据挖掘
机器学习
opencv
语音识别
人工智能
实战千问2大模型第五天——VLLM 运行 Qwen2-VL-7B(多模态)
一、简介VLLM是一种高效的深度学习推理库,通过PagedAttention算法有效管理大
语言模型
的注意力内存,其特点包括24倍的吞吐提升和3.5倍的TGI性能,无需修改模型结构,专门设计用于加速大规模
语言模型
学术菜鸟小晨
·
2025-01-20 02:50
千问
多模型
qwen2
vl
使用Python实现LLM的文本生成:风格迁移与内容控制
文章目录引言1.大型
语言模型
(LLM)概述1.1Transformer架构1.2预训练与微调2.文本生成基础2.1无条件生成2.2条件生成3.风格迁移3.1风格迁移的基本原理3.2使用Python实现风格迁移
二进制独立开发
·
2025-01-20 02:46
GenAI与Python
非纯粹GenAI
python
开发语言
人工智能
自然语言处理
分布式
语言模型
transformer
AI 在播客领域的应用
播客以语言交谈为主,是大
语言模型
AI可以大展拳脚的地方,比如播客简介,播客节目笔记(shownotes)的自动化生成,播客节目单自动化推荐等等。
姚家湾
·
2025-01-19 21:00
播客
AI
文心一言vsGPT-4全面对比
文心一言和GPT-4都是当前非常先进的人工智能
语言模型
,它们各自具有独特的特点和优势。
编程小郭
·
2025-01-19 18:45
文心一言
chatgpt
java
python
人工智能
ai
【大模型】从零样本到少样本学习:一文读懂 Zero-shot、One-shot 和 Few-shot 的核心原理与应用!
正文:在自然语言处理(NLP)领域,Zero-shot、One-shot和Few-shot学习已经成为衡量大
语言模型
泛化能力的重要指标。
橙子小哥的代码世界
·
2025-01-19 17:06
NLP自然语言理解
大模型
自然语言处理
sklearn
深度学习
神经网络
tensorflow
Cognitive Architectures for Language Agents
语言代理的认知架构摘要1引言2背景:从字符串到符号AGI3
语言模型
与生产系统之间的链接4语言代理的认知架构(CoALA):一个概念框架5用例6可操作的见解7讨论8结论摘要最近的努力已经将大型
语言模型
(LLM
UnknownBody
·
2025-01-19 16:57
LLM
Agent
语言模型
AI代理
探索LLMonitor:全面提升AI应用可观测性的开源平台
引言在构建和部署大型
语言模型
(LLM)和聊天模型时,开发者通常面临数据追踪、使用情况分析、成本控制等各种挑战。LLMonitor是一个开源的可观测性平台,专注于解决这些挑战。
afTFODguAKBF
·
2025-01-19 14:05
人工智能
python
利用Langchain与Minimax进行自然语言处理的精彩指南
Minimax作为一家中国初创企业,专注于提供优秀的
语言模型
服务。本篇文章将介绍如何使用Langchain库与Minimax进行交互,帮助开发者充分利用这一强大的AI工具。
afTFODguAKBF
·
2025-01-19 14:05
langchain
自然语言处理
easyui
python
DeepSeek V3:新一代开源 AI 模型,多语言编程能力卓越
DeepSeekV3的核心亮点DeepSeekV3是一款基于混合专家(MoE)架构的大型
语言模型
,
that's boy
·
2025-01-19 10:35
人工智能
chatgpt
openai
claude
midjourney
deepseek-v3
深度剖析 DeepSeek V3 技术报告:架构创新与卓越性能表现
随着人工智能(AI)技术的不断发展,各种大规模
语言模型
(LLM)层出不穷,DeepSeekV3作为其中的一员,凭借其出色的性能表现和创新的架构设计,吸引了广泛关注。
微凉的衣柜
·
2025-01-19 09:27
科技头条
人工智能
大模型
语言模型
学习AI大模型的小白入门建议和具体的学习方法推荐
深度思考我是一名在汽车行业工作的嵌入式系统工程师,现在我想进入人工智能领域,特别是大型
语言模型
。说到人工智能,我是一个完全的新手,所以我需要弄清楚从哪里开始。让我们把它分解一下。
aFakeProgramer
·
2025-01-19 08:17
机器学习人工智能
人工智能
第二课堂笔记——大
语言模型
part1——qwen在这一部分中需要完成初步运行通义千问,流式输出与在网页窗口进行对话。1.环境准备首先配置满足需求的环境。配置环境代码中:!pipinstalltransformers==4.37.0-U用于安装或更新Python的transformers库到特定版本4.37.0。这里的-U参数表示如果已安装transformers库,则将其更新到指定的版本。!pipinstallstr
skna_
·
2025-01-19 06:26
笔记
语言模型
人工智能
大模型-Qwen2.5 技术报告解读
Abstract主要是在介绍通义千问2.5(Qwen2.5)这一大型
语言模型
系列,涵盖了它在不同训练阶段的改进、多样化配置、可获取途径以及在各项性能评测中的出色表现等多个方面,旨在展示其先进性与实用性。
数据分析能量站
·
2025-01-19 06:55
机器学习
人工智能
Python调用通义千问qwen2.5模型步骤
Qwen2.5模型简介1.1模型概述Qwen2.5是阿里云推出的一款超大规模
语言模型
,它基于阿里巴巴达摩院在自然语言处理领域的研究和积累。
我就是全世界
·
2025-01-19 05:15
python
人工智能
深度学习-45-大型
语言模型
LLM之本地化部署运行自己的大模型
文章目录1深度学习1.1神经网络和深度学习1.2神经网络的工作原理1.3神经网络的专业术语2LLM概述2.1大模型的"大"是指什么?2.2训练大模型有多烧钱?2.3如何入门大模型?2.4LLM的结构2.4.1Transformer2.4.2Prompts2.4.3FineTuning3本地跑大模型3.1Ollama运行开源LLM3.1.1启动并运行3.1.2使用api访问3.1.3设置外网访问3.
皮皮冰燃
·
2025-01-19 04:58
深度学习
深度学习
人工智能
从零开始构建一个大
语言模型
-第二章第一节
#第二章目录**2.1理解词嵌入**2.2文本分词2.3将词元转换为词元ID2.4添加特殊上下文词元2.5字节对编码2.6使用滑动窗口进行数据采样2.7创建词元嵌入2.8编码词位置#本章涵盖为大型
语言模型
训练准备文本
释迦呼呼
·
2025-01-19 03:55
从零开始构建一个大语言模型
语言模型
人工智能
自然语言处理
【cs.CV】25.1.14 arxiv更新速递
110篇—第1篇----=====Omni-RGPT:UnifyingImageandVideoRegion-levelUnderstandingviaTokenMarks关键词:计算机视觉,多模态大
语言模型
hinmer
·
2025-01-19 03:25
CV每日更新
arxiv
chatgpt
gpt
人工智能
自然语言处理
自动驾驶
计算机视觉
ai
Knowledge Boundary of Large Language Models: A Survey
大型
语言模型
的知识边界:综述摘要1引言2知识边界的定义3不良行为4知识边界的识别5缓解6挑战与前景7结论局限性摘要尽管大型
语言模型
(LLM)在其参数中存储了大量的知识,但它们在记忆和利用某些知识方面仍然存在局限性
UnknownBody
·
2025-01-19 03:52
LLM
Daily
Survey
Paper
语言模型
人工智能
自然语言处理
从零开始:在服务器上部署大模型并集成到 vscode +Cline使用
近年来,大型
语言模型
(LLMs)展现出了强大的自然语言处理能力,吸引了越来越多的关注。Qwen系列模型是阿里巴巴开源的一系列强大的大
语言模型
,具有优秀的性能和广泛的应用场景。Olla
一个正经的AI
·
2025-01-19 00:35
服务器
vscode
运维
AI编程
3.ChatClient&Chat Model简化与AI模型的交互
通过向预训练
语言模型
(如GPT等)发送提示词或部分对话内容,模型依据自身训练数据及对自然语言模式的理解,生成对话的延续或完整回复,并返回给应用程序。应用程序可以将其呈现给用户或用于进一步处理。
laopeng301
·
2025-01-18 23:20
Spring
AI
人工智能
交互
ollama教程——使用LangChain调用Ollama接口实现ReAct
ollama入门系列教程简介与目录相关文章:Ollama教程——入门:开启本地大型
语言模型
开发之旅Ollama教程——模型:如何将模型高效导入到Ollama框架Ollama教程——兼容OpenAIAPI
walkskyer
·
2025-01-18 21:25
ollama入门教程
langchain
react.js
前端
思维图GOT:用大
语言模型
解决复杂问题
23年8月份来自瑞士和波兰的大学以及一个数据公司Cledar的大
语言模型
论文“GraphofThoughts:SolvingElaborateProblemswithLargeLanguageModels
硅谷秋水
·
2025-01-18 19:05
大模型
人工智能
机器学习
语言模型
人工智能
自然语言处理
文心一言 vs gpt-4 全面横向比较
文心一言是中国百度公司研发的大规模
语言模型
,它有超多的参数,就像一个超级大脑,特别擅长理解并生成中文内容。在聊天啊、写文章啊、答题这些任务上表现不错,对中国文化和国情有更深的理解和适应能力。
周盛欢
·
2025-01-18 18:54
文心一言
LLMs,即大型
语言模型
LLMs,即大型
语言模型
,是一类基于深度学习的人工智能模型,它们通过海量的数据和大量的计算资源进行训练,可以理解和生成自然语言。
maopig
·
2025-01-18 17:52
AI
语言模型
人工智能
自然语言处理
【论文速读】| 利用大
语言模型
在灰盒模糊测试中生成初始种子
基本信息论文标题:HarnessingLargeLanguageModelsforSeedGenerationinGreyb0xFuzzing作者:WenxuanShi,YunhangZhang,XinyuXing,JunXu作者单位:NorthwesternUniversity,UniversityofUtah关键词:Greyb0xfuzzing,LargeLanguageModels,Seed
云起无垠
·
2025-01-18 17:52
论文速读/精读
语言模型
p2p
人工智能
第79期 | GPTSecurity周报
GPTSecurity是一个涵盖了前沿学术研究和实践经验分享的社区,集成了生成预训练Transformer(GPT)、人工智能生成内容(AIGC)以及大
语言模型
(LLM)等安全领域应用的知识。
云起无垠
·
2025-01-18 17:22
GPTSecurity
AIGC
gpt
第60期 | GPTSecurity周报
GPTSecurity是一个涵盖了前沿学术研究和实践经验分享的社区,集成了生成预训练Transformer(GPT)、人工智能生成内容(AIGC)以及大
语言模型
(LLM)等安全领域应用的知识。
云起无垠
·
2025-01-18 17:22
GPTSecurity
人工智能
语言模型
网络安全
【LLM】大
语言模型
(LLMs)
大型
语言模型
(LLMs)1.什么是大型
语言模型
?大型
语言模型
(LargeLanguageModel,LLM)是基于深度学习的自然语言处理模型,能够理解和生成自然语言文本。
林九生
·
2025-01-18 17:21
人工智能
语言模型
人工智能
自然语言处理
全新 Hopper 架构的Transformer 引擎有什么特点?
Transformer模型是当今广泛使用的
语言模型
(例如asBERT和GPT-3)的支柱。
扫地的小何尚
·
2025-01-18 17:50
人工智能
大
语言模型
(LLMs)入门教程(非常详细)从零基础入门到精通,看完这一篇就够了
大
语言模型
(LLMs)作为人工智能(AI)领域的一项突破性发展,已经改变了自然语言处理(NLP)和机器学习(ML)应用的面貌。
大模型零基础教程
·
2025-01-18 17:19
语言模型
人工智能
自然语言处理
大模型
《AI
语言模型
的关键技术探析:系统提示、评估方法与提示工程》
文章主要内容摘要1.系统提示(SystemPrompt)定义:用于设置模型行为、角色和工作方式的特殊指令重要性:定义模型行为边界影响输出质量和一致性可将通用模型定制为特定领域助手挑战:技术集成复杂兼容性问题效果难以精确预测2.模型评估方法创新方向:自一致性(Self-Consistency)评估PlanSearch方法强化学习(RL)应用核心特点:多次采样和交叉验证策略空间探索动态权重调整实践价值
XianxinMao
·
2025-01-18 17:16
人工智能
语言模型
自然语言处理
《多模态
语言模型
:一个开放探索的技术新领域》
核心主题多模态
语言模型
的特点仍处于探索和定义阶段没有固定的标准任务和评估方法研究方向高度开放技术路径主要存在两种方法:后期融合(LateFusion)从
语言模型
backbone开始添加图像编码器效果稳定
XianxinMao
·
2025-01-18 17:16
语言模型
人工智能
算法
第83期 | GPTSecurity周报
GPTSecurity是一个涵盖了前沿学术研究和实践经验分享的社区,集成了生成预训练Transformer(GPT)、人工智能生成内容(AIGC)以及大
语言模型
(LLM)等安全领域应用的知识。
云起无垠
·
2025-01-18 16:11
GPTSecurity
人工智能
网络安全
【大模型LoRa微调】Qwen2.5 Coder 指令微调【代码已开源】
本文需要用到的代码已经放在GitHub的仓库啦,别忘了给仓库点个小心心~~~https://github.com/LFF8888/FF-Studio-Resources第001个文件哦~一、引言:大
语言模型
与指令微调
FF-Studio
·
2025-01-18 07:31
大语言模型
开源
《提示工程的科学化探索与大
语言模型
交互革新》
文章信息摘要主题:提示工程的科学化与大
语言模型
交互革新核心内容:提示工程的科学化与系统化建立可复现的方法论形成系统性知识体系构建标准化流程和评估体系大
语言模型
带来的交互变革从指令驱动到对话驱动从单一输出到多轮复杂交互从工具到协作伙伴的转变提示对模型行为的影响机制认知层面
XianxinMao
·
2025-01-18 06:57
语言模型
交互
第78期 | GPTSecurity周报
GPTSecurity是一个涵盖了前沿学术研究和实践经验分享的社区,集成了生成预训练Transformer(GPT)、人工智能生成内容(AIGC)以及大
语言模型
(LLM)等安全领域应用的知识。
·
2025-01-18 05:13
aigcgpts
GitHub每日最火火火项目(1.17)
OpenBMB/MiniCPM-o项目名称:OpenBMB/MiniCPM-o用途:MiniCPM-o2.6是一个适用于手机的视觉、语音和多模态直播的GPT-4o级别大
语言模型
(LLM)。
FutureUniant
·
2025-01-18 04:12
github日推
github
人工智能
计算机视觉
音视频
ai
第81期 | GPTSecurity周报
GPTSecurity是一个涵盖了前沿学术研究和实践经验分享的社区,集成了生成预训练Transformer(GPT)、人工智能生成内容(AIGC)以及大
语言模型
(LLM)等安全领域应用的知识。
·
2025-01-18 01:02
aigc网络安全
第83期 | GPTSecurity周报
GPTSecurity是一个涵盖了前沿学术研究和实践经验分享的社区,集成了生成预训练Transformer(GPT)、人工智能生成内容(AIGC)以及大
语言模型
(LLM)等安全领域应用的知识。
·
2025-01-18 00:26
aigcgpts
记录一个LLM+API类型的临床预测模型APP(糖尿病Cox预测模型)的过程
记录一个LLM+API类型的临床预测模型APP(糖尿病Cox预测模型)的构建过程LLM代表的是大
语言模型
,API代表的是机器学习模型,LLM+API是说将机器学习模型以API的形式引入到LLM,让机器学习模型以对话的方式与用户交流而服务于临床实践的
预测模型的开发与应用研究
·
2025-01-17 22:20
APP
construction
web
app
GraphRAG 本地 Ollama - 知识图谱
论文摘要使用检索增强生成(RAG)从外部知识源中检索相关信息,使大型
语言模型
(LLMs)能够回答关
ericliu2017
·
2025-01-17 21:07
知识图谱
人工智能
第79期 | GPTSecurity周报
GPTSecurity是一个涵盖了前沿学术研究和实践经验分享的社区,集成了生成预训练Transformer(GPT)、人工智能生成内容(AIGC)以及大
语言模型
(LLM)等安全领域应用的知识。
·
2025-01-17 19:08
aigcgpts
提示工程(Prompt Engineering)最全综述:本质、技术、最佳实践
一、理解提示与提示工程(promptengineering)(一)提示的本质提示是我们输入给大
语言模型
以获取期望响应的信息。它的形式丰富多样,可以是一个
大模型之路
·
2025-01-17 14:13
prompt
prompt
算法
人工智能
LLM
提示工程
安装指南:LLaMA Factory、AutoGPTQ 和 vllm
安装指南:LLaMAFactory、AutoGPTQ和vllm在本文中,我们将详细介绍如何安装LLaMAFactory、AutoGPTQ和vllm,这些工具在大型
语言模型
(LLMs)和视觉
语言模型
(VLMs
从零开始学习人工智能
·
2025-01-17 13:05
人工智能
算法
深度学习
python
DeepSeek Artifacts:前端开发的新利器
这款轻量级模型凭借在大
语言模型
(LLM)排行榜上的优异表现,以及亲民的价格和卓越的性能,在人工智能社区中广受关注。然而,它的姊妹工具DeepSeekArtifacts却因截然不同的缘由引发了热议。
·
2025-01-17 05:12
人工智能
大规模
语言模型
从理论到实践 大
语言模型
预训练数据
大规模
语言模型
从理论到实践:大
语言模型
预训练数据关键词:大规模
语言模型
、预训练数据、数据集选择、数据清洗、数据增强、数据集评估、数据集扩展1.背景介绍1.1问题的由来随着深度学习和大规模神经网络的发展,
AI大模型应用之禅
·
2025-01-17 03:39
AI大模型与大数据
计算科学
神经计算
深度学习
神经网络
大数据
人工智能
大型语言模型
AI
AGI
LLM
Java
Python
架构设计
Agent
RPA
PyTorch建模与应用:从深度学习到大模型
全书共11章,内容涵盖了从深度学习的基础概念到大
语言模型
的应用。第1章介绍了深度
屿小夏
·
2025-01-17 00:12
书籍推荐
深度学习
pytorch
人工智能
论文翻译:A survey on large language model (LLM) security and privacy: The Good, The Bad, and The Ugly
TheGood,TheBad,andTheUglyhttps://www.sciencedirect.com/science/article/pii/S266729522400014X文章目录关于大型
语言模型
CSPhD-winston-杨帆
·
2025-01-17 00:41
论文翻译
LLMs-鲁棒性
语言模型
人工智能
自然语言处理
【vLLM 学习】安装
vLLM是一款专为大
语言模型
推理加速而设计的框架,实现了KV缓存内存几乎零浪费,解决了内存管理瓶颈问题。
·
2025-01-17 00:08
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他