E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
LLm
Beyond One-Model-Fits-All: A Survey of Domain Specialization for Large Language Models
超越一个模型适合所有:大型语言模型领域专业化综述摘要1引言1.1相关综述2领域专业的分类2.1背景2.2领域专业的技术分类3领域专业化的外部增强3.1领域知识增强3.1.1
LLM
中显性知识的利用3.1.2
LLM
UnknownBody
·
2023-11-20 03:21
综述文章
语言模型
深度学习
人工智能
LLM
大模型权重量化实战
大型语言模型(
LLM
)以其广泛的计算要求而闻名。通常,模型的大小是通过将参数数量(大小)乘以这些值的精度(数据类型)来计算的。
新缸中之脑
·
2023-11-20 02:23
LLM
大大大模型部署方案抛砖引玉
oldpan博客点击下方卡片,关注“自动驾驶之心”公众号ADAS巨卷干货,即可获取点击进入→自动驾驶之心【模型部署】技术交流群借着热点,简单聊聊大模型的部署方案,作为一个只搞过CV部署的算法工程师,在最近
LLM
自动驾驶之心
·
2023-11-20 02:22
人工智能
深度学习
计算机视觉
大模型落地的必经之路 | GPTQ加速
LLM
落地,让Transformer起飞!
作者|小书童编辑|集智书童点击下方卡片,关注“自动驾驶之心”公众号ADAS巨卷干货,即可获取点击进入→自动驾驶之心【大模型】技术交流群本文只做学术分享,如有侵权,联系删文生成预训练Transformer模型,也称为GPT或OPT,通过在复杂语言建模任务中取得突破性性能而脱颖而出,但也因其庞大的规模而需要极高的计算和存储成本。具体而言,由于它们的巨大规模,即使对于大型高精度的GPT模型的推理,也可能
自动驾驶之心
·
2023-11-20 02:22
transformer
深度学习
人工智能
LLM
大模型4位量化实战【GPTQ】
在上一篇文章中,我们介绍了简单的8位量化技术和出色的
LLM
.int8()。在本文中,我们将探索流行的GPTQ算法,以了解其工作原理并使用AutoGPTQ库实现它。
新缸中之脑
·
2023-11-20 02:52
mvc
大语言模型的三阶段训练
代码将全部上传到github:https://github.com/hjandlm/
LLM
_Train1.中文词表扩展原生词表大小是32K,在词表扩展后,词表大小是63608。
hj_caas
·
2023-11-20 01:22
LLM
语言模型
人工智能
自然语言处理
大模型应用一:RAG
但是随着国内开源大模型的开放,越来越多人觉得通用
LLM
的价值很低(可能是商业利益的驱使)。大家对技术的追逐有变成了应用变现的需求。
u013250861
·
2023-11-19 23:10
#
LLM/LangChain
人工智能
RAG
基于多向量检索器的多模态 RAG 实现
后面两个示例还涵盖了一些配合多模态
LLM
的多矢量检索器用法,以实现针对图像的RAG。半结构化数据(tables+text)RAG多模态(text+tables+images)RAG私有化
太戈戈
·
2023-11-19 23:40
AI
人工智能
langchain
语言模型
使用SemanticKernel 进行智能应用开发(2023-10更新)
以OpenAI的ChatGPT所掀起的GenAI快速创新浪潮,其中连接
LLM
和应用之间的桥梁的两大开源项目:LangChain[1]和SemanticKernel[2],在半年前写过一篇文章LangChainvsSemanticKernel
dotNET跨平台
·
2023-11-19 21:31
18种大模型指令调优方法分享,附模型源码
该方法的核心目标是使
LLM
具备遵循自然语言指令并完成现实世界任务的能力。
深度之眼
·
2023-11-19 13:29
人工智能干货
深度学习干货
大模型
指令调优
LLM
大模型 (chatgpt) 在搜索和推荐上的应用
目录1大模型在搜索的应用1.1召回1.1.1倒排索引1.1.2倒排索引存在的问题1.1.3大模型在搜索召回的应用(实体倒排索引)1.2排序1.2.1大模型在搜索排序应用(融入
LLM
实体排序)2大模型在推荐的应用
BGoodHabit
·
2023-11-19 08:52
ChatGPT
chatgpt
人工智能
搜索和推荐
GPT实战系列-P-Tuning本地化训练ChatGLM2等
LLM
模型,到底做了什么?(一)
GPT实战系列-如何使用P-Tuning本地化训练ChatGLM2等
LLM
模型?文章目录GPT实战系列-如何使用P-Tuning本地化训练ChatGLM2等
LLM
模型?
Alex_StarSky
·
2023-11-19 08:37
GPT实战系列
ChatGLM2
p-tuning
ChatGPT
LLM
微调训练
本地化训练
私有数据
GPT实战系列-P-Tuning本地化训练ChatGLM2等
LLM
模型,到底做了什么?(二)
GPT实战系列-如何使用P-Tuning本地化训练ChatGLM2等
LLM
模型?
Alex_StarSky
·
2023-11-19 08:04
GPT实战系列
p-tuning训练
ChatGLM2
LLM训练
训练代码解读
大模型
本地化训练
ChatGPT
大型语言模型中的幻觉研究综述:原理、分类、挑战和未决问题11.15+11.16+11.17
大型语言模型中的幻觉研究综述:原理、分类、挑战和未决问题11.15摘要1引言2定义2.1
LLM
2.3大语言模型中的幻觉3幻觉的原因3.1数据的幻觉3.1.1有缺陷的数据源3.1.2较差的数据利用率3.1.3
露葵025
·
2023-11-19 07:43
论文
LLM
幻觉
如何利用 instructor 提高 RAG 的准确性和召回率
本文首发于博客
LLM
应用开发实践RAG(RetrievalAugmentedGeneration)是一种检索增强生成技术,它利用大型语言模型来处理用户查询,RAG技术的主要组成包括数据提取—embedding
骑猪兜风233
·
2023-11-19 06:11
LLM应用构建实践笔记
大语言模型开发者教程
AI编程
人工智能
文心一言
语言模型
自然语言处理
知识图谱
DALL·E
2
改进召回(Retrieval)和引入重排(Reranking)提升RAG架构下的
LLM
应用效果
改进召回(Retrieval)和引入重排(Reranking)提升RAG架构下的
LLM
应用效果原创ullyAI工程化2023-08-2421:08收录于合集#
LLM
应用架构3个#领域技术13个动手点关注干货不迷路如前文
AI生成曾小健
·
2023-11-19 06:56
大语言模型LLM
大模型知识库-可信LLM
-外挂知识库
架构
人工智能
2.2 调用星火大模型的API
调用星火大模型的API1申请API调用权限:2调用原生星火API3统一API调用方式项目仓库地址:https://github.com/datawhalechina/
llm
-universe讯飞星火认知大模型
Alexa2077
·
2023-11-19 03:53
大模型
人工智能
深度学习
pytorch
大模型
新加坡国立华人团队开源全能「大一统」多模态大模型,火爆AI社区!
继ChatGPT引爆2023年的AI潮后,各类开源
LLM
也陆续问世。
人工智能与算法学习
·
2023-11-19 01:21
人工智能
UnIVAL:第一个支持图像、视频、音频和文本任务的大一统模型!
进NLP群—>加入NLP交流群大型语言模型(
LLM
)使得对通才代理的雄心勃勃的追求不再是一个幻想。构建此类通用模型的一个关键障碍是任务和模式的多样性和异质性。
zenRRan
·
2023-11-19 01:17
音视频
机器学习
人工智能
破解一切模态,无限接近AGI!NUS开源全能「大一统」多模态大模型
继ChatGPT引爆2023年的AI潮后,各类开源
LLM
也陆续问世。
PaperWeekly
·
2023-11-19 01:42
agi
多模态大一统:开启全模态
LLM
和通用AI时代的大门
多模态大一统:开启全模态
LLM
和通用AI时代的大门1.目前多模态实现的方法1.1单独训练各领域模型1.2多任务学习1.3集成多模态模型1.4通用多模态模型2.多模态统一难点2.1数据集对齐和融合2.2大规模计算资源需求
东方佑
·
2023-11-19 00:07
NLP
人工智能
自然语言处理
开源
LLM
(大语言模型)整理(一)
LargeLanguageModel(
LLM
)即大规模语言模型,是一种基于深度学习的自然语言处理模型,它能够学习到自然语言的语法和语义,从而可以生成人类可读的文本。
u013250861
·
2023-11-18 22:09
LLM
开源
语言模型
人工智能
使用MLC-
LLM
将RWKV 3B模型跑在Android手机上
0x0.前言这篇文章主要是填一下MLC-
LLM
部署RWKVWorld系列模型实战(3B模型MacM2解码可达26tokens/s)这里留下来的坑,这篇文章里面介绍了如何使用MLC-
LLM
在A100/MacM2
just_sort
·
2023-11-18 22:03
android
智能手机
开源大语言模型完整列表
LargeLanguageModel(
LLM
)即大规模语言模型,是一种基于深度学习的自然语言处理模型,它能够学习到自然语言的语法和语义,从而可以生成人类可读的文本。
ejinxian
·
2023-11-18 22:02
语言模型
人工智能
自然语言处理
MLC-
LLM
支持RWKV-5推理以及对RWKV-5的一些思考
BBuf/how-to-optim-algorithm-in-cuda/tree/master/large-language-model-note,从2023年3月左右到现在保持了持续动态更新整理,有关于
LLM
just_sort
·
2023-11-18 22:28
深度学习
chatgpt
LangChain 实现给动物取名字
mkdirlangchain-
llm
-appcdlangchain-
llm
-app#用vscode打开当前目录code.在macOS上通过终端打开VisualStudioCode(VSCode),您可以按照以下步骤操作
AI架构师易筋
·
2023-11-18 22:10
LLM-Large
Language
Models
langchain
人工智能
LLM
LM(大模型)应用开发利器之LangChain,带你走进AI世界
原文:
LLM
(大模型)应用开发利器之LangChain,带你走进AI世界-简书LangChain组件图LangChain是什么首先LangChain是一个框架,这个框架是用来让开发者进行LLMs(大语言模型
javastart
·
2023-11-18 21:01
langchain
大模型
prompt
langchain
人工智能
chatgpt
这次轮到微软炸场了;5000+AI工具调研报告 (500万字);狂打一星开喷AI聊天机器人;CMU
LLM
课程;AI创业的方向与时机 | ShowMeAI日报
日报&周刊合集|生产力工具与行业应用大全|点赞关注评论拜托啦!MicrosoftIgnite2023技术大会:微软的年度炸场时刻,而且连炸四天https://ignite.microsoft.comOpenAI开发者大会刚刚落下帷幕,微软接棒继续炸场:2023年11月14日至11月17日,MicrosoftIgnite2023在美国华盛顿州西雅图举办,包括100多项产品和技术的发布与更新,涉及应用
ShowMeAI
·
2023-11-17 14:51
ShowMeAI资讯日报
⛽
首席AI资讯收纳官
microsoft
人工智能
机器人
AIGC
大语言模型
llama
agi
编程范式变革进行时 —— Amazon CodeWhisperer 实践全流程及测评分析报告
作者:中杯可乐多加冰基于
LLM
的辅助编程——编程范式变革进行时大语言模型(LargeLanguageModel)是当下人工智能领域的热点话题之一,它代表着自然语言处理技术的新高度,为开发者提供了改变编程方式的可能性
亚马逊云开发者
·
2023-11-17 12:55
【腾讯云 HAI域探秘】基于ChatGLM和StableDiffusion的小红书热门文章创作实践与经验分享
在HAI中,根据应用智能匹配并推选出最适合的GPU算力资源,以确保您在数据科学、
LLM
、AI作画等高性能应用中获得最佳性价比。
ezeroyoung
·
2023-11-17 11:47
腾讯云
stable
diffusion
云计算
2023数维杯国际赛数学建模C题思路模型
在这些应用程序中,由ChatGPT领导的大型语言模型(大型语言模型,
llm
)在世界范围内得到了普及,并得到了广泛的推广和使用。而我们也充分认识到这些模型给人们带来的丰富、智能和方便的体验。同样重要的是
C灿灿数模
·
2023-11-17 09:06
数学建模
【2023云栖】郭瑞杰:阿里云搜索产品智能化升级
阿里云搜索产品智能化升级发布近日在2023云栖大会上,阿里云搜索负责人郭瑞杰对阿里云搜索产品智能化升级发布,在全场景的搜索细分领域,提供智能化产品能力,包括基于大模型的开放搜索(OpenSearch)
LLM
阿里云大数据AI技术
·
2023-11-17 06:10
阿里云
云计算
PAI BladeLLM推理引擎: 超长上下文、更高性能
BladeLLM对
LLM
推理和服务的全链路进行了深度的性能优化和工程优化,确保不同模型在不同设备上都达到最优性价比。
阿里云大数据AI技术
·
2023-11-17 04:06
人工智能
阿里云
Moonshot AI亮相:发布支持20万字输入的千亿参数
LLM
产品
雷递网乐天10月9日成立仅半年的大模型初创公司——MoonshotAI今日宣布在“长文本”领域实现了突破,推出首个支持输入20万汉字的智能助手产品KimiChat。这是目前全球市场上能够产品化使用的大模型服务中所能支持的最长上下文输入长度。从技术上看,参数量决定了大模型支持多复杂的“计算”,而能够接收多少文本输入(即长文本技术)则决定了大模型有多大的“内存”,两者共同决定模型的应用效果。支持更长的
leijianping_ce
·
2023-11-17 04:03
人工智能
自压缩
llm
为 超长记忆
自压缩
llm
为超长记忆解释数据处理实际例子解释#自压缩
llm
为超长记忆#prompt格式##细颗粒词表=词1,词2,词3,词4,词5,词6,词7,词8,词9,词10,#组颗粒词表id1,组颗粒词表id2
东方佑
·
2023-11-17 04:32
NLP
windows
LLm
微调使用的数据集
https://baijiahao.baidu.com/s?id=1769124161629981325&wfr=spider&for=pcRefGPT:基于RefGPT生成大量真实和定制的对话数据集地址:https://github.com/ziliwangnlp/RefGPT数据集说明:包括RefGPT-Fact和RefGPT-Code两部分,其中RefGPT-Fact给出了5万中文的关于事实
东方佑
·
2023-11-17 00:36
NLP
人工智能
数据库
AI绘画神器DALLE 3的解码器:一步生成的扩散模型之Consistency Models
前言关于为何写此文,说来同样话长啊,历程如下我司
LLM
项目团队于23年11月份在给一些B端客户做文生图的应用时,对比了各种同类工具,发现DALLE3确实强,加之也要在论文100课上讲DALLE三代的三篇论文
v_JULY_v
·
2023-11-17 00:31
论文
代码
实战
Consistency
AI绘画神器
DALLE
3
一致性模型
扩散模型
【深度】详细解读与评测OpenAI DevDay的最新API更新与应用
log_from=d9f79b9fe2182_1699572121760专注
LLM
深度应用,关注我不迷路周二凌晨,全球无数AI科技工作者与极客们翘首以盼的首届OpenAI开发者大会上,仅仅四十分钟的主题演讲掌声不断
javastart
·
2023-11-17 00:58
prompt
langchain
大模型
人工智能
langchain
chatgpt
prompt
大型语言模型综述全新出炉:从T5到GPT-4最全盘点,国内20余位研究者联合撰写...
如今的大语言模型(
LLM
)发展到了什么程度?未来短时间内,AGI的发展路线又将如何?
zenRRan
·
2023-11-16 23:10
语言模型
人工智能
深度学习
自然语言处理
机器学习
【NLP】从T5到GPT-4!大语言模型全新综述来了
如今的大语言模型(
LLM
)发展到了什么程度?未来短时间内,AGI的发展路线又将如何?自20世纪50年代图灵测试提出以来,人们始终在探索机器处理语言智能的能力。
风度78
·
2023-11-16 23:37
自然语言处理
语言模型
人工智能
深度学习
机器学习
谷歌新作SPAE:GPT等大语言模型可以通过上下文学习解决视觉任务
点击下方卡片,关注“CVer”公众号AI/CV重磅干货,第一时间送达点击进入—>【多模态和Transformer】交流群转载自:机器之心|编辑:小舟
LLM
的能力还可以发挥到机器学习的更多子领域。
Amusi(CVer)
·
2023-11-16 23:06
gpt
语言模型
学习
人工智能
自然语言处理
大型语言模型综述全新出炉!从T5到GPT-4最全盘点,国内20余位研究者联合撰写...
如今的大语言模型(
LLM
)发展到了什么程度?未来短时间内,AGI的发展路线又将如何?自20世纪50年代图灵测试提出以来,人们始终在探索机器处理语言智能的能力。语言本质上是一个错综复杂的人类
Amusi(CVer)
·
2023-11-16 23:35
语言模型
人工智能
深度学习
机器学习
自然语言处理
斯坦福最新研究警告:别太迷信大模型涌现能力,那是度量选择的结果
但斯坦福大学的研究者对
LLM
拥有涌现能力的说法提出了质疑,他们认为是人为选择度量方式的结果。「别太迷信大模型的涌现,世界上哪儿有那么多奇迹?」斯坦福大学的研究者发现
Amusi(CVer)
·
2023-11-16 23:35
人工智能
机器学习
深度学习
分布式AI在
LLM
时代的技术深度探索
在这个过程中,分布式AI技术逐渐崭露头角,成为了一种在
LLM
(LowLatencyMobile)时代中得到广泛应用的技术方法。
工业甲酰苯胺
·
2023-11-16 18:31
分布式
人工智能
个人开发
AI编程
LLMs可以遵循简单的规则吗?
评估
LLM
在面对对抗性输入时遵循开发人员提供的规则的能力通常需要人工审查,这会减慢监控和方法开发的速度。论文:CANLLMSFOLLOWSIMPLERULES?
wshzd
·
2023-11-16 17:02
ChatGPT
笔记
chatgpt
语言模型
LLM
大模型之基于SentencePiece扩充LLaMa中文词表实践
LLM
大模型之基于SentencePiece扩充LLaMa中文词表实践目前大模型的词表和分词器都是基于SentencePiece工具实现的,比如LLaMa,BLOOM,ChatGLM,Baichuan等
Glan格蓝
·
2023-11-16 17:56
LLM大模型
llama
chatgpt
语言模型
nlp
LLM
(四)| Chinese-LLaMA-Alpaca:包含中文 LLaMA 模型和经过指令微调的 Alpaca 大型模型
论文题目:《EFFICIENTANDEFFECTIVETEXTENCODINGFORCHINESELLAMAANDALPACA》论文地址:https://arxiv.org/pdf/2304.08177v1.pdfGithub地址:https://github.com/ymcui/Chinese-LLaMA-Alpaca一、项目介绍通过在原有的LLaMA词汇中增加20,000个中文符号来提高中文编
wshzd
·
2023-11-16 17:25
ChatGPT
笔记
llama
李开复Yi大模型套壳争议;第二届AI故事大赛;AI算命GPTs;
LLM
应用全栈开发笔记;GPT-5提上日程 | ShowMeAI日报
日报&周刊合集|生产力工具与行业应用大全|点赞关注评论拜托啦!李开复「零一万物」大模型陷套壳争议,事件时间线完整梳理https://huggingface.co/01-ai/Yi-34B/discussions/11#6553145873a5a6f938658491最近两天,李开复麾下「零一万物」最新推出的Yi大模型陷入了「套壳LLaMA2」的争议,官方两次发布说明,李开复也在朋友圈转发解释。日报
ShowMeAI
·
2023-11-16 15:33
ShowMeAI资讯日报
⛽
首席AI资讯收纳官
人工智能
copilot
大语言模型
AIGC
prompt
chatgpt
llama
数据分析场景下,企业如何做好大模型选型和落地?
基于上述背景和问题,爱分析将在11月16日19点举办“
LLM
+Data,推动企业用户数据分析平民化”主题
ifenxi爱分析
·
2023-11-16 15:32
数据分析
数据挖掘
最新类ChatPDF及AutoGPT开源18大功能平台——闻达手把手超详细环境部署与安装——如何在低显存单显卡上面安装私有ChatGPT GPT-4大语言模型
LLM
调用平台
目录前言闻达框架简介前期准备电脑要求安装anaconda安装相应版本的CUDA配置ChatGLM-6BConda环境安装pytorch类ChatPDF及AutoGPT开源模型——闻达环境部署及安装相关代码及模型下载解压模型到指定地址配置文件修改根据使用的不同模型,安装相关库运行体验运行chatGLM-6B大语言模型运行chatRWKV大语言模型运行llama大语言模型类AutoGPT功能类Chat
小胡说人工智能
·
2023-11-16 15:57
ChatGPT商业应用
学习路线
开源
chatgpt
语言模型
人工智能
自然语言处理
上一页
27
28
29
30
31
32
33
34
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他