LLm 第31页

Beyond One-Model-Fits-All: A Survey of Domain Specialization for Large Language Models

超越一个模型适合所有：大型语言模型领域专业化综述摘要1引言1.1相关综述2领域专业的分类2.1背景2.2领域专业的技术分类3领域专业化的外部增强3.1领域知识增强3.1.1LLM中显性知识的利用3.1.2LLM

UnknownBody·2023-11-20 03:21

LLM大模型权重量化实战

大型语言模型(LLM)以其广泛的计算要求而闻名。通常，模型的大小是通过将参数数量（大小）乘以这些值的精度（数据类型）来计算的。

新缸中之脑·2023-11-20 02:23

大大大模型部署方案抛砖引玉

oldpan博客点击下方卡片，关注“自动驾驶之心”公众号ADAS巨卷干货，即可获取点击进入→自动驾驶之心【模型部署】技术交流群借着热点，简单聊聊大模型的部署方案，作为一个只搞过CV部署的算法工程师，在最近LLM

自动驾驶之心·2023-11-20 02:22

大模型落地的必经之路 | GPTQ加速LLM落地，让Transformer起飞！

作者|小书童编辑|集智书童点击下方卡片，关注“自动驾驶之心”公众号ADAS巨卷干货，即可获取点击进入→自动驾驶之心【大模型】技术交流群本文只做学术分享，如有侵权，联系删文生成预训练Transformer模型，也称为GPT或OPT，通过在复杂语言建模任务中取得突破性性能而脱颖而出，但也因其庞大的规模而需要极高的计算和存储成本。具体而言，由于它们的巨大规模，即使对于大型高精度的GPT模型的推理，也可能

自动驾驶之心·2023-11-20 02:22

LLM大模型4位量化实战【GPTQ】

在上一篇文章中，我们介绍了简单的8位量化技术和出色的LLM.int8()。在本文中，我们将探索流行的GPTQ算法，以了解其工作原理并使用AutoGPTQ库实现它。

新缸中之脑·2023-11-20 02:52

大语言模型的三阶段训练

代码将全部上传到github：https://github.com/hjandlm/LLM_Train1.中文词表扩展原生词表大小是32K，在词表扩展后，词表大小是63608。

hj_caas·2023-11-20 01:22

大模型应用一：RAG

但是随着国内开源大模型的开放，越来越多人觉得通用LLM的价值很低（可能是商业利益的驱使）。大家对技术的追逐有变成了应用变现的需求。

u013250861·2023-11-19 23:10

基于多向量检索器的多模态 RAG 实现

后面两个示例还涵盖了一些配合多模态LLM的多矢量检索器用法，以实现针对图像的RAG。半结构化数据(tables+text)RAG多模态(text+tables+images)RAG私有化

太戈戈·2023-11-19 23:40

使用SemanticKernel 进行智能应用开发（2023-10更新）

以OpenAI的ChatGPT所掀起的GenAI快速创新浪潮，其中连接LLM和应用之间的桥梁的两大开源项目：LangChain[1]和SemanticKernel[2]，在半年前写过一篇文章LangChainvsSemanticKernel

dotNET跨平台·2023-11-19 21:31

18种大模型指令调优方法分享，附模型源码

该方法的核心目标是使LLM具备遵循自然语言指令并完成现实世界任务的能力。

深度之眼·2023-11-19 13:29

LLM大模型 (chatgpt) 在搜索和推荐上的应用

目录1大模型在搜索的应用1.1召回1.1.1倒排索引1.1.2倒排索引存在的问题1.1.3大模型在搜索召回的应用(实体倒排索引）1.2排序1.2.1大模型在搜索排序应用（融入LLM实体排序）2大模型在推荐的应用

BGoodHabit·2023-11-19 08:52

GPT实战系列-P-Tuning本地化训练ChatGLM2等LLM模型，到底做了什么？(一)

GPT实战系列-如何使用P-Tuning本地化训练ChatGLM2等LLM模型？文章目录GPT实战系列-如何使用P-Tuning本地化训练ChatGLM2等LLM模型？

Alex_StarSky·2023-11-19 08:37

GPT实战系列-P-Tuning本地化训练ChatGLM2等LLM模型，到底做了什么？(二)

GPT实战系列-如何使用P-Tuning本地化训练ChatGLM2等LLM模型？

Alex_StarSky·2023-11-19 08:04

大型语言模型中的幻觉研究综述：原理、分类、挑战和未决问题11.15+11.16+11.17

大型语言模型中的幻觉研究综述：原理、分类、挑战和未决问题11.15摘要1引言2定义2.1LLM2.3大语言模型中的幻觉3幻觉的原因3.1数据的幻觉3.1.1有缺陷的数据源3.1.2较差的数据利用率3.1.3

露葵025·2023-11-19 07:43

如何利用 instructor 提高 RAG 的准确性和召回率

本文首发于博客LLM应用开发实践RAG（RetrievalAugmentedGeneration）是一种检索增强生成技术，它利用大型语言模型来处理用户查询，RAG技术的主要组成包括数据提取—embedding

骑猪兜风233·2023-11-19 06:11

改进召回（Retrieval）和引入重排（Reranking）提升RAG架构下的LLM应用效果

改进召回（Retrieval）和引入重排（Reranking）提升RAG架构下的LLM应用效果原创ullyAI工程化2023-08-2421:08收录于合集#LLM应用架构3个#领域技术13个动手点关注干货不迷路如前文

AI生成曾小健·2023-11-19 06:56

2.2 调用星火大模型的API

调用星火大模型的API1申请API调用权限：2调用原生星火API3统一API调用方式项目仓库地址：https://github.com/datawhalechina/llm-universe讯飞星火认知大模型

Alexa2077·2023-11-19 03:53

新加坡国立华人团队开源全能「大一统」多模态大模型，火爆AI社区！

继ChatGPT引爆2023年的AI潮后，各类开源LLM也陆续问世。

人工智能与算法学习·2023-11-19 01:21

UnIVAL：第一个支持图像、视频、音频和文本任务的大一统模型！

进NLP群—>加入NLP交流群大型语言模型(LLM)使得对通才代理的雄心勃勃的追求不再是一个幻想。构建此类通用模型的一个关键障碍是任务和模式的多样性和异质性。

zenRRan·2023-11-19 01:17

破解一切模态，无限接近AGI！NUS开源全能「大一统」多模态大模型

继ChatGPT引爆2023年的AI潮后，各类开源LLM也陆续问世。

PaperWeekly·2023-11-19 01:42

多模态大一统：开启全模态LLM和通用AI时代的大门

多模态大一统：开启全模态LLM和通用AI时代的大门1.目前多模态实现的方法1.1单独训练各领域模型1.2多任务学习1.3集成多模态模型1.4通用多模态模型2.多模态统一难点2.1数据集对齐和融合2.2大规模计算资源需求

东方佑·2023-11-19 00:07

开源 LLM （大语言模型）整理（一）

LargeLanguageModel(LLM)即大规模语言模型，是一种基于深度学习的自然语言处理模型，它能够学习到自然语言的语法和语义，从而可以生成人类可读的文本。

u013250861·2023-11-18 22:09

使用MLC-LLM将RWKV 3B模型跑在Android手机上

0x0.前言这篇文章主要是填一下MLC-LLM部署RWKVWorld系列模型实战（3B模型MacM2解码可达26tokens/s）这里留下来的坑，这篇文章里面介绍了如何使用MLC-LLM在A100/MacM2

just_sort·2023-11-18 22:03

开源大语言模型完整列表

LargeLanguageModel(LLM)即大规模语言模型，是一种基于深度学习的自然语言处理模型，它能够学习到自然语言的语法和语义，从而可以生成人类可读的文本。

ejinxian·2023-11-18 22:02

MLC-LLM 支持RWKV-5推理以及对RWKV-5的一些思考

BBuf/how-to-optim-algorithm-in-cuda/tree/master/large-language-model-note，从2023年3月左右到现在保持了持续动态更新整理，有关于LLM

just_sort·2023-11-18 22:28

LangChain 实现给动物取名字

mkdirlangchain-llm-appcdlangchain-llm-app#用vscode打开当前目录code.在macOS上通过终端打开VisualStudioCode（VSCode），您可以按照以下步骤操作

AI架构师易筋·2023-11-18 22:10

LM（大模型）应用开发利器之LangChain，带你走进AI世界

原文：LLM（大模型）应用开发利器之LangChain，带你走进AI世界-简书LangChain组件图LangChain是什么首先LangChain是一个框架，这个框架是用来让开发者进行LLMs（大语言模型

javastart·2023-11-18 21:01

这次轮到微软炸场了；5000+AI工具调研报告 (500万字)；狂打一星开喷AI聊天机器人；CMU LLM课程；AI创业的方向与时机 | ShowMeAI日报

日报&周刊合集|生产力工具与行业应用大全|点赞关注评论拜托啦！MicrosoftIgnite2023技术大会：微软的年度炸场时刻，而且连炸四天https://ignite.microsoft.comOpenAI开发者大会刚刚落下帷幕，微软接棒继续炸场：2023年11月14日至11月17日，MicrosoftIgnite2023在美国华盛顿州西雅图举办，包括100多项产品和技术的发布与更新，涉及应用

ShowMeAI·2023-11-17 14:51

编程范式变革进行时 —— Amazon CodeWhisperer 实践全流程及测评分析报告

作者：中杯可乐多加冰基于LLM的辅助编程——编程范式变革进行时大语言模型（LargeLanguageModel）是当下人工智能领域的热点话题之一，它代表着自然语言处理技术的新高度，为开发者提供了改变编程方式的可能性

亚马逊云开发者·2023-11-17 12:55

【腾讯云 HAI域探秘】基于ChatGLM和StableDiffusion的小红书热门文章创作实践与经验分享

在HAI中，根据应用智能匹配并推选出最适合的GPU算力资源，以确保您在数据科学、LLM、AI作画等高性能应用中获得最佳性价比。

ezeroyoung·2023-11-17 11:47

2023数维杯国际赛数学建模C题思路模型

在这些应用程序中，由ChatGPT领导的大型语言模型（大型语言模型，llm）在世界范围内得到了普及，并得到了广泛的推广和使用。而我们也充分认识到这些模型给人们带来的丰富、智能和方便的体验。同样重要的是

C灿灿数模·2023-11-17 09:06

【2023云栖】郭瑞杰：阿里云搜索产品智能化升级

阿里云搜索产品智能化升级发布近日在2023云栖大会上，阿里云搜索负责人郭瑞杰对阿里云搜索产品智能化升级发布，在全场景的搜索细分领域，提供智能化产品能力，包括基于大模型的开放搜索（OpenSearch）LLM

阿里云大数据AI技术·2023-11-17 06:10

PAI BladeLLM推理引擎: 超长上下文、更高性能

BladeLLM对LLM推理和服务的全链路进行了深度的性能优化和工程优化，确保不同模型在不同设备上都达到最优性价比。

阿里云大数据AI技术·2023-11-17 04:06

Moonshot AI亮相：发布支持20万字输入的千亿参数LLM产品

雷递网乐天10月9日成立仅半年的大模型初创公司——MoonshotAI今日宣布在“长文本”领域实现了突破，推出首个支持输入20万汉字的智能助手产品KimiChat。这是目前全球市场上能够产品化使用的大模型服务中所能支持的最长上下文输入长度。从技术上看，参数量决定了大模型支持多复杂的“计算”，而能够接收多少文本输入（即长文本技术）则决定了大模型有多大的“内存”，两者共同决定模型的应用效果。支持更长的

leijianping_ce·2023-11-17 04:03

自压缩llm 为超长记忆

自压缩llm为超长记忆解释数据处理实际例子解释#自压缩llm为超长记忆#prompt格式##细颗粒词表=词1,词2,词3,词4,词5,词6,词7,词8,词9,词10,#组颗粒词表id1,组颗粒词表id2

东方佑·2023-11-17 04:32

LLm微调使用的数据集

https://baijiahao.baidu.com/s?id=1769124161629981325&wfr=spider&for=pcRefGPT：基于RefGPT生成大量真实和定制的对话数据集地址：https://github.com/ziliwangnlp/RefGPT数据集说明：包括RefGPT-Fact和RefGPT-Code两部分，其中RefGPT-Fact给出了5万中文的关于事实

东方佑·2023-11-17 00:36

AI绘画神器DALLE 3的解码器：一步生成的扩散模型之Consistency Models

前言关于为何写此文，说来同样话长啊，历程如下我司LLM项目团队于23年11月份在给一些B端客户做文生图的应用时，对比了各种同类工具，发现DALLE3确实强，加之也要在论文100课上讲DALLE三代的三篇论文

v_JULY_v·2023-11-17 00:31

【深度】详细解读与评测OpenAI DevDay的最新API更新与应用

log_from=d9f79b9fe2182_1699572121760专注LLM深度应用，关注我不迷路周二凌晨，全球无数AI科技工作者与极客们翘首以盼的首届OpenAI开发者大会上，仅仅四十分钟的主题演讲掌声不断

javastart·2023-11-17 00:58

大型语言模型综述全新出炉：从T5到GPT-4最全盘点，国内20余位研究者联合撰写...

如今的大语言模型（LLM）发展到了什么程度？未来短时间内，AGI的发展路线又将如何？

zenRRan·2023-11-16 23:10

【NLP】从T5到GPT-4！大语言模型全新综述来了

如今的大语言模型（LLM）发展到了什么程度？未来短时间内，AGI的发展路线又将如何？自20世纪50年代图灵测试提出以来，人们始终在探索机器处理语言智能的能力。

风度78·2023-11-16 23:37

谷歌新作SPAE：GPT等大语言模型可以通过上下文学习解决视觉任务

点击下方卡片，关注“CVer”公众号AI/CV重磅干货，第一时间送达点击进入—>【多模态和Transformer】交流群转载自：机器之心|编辑：小舟LLM的能力还可以发挥到机器学习的更多子领域。

Amusi（CVer）·2023-11-16 23:06

大型语言模型综述全新出炉！从T5到GPT-4最全盘点，国内20余位研究者联合撰写...

如今的大语言模型（LLM）发展到了什么程度？未来短时间内，AGI的发展路线又将如何？自20世纪50年代图灵测试提出以来，人们始终在探索机器处理语言智能的能力。语言本质上是一个错综复杂的人类

Amusi（CVer）·2023-11-16 23:35

斯坦福最新研究警告：别太迷信大模型涌现能力，那是度量选择的结果

但斯坦福大学的研究者对LLM拥有涌现能力的说法提出了质疑，他们认为是人为选择度量方式的结果。「别太迷信大模型的涌现，世界上哪儿有那么多奇迹？」斯坦福大学的研究者发现