E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
N-gram语言模型
大
语言模型
(LLM)综述(一):大
语言模型
介绍
ASurveyofLargeLanguageModels前言1.INTRODUCTION2.OVERVIEW2.1大
语言模型
的背景2.2GPT系列模型的技术演变前言随着人工智能和机器学习领域的迅速发展,
青云遮夜雨
·
2023-10-27 20:02
NLP
语言模型
人工智能
自然语言处理
大
语言模型
(LLM)综述(四):如何适应预训练后的大
语言模型
ASurveyofLargeLanguageModels前言5.ADAPTATIONOFLLMS5.1指导调优5.1.1格式化实例构建5.1.2指导调优策略5.1.3指导调优的效果5.1.4指导调优的实证分析5.2对齐调优5.2.1Alignment的背景和标准5.2.2收集人类反馈5.2.3根据人类反馈进行强化学习5.2.4无需RLHF的对齐5.2.5对于SFT和RLHF的评论5.3参数高效的模
青云遮夜雨
·
2023-10-27 20:25
NLP
语言模型
人工智能
自然语言处理
Prompt设计与大
语言模型
微调
本文主要介绍了Prompt设计、大
语言模型
SFT和LLM在手机天猫AI导购助理项目应用。
阿里巴巴淘系技术团队官网博客
·
2023-10-27 18:24
prompt
语言模型
人工智能
自然语言处理
第9期 | GPTSecurity周报
GPTSecurity是一个涵盖了前沿学术研究和实践经验分享的社区,集成了生成预训练Transformer(GPT)、人工智能生成内容(AIGC)以及大型
语言模型
(LLM)等安全领域应用的知识。
云起无垠
·
2023-10-27 11:45
GPTSecurity
gpt
AIGC
第5期 | GPTSecurity周报
GPTSecurity是一个涵盖了前沿学术研究和实践经验分享的社区,集成了生成预训练Transformer(GPT)、人工智能生成内容(AIGC)以及大型
语言模型
(LLM)等安全领域应用的知识。
云起无垠
·
2023-10-27 11:15
人工智能
chatgpt
安全
网络安全
第6期|GPTSecurity周报
GPTSecurity是一个涵盖了前沿学术研究和实践经验分享的社区,集成了生成预训练Transformer(GPT)、人工智能生成内容(AIGC)以及大型
语言模型
(LLM)等安全领域应用的知识。
云起无垠
·
2023-10-27 11:15
gpt
人工智能
网络安全
第7期 | GPTSecurity周报
GPTSecurity是一个涵盖了前沿学术研究和实践经验分享的社区,集成了生成预训练Transformer(GPT)、人工智能生成内容(AIGC)以及大型
语言模型
(LLM)等安全领域应用的知识。
云起无垠
·
2023-10-27 11:15
GPTSecurity
gpt
第8期 | GPTSecurity周报
GPTSecurity是一个涵盖了前沿学术研究和实践经验分享的社区,集成了生成预训练Transformer(GPT)、人工智能生成内容(AIGC)以及大型
语言模型
(LLM)等安全领域应用的知识。
云起无垠
·
2023-10-27 11:39
GPTSecurity
aigc
gpt
大模型周报丨Table-GPT、3D-GPT、AgentTuning等新工作重磅来袭
2022年底,OpenAI推出的基于GPT-3.5的大型
语言模型
ChatGPT,由于
AMiner学术搜索和科技情报挖掘
·
2023-10-27 10:32
1024程序员节
人工智能
gpt
大模型
论文阅读
微软
Table-GPT:让大
语言模型
理解表格数据
llm对文本指令非常有用,但是如果我们尝试向模型提供某种文本格式的表格数据和该表格上的问题,LLM更有可能产生不准确的响应。在这篇文章中,我们将介绍微软发表的一篇研究论文,“Table-GPT:Table-tuningGPTforDiverseTableTasks”,研究人员介绍了Table-GPT,一种针对该问题的GPT模型,可以更好地理解输入中的表并产生准确的响应。我们将解释这篇论文,以了解如
deephub
·
2023-10-27 10:29
人工智能
深度学习
大语言模型
表格数据
什么情况下你会使用AI工具(chatgpt、bard)?
前言–人工智能教程ChatGPT是一款由OpenAI开发的大型
语言模型
,可以生成文本、翻译语言、编写不同类型的创意内容,并以信息丰富的方式回答你的问题。
此星光明
·
2023-10-27 08:12
学习之余
人工智能
chatgpt
bard
ai
智能
gpt
只需100GB内存,让Falcon 180B在你的电脑上起飞
然而,在短短不到几个月的时间,研究所又推出了第三个重量级的大
语言模型
——Falcon180B。
技术狂潮AI
·
2023-10-27 04:00
LLM应用实战
AI模型
Falcon
180B
GPTQ量化
量化HuggingFace的Transformers 模型
huggingface.co/docs/transformers/main/en/main_classes/quantizationAutoGPTQ集成Transformers已集成了optimumAPI以对
语言模型
执行
Tim_Van
·
2023-10-27 04:00
python
模型量化
huggingface
NLP
自然语言处理
大语言模型
[论文笔记]NEZHA
预训练
语言模型
由于具有通过对大型语料库进行预训练来捕获文本中深层上下文信息的人能力,因此在各种自然语言理解任务中均取得了巨大成功。然而,对中文预训练模型B
愤怒的可乐
·
2023-10-27 01:01
论文翻译/笔记
论文阅读
NEZHA
NVIDIA基于Code Llama发布在线版本Llama,人人可以免费使用
CodeLlama是Meta发布的基于Llama-2,针对代码生成的NLP大
语言模型
。
人工智能研究所
·
2023-10-26 22:48
人工智能之NLP自然语言处理
llama
Prevalence and prevention of large language model use in crowd work
众包工作中使用大型
语言模型
的流行率和预防摘要1研究1:LLM使用的普遍率2研究2:LLM使用的预防3讨论4材料与方法摘要我们表明,大型
语言模型
(LLM)的使用在众包工作者中很普遍,有针对性的缓解策略可以显著减少但不能消除
UnknownBody
·
2023-10-26 21:46
LLM
语言模型
人工智能
自然语言处理
大
语言模型
(LLM)综述(三):大
语言模型
预训练的进展
模型架构4.2.1典型架构4.2.2详细配置4.2.3预训练任务4.2.4解码策略4.2.5总结和讨论4.3模型训练4.3.1优化设置4.3.2可扩展的训练技术前言随着人工智能和机器学习领域的迅速发展,
语言模型
已经从简单的
青云遮夜雨
·
2023-10-26 21:58
NLP
1024程序员节
gpt
语言模型
人工智能
自然语言处理
浅试通义千问大模型API调用
“通义千问大模型”是阿里云推出的一个超大规模的
语言模型
,具有强大的归纳和理解能力,可以处理各种自然语言处理任务,包括但不限于文本分类、文本生成、情感分析等。
来上云吧
·
2023-10-26 18:10
easyui
前端
javascript
第13期 | GPTSecurity周报
GPTSecurity是一个涵盖了前沿学术研究和实践经验分享的社区,集成了生成预训练Transformer(GPT)、人工智能生成内容(AIGC)以及大型
语言模型
(LLM)等安全领域应用的知识。
云起无垠
·
2023-10-26 18:12
GPTSecurity
AIGC
gpt
第10期 | GPTSecurity周报
GPTSecurity是一个涵盖了前沿学术研究和实践经验分享的社区,集成了生成预训练Transformer(GPT)、人工智能生成内容(AIGC)以及大型
语言模型
(LLM)等安全领域应用的知识。
云起无垠
·
2023-10-26 18:12
GPTSecurity
gpt
人工智能
aigc
第12期 | GPTSecurity周报
GPTSecurity是一个涵盖了前沿学术研究和实践经验分享的社区,集成了生成预训练Transformer(GPT)、人工智能生成内容(AIGC)以及大型
语言模型
(LLM)等安全领域应用的知识。
云起无垠
·
2023-10-26 18:12
GPTSecurity
AIGC
gpt
第11期 | GPTSecurity周报
GPTSecurity是一个涵盖了前沿学术研究和实践经验分享的社区,集成了生成预训练Transformer(GPT)、人工智能生成内容(AIGC)以及大型
语言模型
(LLM)等安全领域应用的知识。
云起无垠
·
2023-10-26 18:09
GPTSecurity
AIGC
gpt
Are Large Language Models Really Robust to Word-Level Perturbations?
大型
语言模型
真的对单词级扰动具有鲁棒性吗?
UnknownBody
·
2023-10-26 18:37
LLM
语言模型
人工智能
自然语言处理
NEFTUNE: NOISY EMBEDDINGS IMPROVE INSTRUCTION FINETUNING
NEFTUNE:噪声嵌入改善指令微调摘要1引言2NEFTUNE:噪声嵌入指令调整3实验设置4结果5分析6结论与局限性摘要我们展示了
语言模型
微调可以通过简单的增强来改进,有时甚至是显著的改进。
UnknownBody
·
2023-10-26 18:37
LLM
语言模型
微调
OPENCHAT: ADVANCING OPEN-SOURCE LANGUAGE MODELS WITH MIXED-QUALITY DATA
OPENCHAT:利用混合质量数据推进开源
语言模型
摘要1引言2前言3OpenChat4实验5分析6相关工作7结论与未来工作摘要如今,像LLaMA这样的开源大型
语言模型
已经出现。
UnknownBody
·
2023-10-26 18:07
LLM
语言模型
人工智能
自然语言处理
大学生学数学,不妨读《数学之美》这本书
统计方法、统计
语言模型
、中文信息处理、隐含马尔科夫模型、布尔代数、图论、网页排名技术、信息论、动态规划、余弦定理、矩阵运算、信息指纹、密码学、搜索技术、数学模型、最大熵模型、拼音输入法、贝叶斯网络、句法分析
令狐翀冲鸭
·
2023-10-26 17:30
大
语言模型
系列
国产大模型开源一哥再登场,最强双语LLM「全家桶」级开源!340亿参数超越Llama2-70B为什么说大模型训练很难?-知乎GitHub-jeinlee1991/chinese-llm-benchmark:中文大模型能力评测榜单:覆盖百度文心一言、chatgpt、阿里通义千问、讯飞星火、belle/chatglm6b等开源大模型,多维度能力评测。不仅提供能力评分排行榜,也提供所有模型的原始输出结果
贝猫说python
·
2023-10-26 16:08
语言模型
人工智能
自然语言处理
抢跑大模型应用大战,从这场黑客松开始
Datawhale赛事主办方:36Kr,合作方:Datawhale首届我爱黑“可颂”大
语言模型
应用创新挑战赛来了!
Datawhale
·
2023-10-26 12:07
GPT-1、GPT-2和GPT-3模型详解及其进化之路
GPT-1模型原理与结构OpenAIgpt模型基于Transformer的
语言模型
,其利用Transformer的decoder结构来进行单向
语言模型
的训练。
-柚子皮-
·
2023-10-26 12:16
LLM
gpt
人工智能
大模型
GPT-2
LLM:大
语言模型
大
语言模型
发展树主要分成底层和3个分支(transformer-encoder类、transformer类、transformer-decoder类)from:[https://blog.csdn.net
-柚子皮-
·
2023-10-26 12:16
LLM
大语言模型
GPT的前世今生:从gpt1到chatgpt的能力提升
transformer模型openai推出了gpt1模型以及google推出了bert模型,到2019-2021年openai陆续推出gpt2和gpt3,再到2022-2023年推出chat-gpt和gpt4,大
语言模型
已经发展成了一个具有
-柚子皮-
·
2023-10-26 11:11
LLM
chatgpt
gpt
人工智能
【AI实战】最强开源 6B 中文大
语言模型
ChatGLM2-6B,从零开始搭建
【AI实战】最强开源6B中英文大
语言模型
ChatGLM2-6B,从零开始搭建ChatGLM2-6B简介ChatGLM2-6B评测结果ChatGLM2-6B搭建参考ChatGLM2-6B简介ChatGLM2
szZack
·
2023-10-26 10:24
大语言模型
chatGLM2
大模型
chatGPT
[BELLE] Chathome:development and evaluation of a domain-specific llm for home renovation
1.introductionChatHome是一个专门为家装改造设计的
语言模型
,包括两个步骤:首先,使用涵盖专业文章、标准文件和网络内容的广泛家装改造数据集对通用模型进行预训练后调整;其次,使用家装改造为基础的提示生成的问题
Kun Li
·
2023-10-26 08:58
大模型
多模态和生成
BELLE
chatgpt
当一名硅谷创业者决定参加百度“文心杯”大赛
但这次,是我们团队第一次尝试用国内的大
语言模型
。我感觉到了很多惊喜,比如在速度上,文心一言比ChatGPT的生成答案速度还快。”
超声波沙龙
·
2023-10-26 07:53
人工智能
论文解读:Black-Box Tuning for Language-Model-as-a-Service
核心要点:诸如GPT-3等大预训练
语言模型
(PLM)以服务的形式发布。允许用户设计特定于任务的提示(TaskspecifiedPrompt),并通过黑盒API查询PLM。
RittoQin
·
2023-10-26 07:41
NLP
深度学习
深度学习
人工智能
大
语言模型
在天猫AI导购助理项目的实践!
本文主要介绍了Prompt设计、大
语言模型
SFT和LLM在手机天猫AI导购助理项目应用。
机器学习社区
·
2023-10-26 07:01
机器学习
人工智能
语言模型
自然语言处理
大模型
计算机视觉
探索大模型技术在运维方向的应用前景
OpenAI在2022年11月发布了对话型大
语言模型
ChatGPT,提供了高度智能化的人机交互体验和极富创造力的内容生成能力,模型一经发布,就得到全世界的广泛关注。
机器学习社区
·
2023-10-26 07:30
机器学习
运维
2023 年最佳开源软件
上榜的25个软件涵盖编程语言、运行时、应用程序框架、数据库、分析引擎、机器学习库、大型
语言模型
(LLM)、用于部署LLM的工具等领域ApacheHudi在构建开放式数据湖或湖仓一体时,许多行业都需要一个更可发展和可变化的平台
ejinxian
·
2023-10-26 07:15
开源软件
一篇关于LLM指令微调的综述
深度学习自然语言处理原创作者:cola指令微调(IT)是提高大型
语言模型
(LLM)能力和可控性的关键技术。
大数据AI人工智能培训专家培训讲师叶梓
·
2023-10-26 04:59
easyui
前端
javascript
一款集成了主流大
语言模型
以及绘图模型的 APP, 采用 Flutter 开发,代码完全开源!!
一款集成了主流大
语言模型
以及绘图模型的APP,采用Flutter开发,代码完全开源,支持以下功能:支持OpenAI的GPT-3.5,GPT-4大
语言模型
支持Anthropic的Claudeinstant
向彪-blockchain
·
2023-10-26 04:54
AI人工智能
1024程序员节
立哥尖端技术-中国电信Telechat大模型模型层探秘
该层为整个系统提供全局模型能力,由通用Telechat(语翼)大
语言模型
支撑。
小可爱J 人工智能学者 全栈工程师
·
2023-10-26 03:09
大数据分析
人工智能
paddle
策略模式
语言模型
中国电信
5G
AI 编程与研发效能论坛 笔记摘录
LLM涉及到的领域NLP/ML提示工程知识工程多任务调度算法优化LLM涉及到的技术算法:深度学习、强化学习、迁移学习大
语言模型
预训练技术,包括构建预训练系统参数高效微调技术数
恭仔さん
·
2023-10-26 01:26
1024程序员节
【网安大模型专题10.19】论文6:Java漏洞自动修复+数据集 VJBench+大
语言模型
、APR技术+代码转换方法+LLM和DL-APR模型的挑战与机会
写在最前面摘要贡献发现介绍背景:漏洞修复需求和Java漏洞修复方向动机方法贡献数据集先前的数据集和Java漏洞Benchmark数据集扩展要求数据处理工作最终数据集VJBenchVJBench与Vul4J的比较大
语言模型
和
是Yu欸
·
2023-10-26 01:21
网络安全
笔记
java
语言模型
开发语言
论文阅读
安全
代码复审
深度学习
AI小百科 - 什么是大
语言模型
(Large Language Model)?
我是一个特殊的机器人助手,名字叫做LLM(LargeLanguageModel)。想象一下,你知道电脑是怎么帮助人们做各种事情的吧?LLM就是一种非常聪明的电脑程序,它被训练得非常聪明,可以回答各种各样的问题。LLM就像是一个超级智能的图书馆管理员,它可以记住很多书里的知识,而且能够理解人们问的问题,并给出最合适的答案。无论是关于科学、历史、地理、文学还是其他领域的问题,LLM都可以帮助你找到答案
LarryHai6
·
2023-10-26 01:18
IT-AI小百科
人工智能
大语言模型
LLM
【网安大模型专题10.19】论文3:ChatGPT+自协作代码生成+角色扮演+消融实验
Self-collaborationCodeGenerationviaChatGPT写在最前面朋友分享的收获与启发课堂讨论代码生成如何协作,是一种方法吗思路相同交互实用性代码生成与自协作框架摘要相关工作PPT学习大
语言模型
在代码生成方向提高生成的代码的准确性和质量
是Yu欸
·
2023-10-26 01:13
网络安全
笔记
chatgpt
安全
论文阅读
nlp
ppt
语言模型
自然语言处理
AI在线工具分享
1、ChatGPTChatGPT是一种由OpenAI训练的大型
语言模型
。
Knight_Key
·
2023-10-25 20:40
AI
Alexon:在云原生环境中快速部署应用服务
SymeCloud公司主要致力于AI-Infra方面的研发,从OpenAI泄露出的技术架构来看,基于大
语言模型
的推理产品的主要工程难度在于部署。产品级LLM并不是简单地跑个单节点,而是有复杂的架构
UsamaBinLaden
·
2023-10-25 16:38
1024程序员节
大模型人工智能师资培训·华南理工大学站重磅招募中!
伴随预训练大
语言模型
技术引发的产业变革,市场对AI人才需求也同样发生着深刻变化,教育迎来了新的机遇与挑战。
飞桨PaddlePaddle
·
2023-10-25 15:57
师资培训
人工智能
斯坦福NLP提出EFT:如何不实际微调而“假装”微调了LLM?
语言模型
(LM)的训练经历两个关键阶段:首先,利用大量多样化的文本数据进行预训练;接着,对模型针对特定目标进行微调。
大数据AI人工智能培训专家培训讲师叶梓
·
2023-10-25 14:51
自然语言处理
人工智能
惊呼!在Mac上可以跑LLaMA啦!附上详细教程
编|好困源|新智元现在,Meta最新的大
语言模型
LLaMA,可以在搭载苹果芯片的Mac上跑了!前不久,Meta前脚发布完开源大
语言模型
LLaMA,后脚就被网友放出了无门槛下载链接,「惨遭」开放。
夕小瑶
·
2023-10-25 11:36
macos
上一页
52
53
54
55
56
57
58
59
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他