E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
N-gram语言模型
Textbooks Are All You Need
课本是你全部所需要的摘要1引言2训练细节和高质量数据的重要性3对CodeExercise进行微调后的模型能力峰值4LLM评分对非常规问题的评价5数据修剪用于公正的性能评估6结论摘要我们介绍了phi-1,这是一种新的大型代码
语言模型
UnknownBody
·
2023-09-18 13:18
LLM
语言模型
人工智能
虹科分享 | 谷歌Vertex AI平台使用Redis搭建大
语言模型
文章来源:虹科云科技点此阅读原文基础模型和高性能数据层这两个基本组件始终是创建高效、可扩展
语言模型
应用的关键,利用Redis搭建大
语言模型
,能够实现高效可扩展的语义搜索、检索增强生成、LLM缓存机制、LLM
虹科电子科技
·
2023-09-18 12:52
云科技
人工智能
redis
语言模型
Learn Prompt-为什么用 ChatGPT API?
引用人工智能先驱吴恩达先生说过的话:“一个系统需要的远不止一个提示(prompt)或者一个对LLM(大性
语言模型
)的调用。”
xiaoshun007~
·
2023-09-18 11:29
ChatGPT
chatgpt
prompt
人工智能
一文分享国内好用大
语言模型
合集
一、背景自从ChatGPT出现以后,国内大模型如雨后春笋般不断出现。在我看来国外最好用的是NewBing和ChatGPT,国内最好用的是天工大模型、讯飞星火、通义千问。但是,由于众所周知的原因,暂时国内不能直接使用ChatGPT、NewBing、Bard、Claude等国外相对先进的模型。本文主要盘点一下,自己使用过的还不错的大模型,还没有用过大模型的同学可以体验体验。二、模型推荐在我看来国内大语
明明如月学长
·
2023-09-18 10:34
AI
助力软件开发
人工智能
语言模型
人工智能
自然语言处理
chatgpt综述和报告
复旦大学邱锡鹏教授《大型
语言模型
的能力分析与应用》_哔哩哔哩_bilibili2022年底,美国OpenA1公司发布了ChatGPT,一个可以与人类对话交互的千亿规模参数的大型
语言模型
。
Kun Li
·
2023-09-18 07:37
大模型
多模态和生成
chatgpt
人工智能
【自然语言处理】【大模型】RWKV:基于RNN的LLM
相关博客【自然语言处理】【大模型】RWKV:基于RNN的LLM【自然语言处理】【大模型】CodeGen:一个用于多轮程序合成的代码大
语言模型
【自然语言处理】【大模型】CodeGeeX:用于代码生成的多语言预训练模型
BQW_
·
2023-09-18 05:01
自然语言处理
自然语言处理
rnn
RWKV
LLM
模型结构
大
语言模型
之十-Byte Pair Encoding
Tokenizer诸如GPT-3/4以及LlaMA/LlaMA2大
语言模型
都采用了token的作为模型的输入输出,其输入是文本,然后将文本转为token(正整数),然后从一串token(对应于文本)预测下一个
shichaog
·
2023-09-18 04:57
神经网络&人工智能
语言模型
数据库
人工智能
Elasticsearch:什么是生成式人工智能?
通过利用大型
语言模型
、神经网络和机器学习的力量,生成式人工智能能够生成模仿人类
Elastic 中国社区官方博客
·
2023-09-18 00:38
Elasticsearch
AI
Elastic
人工智能
chatgpt
elasticsearch
数据库
大数据
全文检索
搜索引擎
一文带你了解腾讯自主研发的通用大
语言模型
——混元大模型
——腾讯混元助手七、总结2023年9月7日上午腾讯全球数字生态大会上,腾讯集团高级执行副总裁、腾讯云与智慧产业事业群CEO汤道生表示,腾讯将迈入“全面拥抱大模型”时代,并同时宣布,腾讯自主研发的通用大
语言模型
IT技术分享社区
·
2023-09-17 23:16
评测
语言模型
人工智能
大数据
腾讯云
前沿技术
AIGC
大模型,教培机构要过窄门
教育+大模型,并不稀奇,自从AI大模型火爆之后,教育就被认为是大
语言模型
最容易落地的领域。稀奇的是,和其他场内玩家相比,教培机构的优势确实称不上明显。
脑极体
·
2023-09-17 17:31
[NLP] LLM---<训练中文LLama2(五)>对SFT后的LLama2进行DPO训练
当前关于LLM的共识大型
语言模型
(LLM)使NLP中微调模型的过程变得更加复杂。最初,当ChatGPT等模型首次出现时,最主要的方法是先训练奖励模型,然后优化LLM策略。
舒克与贝克
·
2023-09-17 15:37
自然语言处理
人工智能
深度学习
如何评测一个大模型?(微软亚洲研究院 )
编者按:大型
语言模型
(Largelanguagemodels,LLMs)因其在学术界和工业界展现出前所未有的性能而备受青睐。随着LLMs在研究和实际应用中被广泛使用,对其进行有效评测变得愈发重要。
思考实践
·
2023-09-17 13:38
LLM
LLM
大语言模型如何评价
亚洲微软研究院
综述
全面
Llama2-Chinese项目:2.2-大
语言模型
词表扩充
因为原生LLaMA对中文的支持很弱,一个中文汉子往往被切分成多个token,因此需要对其进行中文词表扩展。思路通常是在中文语料库上训练一个中文tokenizer模型,然后将中文tokenizer与LLaMA原生tokenizer进行合并,最终得到一个扩展后的tokenizer模型。国内Chinese-LLaMA-Alpaca开源项目详细说明了词表扩展[2]。一.对LLaMAtokenizer扩
NLP工程化
·
2023-09-17 10:39
人工智能
自然语言处理
Llama
大语言模型
类似 ChatGPT 的人工智能即将出现在主要科学搜索引擎中
8月1日,荷兰出版巨头Elsevier为其Scopus数据库的部分用户发布了由ChatGPT支持的AI界面,而英国公司DigitalScience则宣布对其Dimensions数据库进行AI大
语言模型
(
人工智能学家
·
2023-09-17 09:12
搜索引擎
chatgpt
人工智能
【码银送书第六期】《ChatGPT原理与实战:大型
语言模型
的算法、技术和私有化》
写在前面2022年11月30日,ChatGPT模型问世后,立刻在全球范围内掀起了轩然大波。无论AI从业者还是非从业者,都在热议ChatGPT极具冲击力的交互体验和惊人的生成内容。这使得广大群众重新认识到人工智能的潜力和价值。对于AI从业者来说,ChatGPT模型成为一种思路的扩充,大模型不再是刷榜的玩具,所有人都认识到高质量数据的重要性,并坚信“有多少人工,就会有多少智能”。ChatGPT模型效果
码银
·
2023-09-17 09:54
送书活动
chatgpt
人工智能
DL.to 最新研究(论文)推荐——分割、CVPR、扩散模型、感受野注意力模块
目录一、CVPR1.CrowdCLIP:基于视觉-
语言模型
的无监督人群计数CrowdCLIP:UnsupervisedCrowdCountingviaVision-LanguageModel2.BeyondmAP
Curb
·
2023-09-17 08:09
深度学习
人工智能
机器学习
国内AI语言大模型【星火】各类模块及部分功能使用方法介绍
现在,科大讯飞就推出了大
语言模型
——星火!能够学习和理解人类的语言,进行多轮对话,回答问题,高效便捷地帮助人们获取信息、知识和灵感。
珞瑜·
·
2023-09-17 06:28
【付费专栏】AI系列
人工智能
RetNet:万众期待的 Transformers 杀手
Transformer已成为大
语言模型
上的架构,因为它有效地克服了循环神经网络(RNN)的顺序训练问题。
冷冻工厂
·
2023-09-17 01:49
自然语言处理
学习 CodeWhisperer 的一些总结
Codeium:是一个免费的人工智能驱动的代码生成工具Tabnine:一个自动代码生成工具,免费版本非常有限,只提供简短的代码完成Codex:OpenAI开发的一种
语言模型
,可根据自然语言提示(例如问题描述
亚马逊云开发者
·
2023-09-17 01:26
人工智能
Java
python
Learn Prompt-什么是ChatGPT?
它建立在OpenAI的GPT-3.5大型
语言模型
之上,并采用了监督学习和强化学习技术进行了微调。ChatGPT是一种聊天机器人,允许用户与基于计算机的代理进行对话。
xiaoshun007~
·
2023-09-16 23:08
ChatGPT
chatgpt
prompt
人工智能
的大
语言模型
(LLMs)训练/微调/推理方法
即使RTX3090有着24GB的RAM,使用一块RTX3090依然无法fp32精度训练最小号的LLaMA-6B。估算模型所需的RAM首先,需要了解如何根据参数量估计模型大致所需的RAM,这在实践中有很重要的参考意义。需要通过估算设置batch_size,设置模型精度,选择微调方法和参数分布方法等。接下来用LLaMA-6B模型为例估算其大致需要的内存。精度对所需内存的影响:fp32精度,一个参数需要
桂花很香,旭很美
·
2023-09-16 22:24
NLP
AIGC
语言模型
人工智能
深度学习
Llama-1|Alpaca-LoRA 微调模型下载以及安装推理教程
LoRA你可以理解为
语言模型
的一个角色,同绘画领域是一致的,是一个基于大模型所单独调教好的指定角色。比如Llama-1在泄漏之初的对话能力是极差的,仅能够通过排比式语句或其它方式引导其回复指
产品大道
·
2023-09-16 22:54
人工智能
人工智能
语言模型
llama
语言大模型总结
ChatGLM机构:清华大学类型:国产ChatGLM-6B是一个开源的、支持中英双语的对话
语言模型
,开源GIT网址,基于GeneralLanguageModel(GLM)架构,具有62亿参数。
2332232
·
2023-09-16 22:54
人工智能
Llama-2 推理和微调的硬件要求总结:RTX 3080 就可以微调最小模型
大
语言模型
微调是指对已经预训练的大型
语言模型
(例如Llama-2,Falcon等)进行额外的训练,以使其适应特定任务或领域的需求。
deephub
·
2023-09-16 22:21
llama
人工智能
机器学习
深度学习
大语言模型
【Datawhale课程笔记-简单学点大模型】引言
参考课程GITHUB地址:https://github.com/datawhalechina/so-large-lm引言什么是
语言模型
语言模型
(LM)的经典定义是一种对令牌序列(token)的概率分布。
JeffDingAI
·
2023-09-16 22:40
Datawhale学习笔记
笔记
【Datawhale课程笔记-简单学点大模型】大模型的能力
大模型的能力参考GITHUB:https://github.com/datawhalechina/so-large-lm/blob/main/第二章:大模型的能力.md深入探讨GPT-3——这个具有代表性的大型
语言模型
的能力
JeffDingAI
·
2023-09-16 22:40
Datawhale学习笔记
笔记
【Datawhale课程笔记-简单学点大模型】模型架构
模型架构参考地址:https://github.com/datawhalechina/so-large-lm/blob/main/第七章:模型架构.md大模型之模型概括
语言模型
的一开始就可以被看做是一个黑箱
JeffDingAI
·
2023-09-16 22:40
Datawhale学习笔记
笔记
通义千问:一个专门响应人类指令的大模型
【产品介绍】名称通义千问上线/成立时间2023年4月7日具体描述通义千问是一个超大规模的
语言模型
,功能包括多轮对话、文案创作、逻辑推理、多模态理解、多语言支持。
Mr.长安
·
2023-09-16 21:00
AIGC产品合集
人工智能
NewBing、Andi、Phind、Perplexity 还有国产kuaisou五个AI搜索引擎的介绍和对比
NewBingNewBing是微软推出的新一代AI搜索引擎,它基于OpenAI的下一代大
语言模型
,比ChatGPT更强大,专门为搜索定制。
朴拙数科
·
2023-09-16 21:29
人工智能
搜索引擎
文心一言:中文生成式对话产品
【产品介绍】名称文心一言上线/成立时间2023年3月27日具体描述文心一言(英文名:ERNIEBot)是百度全新一代知识增强大
语言模型
,文心大模型家族的新成员,能够与人对话互动,回答问题,协助创作,高效便捷地帮助人们获取信息
Mr.长安
·
2023-09-16 21:25
AIGC产品合集
文心一言
文心一言人工智能使用教程和操作方法
文心一言人工智能使用教程和操作方法文心一言是一款由百度研发的基于人工智能技术的
语言模型
,它能够帮助人们回答各种各样的问题,同时还可以协助完成文本创作、智能办公、智能家居控制等多种任务。
a谷雨c
·
2023-09-16 21:55
人工智能
Recommender Systems in the Era of Large Language Models (LLMs)
大
语言模型
时代的推荐系统摘要1引言2相关工作3基于LLM推荐系统的深度表示学习4预训练和微调LLM用于推荐系统5提示LLM用于推荐系统6未来方向6.1幻觉缓解6.2推荐系统重值得信赖的大
语言模型
6.3推荐系统垂直领域特定
UnknownBody
·
2023-09-16 18:57
LLM
综述文章
推荐系统
语言模型
人工智能
自然语言处理
如何使用 RunwayML 进行创意 AI 创作
*文字生成:使用
语言模型
来生成各种创意文本格式,如诗歌
winfredzhang
·
2023-09-16 16:53
runway
gen2
图生视频
PMC-LLaMA: Towards Building Open-source Language Models for Medicine
PMCLLaMA:构建医学开源
语言模型
摘要引言相关工作问题定义数据集构造实验结果结论摘要最近,大型
语言模型
(LLM)在自然语言理解方面展示了非凡的能力。
UnknownBody
·
2023-09-16 14:34
LLM
llama
语言模型
人工智能
AIGC这么火爆,用来做数字营销又会怎样?
在日益丰富和完善的大
语言模型
帮助下,如今AIGC在文字、图像甚至不少专业应用领域展现出的高超水准,就连许多专业人士也自叹弗如。
趣味科技v
·
2023-09-16 13:36
AIGC
ChatGPT在职业规划中的智能助手
ChatGPT作为一种智能
语言模型
,可以在职业规划中充当智能助手的角色。本文将探讨ChatGPT在职业规划中的应用,以及它如何成为未来工作的智能伙伴。首先,ChatGPT可以提供职业发展的智能建议。
qq_43393952
·
2023-09-16 12:44
chatgpt
open-interpreter +GTX1080+wxbot+codellama
https://github.com/KillianLucas/open-interpreter/OpenInterpreter(开放解释器)可以让大
语言模型
(LLMs)在本地运行代码(比如Python
三块钱0794
·
2023-09-16 12:16
cadellama
chatgpt
aopenai
gtx1080
llama-cpp
interprete
大
语言模型
如何生成内容
大
语言模型
生成内容主要基于
语言模型
算法。
语言模型
是一种机器学习算法,它可以根据给定文本来预测下一个词语或字符的出现的概率。
AI 智能服务
·
2023-09-16 11:32
#
大模型应用
语言模型
人工智能
自然语言处理
Llama.cpp工具main使用手册
Llama.cpp提供的main工具允许你以简单有效的方式使用各种LLaMA
语言模型
。它专门设计用于与llama.cpp项目配合使用。
新缸中之脑
·
2023-09-16 11:02
llama
自然语言处理 | (12)基于统计的
语言模型
构建
统计
语言模型
:自然语言从它产生开始,逐渐演变成一种上下文相关的信息表达和传递方式。
CoreJT
·
2023-09-16 08:22
自然语言处理
自然语言处理NLP
统计语言模型构建
0概率问题
平滑方法
统计语言模型训练
Exploring the Potential of Large Language Models (LLMs) in Learning on Graphs
探索大型
语言模型
在图形学习中的潜力摘要1引言2前言3LLM在图上的流水线4LLM作为增强器5LLM作为预测器6相关工作7结论7.1关键发现7.2局限性7.3未来方向摘要图学习由于其在现实世界中的广泛应用而引起了极大的关注
UnknownBody
·
2023-09-16 08:21
LLM
图神经网络
语言模型
人工智能
大数据
Right to be Forgotten in the Era of Large Language Models: Implications, Challenges, and Solutions
大型
语言模型
时代的被遗忘权:含义、挑战和解决方案摘要1被遗忘权背后的法律原则2大
语言模型
与数据实践3大
语言模型
与RTBF4技术方案5法律观点6进行中的讨论7结论摘要被遗忘权(RTBF)最初是根据
UnknownBody
·
2023-09-16 08:21
LLM
语言模型
人工智能
自然语言处理
Secrets of RLHF in Large Language Models Part I: PPO
大型
语言模型
中RLHF的秘密(上):PPO摘要1引言2相关工作3人类反馈的强化学习4有益和无害的奖励模型5PPO的探索6评估和讨论局限性摘要大型
语言模型
(LLM)为通用人工智能的发展制定了蓝图。
UnknownBody
·
2023-09-16 08:21
LLM
语言模型
人工智能
自然语言处理
Challenges and Applications of Large Language Models
大
语言模型
的挑战与应用摘要1引言2挑战3应用3.1聊天机器人3.2计算生物学3.3计算机程序3.4创造性工作3.5知识工作3.6法律3.7医学3.8推理3.9机器人和嵌入式代理3.10社会科学和心理学3.11
UnknownBody
·
2023-09-16 08:20
LLM
综述文章
语言模型
人工智能
自然语言处理
达摩院SPACE对话大模型:预训练
语言模型
,预训练对话模型,知识注入
01预训练
语言模型
VS预训练对话模型1.大规模
语言模型
过去几年NLP领域的重大进展,主要是大型预训练模型出现与大规模使用。预训练
语言模型
有了很大的发展,出现了很多变种。
柴神
·
2023-09-16 08:59
语言模型
人工智能
自然语言处理
拓世AIGC | 大
语言模型
螺旋上升式进化,人文、技术与未来
本月初,上海世博园举办外滩大会见解论坛中,众多学者和企业家共同探讨了大
语言模型
时代的人机关系、硅基生命和碳基生命未来之争等议题。面对全新的局面,论坛释放出积极信号和值得持续关注的论点。
拓世科技集团
·
2023-09-16 08:59
AIGC
语言模型
人工智能
提示词加神秘咒语让大模型更加聪明
论文:大
语言模型
的自我优化论文来源:https://arxiv.org/abs/2309.03409论文来自谷歌与DeepMind合并后的部门,但作者以原谷歌大脑
AI 研习所
·
2023-09-16 06:21
人工智能
LLM构建AI应用 —— 工程师如何使用黑盒工具
本文将结合开源框架和应用程序,从工程师的角度,与大家讨论如何对大
语言模型
进行封装和应用,并从工程层面解决现有问题,搭建完整可商用的AI应用程序。LLM,LargeLanguage
搜狐技术产品小编2023
·
2023-09-16 05:41
人工智能
Bert系列(1):从
语言模型
和Transformer开始
最近在工作中用bert做了不少NLP的算法任务,但是对bert的前世今生总感觉了解不够深入,通过开源社区的知识分享和原始论文的研读,做了以下学习笔记,结合工作中遇到场景,争取做到温故知新:博客来源:【1】http://jalammar.github.io/illustrated-transformer/【2】https://zhuanlan.zhihu.com/p/48508221【3】https
算法爬坑师
·
2023-09-16 01:33
LLM 04-大模型的数据
LLM03-大模型的数据到目前为止,我们已经讨论了大型
语言模型
的行为(能力和损害)。现在,我们要剥开洋葱的第一层,开始讨论这些模型是如何构建的。
Gocara
·
2023-09-16 00:21
LLM
python
语言模型
nlp
上一页
66
67
68
69
70
71
72
73
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他