E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
N-gram语言模型
LLM的实践古往今来(持续更新ing...)
代码实践部分主要见:Gitee:llm-throughtout-ages:LLM(预训练
语言模型
)的代码应用和最佳实践GitHub:PolarisRisingWar/llm-throught-ages:
诸神缄默不语
·
2023-11-01 07:00
人工智能学习笔记
transformers
NLP
自然语言处理
预训练语言模型
Bert
【论文笔记】Unifying Large Language Models and Knowledge Graphs:A Roadmap
(后续更新完善)2.KG-ENHANCEDLLMS2.1KG-enhancedLLMPre-training以往将KGs集成到大型
语言模型
的工作主要分为三个部分:1)将KGs集成到训练目标中,2)将KGs
·
2023-11-01 07:58
论文
知识图谱
论文阅读
语言模型
知识图谱
自然语言处理
学习笔记-简单概念记录
语言模型
:衡量一句话是句子的概率假设有句子,根据
语言模型
计算s的概率为通常还使用
n-gram
语言模型
计算句子概率1-gram
语言模型
(uni-grammodel):2-gram
语言模型
(bi-grammodel
Pluto_wl
·
2023-11-01 07:54
从
语言模型
到ChatGPT,大模型训练全攻略
文|python前言你是否想过,为什么ChatGPT能够如此火爆呢?我认为这主要是因为ChatGPT提供了好玩、有用的对话式交互功能,能够为用户提供帮助,而不仅仅是依靠“大”模型的魅力。毕竟,GPT-3在2020年就已经推出了,拥有175B的参数规模,但除了最初的热度之外,它并没有引起社会太多的关注。那么,究竟是什么让ChatGPT能够生成相对客观且富有信息量的回答呢?研究者们基于预训练好的大规模
夕小瑶
·
2023-11-01 07:17
语言模型
chatgpt
人工智能
机器学习
自然语言处理
大型
语言模型
,真的能够理解人类吗?
作者|BlaiseAguerayArcas译者|弯月出品|CSDN(ID:CSDNnews)简介大型
语言模型
(Largelanguagemodel,简称LLM)代表了人工智能(AI)的重大进步,特别是朝着类人通用人工智能的目标迈进了一大步
AI科技大本营
·
2023-11-01 06:38
神经网络
编程语言
机器学习
人工智能
办公软件
大型
语言模型
与文本摘要
大型
语言模型
与文本摘要基于大型
语言模型
的抽取式摘要基于大型
语言模型
的零样本跨语言摘要基于大型
语言模型
的问答式摘要通过摘要任务评估大型
语言模型
的事实一致性基于大型
语言模型
的摘要事实一致性评估器未来方向大型
语言模型
的自我偏好基于大型
语言模型
生成提示基于大型
语言模型
的文本编辑基于大型
语言模型
的抽取式摘要
梦里年华似烟花
·
2023-11-01 06:33
人工智能
机器学习
语言模型
语言模型
和人类的推理都依赖内容
这篇论文对最先进的大型
语言模型
和人类进行了评估,发现
语言模型
反映了人类在这些任务中观察到的许多相同模式--与人类一样,当任务的语义内容更准确时,模型的回答也更准确。这些
极道Jdon
·
2023-11-01 06:29
javascript
reactjs
微软多模态ChatGPT来了?16亿参数搞定看图答题、智商测验等任务
关注并星标从此不迷路计算机视觉研究院公众号ID|ComputerVisionGzq学习群|扫码在主页获取加入方式计算机视觉研究院专栏作者:Edison_G从大型
语言模型
(LLM)到多模态大型
语言模型
(MLLM
计算机视觉研究院
·
2023-11-01 04:49
microsoft
chatgpt
人工智能
深度学习
机器学习
DevChat:VSCode中基于大模型的AI智能编程助手
它利用了最先进的大
语言模型
技术,像人类开发者一样高效地理解需求,并提供最佳的代码和项目实现方式。DevChat都可提供智能补全、错误纠正、代码规范
herosunly
·
2023-11-01 04:47
vscode
人工智能
ide
大语言模型
NLP
NLP课程笔记(严睿老师)——
语言模型
(N-grams)
一、probabilisticLanguageModeling目标:计算一个句子或句子中单词出现的概率怎么计算?Thechainrule计算联合概率可以直接用count来估计概率吗?不可以马尔可夫假设(MarkovAssumption):滑动窗口,只与临近的几个词有关Unigrams:每个单词独立,与其他词没有关系Bigrammodel:认为只与相邻的前一个词有关系(实际上不是很够)N-gramm
AngelaOrange
·
2023-10-31 23:18
NLP自然语言处理
自然语言处理
NLP
语言模型
N-grams
【笔记3-6】CS224N课程笔记 - RNN和
语言模型
CS224N(六)RecurrentNeuralNetworksandLanguageModels
语言模型
语言模型
介绍
n-gram
基于窗口的神经
语言模型
RNNRNNLossandPerplexityRNN
jessie_weiqing
·
2023-10-31 23:47
笔记
CS224N
RNN
cs224n
自然语言处理
GRU
LSTM
笔记49:53
语言模型
--课程笔记
本地笔记地址:D:\work_file\DeepLearning_Learning\03_个人笔记\3.循环神经网络\
语言模型
PS:沐神别怪我,实在是截屏避不开啊,我就留个备忘,在我博客里先委屈一下哈,
恨晨光熹微
·
2023-10-31 23:16
入门系列
笔记
语言模型
人工智能
自相矛盾的LLM幻觉:评估、检测、缓解10.30
自相矛盾的LLM幻觉:评估、检测、缓解摘要引言相关工作定义和激励自我矛盾4触发、检测和减轻自相矛盾的行为5实例化到开放文本生成6实验摘要大型
语言模型
(LargeLMs)容易产生包含虚构内容的文本。
露葵025
·
2023-10-31 23:20
论文
人工智能
chatgpt
[论文笔记]RetroMAE
引言RetroMAE,中文题目为通过掩码自编码器预训练面向检索的
语言模型
。尽管现在已经在许多重要的自然语言处理任务上进行了预训练,但对于密集检索来说,仍然需要探索有效的预训练策略。
愤怒的可乐
·
2023-10-31 23:49
论文翻译/笔记
#
文本匹配[论文]
论文阅读
验证链(CoVe)降低LLM中的幻觉10.31
执行验证3.4最终验证的回答4实验(直译)4.1任务4.1.1WIKIDATA4.1.2WIKI-CATEGORYLIST4.1.3MULTISPANQA4.1.4生物传记的长篇生成4.2基准摘要在大型
语言模型
中
露葵025
·
2023-10-31 23:18
论文
人工智能
ReuseAndDiffuse笔记
arxiv.org/pdf/2309.03549.pdfhttps://mp.weixin.qq.com/s/pbSK4KOO2hqQU1-uwQzjBA数据集:BLIP-2、MiniGPT4等多模态大
语言模型
无名份的浪漫2018
·
2023-10-31 22:54
人工智能
AIGC
ai问答网站有哪些
1、MentalAIMentalAI(https://ai.ciyundata.com/)是一种基于星火大模型和文心大模型的知识增强大
语言模型
,专注于自然语言处理(NLP)领域的技术研发。
偷拨网线的william
·
2023-10-31 19:44
人工智能
世界经济论坛:ChatGPT等生成式AI,对全球23%岗位产生巨大影响
世界经济论坛与全球最大上市咨询公司之一埃森哲合作,联合发布了《未来工作:大
语言模型
与就业》白皮书。
RPA中国
·
2023-10-31 16:07
人工智能
chatgpt
ChatGPT、Llama-2等大模型,能推算出你的隐私数据!
ChatGPT等大
语言模型
的推理能力有多强大?通过你发过的帖子或部分隐私数据,就能推算出你的住址、年龄、性别、职业、收入等隐私数据。
RPA中国
·
2023-10-31 16:07
chatgpt
llama
人工智能
将ChatGPT与物理机器人结合,波士顿动力开发了一只怪物!
波士顿动力表示,ChatGPT等大
语言模型
展现出了强大的控制和输出能力,这让他们大受启发,可以
RPA中国
·
2023-10-31 16:37
chatgpt
机器人
科技云报道:不堪忍受英伟达霸权,微软、OpenAI纷纷自研AI芯片
英伟达是当之无愧的“AI算力王者”,A100、H100系列芯片占据金字塔顶尖位置,是ChatGPT这样的大型
语言模型
背后的动力来源。但面对英伟达的独霸天下,科技巨头们都纷纷下场自研AI芯片。
科技云报道
·
2023-10-31 15:19
科技
人工智能
AI芯片
BERT-as-service 时隔三年突然更新,这次连名儿都改了
从BERT到BERT-as-service2018年9月,Google一篇BERT模型相关论文引爆全网:该自然
语言模型
,在机器阅读理解顶级水平测试SQuAD1.1中,连破11项NLP测试记录,两个衡量指标全面超越人类
Jina AI
·
2023-10-31 14:14
神经搜索全家桶_教程
bert
自然语言处理
深度学习
图搜索算法
神经网络
专门解决数学问题的大模型
01项目介绍LLEMMA:一个专门解决数学问题的开源大
语言模型
,能力超过所有已知的开源模型LLEMMA由多个大学和EleutherAI公司共同研发,模型能够理解和生成数学表达式、解决数学问题,并与其他计算工具
AI 研习所
·
2023-10-31 13:21
AIGC
AGI
大模型
AIGC
人工智能
Python调用讯飞星火大模型v3 api接口使用教程
1、获取api接口的ID和key这里我们可以获取星火免费赠送的200万个token使用和测试,获取方法如下:打卡网站讯飞星火认知大模型-AI大
语言模型
-星火大模型-科大讯飞,登录用户点击免费使用1.1创建应用点击购买首次应该会让创建一个应用
IT大头
·
2023-10-31 13:40
python
人工智能
自然语言处理
国内好用的免费ai软件
国内就只推荐几个大厂,基本感受都差不多百度文心一言百度研发的知识增强大
语言模型
,能够与人对话互动,回答问题,协助创作,高效便捷地帮助人们获取信息、知识和灵感。
小名空鵼
·
2023-10-31 13:39
人工智能
云计算
AI编程
【论文解读】RLAIF基于人工智能反馈的强化学习
一、简要介绍人类反馈强化学习(RLHF)可以有效地将大型
语言模型
(LLM)与人类偏好对齐,但收集高质量的人类偏好标签是一个关键瓶颈。
合合技术团队
·
2023-10-31 12:14
人工智能
论文
RLAIF
使用Llama index构建多代理 RAG
检索增强生成(RAG)已成为增强大型
语言模型
(LLM)能力的一种强大技术。通过从知识来源中检索相关信息并将其纳入提示,RAG为LLM提供了有用的上下文,以产生基于事实的输出。
deephub
·
2023-10-31 10:36
人工智能
深度学习
大语言模型
llama
RAG
第17期 | GPTSecurity周报
GPTSecurity是一个涵盖了前沿学术研究和实践经验分享的社区,集成了生成预训练Transformer(GPT)、人工智能生成内容(AIGC)以及大型
语言模型
(LLM)等安全领域应用的知识。
云起无垠
·
2023-10-31 10:32
GPTSecurity
AIGC
gpt
人工智能
第16期 | GPTSecurity周报
GPTSecurity是一个涵盖了前沿学术研究和实践经验分享的社区,集成了生成预训练Transformer(GPT)、人工智能生成内容(AIGC)以及大型
语言模型
(LLM)等安全领域应用的知识。
云起无垠
·
2023-10-31 10:01
GPTSecurity
AIGC
gpt
#Reading Paper# 【LLM】X-LLM: Bootstrapping Advanced Large Language Models by Treating Multi-Modalitie
BootstrappingAdvancedLargeLanguageModelsbyTreatingMulti-ModalitiesasForeignLanguages(X-LLM:通过将多模态视为外语来引导高级大型
语言模型
堇禤
·
2023-10-31 06:26
多模态LLM
语言模型
人工智能
深度学习
LLM
音视频技术开发周刊 | 317
MIT惊人再证大
语言模型
是世界模型!LLM能分清真理和谎言,还能被人类洗脑MIT等学者的「世界模型」第二弹来了!
LiveVideoStack_
·
2023-10-31 04:30
IMYAI-人工智能聊天绘画机器人4.0 - 终身学习者的超级生产力工具!
ChatGPT全名ChatGenerativePre-trainedTransformer(聊天生成性预训练转换模型)说简单点,ChatGPT就是一个AI聊天机器人,背后是一个十分庞大的
语言模型
,由国外的
图欧学习资源库
·
2023-10-30 19:10
人工智能
机器人
利用检索和存储访问知识库上增强大型
语言模型
10.30
利用检索和存储访问知识库上增强大型
语言模型
摘要引言2相关研究3方法3.1任务定义3.2知识检索3.2.1代码实现3.2.2实体链接3.2.3获取实体信息3.2.4查找实体或值3.2.5查找关系3.3知识存储
露葵025
·
2023-10-30 19:26
论文
语言模型
人工智能
自然语言处理
【SIGIR 2022】面向长代码序列的Transformer模型优化方法,提升长代码场景性能
由于self-attention模块的复杂度随序列长度呈次方增长,多数编程预训练
语言模型
(Programming-basedPretrainedLan
阿里云大数据AI技术
·
2023-10-30 18:12
请放下偏见:试试“中国版”的chatgpt网站
下面小编给大家分享3个.1.HeiGPTHeiGPT是基于Openai官方GPT-3.5
语言模型
构架,通过在海量的文本数据上进行训练,具备了强大的自然语言处理能力,
AI 智能大亨
·
2023-10-30 17:46
chatgpt
亲测!“汉化版”chatgpt国内就能用哦!一起来体验下!
下面小编给大家分享3个.1.l4s.cnHeiGPT是基于Openai官方GPT-3.5
语言模型
构架,通过在海量的文本数据上进行训练,具备了强大的自然语言处理能力,
AI 智能大亨
·
2023-10-30 17:46
chatgpt
ChatGPT 账号被封?推荐 5 款国外网站,完美替代!
注:以下国外网站访问可能需要会“魔法"1.Bard网址:https://bard.google.comBard是一个由Google公司推出的免费AI
语言模型
。
程序员阿狸
·
2023-10-30 17:44
chatgpt
人工智能
机器学习
分享3个类似 ChatGPT 国内AI软件,请及时收藏!
下面小编给大家分享3个.1.HeiGPTHeiGPT是基于Openai官方GPT-3.5
语言模型
构架,通过在海量的文本数据上进行训练,具备了强大的自然语言处理能力,
AI 智能大亨
·
2023-10-30 17:41
chatgpt
Data-Centric Financial Large Language Models
以数据为中心的大语言金融模型摘要1引言2背景3方法4实验5结论和未来工作摘要大型
语言模型
(LLM)有望用于自然语言任务,但在直接应用于金融等复杂领域时却举步维艰。
UnknownBody
·
2023-10-30 16:45
LLM
语言模型
人工智能
自然语言处理
Who‘s Harry Potter? Approximate Unlearning in LLMs
LLMs中的近似遗忘摘要1引言2我们方法的描述3评估方法4结果5结论摘要大型
语言模型
(LLM)是在大量的互联网语料库上训练的,这些语料库通常包含受版权保护的内容。
UnknownBody
·
2023-10-30 16:45
LLM
语言模型
遗忘学习
Large Language Models as Generalizable Policies for Embodied Tasks
大型
语言模型
作为具体任务的可推广策略摘要1引言2相关工作3方法4语言重排问题5实验6结论摘要我们展示了大型
语言模型
(LLM)可以被调整为用于具体视觉任务的可推广策略。
UnknownBody
·
2023-10-30 16:14
LLM
语言模型
人工智能
自然语言处理
强化学习
【操作系统】考研真题攻克与重点知识点剖析 - 第 1 篇:操作系统概述
此前我尝试了完全使用Python或是结合大
语言模型
对考研真题进行数据清洗与可视化分析,本人技术有限,最终数据清洗结果不够理想,相关CSDN文章便没有发出。
friklogff
·
2023-10-30 16:13
操作系统
考研
哈工大发布大模型思维链推理综述:200+文献全面解析大
语言模型
思维链推理最新进展...
©PaperWeekly原创·作者|初征,陈靖昌,刘铭,秦兵,刘挺单位|哈尔滨工业大学研究方向|自然语言处理论文标题:ASurveyofChainofThoughtReasoning:Advances,FrontiersandFuture论文链接:https://arxiv.org/abs/2309.15402仓库链接:https://github.com/zchuz/CoT-Reasoning-
PaperWeekly
·
2023-10-30 15:09
语言模型
人工智能
自然语言处理
港大联合百度开源通用图大模型GraphGPT:让大
语言模型
读懂图数据
导读图神经网络(GNN)已成为处理和学习图数据的强大工具,在社交网络分析、推荐系统、智慧城市和生物信息等多个领域带来了革命性的进展。图神经网络的核心优势在于其揭示图数据中复杂关联性的能力。通过消息传递和信息聚合,图神经网络能够高效地在图中传递和整合信息,从而理解复杂的图结构知识并做出准确的预测。然而,许多图神经网络方法存在一个明显的缺陷,即它们极大地依赖于高质量的监督信号,这可能导致在处理稀疏和有
PaperWeekly
·
2023-10-30 15:04
百度
语言模型
人工智能
自然语言处理
DIY一个智能音箱
十一假期里将蓝牙音箱改造成一个智能音箱,参考了网上的实现方法,后台的大
语言模型
使用的是百度的文心一言.账号Picovoice唤醒词服务https://console.picovoice.ai/我绑定了github
csdnharrychinese
·
2023-10-30 15:24
智能音箱
吴恩达《面向开发者的提示词工程》
中英字幕|P01Introduction】2023吴恩达新课《面向开发者的提示词工程》_哔哩哔哩_bilibili对应的笔记ChatGPTPrompt-知乎本课程主要介绍指令微调LLM的最佳实践在大型
语言模型
或
人鱼线
·
2023-10-30 12:37
人工智能
深度学习
2022-arxiv-P-Tuning v2 Prompt Tuning Can Be Comparable to Fine-tuning Universally Across Scales and
arxiv-P-Tuningv2PromptTuningCanBeComparabletoFine-tuningUniversallyAcrossScalesandTasksP-Tuningv2:快速调优可以与跨规模和任务的普遍微调相媲美提示微调,只用一个冻结的
语言模型
来微调连续的提示
发呆的比目鱼
·
2023-10-30 11:00
预训练模型
prompt
2021-arxiv-LoRA Low-Rank Adaptation of Large Language Models
arxiv-LoRALow-RankAdaptationofLargeLanguageModelsPaper:https://arxiv.org/abs/2106.09685Code:https://github.com/microsoft/LoRA大型
语言模型
的
发呆的比目鱼
·
2023-10-30 11:50
预训练模型
语言模型
人工智能
自然语言处理
ESM蛋白质
语言模型
系列
模型总览第一篇《Biologicalstructureandfunctionemergefromscalingunsupervisedlearningto250millionproteinsequences》ESM-1b第二篇《MSATransformer》在ESM-1b的基础上作出改进,将模型的输入从单一蛋白质序列改为MSA矩阵,并在Transformer中加入行、列两种轴向注意力机制,对位点分
B1CK
·
2023-10-30 10:43
语言模型
人工智能
自然语言处理
2023年CCF中国开源大会“大模型时代的智能化软件工程新范式”分论坛成功举行...
同济大学特聘研究员、OpenKG发起人王昊奋老师带来了名为“增强大
语言模型
关键技术与应用范式“的主题报
pengxin_ce
·
2023-10-30 10:07
开源
软件工程
上一页
50
51
52
53
54
55
56
57
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他