E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
N-gram语言模型
主流大
语言模型
从预训练到微调的技术原理
引言本文设计的内容主要包含以下几个方面:比较LLaMA、ChatGLM、Falcon等大
语言模型
的细节:tokenizer、位置编码、LayerNormalization、激活函数等。
智慧医疗探索者
·
2024-01-07 10:32
人工智能初探
语言模型
人工智能
自然语言处理
Github 2024-01-06 开源项目日报Top10
根据开发语言中项目的数量,汇总情况如下:开发语言项目数量Python项目3Java项目1TypeScript项目1HTML项目1Go项目1HCL项目1Rust项目1JupyterNotebook项目1非开发语言项目1大型
语言模型
课程创建周期
孙琦Ray
·
2024-01-07 10:57
github
开源
Github趋势分析
开源项目
Python
Golang
LLM之RAG实战(十三)| 利用MongoDB矢量搜索实现RAG高级检索
想象一下,你是一名侦探,身处庞大的信息世界,试图在堆积如山的数据中找到隐藏的一条重要线索,这就是检索增强生成(RAG)发挥作用的地方,它就像你在人工智能和
语言模型
世界中的可靠助手。
wshzd
·
2024-01-07 09:19
ChatGPT
笔记
mongodb
数据库
【提示学习论文五】Conditional Prompt Learning for Vision-Language Models论文原理及复现工作
ConditionalPromptLearningforVision-LanguageModels视觉
语言模型
的条件提示学习文章介绍这篇文章于2022年发表在CVPR(ConferenceonComputerVisionandPatternRecognition
一个很菜的小猪
·
2024-01-07 08:07
提示学习
学习
prompt
语言模型
拼多多没有返利了?拼多多返利机器人,微信返利机器人了
关于微信返利机器人的使用情况,由于我是一个AI
语言模型
,无法提供实时的信息。但一般来说,微信返利机器人可以在符合微信平台规定的情况下继续使用。
氧券导师果果
·
2024-01-07 07:51
【NLP】2024年改变人工智能的前六大NLP
语言模型
作为这一领域显著进步的证明,近年来出现了几种开创性的
语言模型
,突破了机器能够理解和生成的界限。在本文中,我们将深入研究大规模
语言模型
的最新进展,探讨每个模型引入的增强功能、它们的功能和潜在的应用程序。
架构师研究会
·
2024-01-07 07:32
自然语言处理
AIGC
LLM
人工智能
语言模型
自然语言处理
LLM
大语言模型
聚焦QCon:小红书邀你一起探讨高性能网关、LLM 推理加速
伴随着人工智能的快速发展,大
语言模型
(LargeLanguageModel)正逐渐改变我们与机器的交流方式。
小红书技术REDtech
·
2024-01-07 04:58
网络
LLM
架构
人工智能
小红书 X WSDM 2024「对话式多文档问答挑战赛」火热开赛!
基于大
语言模型
(LLM)的对话问答机器人,已经成为当前人工智能领域学术界和工业界共同关注的的热门研究方向之一。
小红书技术REDtech
·
2024-01-07 04:26
人工智能
WSDM
数据挖掘
信息检索
搜索
BMTrain来高效训练预训练模型-大模型的福音
一.背景知识在2018年,预训练
语言模型
技术的出现成为人工智能领域一场革命性的变革。
Algorithm_Engineer_
·
2024-01-06 23:59
人工智能
机器学习
人工智能
【自然语言处理】Transformer-XL 讲解
Transformer-XL首先需要明确,Transformer-XL(XL是extralong的简写)只是一个堆叠了自注意力层的BPTT
语言模型
,并不是Transformer原始论文中提到的编码器-解码器架构
不牌不改
·
2024-01-06 23:24
【NLP
&
CV】
自然语言处理
transformer
人工智能
机器学习
深度学习
算法
python
老胡的周刊(第121期)
项目clone-voice[2]一个带web界面的声音克隆工具,使用你的音色或任意声音来录制音频:clone-voiceFastGPT[3]FastGPT是一个基于LLM大
语言模型
的知识库问答系统,提供开箱即用的数据处理
老胡的储物柜
·
2024-01-06 22:58
一年百模大战下来,有哪些技术趋势和行业真相逐渐浮出水面?
GPT-4:多模态大
语言模型
,输入输出不再局限于文本,具有推理感知能力,初步具有AGI能力。AGI:通俗称为强人工智能或者通用人工智
Dlimeng
·
2024-01-06 21:12
gpt
人工智能
chatgpt
aigc
openai
ai
ai绘画
ES在工作中的使用
文章目录概要实际应用技术细节小结概要ES官方文档如下链接:https://www.elastic.co/cn/elasticsearch/一句话概括就是:一整套检索算法,能够与大型
语言模型
(LLM)集成
qq_43369327
·
2024-01-06 21:48
elasticsearch
大数据
搜索引擎
10款以上开源工具,用于大型
语言模型
应用开发
订阅:https://rengongzhineng.io/当我们谈论人工智能时,大型
语言模型
(LLM)作为关键工具凸显其重要性,它们赋予机器以类似
新加坡内哥谈技术
·
2024-01-06 18:03
语言模型
人工智能
自然语言处理
通过大量生物、地球、农业、气象、生态、环境科学领域中案例,一起探索如何优雅地使用大模型吧!
以ChatGPT、LLaMA、Gemini、DALL·E、Midjourney、StableDiffusion、星火大模型、文心一言、千问为代表AI大
语言模型
带来了新一波人工智能浪潮,可以面向科研选题、
思考的小猴子
·
2024-01-06 17:13
农业
土壤
生态
人工智能
农业
环境
用大模型读取你的想法,并转化成文本!恐怖的DeWave模型
悉尼科技大学的科研人员,通过大
语言模型
、EEG(大脑活动检测工具)、脑机接口等技术,开发了一个可自动读取人类想法,并转化成文本的AI大模型——DeWave。
RPA中国
·
2024-01-06 15:44
人工智能
ChatGPT 原来是这样工作的(下)
大家好,上期我们讲到研发人员正在研究解决
语言模型
中的一致性问题。ChatGPT使用了人类反馈来指导学习过程,对其进行训练。所使用的具体技术是RLHF。
城北楠哥
·
2024-01-06 15:45
OpenAI 拟每年投入 100-500 万美元,以获取新闻使用许可
最近两位媒体公司高层透露,OpenAI正积极与新闻出版公司进行谈判,提出每年投入100万至500万美元的费用,以获取将新闻文章用于训练大型
语言模型
的授权。
Lorin 洛林
·
2024-01-06 14:55
互联网资讯
业界资讯
ai
【LLM】2023年大型
语言模型
训练
2022年底,大型
语言模型
(LLM)在互联网上掀起了风暴,OpenAI的ChatGPT在推出5天后就达到了100万用户。
架构师研究会
·
2024-01-06 13:02
LLM
AIGC
人工智能
语言模型
人工智能
自然语言处理
LLM
大语言模型
如何解决大型
语言模型
的「幻觉」问题
文章目录引言什么是大型
语言模型
的「幻觉」?
跑起来总会有风
·
2024-01-06 11:23
未来科技与编程视角
语言模型
人工智能
自然语言处理
搭载大模型的华为小艺有多强? 真不愧为打工人的“智慧助手”!
2023“年度十大科技名词”已经新鲜出炉,“大
语言模型
”“生成式人工智能”毫无疑问登顶本年度最热科技名词的榜首。
花先锋队长
·
2024-01-06 08:09
华为
人工智能
mask = (x > 0).unsqueeze(1).repeat(1, x.size(1), 1).unsqueeze(1)
bert源码里出现这一句代码:mask=(x>0).unsqueeze(1).repeat(1,x.size(1),1).unsqueeze(1)某大
语言模型
解释:mask=(x>0).unsqueeze
不当菜鸡的程序媛
·
2024-01-06 05:24
学习记录
人工智能
深度学习
【MLOps】使用Ray缩放AI
在这里,我将介绍Ray,并介绍如何使用Ray扩展大型
语言模型
(LLM)和强化学习(RL),然
架构师研究会
·
2024-01-06 01:59
MLOps
人工智能
IT运维
人工智能
Ray
MLops
【人工智能】为什么说大模型会有「幻觉」问题,又如何去解决呢
LLM是LargeLanguageModel的缩写,指的是一种大规模
语言模型
,可以用来为许多自然语言处理(NaturalLanguageProcessin
全栈小5
·
2024-01-05 22:44
人工智能
人工智能
2023年度盘点:AIGC、AGI、GhatGPT、人工智能大模型必读书单
前言2023年是人工智能大
语言模型
大爆发的一年,一些概念和英文缩写也在这一年里集中出现,很容易混淆,甚至把人搞懵。LLM:LargeLanguageModel,即大
语言模型
,旨在理解和生成人类语言。
秋说
·
2024-01-05 21:29
赠书活动
AIGC
agi
人工智能
PostgreSQL pgvector:如何利用向量数据库提升搜索效率和精度
事实上,在大型
语言模型
环境中,向量数据库也很有用。在机器学习领域,我们经常处理的是向量嵌入。向量嵌入是通过特定的机器学习模型运行对象的特征,将对象的上下文信息投射到潜在空间中来创建的。
学习3人组
·
2024-01-05 19:32
数据库
postgresql
【AI导师】利用Coding Agent完成AIGC编程
一开始,ChatGPT和类似的
语言模型
主要用于自然语言处理和生成对话。在这个背景下,一些国内的开发者和企业开始将这些技术应用于编程领域,形成了一些
吴NDIR
·
2024-01-05 17:16
人工智能
AIGC
chatgpt
ai
How to Bridge the Gap between Modalities: A Comprehensive Survey on Multi-modal Large Language Model
如何弥合模态之间的差距——多模态大
语言模型
综述摘要1引言2概述3多模态转换器4多模态感知器5工具辅助6数据驱动MLLMs7未来方向和挑战8结论摘要本文探讨了多模态大型
语言模型
(MLLMs),
UnknownBody
·
2024-01-05 13:04
LLM
综述文章
语言模型
人工智能
自然语言处理
A Survey of Graph Meets Large Language Model: Progress and Future Directions
当图遇到大型
语言模型
综述:进展与未来方向摘要1引言2前言3LLM作为增强器4LLM作为预测器5GNN-LLM对齐6未来方向7结论摘要图在表示和分析引用网络、社交网络和生物数据等现实世界应用中的复杂关系方面发挥着重要作用
UnknownBody
·
2024-01-05 13:34
LLM
综述文章
图神经网络
语言模型
人工智能
自然语言处理
YUAN 2.0: A Large Language Model with Localized Filtering-based Attention
YUAN2.0:一个基于本地化过滤的注意力的大型
语言模型
摘要1引言2相关工作3方法4结果与分析5结论摘要在这项工作中,我们开发并发布了Yuan2.0,这是一系列参数从21亿到1026亿的大型
语言模型
。
UnknownBody
·
2024-01-05 13:34
LLM
语言模型
人工智能
自然语言处理
LONGQLORA: EFFICIENT AND EFFECTIVE METHOD TO EXTEND CONTEXT LENGTH OF LARGE LANGUAGE MODELS
LONGQLORA:扩展大型
语言模型
上下文长度的高效方法摘要1引言2方法3实验4结论摘要我们提出了LongQLoRA,这是一种用较少的训练资源扩展大型
语言模型
上下文长度的有效方法。
UnknownBody
·
2024-01-05 13:33
LLM
语言模型
人工智能
自然语言处理
用开源大
语言模型
开发的智能对话机器人初版原型验证
用开源大
语言模型
开发的智能对话机器人初版原型验证0.背景1.初版检证效果展示2.验证效果总结0.背景同事要想做一个智能对话机器人,特别的需求有有些几点,通过预置提示词(包括确认事项),让大
语言模型
用会话式的形式逐一确认各个问题
engchina
·
2024-01-05 12:24
LINUX
机器人
人工智能
ChatGPT
大语言模型
LLMs
大
语言模型
占显存的计算和优化
可以优化的地方:per_device_train_batch_size(相当于batchsize,越小显存占的越小)gradient_accumulation_steps(per_device_train_batch_size*gradient_accumulation_steps=计算梯度的数据数)gradient_checkpointing(前项激活值里面有很多是不需要存的,可以在反向传播再次
鱼鱼9901
·
2024-01-05 12:39
nlp
语言模型
人工智能
自然语言处理
一步步解析ChatGPT:从头训练或者微调GPT模型,实现差异化AI助手的定制
一起因其实现在大
语言模型
能够发展起来的起因就是现如今有了许多高质量料库,可以对模型进行训练。然而,这些语料库都是开源,因而对应模型训练的结果也都是一样的。
码说AI
·
2024-01-05 10:22
AIGC-ChatGPT
人工智能
chatgpt
gpt
【LLM】自主GPT-4:从ChatGPT到AutoGPT、AgentGPT、BabyAGI、HuggingGPT等
这些最先进的
语言模型
席卷了世界,激励开发人员、爱好者和组织探索集成和构建这些尖端模型的创新方法。因此,LangChain和LlamaIndex等平台如雨后春笋般涌现,以简化集成并促进新应用程序的开发。
架构师研究会
·
2024-01-05 09:12
自然语言处理
AIGC
LLM
人工智能
LLM
大语言模型
自然语言处理
第一课:Transformer
第一课:Transformer文章目录第一课:Transformer1、学习总结:什么是
语言模型
?
一条大蟒蛇6666
·
2024-01-05 08:20
昇思技术公开课学习笔记
transformer
深度学习
人工智能
Mindspore
自然语言转SQL,一个微调ChatGPT3.5的实例(上)--训练数据准备
最近,大型
语言模型
(LLM)技术(如GPT-4)的进展提高了所提出解决方案的准确性。
数大招疯
·
2024-01-05 08:36
NL2SQL
GPT
使用生成式AI查询大型BI表
鉴于大型
语言模型
(LLM)令人印象深刻的功能,我们很自然地想知道人工智能是否可以帮助我们将信息需求转化为格式良好的SQL查询。诚然,大多数LLM可以基于自然语言输入至少输出一些SQL查询。
数大招疯
·
2024-01-05 08:05
人工智能
数据库
服务器
大模型的实践应用5-百川大模型(Baichuan-13B)的模型搭建与模型代码详细介绍,以及快速使用方法
Baichuan-13B是由百川智能继Baichuan-7B之后开发的包含130亿参数的开源可商用的大规模
语言模型
,在权威的中文和英文benchmark上均取得同尺寸最好的效果。
微学AI
·
2024-01-05 07:42
大模型的实践应用
大模型
百川
GPT
transformer
2024 年 5 个关键网络安全趋势
考虑到基于人工智能(AI)和大型
语言模型
(LLM)的工具的功能和可访问性不断增强,我们必须领先威胁行为者几步,并了解来
网络研究院
·
2024-01-05 05:51
网络研究院
自动化
网络攻击
人工智能
网络安全
观点
OpenAI换血大震动始末:“ChatGPT之父”奥特曼,缘何被“扫地出门”?
ChatGPT:我是ChatGPT,一个由OpenAI训练的大型
语言模型
,我能够理解和生成文本,并回答各种问题。作为公司CEO的阿尔
攻城狮Wayne
·
2024-01-05 05:44
芯片的设计与验证案例
开源项目
嵌入式开发应用案例
chatgpt
【LLM】大型
语言模型
综述论文
当参数尺度超过一定水平时,这些扩展的
语言模型
不仅实现了显著的性能改进,而且还表现出一些小规模
语言模型
(如BERT)所不具备的特殊能力(如上下文学习)。
架构师研究会
·
2024-01-05 04:31
自然语言处理
LLM
AIGC
语言模型
人工智能
自然语言处理
感知与认知的碰撞,大模型时代的智能文档处理范式
目录0写在前面1GPT4-V:拓宽文档认知边界2大
语言模型
的文档感知缺陷3大一统文档图像处理范式3.1像素级OCR任务3.2OCR大一统模型3.3长文档理解与应用4总结抽奖福利0写在前面由中国图象图形学学会青年工作委员会发起的第十九届中国图象图形学学会青年科学家会议于
Mr.Winter`
·
2024-01-05 02:18
前沿资讯
人工智能
深度学习
pytorch
机器学习
计算机视觉
数据挖掘
FinGPT——金融领域开源大模型
文章目录背景论文摘要相关工作大型
语言模型
(LLMs)和ChatGPT金融领域的LLMs为什么需要开源的金融LLMs?
dzysunshine
·
2024-01-05 00:41
垂直领域大模型
金融领域
【生成人工智能】Ray如何解决生成人工智能基础设施的常见生产挑战
生成的图像和
语言模型
有望改变企业的设计、支持、开发等方式。本博客重点关注围绕基础模型支持工作负载生产部署的基础设施挑战,以及Ray,一个用于扩展ML工作负载的领先解决方案,如何应对这些挑战。
架构师研究会
·
2024-01-05 00:41
LLM
人工智能
MLOps
人工智能
生成模型
Ray
模型训练
MLOps
如何训练你自己的大
语言模型
: 分步指南
引言大
语言模型
(LargeLanguageModels,LLM)真正彻底改变了人工智能(AI)领域。
Garry1248
·
2024-01-05 00:58
语言模型
人工智能
自然语言处理
【langchain】入门初探实战笔记(Chain, Retrieve, Memory, Agent)
1.简介1.1大
语言模型
技术栈大
语言模型
技术栈由四个主要部分组成:数据预处理流程(datapreprocessingpipeline)嵌入端点(embeddingsendpoint)+向量存储(vectorstore
小松不菜
·
2024-01-04 23:51
LLM
langchain
数据库
LLM
文本搜索快速实现
SentenceTransformers框架使您可以访问常见的大型
语言模型
,将原始数据转换为嵌入。
cxscode
·
2024-01-04 22:36
python
AI模型必选
网站最底下有直接的入口1、国内使用chatGPT接口二次开发的网站,有很多我随便发一个https://chat18.aichatos.xyz/#/chat/2、“通义千问”:阿里云推出的一个超大规模的
语言模型
小羊客栈
·
2024-01-04 22:19
人工智能
chatgpt3.5和chatgpt4的区别
GPT-3(第三代生成式预训练模型)是OpenAl开发的一个大型
语言模型
,它在很多自然语言处理任务中表现出色。
ai使用测评
·
2024-01-04 21:25
gpt-3
openai
chatgpt
gpt
上一页
24
25
26
27
28
29
30
31
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他