E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
变化检测论文解读
VoxPoser:使用大语言模型(GPT-4)来对机器人操作的可组合三维值图【
论文解读
】
这是最近斯坦福的李飞飞团队的一篇论文:VoxPoser:Composable3DValueMapsforRoboticManipulationwithLanguageModels主要是通过大语言模型LLM和视觉语言模型VLM结合,来对机器人做各种日常操作,我们可以先来看下实际效果:大语言模型加视觉模型的通用机器人可以看到在不同的实际场景中都可以很好的进行日常操作,而且具备对机器人不需要进行训练的优
寅恪光潜
·
2023-07-30 16:59
Python
机器人操作系统(ROS)
机器人
VoxPoser通用机器人
affordance_map
constraint_map
XMEM视频掩码
LLM+VLM
Transforms3d
《Relational inductive biases, deep learning, and graph networks》
论文解读
(转载)
mark一下,感谢作者分享!(后续还会补充)研究背景机器学习界有三个主要学派,符号主义(Symbolicism)、连接主义(Connectionism)、行为主义(Actionism)。符号主义的起源,注重研究知识表达和逻辑推理。经过几十年的研究,目前这一学派的主要成果,一个是贝叶斯因果网络,另一个是知识图谱。贝叶斯因果网络的旗手是JudeaPearl教授,2011年的图灵奖获得者。但是据说201
法相
·
2023-07-29 17:45
深度学习
Relational
inductive
biases
deep
learning
graph
networks
图深度学习
GraphDL
论文解读
|Struck算法:基于结构化输出预测的自适应视觉目标跟踪框架
原创|文BFT机器人01背景本文的背景是关于自适应视觉目标跟踪的研究。在传统的跟踪方法中,通常采用基于检测的方式,即尝试学习一个分类器来区分目标对象和其周围的背景。然而,这种方法存在一些问题,例如需要手动选择特征和参数,容易受到噪声和目标变化的影响。为了解决这些问题,本文提出了一种新的自适应跟踪框架,该框架基于结构化输出预测。具体而言,作者采用了核化结构化输出支持向量机(SVM)在线学习的方法来实
BFT白芙堂
·
2023-07-29 02:14
算法
目标跟踪
人工智能
论文解读
|PF-Net:用于 3D 点云补全的点分形网络
原创|文BFT机器人01背景从激光雷达等设备中获取的点云往往有所缺失(反光、遮挡等),这给点云的后续处理带来了一定的困难,也凸显出点云补全作为点云预处理方法的重要性。点云补全(PointCloudCompletion)用于修补有所缺失的点云(PointCloud),从缺失点云出发估计完整点云,从而获得更高质量的点云。点云有助于用较小的数据量描述三维物体,在三维物体的检测识别领域应用广泛。02相关工
BFT白芙堂
·
2023-07-29 02:43
3d
[
论文解读
] DeepRoad: GAN-Based Metamorphic Testing and Input Validation Framework for Autonomous Driving
DeepRoad:GAN-BasedMetamorphicTestingandInputValidationFrameworkforAutonomousDrivingSystems文章目录DeepRoad:GAN-BasedMetamorphicTestingandInputValidationFrameworkforAutonomousDrivingSystems简介摘要介绍背景DNN体系结构方
年糕糕糕
·
2023-07-28 15:58
论文解读
第J2周:ResNet50V2算法实战与解析
本文为365天深度学习训练营中的学习记录博客参考文章:365天深度学习训练营-第J2周:ResNet50V2算法实战与解析原作者:K同学啊|接辅导、项目定制目录一、
论文解读
1.ResNetV2结构与ResNet
王者与CV
·
2023-07-28 13:08
PyTorch教程与实战系列
算法
pytorch
人工智能
计算机视觉
深度学习
Custard拥塞控制算法
论文解读
该论文的全称为“InternetCongestionControlviaDeepReinforcementLearning”,收录于NIPS2018。该论文提出了一个新的拥塞控制算法,并命名为了Custard(CUSTomizedAndRobustDecision)。启示拥塞控制协议设计分类拥塞控制协议的设计主要分为两类:针对于某一特定的网络环境或预先设定好的一类网络环境进行的协议的设计或者自动生
明星有灿
·
2023-07-28 10:31
【Vit】社区开放麦#38 目标检测新范式!DETR 系列算法解读 - 知识点目录
DETR系列算法解读1.IntrotoDETRDETR
论文解读
DETR系列算法在MMDet-v2.0实现时的缺陷2.DETR(ECCV2022)3.ConditionalDETR(ICCV2021)4.
songyuc
·
2023-07-27 03:54
目标检测
计算机视觉
DETR
《论文阅读》具有特殊Token和轮级注意力的层级对话理解 ICLR 2023
你是否也像我之前搜索
论文解读
,得到只是中文翻译的解读后感到失望?小白如何从零读懂论文?和我一起来探索吧!
365JHWZGo
·
2023-07-26 14:29
组会论文
论文阅读
论文解读
13——TransBoost: A Boosting Tree KernelTransferLearningAlgorithm for ImprovingFinancial Inclusion
目录1、文章贡献2、迁移学习3、迁移学习算法目标4、迁移学习算法框架5、理论分析6、算法局限7、实验1、文章贡献为了解决金融产品中新用户数据及标签获取困难等问题,发展普惠金融,文中提出了新的迁移学习算法TransBoost,对传统迁移学习方法核均值匹配KMM模型进行了推广,将提升树作为内核来结合树模型和内核方法的优点,能够处理高维特征和稀疏数据,提高了金融包容性。2、迁移学习迁移学习简单地来说就是
对流层的酱猪肘
·
2023-07-26 01:43
论文解读
boosting
迁移学习
决策树
论文解读
14——XGBoost:A Scalable Tree Boosting System
目录1、文章贡献2、算法推导3、寻找分裂点算法3.1精确贪心算法3.2近似算法4、稀疏感知算法5、特征维度的并行化6、XGBoostVSGBDT7、XGBoost局限半年前看了这篇XGBoost的原文,网上解读很多,于是迟迟没有将其中的精髓记录下来,准备重点记一记,以免日后遗忘。1、文章贡献在原有GBDT的基础上提出了XGBoost,一种高效的极端梯度提升树模型,其属于boosting算法的一种,
对流层的酱猪肘
·
2023-07-26 01:43
论文解读
boosting
算法
机器学习
论文解读
15——LightGBM: A Highly Efficient Gradient Boosting Decision Tree
不熟悉XGBoost的小伙伴可以看看这篇笔记
论文解读
14——XGBoost:AScalab
对流层的酱猪肘
·
2023-07-26 01:43
论文解读
boosting
决策树
算法
首发YOLOv5即插即用模块SCCOnv:CVPR2023(Spatial and Channel Reconstruction Convolution for Feature Redundancy)
ScSCConv
论文解读
具体工作具体结构核心代码**yolo注册**yaml文件运行结果测试
论文解读
本文主要是提出了一个新颖的卷积模块SCConv,名字含义是结合空间和通道的重组卷积,此模块目标在于减少视觉任务中由于冗余特征提取而产生的计算成本
一休哥※
·
2023-07-25 03:02
YOLOv8
YOLO5系列改进专栏
YOLOv8改进系列
YOLO
经典CNN(二):ResNet50V2算法实战与解析
本文为365天深度学习训练营中的学习记录博客原作者:K同学啊|接辅导、项目定制1
论文解读
在《IdentityMappingsinDeepResidualNetworks》中,作者何凯明先生提出了一种新的残差单元
放鹿的散妃
·
2023-07-24 14:47
CNN
cnn
人工智能
神经网络
论文解读
Nerf2Mesh:基于Nerf的网格资产生成
论文标题DelicateTexturedMeshRecoveryfromNeRFviaAdaptiveSurfaceRefinement简单翻译:通过Nerf恢复网格结构论文下载地址,点这里1:网格知识点介绍(可跳过):3D模型有三种表达方式,体素(Voxel),网格(Mesh),点云(PointCloud)、SDF等,但在实际渲染应用中,主流的表达方式用的是网格。类似下图,任务3D模型都可以用一
出门吃三碗饭
·
2023-07-24 13:58
虚拟现实
Nerf
3D建模
三维重建
VoxelNet
论文解读
和代码解析
目录一、论文动机二、论文方法三、网络结构1.FeatureLearningNetwork2.中间卷积层(Convolutionmiddlelayers)3.RPN层四、损失函数及其余创新点4.1损失函数4.2点云的数据增强4.3高效实现堆叠VFE五、代码阅读六、Reference论文地址:https://arxiv.org/abs/1711.06396代码地址:GitHub-RPFey/voxel
CVplayer111
·
2023-07-23 08:26
三维目标检测论文阅读
计算机视觉
人工智能
1024程序员节
论文解读
|结构光成像技术
原创|文BFT机器人01全帧空间变化的颜色模式顺序投影技术的主要缺点包括无法获取动态运动中的3D物体或活体物体(如人体部位)。我们现在提出了几种单镜头三维表面成像技术,这些技术利用了投影模式中的颜色信息或独特的编码方案,只需要在彩色模式照明下获得一幅物体图像,就可以获得场景中每个可见点的(x,y,z)坐标的全帧3D图像。图1彩虹3D相机1.1彩虹3D相机传统的立体图像必须从一对立体图像中提取相应的
BFT白芙堂
·
2023-07-23 08:55
数码相机
论文解读
|2017 CVPRPointNet: 用于三维分类和分割的点集深度学习
原创|文BFT机器人01背景传统的卷积结构需要规则的输入数据格式,如图像网格或三维体素,以便进行权重共享和其他核优化。由于点云或网格不是规则的格式,因此研究人员通常会将这些数据转换为规则的三维体素网格或图像集合,然后再输入到深度网络结构中。然而,这种数据表示转换会导致不必要的数据冗杂和引入量化误差,可能会掩盖数据的自然不变性。PointNet提供了一种适用于处理三维无序点集的全新深度网络架构,避免
BFT白芙堂
·
2023-07-23 08:55
分类
深度学习
数据挖掘
论文解读
|VoxelNet:基于点云的3D物体检测的端到端学习
原创|文BFT机器人01摘要论文提出了表述了一个新的基于点云的3D检测方法,名为VoxelNet,该方法是一个端到端可训练的深度学习架构,利用了稀疏点云的结构特性,直接在稀疏的3D点上进行操作,并通过高效的并行处理体素网格来获得性能的提升。此方法在KITTI基准数据集上进行了实验,并展示了VoxelNet在基于激光雷达的汽车、行人和骑自行车者检测任务中取得了最先进的结果。实验表明,VoxelNet
BFT白芙堂
·
2023-07-23 08:25
3d
学习
【计算机视觉】A Simple Framework for Open-Vocabulary Segmentation and Detection
论文解读
上排:OpenSeeD对开放词汇的实例分割和检测、全景和语义分割、野外实例分割和给定参考框位置和概念的条件分割的可视化。下一行:我们的OpenSeeD模型在零射击和特定任务传输设置的八个基准测试中优于以前最先进的方法(每个灰条下面列出)。文章目录一、导读二、介绍三、RelatedWork3.1GenericSegmentationandDetection3.2Open-VocabularySegm
旅途中的宽~
·
2023-07-23 06:39
计算机视觉
计算机视觉
人工智能
深度学习
目标检测
图像分割
开放域
论文解读
-SAM: Segment Anything Model
文章目录论文链接:demoAbstract:IntroductionSegmentAnythingTaskSegmentAnythingModel1.论文主要解决的问题:2.成功的关键:3.实验设计4.主要贡献5.下一步的研究点:论文链接:https://ai.facebook.com/research/publications/segment-anything/demohttps://segme
重糖爱好者
·
2023-07-23 03:17
论文阅读
计算机视觉
深度学习
人工智能
ICASSP2023
论文解读
|如何检测会议记录中的待办事项?
得益于语音识别技术的发展,人工智能可以帮助人们记录会议,自动检测与会后行动项关联的会议内容,并进行总结。行动项识别对于管理会后待办任务至关重要。针对对于行动项识别任务,相关数据集稀缺且规模小。因此,达摩院构建并开源了AMC-A语料库,这或是首个带有行动项标注的中文会议语料库。基于行动项数据集,达摩院提出了Context-Drop方法,通过对比学习利用局部和全局上下文,在行动项识别任务中取得了更好的
语音之家
·
2023-07-22 06:17
智能语音
人工智能
语音识别
语言模型
深度学习
【
论文解读
】2017 STGCN: Spatio-Temporal Graph Convolutional Networks
一、简介使用历史速度数据预测未来时间的速度。同时用于序列学习的RNN(GRU、LSTM等)网络需要迭代训练,它引入了逐步累积的误差,并且RNN模型较难训练。为了解决以上问题,我们提出了新颖的深度学习框架STGCN,用于交通预测。二、STGCN模型架构2.1整体架构图示2.2ST-Convblocks符号含义M历史时间序列长度n节点数CiC_iCi输入的channel数CoC_oCo输出的chann
Scc_hy
·
2023-07-21 13:31
笔记
深度学习
人工智能
机器学习
paper
F2FS文件系统
论文解读
F2FS文件系统
论文解读
F2FSF2FS轮廓DesignandImplementationofF2FSBlock、Segment、SectionandZone整体布局文件结构(fileinodestructure
DeadPool loves Star
·
2023-07-20 06:58
操作系统
论文悦读
f2fs
操作系统
论文解读
: 2023-ChatLaw: Open-Source Legal Large Language Model with Integrated External Knowledge Bases
最近大的法律大模型Chatlaw成功出道,在法律领域超过GPT-4。现在看一下他们的技术报告:ChatLaw:Open-SourceLegalLargeLanguageModelwithIntegratedExternalKnowledgeBases,给大家以LLM+外部知识库构建领域模型提供参考思路。论文地址:https://arxiv.org/pdf/2306.16092.pdf代码:http
hj_caas
·
2023-07-19 15:45
自然语言处理
语言模型
人工智能
自然语言处理
论文解读
: 2023-Lost in the Middle: How Language Models Use Long Contexts
大模型使用的关键在于Prompt,然而大模型存在幻觉现象,如何减少这种现象的发生成为迫切解决的问题。外部知识库+LLM的方法可以缓解大模型幻觉,但是如何撰写Prompt才能发挥LLM的性能。下面介绍这篇论文说明上下文信息出现在Prompt什么位置使模型表现最佳,以及上下文文本长度对LLM性能的影响。Title:LostintheMiddleHowLanguageModelsUseLongConte
hj_caas
·
2023-07-19 15:44
自然语言处理
语言模型
人工智能
自然语言处理
MotionBert
论文解读
及详细复现教程
MotionBert:统一视角学习人体运动表示通过学习人体运动表征,论文原作者提出了处理以人为中心的视频任务的统一方法。使用双流时空transformer(DSTformer)网络实现运动编码器,能够全面、自适应地捕获骨骼关节之间的远程时空关系。所学运动表征能轻松转移到多个下游任务,并在三个任务上实现最先进性能,证明其多功能性。相关链接:Paper:LearningHumanMotionRepre
HermanYe996
·
2023-07-19 10:45
计算机视觉
ai
姿态估计
【
论文解读
】InstructGPT : Training language models to follow instructions with human feedback
最近抽空想梳理下GPT的相关工作,现在大模型越来越重要了,可以解决很多很复杂的问题。这里简单梳理一下InstructGPT的相关工作,论文链接:https://arxiv.org/pdf/2203.02155.pdf。一、前言InstructGPT做了什么,从论文的摘要来描述是:使语言模型变得更大并不意味着它们本身就能更好地遵循用户的意图。例如,大型语言模型可能会生成不真实、有毒或对用户毫无帮助的
Guapifang
·
2023-07-18 17:51
深度学习
NLP自然语言处理
语言模型
人工智能
深度学习
PillarNext
论文解读
这篇文章是轻舟智航23年的一篇论文,是对pillarNet进行改进。改进方面:1.训练更长的时间+在检测头增加IOU预测score,这个iou分数预测不太清楚,不知道是不是iouloss2.扩大感受野,包括Neck部分使用FPN或者BiFPN.使用ASPP空洞卷积来增大感受野。3.在head部分对特征进行上采样,分组预测,有两个头。4.同时他们在2d骨干网络降采样部分加入了许多残差块,以此来提高性
CVplayer111
·
2023-07-18 00:36
三维目标检测论文阅读
人工智能
计算机视觉
深度学习
【
论文解读
】Region-of-interest determination and bit-rate conversion for H.264 video transcoding
介绍题目:Region-of-interestdeterminationandbit-rateconversionforH.264videotranscoding级别:SCI年份:2013年机构:台湾东华大学资源下载:https://download.csdn.net/download/yanceyxin/88045881结论:在转码时间上,对比JM15.1,可以实现至少47.52%的时间节省。在
DogDaoDao
·
2023-07-17 10:15
论文解读
H264标准
音视频架构
h.264
视频转码
视频编解码
实时音视频
皮肤检测
深度学习笔记之残差网络(ResNet)
深层神经网络训练难残差网络的执行过程残差网络结构为什么能够解决核心问题残差网络的其他优秀性质引言本节将介绍残差网络(ResidualNetwork,ResNet\text{ResidualNetwork,ResNet}ResidualNetwork,ResNet),本篇不是
论文解读
静静的喝酒
·
2023-07-16 15:19
深度学习
深度学习
神经网络
残差网络
梯度优化问题
Boosting
FCN的论文简略解读+代码复现
FCN:论文涉及重点:(想要详细了解FCN文章内容,推荐:摘要逐句解读:玩转图像分割吃透FCN顶会大佬的学习经验《摘要逐句精读》_哔哩哔哩_bilibili;
论文解读
:FCN文章_哔哩哔哩_bilibili
咕哥
·
2023-07-16 10:36
深度学习
人工智能
[Image Caption系列(1)] Show attend and tell
论文解读
最近在研究关于ImageCaption相关的东西,我打算把我看到的关于ImageCaption的论文用一个系列介绍一下,本篇是第一篇。说到近几年深度学习在ImageCaption的应用,最经典的也是开山之作的就是Bengio团队在15年发表的Show,AttendandTell:NeuralImageCaptionGenerationwithVisualAttention一文了,本篇介绍的就是这篇
lhanchao
·
2023-07-16 08:02
Image
Caption
Image
Caption
深度学习
强化学习从基础到进阶–案例与实践[11]:AlphaStar
论文解读
、监督学习、强化学习、模仿学习、多智能体学习、消融实验
【强化学习原理+项目专栏】必看系列:单智能体、多智能体算法原理+项目实战、相关技巧(调参、画图等、趣味项目实现、学术应用项目实现专栏详细介绍:【强化学习原理+项目专栏】必看系列:单智能体、多智能体算法原理+项目实战、相关技巧(调参、画图等、趣味项目实现、学术应用项目实现对于深度强化学习这块规划为:基础单智能算法教学(gym环境为主)主流多智能算法教学(gym环境为主)主流算法:DDPG、DQN、T
汀、人工智能
·
2023-07-16 08:21
#
人工智能
深度学习
强化学习
多智能强化学习
模仿学习
可数的无穷和不可数的无穷
《图灵的秘密:他的生平、思想及
论文解读
》作者:[美]佩措尔德译者:杨卫东,朱皓出版社:人民邮电出版社出版时间:2013-11 这两个无穷——无穷无尽的自然数和无穷稠密的连续统——在某些方面有相似之处吗
大龙10
·
2023-07-16 06:47
论文解读
:Inpaint Anything: Segment Anything Meets Image Inpainting
论文:https://arxiv.org/pdf/2304.06790.pdf代码:https://github.com/geekyutao/Inpaint-Anything图1:InpaintAnything示意图。用户可以通过点击图像中的任何对象来选择它。借助强大的视觉模型,例如SAM[7]、LaMa[13]和稳定扩散(SD)[11],InpaintAnything能够平滑地移除对象(即,移除
LeapMay
·
2023-07-16 05:05
GPT应用实战
人工智能
论文解读
:LaMa:Resolution-robust Large Mask Inpainting with Fourier Convolutions
论文:https://arxiv.org/pdf/2109.07161.pdf代码:GitHub-advimman/lama:LaMaImageInpainting,Resolution-robustLargeMaskInpaintingwithFourierConvolutions,WACV2022目录1摘要:2主要贡献:3方法3.1网络前层的全局上下文3.2快速傅里叶卷积3.3快速傅里叶网络p
LeapMay
·
2023-07-16 05:59
深度学习
人工智能
计算机视觉
angular知识点--组件生命周期钩子(ngDoCheck & 变化监测)
ngDoCheck一、变化监测二、ngDoCheck实例三、Angular的两种
变化检测
策略3.1Default策略3.2OnPush策略四、两种策略实例4.1在default策略下4.2在OnPush
某些开发
·
2023-07-15 18:41
angular
18 SAR图像和光学图像的配准算法(matlab程序)
SAR因具有全天候成像能力和地物穿透能力,因此具有非常广泛的应用,如
变化检测
[1]、图像融合[2]、目标检测与识别[3]。图像配准方法可分为两类:基于区域的配准方法和基于特征的配准方法[4]。
素馨堂
·
2023-07-15 02:30
算法
人工智能
计算机视觉
【计算机视觉】MobileSAM
论文解读
:比SAM小60倍,比FastSAM快4倍,速度和效果双赢
文章目录一、导读二、摘要三、Introduction三、Relatedwork3.1SAM:泛化和通用功能性3.2ViT:轻巧高效四、Mobile-FriendlySAM4.1BackgroundandProjectGoal4.1.1BackgroundonSAM4.1.2Projectgoal4.2ProposedMethod4.2.1耦合蒸馏4.2.2从半耦合到解耦的蒸馏4.2.3论Mask解
旅途中的宽~
·
2023-07-14 16:33
计算机视觉
计算机视觉
人工智能
SAM
FastSAM
MobileSAM
Generative AI 新世界 | 文生图领域动手实践:预训练模型的部署和推理
本文作者黄浩文亚马逊云科技资深开发者布道师在上期文章,我们探讨了文生图(Text-to-Image)方向的主要
论文解读
,包括:VAE、DDPM、DDIM、GLIDE、Imagen、UnCLIP、CDM、
亚马逊云开发者
·
2023-07-14 15:49
人工智能
深度学习
机器学习
BERT
论文解读
1.Introduction1.1相关链接论文下载链接:https://arxiv.org/pdf/1810.04805.pdfGoogle中文BERT预训练大模型下载链接:GitHub-ymcui/Chinese-BERT-wwm:Pre-TrainingwithWholeWordMaskingforChineseBERT(中文BERT-wwm系列模型)在该页面上,可以找到BERT-wwm-ex
EthanZhang1412
·
2023-07-14 15:36
bert
深度学习
自然语言处理
Drag Your GAN
论文解读
,基于点的交互式操作拖动到生成图像[DragGAN]
只需要鼠标的点击就可以自动修图的产品,火爆问世,可以说是超越PS,神一般的存在了,而且没有门槛,对于普通大众来说直接可以上手使用,这个是PS完全不具备的。更关键的是,这款产品跟PS明显区别在于,PS一般来说是做美化处理为主,而DragYourGAN可以让眼睛真的睁开和闭上,嘴角上扬是可以露出牙齿的,姿态的改变跟真人在摆POSE一般,非常有趣。大家可以点击下面两个视频感受下,如何神奇的修图:Drag
寅恪光潜
·
2023-07-14 03:43
Python
深度学习框架(PyTorch)
运动监督损失
手柄点跟踪
优于PIPs和RAFT
DragGAN的缺陷
粒子视频流
2017年美国大学生数学建模竞赛F题优秀
论文解读
Version:1.0StartHTML:000000380EndHTML:000538406StartFragment:000420527EndFragment:000538362StartSelection:000422140EndSelection:000538356SourceURL:https://mp.weixin.qq.com/s?__biz=MzUyODE4MTAwNw==&mid
校苑数模
·
2023-07-14 02:54
Vision Transformer(VIT)
论文解读
及实现
1
论文解读
paper:VIT1.1VIT模型架构如下图所示:图片原始输入维度H*W*C在H和W按像素P切分,则H、W可分割为NPP,N=HW/(PP),N为输入transform序列的长度。
晚点吧
·
2023-07-14 00:01
CV
transformer
深度学习
CV
VIT
BERT
论文解读
及实现(一)
BERT:Pre-trainingofDeepBidirectionalTransformersforLanguageUnderstanding1
论文解读
1.1模型概览Therearetwostepsinourframework
晚点吧
·
2023-07-13 21:20
NLP
bert
人工智能
深度学习
语言模型
BERT
论文解读
及实现(二)
基于github的bert源码解读bertgithub链接:https://github.com/google-research/bert/tree/masterwindows流程运行改编版源码及数据百度网盘链接:链接:https://pan.baidu.com/s/1APk9EIh_wuU41fMHSMz3Pg?pwd=s2k7提取码:s2k71模型预训练1.1训练数据加工pythoncreat
晚点吧
·
2023-07-13 21:50
NLP
bert
人工智能
深度学习
GPT(Generative Pre-Training)
论文解读
及实现(一)
1GPTFramework1.1Unsupervisedpre-trainingGivenanunsupervisedcorpusoftokensU={u1,...,un},weuseastandardlanguagemodelingobjectivetomaximizethefollowinglikelihood:在给定语料上下文环境下,目标时最大化下面的语言模型,即在给定前i-1个词和参数θ前
晚点吧
·
2023-07-13 21:30
NLP
gpt
transformer
NLP
InstructGPT
论文解读
介绍上图可以看出InstructGPT(PPO-ptx)及变体(varianttrainedwithoutpretrainingmix)(PPO)显著优于GPT,1.3B的InstructGPT优于175B的GPT,SFT作为RLHF第一阶段的模型效果比GPT好。当然结果是由人来评价的。RLHF包含三个步骤:SFT:对话数据微调基座语言模型,RM:评分数据微调RM模型PPO:SFT模型生成答案,R
sunghosts
·
2023-06-24 09:58
机器学习
自然语言处理
深度学习
【
论文解读
系列】Blip-2:引导语言图像预训练具有冻结图像编码器和大型语言模型
Blip-2BLIP-2:BootstrappingLanguage-ImagePre-trainingwithFrozenImageEncodersandLargeLanguageModelsBLIP-2:引导语言图像预训练具有冻结图像编码器和大型语言模型(0)总结&实测总结:blip-2最大的贡献在于,提出了一种新的视觉语言预训练范式,使得视觉语言预训练模型可以无须端到端地训练即可得到SOTA
JackCrum
·
2023-06-24 05:56
语言模型
深度学习
人工智能
上一页
6
7
8
9
10
11
12
13
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他