E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
NLP知识图谱论文笔记
【
论文笔记
】Do Transformers Really Perform Bad for Graph Representation(简要笔记供复习使用)
DoTransformersReallyPerformBadforGraphRepresentation论文地址:DoTransformersReallyPerformBadforGraphRepresentation一句话paper:利用度,最短路径增强的GraphTransformerMotivation原有将transformer应用于图的效果并不好节点重要性,图结构性信息往往在目前的工作中
好想变有钱535
·
2024-01-18 07:28
论文阅读
笔记
【
论文笔记
】BGRL:Large-Scale Representation Learning on Graphs via Bootstrapping(简要笔记供复习使用)
BGRL:Large-ScaleRepresentationLearningonGraphsviaBootstrapping文章地址:Large-ScaleRepresentationLearningonGraphsviaBootstrappingMotivation现有自监督学习的方法大多需要大量的负样本和大规模的数据增强,而选择负样本的原则的缺失导致负样本不一定会增加模型精度,尤其是在大模型中
好想变有钱535
·
2024-01-18 07:28
深度学习
笔记
人工智能
【
论文笔记
】ImGCL:Revisiting Graph Contrastive Learning on Imbalanced Node Classification(简要笔记供复习使用)
ImGCL:RevisitingGraphContrastiveLearningonImbalancedNodeClassification论文地址:RevisitingGraphContrastiveLearningonImbalancedNodeClassification.pdfContribution利用一个自适应采样策略的对比学习框架解决了数据集不平衡(长尾数据集)的性能受限问题,具体来
好想变有钱535
·
2024-01-18 07:51
笔记
深度学习
人工智能
On Data Scaling in Masked Image Modelin
前言 本文验证SIMMIM无监督预训练方法,是否会出现与
NLP
类似的拓展法则现象。1、结论 这篇论文做了大量的对比实验,因此,先说结论: 1)大模型在小数据上过拟合;(感觉没啥a) 2)MIM
武乐乐~
·
2024-01-18 07:49
深度学习
人工智能
自然语言处理
NLP
任务中常用的损失函数
损失函数类型适用于:文本分类,情感分析,机器翻译,抽取式问答的有:y,y^y,\hat{y}y,y^分别表示真实和预测值二分类交叉熵损失L(y,y^)=−(ylogy^+(1−y)log(1−y^)L(y,\hat{y})=-(ylog\hat{y}+(1-y)log(1-\hat{y})L(y,y^)=−(ylogy^+(1−y)log(1−y^)多分类交叉熵损失函数L(y,y^)=−∑i=1m
bulingg
·
2024-01-18 04:22
算法工程师
自然语言处理
人工智能
中文
NLP
笔记:11. 基于 LSTM 生成古诗
基于LSTM生成古诗1.语料准备一共四万多首古诗,一行一首诗2.预处理将汉字表示为One-Hot的形式在每行末尾加上]符号是为了标识这首诗已经结束,说明]符号之前的语句和之后的语句是没有关联关系的,后面会舍弃掉包含]符号的训练数据。puncs=[']','[','(',')','{','}',':','《','》']defpreprocess_file(Config):#语料文本内容files_c
不会停的蜗牛
·
2024-01-18 04:37
我也有灰色地带
别以为我整天写
NLP
的好处,我的生活就一定过得完美,不可能的。
NLP
虽好,我也有用错的时候。在我看来,一旦用错,就必然会导致我所不期的结果。我把我行差踏错的场景标识成“我的灰色地带”。
福哥0075826
·
2024-01-17 22:23
NLP
三大特征提取器全梳理:RNN vs CNN vs Transformer
【嵌牛鼻子】RNNCNNTransformer【嵌牛提问】
NLP
三大特征提取器是什么?【嵌牛正文】如果用
d5cc63d9e177
·
2024-01-17 20:10
【OUC深度学习入门】第6周学习记录:Vision Transformer & Swin Transformer & ConvNeXt
Part1VisionTransformer1网络结构ViT模型不仅适用于
NLP
领域,在CV领域也能取得不错的效果。
深蓝与夜的呼吸
·
2024-01-17 19:41
深度学习
transformer
学习
【深度学习:BERT 】开源 BERT:最先进的自然语言处理预训练
双向性的力量使用云TPU进行训练BERT结果让BERT为您服务自然语言处理(
NLP
)的最大挑战之一是训练数据的短缺。
jcfszxc
·
2024-01-17 19:27
深度学习知识专栏
深度学习
自然语言处理
bert
2022-03-21
#知识##校园学习##
NLP
##自然语言处理##人工智能专业建设##textblob##文本数据清洗##实验视频##正则表达式##Python##keras##文本分词#个人用户获取相关代
跨象乘云
·
2024-01-17 19:45
儿子写给母亲的表扬颂
为期四天的心理学
NLP
系统学习结束了,回忆四天的学习,第三天培训的肖导留了一个作业,给我留下了深刻的印象,作业内容是要我们站在他人角度给自己写一篇表扬颂,她人可以是朋友,孩子,父母,兄弟姐妹。
蜗居娃娃
·
2024-01-17 18:48
在线
知识图谱
可视化工具
在传统的企业运营管理过程中,大量的数据和信息以文档的形式存在,需要通过一定的方式进行组织、存储、加工和利用,而
知识图谱
就是这样一种数据表示形式。
悦数图数据库
·
2024-01-17 18:39
知识图谱
如何搭建企业级
知识图谱
系统
企业级
知识图谱
系统作为一种基于图谱技术的知识管理工具,能够帮助企业更好地整合、管理和利用知识资源,提高决策效率和准确性,为企业的发展提供有力支持。
悦数图数据库
·
2024-01-17 17:35
知识图谱
人工智能
PyTorch Tutorial 2.0
这里是对于PyTorchTutorial-CSDN博客的补充,但是与其相关的
NLP
内容无关,只是一些基础的PyTorch用法的记录,主要目的是能够自己生成一些模拟的数据集。
Karen_Yu_
·
2024-01-17 15:55
pytorch
人工智能
python
stanfordcore
nlp
提示RuntimeError: Java not found.
遇到问题:/anaconda3/envs/tensorflow/bin/python3/anaconda3/demo/demo/gcn_eca/gcn_model_tf/get_w2v_corpus.pyTraceback(mostrecentcalllast):File“/anaconda3/demo/demo/gcn_eca/gcn_model_tf/get_w2v_corpus.py”,li
liqiang12689
·
2024-01-17 15:18
python标准库
自然语言处理
normalization in nn (batchnorm layernorm instancenorm groupnorm)
importtorchimporttorch.nnasnn定义输入,本文以
nlp
或时间序列预测的数据结构为例。即[batch_size,time_ste
sdu_study
·
2024-01-17 14:48
人工智能
机器学习
算法
【
论文笔记
】Summarizing source code through heterogeneous feature fusion and extraction
SummarizingsourcecodethroughheterogeneousfeaturefusionandextractionAbstract1.Introduction2.HCGconstruction2.1SourcecodetoAST2.2ASTpruning2.3Featurefusionwithheterogeneousedges3.HetCoSmodel3.1.Overview
落啦啦
·
2024-01-17 14:14
论文
代码摘要生成
论文阅读
深度学习
transformer
使用Ha
nlp
加载大字典
问题因为需要加载一个近1G的字典到Ha
nlp
中,一开始使用了CustomDictionay.add()方法来一条条的加载,果然到了中间,维护DoubleArraTre的成本太高,添加一个节点,都会很长时间
lanlantian123
·
2024-01-17 12:10
技术动态 |
知识图谱
遇上RAG行业问答:回顾知识检索增强范式、挑战及与
知识图谱
的结合...
转载公众号|老刘说
NLP
今天我们来看看AIDD2023(https://aidd.vip/dhrc-sz2023)中有关
知识图谱
与行业问答上的一些有趣的分享,供大家一起参考。
开放知识图谱
·
2024-01-17 11:46
知识图谱
人工智能
OpenSPG 新版发布:新增大模型知识抽取,3 步快速搭建专属
知识图谱
转载公众号|SPG
知识图谱
随着ChatGPT的横空出世,大模型已然成为人工智能领域的焦点。大模型在语言理解、对话生成方面表现得尤其亮眼,而
知识图谱
则擅长大模型所无法解决的事实性“幻觉”和复杂推理问题。
开放知识图谱
·
2024-01-17 11:46
知识图谱
人工智能
论文浅尝 | 学习时序
知识图谱
中的隐含知识
笔记整理:陈鹏,天津大学硕士链接:https://aclanthology.org/2023.acl-long.705.pdf1.动机
知识图谱
(KnowledgeGraph)是一种结构化的多关系数据,用于记录事件
开放知识图谱
·
2024-01-17 11:45
学习
知识图谱
人工智能
冻结Prompt微调LM: T5 & PET (a)
2019.10ExploringtheLimitsofTransferLearningwithaUnifiedText-to-TextTransformerTask:EverythingPrompt:前缀式人工promptModel:Encoder-DecoderTakeAway:加入前缀Prompt,所有
NLP
AI-智能
·
2024-01-17 11:55
prompt
人工智能
大模型
机器学习
如何十分钟快速看懂一篇英文
NLP
论文?
已经2024年了,该出现一个写论文解读AIAgent了。大家肯定也在经常刷论文吧。但真正尝试过用GPT去刷论文、写论文解读的小伙伴,一定深有体验——费劲。其他agents也没有能搞定的,今天我发现了一个超级厉害的写论文解读的agent,传送门:赛博马良智能体-AI论文解读达人它不仅可以每天推荐你想看的AI论文,而且当你想快速看懂一篇英文论文的时候,可以直接丢给我们的agent,它就会给你写一篇详细
夕小瑶
·
2024-01-17 10:16
人工智能
自然语言处理
神经网络
深度学习
大模型
论文阅读
论文笔记
2024年1月16日Arxiv热门
NLP
大模型论文:Ada-Retrieval: An Adaptive Multi-Round Retrieval Paradigm for Sequential R
多轮次智能推荐新突破,MSRA&人大联合提出Ada-Retrieval,性能全面超越传统模型!引言:个性化推荐系统的新篇章个性化推荐系统在电子商务、社交媒体和娱乐平台等在线应用中扮演着至关重要的角色。通过根据用户的历史行为和偏好提供个性化推荐,这些系统增强了用户体验和参与度。尽管传统的单轮检索模型在推荐系统中已经取得了一定的成功,但它们在捕捉用户偏好的动态性和适应不断变化的项目空间多样性方面仍存在
夕小瑶
·
2024-01-17 10:16
自然语言处理
人工智能
大模型
神经网络
深度学习
语言模型
2024年1月16日Arxiv热门
NLP
大模型论文:Using Natural Language Inference to Improve Persona Extraction from Dialog
霍普斯金新研究:提高对话智能体在新领域中从对话中提取个性信息的能力引言:探索跨领域对话智能体的个性化挑战在构建对话智能体时,个性化是一个关键挑战,尤其是在跨领域的情况下。对话智能体需要能够根据其被赋予的角色或个性来生成回应,这要求它们能够理解并表达与特定角色相关的特征和行为。然而,现有的对话智能体往往在维持一致的个性上存在困难,尤其是在从现实世界场景转移到如幻想世界等不同叙事领域时。为了解决这一问
夕小瑶
·
2024-01-17 10:45
自然语言处理
人工智能
chatgpt
大模型
论文阅读
论文笔记
2024年1月16日Arxiv热门
NLP
大模型论文:A Closed-form Solution for Weight Optimization in Fully-connected ......
颠覆传统!一次迭代,全层并行,新神经网络权重优化方法,让机器学习效率飞跃引言:机器学习的崛起与发展概述在21世纪初,强大的计算机硬件和工作站的出现使得机器学习得以迅猛发展。作为人工智能的一部分,机器学习领域不断演进,并吸引了大量的研究兴趣,特别是在成功应用于各种学术和工业问题之后。这些机器的强大处理能力甚至在某些情况下超越了人类的表现。机器学习工具对于那些难以建立精确数学模型的实际问题尤其有趣,因
夕小瑶
·
2024-01-17 10:45
自然语言处理
搜索引擎
人工智能
chatgpt
transformer
深度学习
大模型
十分钟读完 OpenAI提出InstructGPT模型的经典论文:Training language models to follow instructions with human feedback
OpenAI提出新模型InstructGPT:通过人类反馈微调大型语言模型,减少有害输出引言:探索大型语言模型与用户意图对齐的新途径随着人工智能技术的飞速发展,大型语言模型(LMs)在自然语言处理(
NLP
夕小瑶
·
2024-01-17 10:15
语言模型
人工智能
自然语言处理
深度学习
大模型
chatgpt
2024年1月16日Arxiv最热
NLP
大模型论文:The Unreasonable Effectiveness of Easy Training Data for Hard Tasks
让AI从简单学起,竟然能解决难题?AllenAI最新研究发现:简单到困难的泛化能力出奇地强引言:探讨训练模型在难题上的表现:简单数据的不合理有效性在人工智能的发展过程中,一个重要的问题是如何训练模型以便它们能够在难度较高的测试数据上表现良好,尤其是在难以获取准确标注的难题训练数据的情况下。这个问题被称为可扩展监督问题(scalableoversightproblem),随着语言模型的不断进步,这个
夕小瑶
·
2024-01-17 10:14
人工智能
深度学习
chatgpt
自然语言处理
transformer
2024年1月16日Arxiv热门
NLP
大模型论文:Improved Learned Sparse Retrieval with Corpus-Specific Vocabularies
亚马逊颠覆搜索技术:自定义词汇库提升检索性能,效率提高50%,准确度飙升12%!引言:搜索引擎中的词汇选择与检索效率在搜索引擎的世界中,词汇的选择对于检索效率至关重要。传统的搜索引擎技术,如BM25,依赖于对文档中词汇的频率统计来估计词汇的重要性。然而,随着预训练语言模型(如BERT)的兴起,我们现在可以通过直接优化检索任务来学习文档中词汇的重要性。这些学习到的词汇重要性分数是许多学习型稀疏检索技
夕小瑶
·
2024-01-17 10:14
自然语言处理
人工智能
语言模型
神经网络
深度学习
大模型
论文阅读
2024年1月16日Arxiv最热
NLP
大模型论文:How Johnny Can Persuade LLMs to Jailbreak Them: Rethinking Persuasion to C
让大语言模型轻松「越狱」,人大研究揭示AI安全新风险,攻击成功率高达92%!引言:人工智能安全的新视角——以人类沟通者的角色挑战大型语言模型(LLMs)随着大型语言模型(LLMs)的日益普及和能力提升,它们在日常互动中的安全性问题也逐渐显现。传统的人工智能(AI)安全研究多从算法角度出发,关注由安全专家开发的基于算法的攻击手段。然而,非专家用户在与LLMs的日常交互中也可能带来风险。本文提出了一种
夕小瑶
·
2024-01-17 10:43
人工智能
语言模型
自然语言处理
神经网络
深度学习
2024 年1月15日Arxiv最热
NLP
大模型论文:APAR: LLMs Can Do Auto-Parallel Auto-Regressive Decoding
清华大学让大语言模型自动并行自回归解码,速度提升高达4倍!引言:大型语言模型的高效部署挑战随着大型语言模型(LLMs)在各种人工智能应用中的广泛应用,对于这些模型的高效部署需求日益增长。高效部署在这里指的是低延迟和高吞吐量。然而,LLMs的基础自回归(AR)结构给实现更高效的服务带来了显著挑战。首先,自回归解码过程中,每一个新的词元都是基于之前生成的所有词元条件生成的,这种增量式解码导致生成速度不
夕小瑶
·
2024-01-17 10:13
自然语言处理
人工智能
transformer
chatgpt
2024年1月16日Arxiv热门
NLP
大模型论文:Multi-Candidate Speculative Decoding
大幅提速
NLP
任务,无需牺牲准确性!
夕小瑶
·
2024-01-17 10:03
自然语言处理
人工智能
语言模型
神经网络
深度学习
大模型
刘知远LLM入门到实战——自然语言基础
文章目录自然语言处理基础词表示语言模型N-gramModelNeuralLanguageModel:为什么
NLP
等领域的模型越来越大?大模型会带来哪些新的范式和挑战?
李日音
·
2024-01-17 08:41
语言模型
笔记
langchain
python
论文笔记
(三十八)HandyPriors: Physically Consistent Perception of Hand-Object ... Differentiable Priors
HandyPriors:PhysicallyConsistentPerceptionofHand-ObjectInteractionswithDifferentiablePriors文章概括摘要1.介绍2.相关工作3.方法:HANDYPRIORSA.问题设置B.可变渲染先验C.可微物理先验D.基于优化的改进E.基于过滤的跟踪4.实验A.真实世界中的机器人手和物体迭代B.姿势估计C.基于过滤的跟踪D
墨绿色的摆渡人
·
2024-01-17 07:10
文章
论文阅读
论文笔记
(三十九)Learning Human-to-Robot Handovers from Point Clouds
LearningHuman-to-RobotHandoversfromPointClouds文章概括摘要1.介绍2.相关工作3.背景3.1.强化学习3.2.移交模拟基准4.方法4.1.HandoverEnvironment4.2.感知4.3.基于视觉的控制4.4.师生两阶段培训(Two-StageTeacher-StudentTraining)5.实验5.1.模拟评估5.2.模拟对模拟传输5.3.
墨绿色的摆渡人
·
2024-01-17 07:10
文章
论文阅读
论文笔记
(三十七)Visually Guided Model Predictive Robot Control via 6D Object Pose Localization and Tracking
VisuallyGuidedModelPredictiveRobotControlvia6DObjectPoseLocalizationandTracking文章概括摘要1.介绍2.相关工作3.物体姿态引导模型预测控制A.时间一致的6D物体姿态跟踪器B.使用MPC进行基于姿势的6D视觉伺服C.跟踪目标4.实验A.感知模块的定量评估B.视觉引导反馈控制5.结论文章概括作者:MedericFourmy
墨绿色的摆渡人
·
2024-01-17 07:10
文章
论文阅读
计算机视觉
人工智能
论文笔记
(二十)VisuoTactile 6D Pose Estimation of an In-Hand Object using Vision and Tactile Sensor Data
VisuoTactile6DPoseEstimationofanIn-HandObjectusingVisionandTactileSensorData文章概括摘要1.介绍2.背景3.网络结构A.视觉触觉传感器融合B.姿势估计器C.损失函数4.数据集的生成A.触觉传感器不变的姿态估计B.数据收集设置C.数据集特征5.实验A.网络训练设置B.硬件部署6.结果A.量化评估B.定性评价C.消融研究D.与
墨绿色的摆渡人
·
2024-01-17 07:40
文章
深度学习
物体姿势估计系统
论文笔记
(三十六):6-DoF Pose Estimation of Household Objects for Robotic Manipulation: ... and Benchmark
6-DoFPoseEstimationofHouseholdObjectsforRoboticManipulation:AnAccessibleDatasetandBenchmark文章概括摘要1.介绍2.方法A.一组对象B.3D纹理物体模型C.捕捉真实图像D.用地面实况标注图像E.深度校准F.对称意识度量3.实验A.注释验证实验B.姿势预测基线C.BOP挑战赛D.详细实验4.与以前工作的关系5.
墨绿色的摆渡人
·
2024-01-17 07:40
文章
论文阅读
论文笔记
(十九)RGB-D Object Tracking: A Particle Filter Approach on GPU
RGB-DObjectTracking:AParticleFilterApproachonGPU文章概括摘要1.介绍2.贡献3.粒子滤波器4.可能性评估5.实施细节6.实验A.物体模型B.合成序列C.真实序列7.结论8.鸣谢文章概括作者:ChanghyunChoiandHenrikI.Christensen来源:CenterforRobotics&IntelligentMachines,Colle
墨绿色的摆渡人
·
2024-01-17 07:39
文章
粒子滤波
论文笔记
(十四):PoseRBPF: A Rao–Blackwellized Particle Filter for 6-D Object Pose Tracking
PoseRBPF:ARao–BlackwellizedParticleFilterfor6-DObjectPoseTracking文章概括摘要1.介绍2.相关工作3.用PoseRBPF进行六维物体姿势跟踪A.问题定式化B.PoseRBPF概述C.Rao–Blackwellized粒子滤波器的公式D.观察似然E.运动先验F.6维对象姿态跟踪框架G.PoseRBPF的RGB-D扩展H.快速PoseRB
墨绿色的摆渡人
·
2024-01-17 07:09
文章
粒子滤波
论文笔记
(十八):Object Detection and Spatial Location Method for ... Based on 3D Virtual Geographical Scen
ObjectDetectionandSpatialLocationMethodforMonocularCameraBasedon3DVirtualGeographicalScene文章概括摘要1介绍2方法框架3三维虚拟地理场景的融合构建算法A.三维地理场景的构建B.初始化虚拟摄像机C.生成三维虚拟地理场景4基于三维虚拟地理场景的坐标计算算法5使用Brax:解决运动和操作问题5.1与Brax捆绑的学
墨绿色的摆渡人
·
2024-01-17 07:09
文章
神经网络
论文笔记
(四):6-PACK: Category-level 6D Pose Tracker with Anchor-Based Keypoints
6-PACK:Category-level6DPoseTrackerwithAnchor-BasedKeypoints文章概括1.摘要2.介绍3.相关工作4.问题定义5.模型5.1基于锚的注意机制5.2无监督的3D关键点生成6.结论文章概括作者:ChenWang,RobertoMart´ın-Mart´ın,DanfeiXu,JunLv,CewuLu,LiFei-Fei,SilvioSavares
墨绿色的摆渡人
·
2024-01-17 07:08
文章
论文笔记
(七):ROS Reality: A Virtual Reality Framework Using Consumer-Grade Hardware for ROS-Enabled Robot
ROSReality:AVirtualRealityFrameworkUsingConsumer-GradeHardwareforROS-EnabledRobots文章概括摘要1.介绍2.相关工作3.ROSRealityA.作为远程操作界面的VRB.系统概述C.ROSD.HTCViveE.UnityF.ROSReality1)WebSocket客户端2)URDF解析器3)TransformList
墨绿色的摆渡人
·
2024-01-17 07:08
文章
论文笔记
(一):se(3)-TrackNet: Data-driven 6D Pose Tracking by ...... in Synthetic Domains
se(3)-TrackNet:Data-driven6DPoseTrackingbyCalibratingImageResidualsinSyntheticDomains文章概括1.摘要2.介绍3.相关工作3.1数据驱动的6D姿势估计:3.26D姿势跟踪:3.2.1概率跟踪:3.2.2基于优化的跟踪:3.3模拟到现实:4.方法4.1具有残差的SE(3)流形上的跟踪4.2神经网络的设计4.3通过PP
墨绿色的摆渡人
·
2024-01-17 07:38
文章
人工智能
论文笔记
(二):DenseFusion: 6D Object Pose Estimation by Iterative Dense Fusion
DenseFusion:6DObjectPoseEstimationbyIterativeDenseFusion文章概括1.摘要2.介绍3.相关工作3.1来自RGB图像的姿势:3.2来自深度/点云的姿势:3.3来自RGB-D数据的姿势:4.模型4.1结构概括4.2语义分割4.3Dense特征提取4.3.1密集的3D点云特征嵌入4.3.2密集的彩色图象特征嵌入4.4Pixel-wise密集融合4.4
墨绿色的摆渡人
·
2024-01-17 07:38
文章
论文笔记
(四十)Goal-Auxiliary Actor-Critic for 6D Robotic Grasping with Point Clouds
Goal-AuxiliaryActor-Criticfor6DRoboticGraspingwithPointClouds文章概括摘要1.介绍2.相关工作3.学习6D抓握政策3.1背景3.2从点云抓取6D策略3.3联合运动和抓握规划器的演示3.4行为克隆和DAGGER3.5目标--辅助DDPG3.6对未知物体进行微调的后视目标4.实验4.1模拟消融研究(AblationStudiesinSimul
墨绿色的摆渡人
·
2024-01-17 07:00
文章
论文阅读
ImageNet Classification with Deep Convolutional
论文笔记
✅作者简介:人工智能专业本科在读,喜欢计算机与编程,写博客记录自己的学习历程。个人主页:小嗷犬的个人主页个人网站:小嗷犬的技术小站个人信条:为天地立心,为生民立命,为往圣继绝学,为万世开太平。本文目录标题和作者摘要创新点ReLU多GPUDropout其他网络结构输入层(Inputlayer)卷积层(C1)卷积层(C2)卷积层(C3)卷积层(C4)卷积层(C5)全连接层(FC6)全连接层(FC7)输
小嗷犬
·
2024-01-17 06:25
深度学习
论文笔记
论文阅读
人工智能
深度学习
神经网络
卷积神经网络
[
论文笔记
] PAI-Megatron 1、Qwen continuing pretrain(CT)千问预训练
通义千问开源模型在PAI灵骏的最佳实践-知乎https://github.com/alibaba/Pai-Megatron-Patch/blob/main/examples/megatron.md背景:目标:使用qwen基座来做CT。数据情况:预训练数据已经用qwen-tokenizer分过词。所以不需要准备数据。如果需没有数据,也可以从Pai-Megatron上拉数据。Megatron训练流程:
心心喵
·
2024-01-17 06:54
论文笔记
论文阅读
论文笔记
:信息融合的门控多模态单元(GMU)
整理了GMU(ICLR2017GATEDMULTIMODALUNITSFORINFORMATIONFUSION)论文的阅读笔记背景模型实验论文地址:GMU背景 多模态指的是同一个现实世界的概念可以用不同的视图或数据类型来描述。比如维基百科有时会用音频的混合来描述一个名人;来自社交网络的用户用文本和多媒体附件(图像/视频/音频)评论音乐会或体育比赛等事件。医疗记录由图像、声音、文本和信号等的集合表
图学习的小张
·
2024-01-17 06:23
论文笔记
论文阅读
上一页
18
19
20
21
22
23
24
25
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他