个人随笔（论文解读第7页

【论文解读】(如何微调BERT？) How to Fine-Tune BERT for Text Classification?

文章目录论文信息1.论文内容2.论文结论2.1微调流程2.2微调策略(Fine-TuningStrategies)2.3FurtherPretrain3.论文实验介绍3.1实验数据集介绍3.2实验超参数3.3Fine-Tuning策略探索3.3.1处理长文本3.3.2不同层的特征探索3.3.3学习率探索（灾难性遗忘探索）3.3.4不同层使用不同学习率3.2FurtherPretraining探索3

iioSnail·2023-10-21 13:55

如果你有写作梦，那就努力去追

18年的时候，我写了五万多字个人随笔和散文，也向一些媒体杂志投了很多稿件。其中有作品发表，也有作品得奖。但真正想认真把写作当成一件事业来做，是在今年。国庆假期，我对自己的未来和人生进行了认真的思考。

爱然之家·2023-10-21 05:36

个人随笔诗（五）

入秋桂花的香坠入凡尘行人在低诉游子在咏吟我信步江边星河蜿蜒西风又冷欲披星戴月却只能流浪世间

阴空落雨天凉秋·2023-10-20 03:32

安卓开发工作日常小结（重要点汇总）

这篇博客仅做于个人随笔，言辞简洁随性，不适于网友参考~进入手机先切换成root身份：adbroot进入手机：adbshell手机shell查看log17.log相关命令–dumpstate系统状态信息,

爱玲姐姐·2023-10-19 10:55

《Graph WaveNet for Deep Spatial-Temporal Graph Modeling》论文解读

基于时空图采用GraphWaveNet建模，其能够有效的处理大范围时间序列的时空图数据。在该模型架构中，主要包括两个模块，分别为GCN和TCN。两个模块融合获取时间空间的依赖关系。该模型的框架如下：目录一、本论文的创新点如下：

Winner3·2023-10-19 00:12

个人随笔_3

人间词话里有三个境界昨夜西风凋碧树。独上高楼，望尽天涯路。衣带渐宽终不悔。为伊消得人憔悴众里寻他千百度。蓦然回首，那人却在灯火阑珊处这三种境界不管用在什么地方，都比较合适。不管是在学习过程中，还是在做人这方面。不管是在职场上，或者生活方面。明确自己的目标，孜孜不倦的学习，以期最后的豁然开朗。把自己困在原地的，只有自己。以已为约束，可以修德

苏仙森·2023-10-18 15:58

CodePlan

CodePlan论文解读最近在看老师给的LLM-Agent论文，在这记录一下CodePlan:Repository-levelCodingusingLLMsandPlanning【论文】旨在解决储存库级别的

oveZ·2023-10-18 07:38

知识图谱最新论文清单（附论文解读）

EMNLP2018■论文解读|康矫健，浙江大学硕士，研究方向为知识图谱、自然语言处理论文链接：PaperWeekly源码链接：pouyapez/mkbe论文动机当前知识库补全的方法主要是将实体和关系嵌入到一个低维的向量空间

weixin_30865427·2023-10-18 03:57

单目3D目标检测——MonoDLE 模型训练 | 模型推理

模型原理，参考我这篇博客：【论文解读】单目3D目标检测MonoDLE（CVPR2021）_一颗小树x的博客-CSDN博客源码地址：https://github.com/xinzhuma/monodle目录一

一颗小树x·2023-10-17 03:51

知识增广的预训练语言模型K-BERT：将知识图谱作为训练语料

ojs.aaai.org/index.php/AAAI/article/view/5681项目地址：https://github.com/autoliuweijie/K-BERT01背景论述笔者在前面的论文解读中提到过

NLP论文解读·2023-10-16 13:20

单目3D目标检测——MonoCon 模型训练 | 模型推理

模型原理，参考我这篇博客：【论文解读】单目3D目标检测MonoCon（AAAI2022）_一颗小树x的博客-CSDN博客源码地址：https://github.com/2gunsu/monocon-pytorch

一颗小树x·2023-10-16 07:37

不良条件视觉感知专栏（一）任务前言

Transformer、目标检测、语义分割交流群欢迎关注公众号CV技术指南，专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读、CV招聘信息。CV

CV技术指南(公众号)·2023-10-16 07:25

论文解读《Top-Down Feedback for Crowd Counting Convolutional Neural Network》AAAI2018

Top-DownFeedbackforCrowdCountingConvolutionalNeuralNetwork用于人群计数的自顶向下的反馈卷积神经网络DeepakBabuSam,R.VenkateshBabu摘要：1.原因：largevariabilityinappearanceofpeople人群呈现的巨大变化Oftenpeopleareonlyseenasabunchofblobs.Oc

guoqiangszu·2023-10-15 20:06

论文解读《CrowdNet: A Deep Convolutional Network for Dense Crowd Counting》ACMM-MM2016

CrowdNet:ADeepConvolutionalNetworkforDenseCrowdCountingLokeshBoominathanSrinivasSSKruthiventiR.VenkateshBabu摘要：提出一个新颖的深度学习框架估计静态图像中高密集人群的密度。Weuseacombinationofdeepandshallow,fullyconvolutionalnetworks

guoqiangszu·2023-10-15 20:06

从零开始的stable diffusion

源于这一系列的疑问，我开始了漫长的论文解读。High-ResolutionImageSynthesisw

阿里巴巴淘系技术团队官网博客·2023-10-15 09:23

谈一个趋势判断的误区[22-11-01]

3)个人随笔。源自我，转化和总结。

许一的差评家学·2023-10-14 23:58

论文解读Mask the Correct Tokens: An Embarrassingly Simple Approachfor Error Correction

将bert的预训练加入纠错训练，问题是[MASK]替换再预测，会带来的负面影响，而且这样做真的比两阶段训练好嘛？如果两阶段训练，第二阶段也做一些混淆集的替换又会怎样呢?这样的copy占比也很少啊？论文实验表明增加20%的copytomask结果最好（这个比例应该和测试集有关吧）

旺旺棒棒冰·2023-10-14 15:06

Learn to See in the Dark 论文解读

本文为转载，原博客地址：https://blog.csdn.net/linchunmian/article/details/80291921整理下最近一篇论文的学习笔记。这是由UIUC的陈晨和IntelLabs的陈启峰、许佳、VladlenKoltun合作提出的一种在黑暗中也能快速、清晰的成像系统，让机器“看破”黑暗。以下是论文的主要部分。摘要在暗光条件下，受到低信噪比和低亮度的影响，图片的质量会

咸鱼半条·2023-10-14 13:18

LLaMA-Adapter: Efficient Fine-tuning of Language Models with Zero-into Attention论文解读

LLaMA-Adapter:EfficientFine-tuningofLanguageModelswithZero-intoAttention论文解读IntroductionLLaMA-AdapterLearnableAdaptionPromptsZero-initAttention

HanZee·2023-10-13 08:50

《论文阅读》通过动态融入常识知识来提高同理心对话的生成 ACL (Findings) 2023

你是否也像我之前搜索论文解读，得到只是中文翻译的解读后感到失望？小白如何从零读懂论文？和我一起来探索吧！今天为大家带来的是《Improving

365JHWZGo·2023-10-11 21:03

个人随笔

我早就记不清楚为了让生活变得有趣一点，我付出了多大代价了，我只知道我每天都在日常翻车，轮滑练好一个动作我只能不断的去经历失败，一个小时100次还是200次早就数不清了，也曾经为了对抗不公，敢在警察局怼人，我不知道那时候的自己从哪里来的胆量，但是我依然记得很清楚，我最多被关一个晚上，但是如果警察局这种地方都没有公正的话，那我估计等有了实力转身回来灭了这个地方生活中教会我的事情就是，一个故事的发生，早

老乌尘·2023-10-10 14:47

【论文解读】文本分类上分利器:Bert微调trick大全

论文标题：HowtoFine-TuneBERTforTextClassification?中文标题：如何微调BERT进行文本分类？论文作者：复旦大学邱锡鹏老师课题组实验代码：https://github.com/xuyige/BERT4doc-Classification前言大家现在打比赛对预训练模型非常喜爱，基本上作为NLP比赛基线首选（图像分类也有预训练模型）。预训练模型虽然很强，可能通过简单

致Great·2023-10-10 10:56

个人随笔诗（其二）

落日盗取火种焚烧天际太阳立在地平线阴影倾斜等世界的黑暗降临燃起篝火我是在庆祝还是附和？等黑暗降临时务必思索生而为人的苦乐

阴空落雨天凉秋·2023-10-09 17:14

GPT系列论文解读：GPT-3

GPT系列GPT（GenerativePre-trainedTransformer）是一系列基于Transformer架构的预训练语言模型，由OpenAI开发。以下是GPT系列的主要模型：GPT：GPT-1是于2018年发布的第一个版本，它使用了12个Transformer编码器层和1.5亿个参数。GPT-1的训练数据包括了互联网上的大量文本。GPT-2：GPT-2于2019年发布，是GPT系列的

青云遮夜雨·2023-10-09 14:57

谈一个形容词的误区[22-11-06]

3)个人随笔。源自我，转化和总结。谈一个形容词的误区[22-11-06]一）讨论范围群里不少人对最近的变化感到悲观，但也有人认为现在还不错。别人说幸福时，我们怀疑是反讽，但不能排除她确实认为幸福。

许一的差评家学·2023-10-09 09:38

人脸动作迁移——基于DaGAN深度感知的生成对抗网络操作对口型数字人

一、论文解读1.论文简介在DaGAN这篇论文中，作者首先介绍了一种自监督的几何学习方法，可

知来者逆·2023-10-09 07:42

论文笔记：多任务学习在美团推荐中的应用

©NLP论文解读原创•作者|小欣导读本文重点对2021年KDD的一篇关于多任务学习的论文（也是美团在多任务学习领域的一个应用）《ModelingtheSequentialDependenceamongAudienceMulti-stepConversionswithMulti-taskLearninginTargetedDisplayAdvertising

NLP论文解读·2023-10-09 05:08

转载：stable diffusion原理解读通俗易懂，史诗级万字爆肝长文，喂到你嘴里

超详细stablediffusion论文解读，收藏备用，以后有感兴趣的小朋友可以关注下。另一篇实战（收费挺讨厌的）：OpenAI一夜颠覆AI绘画！

wuling129·2023-10-08 20:55

个人随笔~

手里只有四块五，可是再也住不到三块五的海景房，吃不到三块钱的羊肉串和一块五的白啤酒。。天渐渐黑了，可是我们又在哪儿呢？红色的玫瑰变成了白色。我像个孤城的浪子，你成了现实的过客，求求不要笑话我的无知，我还有一丝的顾虑和幻想。姐姐，今夜我在德令哈，去远方的末班车已经开走了，我又找不到回家的方向了，听着巴音河的馋馋水声，伴着星空在公园的长椅上借宿一晚。

萧子寒·2023-10-08 13:29

个人随笔诗（六）

演你丑恶的嘴脸隐藏在帽沿想要展示最光鲜的一面我不能接受禽兽衣着冠服也可称作人而且还在表演背诵最出彩的剧本那流传千古的剧情不要去改变因为一个人难成主角难以即兴出演观众的感受也要好好领会避免故作高深的羞耻的瞬间

阴空落雨天凉秋·2023-10-08 02:03

论文解读 | Fully Convolutional Networks for semantic Segmentation

抄于：https://www.cnblogs.com/xuanxufeng/p/6249834.html摘要卷积网络在特征分层领域是非常强大的视觉模型。我们证明了经过端到端、像素到像素训练的卷积网络超过语义分割中最先进的技术。我们的核心观点是建立“全卷积”网络，输入任意尺寸，经过有效的推理和学习产生相应尺寸的输出。我们定义并指定全卷积网络的空间，解释它们在空间范围内denseprediction任

颐水风华·2023-10-07 05:59

Latent Diffusion Models 论文解读

论文下载地址：https://arxiv.org/pdf/2112.10752.pdf0摘要通过将图像形成过程分解为去噪自编码器的连续应用，扩散模型（DM）在图像数据及其他方面取得了最先进的合成结果。此外，它们的表述允许一种指导机制来控制图像生成过程，而无需重新训练。然而，由于这些模型通常直接在像素空间中操作，因此优化功能强大的扩散模型通常会消耗数百个GPU天，并且由于顺序评估而导致推理成本高昂。

AI 菌·2023-10-06 21:57

DINO学习

DINOV2:全网最详细的DINOv2论文解读来啦！-

qq_478377515·2023-10-06 10:17

《论文阅读》监督对抗性对比学习在对话中的情绪识别 ACL2023

你是否也像我之前搜索论文解读，得到只是中文翻译的解读后感到失望？小白如何从零读懂论文？和我一起来探索吧！今天为大家带来的是《SupervisedAdversarialContrastiveL

365JHWZGo·2023-10-05 08:00

--人行论文解读下篇

上一篇（https://www.jianshu.com/p/7c3918f7fbba）笔者向大家解读第一部分，主要对区块链技术的经济学解释。本篇为你解读完成。三、区块链的经济功能3.1区块链的主要应用方向区块链的主要应用方向解读：将区块链应用分成了4类：1，应用不涉及Token：以联盟链为代表，比如银行之间利用区块链技术做清算2，以Token代表区块链外的资产或权利：比如在供应链金融和数字票据等场

jerry的技术与思维·2023-10-05 05:48

GPT系列论文解读：GPT-2

GPT系列GPT（GenerativePre-trainedTransformer）是一系列基于Transformer架构的预训练语言模型，由OpenAI开发。以下是GPT系列的主要模型：GPT：GPT-1是于2018年发布的第一个版本，它使用了12个Transformer编码器层和1.5亿个参数。GPT-1的训练数据包括了互联网上的大量文本。GPT-2：GPT-2于2019年发布，是GPT系列的

青云遮夜雨·2023-10-05 00:43

K-BERT论文解读

一、前言这篇文章将bert同knowledgegraph（KG）结合在一起。一解决了Heterogeneousembeddingspace问题（KG的实体向量与wordembedding不连续的问题。）解决了knowledgeNoise知识噪音.北大的团队一直有做KG的，上次在EMNLP中看到的一个本科生还是硕士？就是做了一个KG局部更新方法，使得KG能够更快速的更新知识。这次的这篇论文就把BER

LemonLee·2023-10-04 09:23

dm-vio-ros的安装（详细）

前言dm-vio安装参考博客【SLAM】DM-VIO(ros版)安装和论文解读在安装过程中，有些地方提示的不是很清楚，故写一篇记录避免再次犯错。

~山有木兮·2023-10-03 17:29

SentenceTransformer 之论文解读

摘要原文标题：Sentence-BERT:SentenceEmbeddingsusingSiameseBERT-Networks链接：https://arxiv.org/pdf/1908.10084.pdf尽管Bert和RoBERTa在句子对回归任务上，例如语义文本相似度（SemanticTextSimilarity），取得了新的sota结果。但是，需要将两个句子都输入到模型中，造成较大的计算延时

xiao4816·2023-10-02 13:37

Lenet5经典论文解读

【嵌牛鼻子】Lenet-5经典论文解读【嵌牛正文】一论文

Daniel_go·2023-10-02 10:30

KDD 2019论文解读：多分类下的模型可解释性

reference:https://developer.aliyun.com/article/715920简介：日前，由阿里巴巴研究型实习生张雪舟、蚂蚁金服高级算法专家娄寅撰写的论文《AxiomaticInterpretabilityforMulticlassAdditiveModels》入选全球数据挖掘顶级会议KDD2019。日前，由阿里巴巴研究型实习生张雪舟、蚂蚁金服高级算法专家娄寅撰写的论文

婉妃·2023-10-02 03:40

目标检测学习笔记3——Yolo1 Yolo论文解读

文章目录1.引言2.Yolov1论文摘要1.介绍2.一个统一的目标检测框架2.1网络设计2.2训练阶段2.3推断预测阶段2.3Yolo的缺陷3.一些数据对比1.引言Yolo1,2,3的作者是JosephRedmon.Yolo是one-stage算法，即无需提取候选框、没有复杂的上下游处理工作，而是图片输入后经过网络，一次性往前推段得到boundingbox的定位以及分类结果。是端到端训练优化。优点

Shadownow·2023-10-01 01:31

目标检测论文解读5——YOLO v1

angmaodie3396·2023-10-01 01:00

【个人随笔】梦

昨天也里做了一个梦，梦见带着孩子去逛街还是啥，到了某个街区，告诉孩子这是之前我和她爸爸一起玩的地方，然后场景切换，变成一幢很高很高的楼，只是下楼的方式一边滑下去，一边是用绳子牵引一段一段下去。我还没有叮嘱两句，孩子就从滑落的那条道直接就滑下去了，一下子就看不见了；我从绳子这边才开始，降落下了一截，胆战心惊，看见了同事，然后就切换场景来。想想最近做了好多这种梦，真的很焦虑，焦虑的一方有自己所面临的困

苏默马·2023-09-29 02:01

卢之·2023-09-29 01:23

[博学谷学习记录] 超强总结，用心分享|Pyspark基础入门1

陈万君Allen·2023-09-26 14:52

【论文解读】RALM：微信看一看中基于Attention机制的实时Look-alike推荐模型

前段时间读了来自微信团队发表在KDD2019上的一篇论文《Real-timeAttentionBasedLook-alikeModelforRecommenderSystem》，简称是RALM，主要介绍的是一种将Attention机制与look-alike模型结合后的实时推荐模型，这个算法目前应用在了微信“看一看”模块上。在读论文的过程中产生了许多疑问，也查找了不少资料。因为网上对这篇论文的解读不

_王子段·2023-09-26 02:35

Vision Transformer(ViT)论文解读与代码实践(Pytorch)

VisionTransformerVisionTransformer（ViT）是一种基于Transformer架构的神经网络模型，用于处理计算机视觉任务。传统的计算机视觉模型如卷积神经网络（CNN）在处理图像任务时取得了很大的成功，但CNN存在一些局限，例如对于长距离依赖的建模能力较弱。ViT通过引入Transformer的注意力机制来解决这些问题，并在一些视觉任务上取得了优秀的结果。与传统的CN

青云遮夜雨·2023-09-24 21:30

《Cascaded Pyramid Network for Multi-Person Pose Estimation》--旷世2017COCO keypoints冠军论文解读

简介《CascadedPyramidNetworkforMulti-PersonPoseEstimation》，这是Face++旷世科技2017年取得COCOKeypointsChallenge冠军的文章，主要目的是解决inthewild场景下多人的姿态估计，即关键点回归。这里对这篇文章做一个简单的总结，如有理解不对的地方，欢迎指正！！文章的主要贡献是：重点内容1提出了一种金字塔型的串接模型，即C

zhangboshen·2023-09-24 11:34

数据库顶会 VLDB 2023 论文解读 - Krypton: 字节跳动实时服务分析 SQL 引擎设计

“Krypton源于DC宇宙中的氪星，它是超人的故乡，以氪元素命名”。引言近些年，在复杂的分析需求之外，字节内部的业务对于实时数据的在线服务能力也提出了更高的要求。大部分业务不得不采用多套系统来应对不同的Workload，虽然能满足需求，但也带来了不同系统数据一致性的问题，多个系统之间的ETL也浪费了大量的资源，同时对于研发人员来讲，也不得不学习维护多套系统。为了解决这个问题，我们开启了Krypt

字节跳动云原生计算·2023-09-24 10:02

推荐频道

个人随笔（论文解读