我爱计算机视觉

计算机视觉研究那些事｜CVPR 2020 论文分享会

本文转载自微软学术合作。

在以下链接查看 CVPR 2020 线上论文分享会全程回放：

https://space.bilibili.com/110487933/channel/detail?cid=128252

在以下链接查看本场分享会所有讲者的 PPT 和论文：

https://github.com/peterchenhao/Microsoft-Student-Club/tree/master/2020%20CVPR%20Pre-workshop

5 月 14 日，微软亚洲研究院创研论坛 CVPR 2020 线上论文分享会在线上圆满落幕。来自国内外计算机视觉领域的 19 位优秀代表与大家零距离交流，分享了他们在 CVPR 2020 发表的最新研究成果。

本次活动广受计算机视觉老师、学生、研究人员和工程师的欢迎。千余名观众进入分享会微信群讨论交流；在总计 9 个小时的直播活动中，观看人数的峰值高达 5.3 万，观众们贡献了 2700 余条弹幕，提出了百余个有价值的学术问题。

在开场演讲中，三位嘉宾分别从不同视角阐述了 CVPR 2020 论文分享会举办的初衷。北京大学教授、中国计算机学会计算机视觉专委会主任提出，今天的论文分享会活动，能够让大家尽早体验线上学术交流，并学习如何展示自己的学术成果以及与同行交流，这也是许多国内的研究者相对薄弱的地方。

北京大学教授、中国计算机学会计算机视觉专委会主任查红彬

清华大学教授、清华-微软联合实验室清华方主任温江涛指出，大家除了发表顶尖水平的论文、获得高质量的研究成果，也要思考自己的研究对社会、国家和人类的意义，以及如何将研究成果应用于解决问题。

微软亚洲研究院学术合作总监则分享了三个关键词：

第一，“拥抱改变”，线上的形式没有时间、地点的限制，让这次活动能够请到原来可能请不到的讲者；

第二，“精选”，今年的讲者是精挑细选的，观众的互动提问也将“精选”给分享者回答；

第三，“初心”，CVPR 论文分享会自四年前开始举办就以“分享”为宗旨，希望推动计算机视觉领域的发展，也期待大家在分享交流之后有更多思考。

微软亚洲研究院学术合作总监马歆

回顾过去的一年，计算机视觉在学术界与产业界的关注度持续升温，相关应用及产业化呈现出加速趋势。相信大家一定很好奇，作为顶会主席的大牛如何看待此领域的发展呢？

由此，除了论文干货分享外，本次活动特别准备了彩蛋环节——由重磅嘉宾参与的圆桌讨论。五位担任过视觉领域顶会主席的嘉宾：美国加州大学伯克利分校教授马毅、美国罗彻斯特大学教授罗杰波、Wormpex Al Research 副总裁兼首席科学家华刚、加州大学圣地亚哥分校教授屠卓文和加州大学美熹德分校教授杨明玄，在微软亚洲研究院首席研究员王井东的主持下，就论文的选题与写作、如何看待 arXiv、鲁棒 AI、计算机视觉领域的未来发展等议题进行了精彩探讨。

分享嘉宾

罗杰波

美国罗彻斯特大学教授

CVPR 2012 Program Chair

马毅

加州大学伯克利分校教授

ICCV 2013 Program Chair

ICCV 2015 General Chair

华刚

Wormpex AI Research 副总裁兼首席科学家

CVPR 2019 Program Chair

CVPR 2022 Program Chair

屠卓文

加州大学圣地亚哥分校教授

CVPR 2019 Program Chair

杨明玄

加州大学美熹德分校教授

ICCV 2019 Program Chair

主持人

王井东

微软亚洲研究院首席研究员

圆桌讨论

论文选题与写作：

把自己变成最挑剔的审稿人

王井东：各位有多重身份：投稿人（Author）、审稿人（Reviewer）、领域主席（Area Chair）、程序主席（Program Chair），想请各位从这些身份角度给我们分享一下计算机视觉研究的经验、建议，比如论文选题、论文写作、以及 rebuttal 等等。

罗杰波：这个问题很有意思。我在计算机视觉领域做了差不多 30 年了，看到这个领域有了巨大的进步。这 30 来年，每年都要选一个题，这是一个常规性的挑战。我个人有一个特点就是不凑热闹、不刷榜，我觉得特别是学术界的人，不要以刷榜为目的。选题的话，首先要选一些自己要感兴趣的，第二，有没有一些独特的点去做，而不是说别人做什么你就做什么。

写作的话，有一个普遍规律，你写论文不是写给自己看，也不是写给导师或是学术带头人看，reviewer 才是第一关，需要让他们看得懂、看得出妙处来。你拿到拒信肯定会觉得很沮丧，说审稿人这个没看懂、那个没看懂，但其实很多时候是有（自己）原因的。我经常跟学生说，你得让 reviewer 帮助你，你不把东西讲清楚，人家是不可能给你高分的。

杨明玄：写作当然很重要的，更重要的是要从作者的位置跳出来。你的 advisor 的任务（之一）是做最刁钻的那个 reviewer——他们是为你好，而不是为了跟你作对。老板的经验通常比你多，也看过很多有好有坏的文章，所以他们会帮你把论文修改得尽可能完善，这样送出去的文章就可以避免很多问题。

当然写作需要慢慢地改进。你可以当自己是一个审稿人。看看怎么 review，当你把review、 discussion、rebuttal等这些步骤都走过，相当于你做了次模拟考。还可以把好的文章的结构记录下来。

马毅：关于写作，我个人认为我们的教育可能不太重视这一部分，我是到了后来做研究、写文章、写书的时候才真正开始学习如何写作。我认为做研究分两个阶段，第一个阶段是作为学生时，先要学习做学问的技巧，包括写作的技巧和能力、如何把事情讲清楚甚至 technical presentation（技术报告）……你最早的几篇文章实际上更多是在训练自己的这些技能。过了这个坎儿之后，可以按照自己的兴趣，真正是为了做研究而做研究。两个阶段都非常重要，一个是训练技巧，一个是研究的内容。

我个人认为不要太过于去取悦 reviewer，无论是很伟大的研究者，还是包括我自己在内的很多人，都有过文章被“杀掉”的经历。我想大家的写作应该没有问题，也不缺好的 idea，所以不要把 review 本身看得太重，更重要的是，你自己是不是觉得你的研究问题有价值。

当我做研究生的时候，老板给了我两个关于写作的建议。第一，关于语言，找你最欣赏的人的文章和书，去学习他们怎么讲一件事，怎么开头、承前启后，怎么分配主次和先后，怎么把事情交代清楚。小到语言，大到结构，都可以去学。

技术上的东西罗教授也提到了，你自己要变成自己最挑剔的 reviewer。要把自己训练成最难说服自己的人，做到这一点再说服别人就容易了。

这两点一个是关于写作本身，关于文章和语言，另外一个是技术上如何做到严谨，自身两方面的提高非常非常重要，可能也不是一蹴而就的，要通过一定的经验和经历，在屡败屡战中逐步提高，学会自我反省和换位思考。

华刚：其实刚才三位教授都已经讲得很全了，我就稍微总结一下。

第一点，对论文选题来讲，我觉得罗教授讲得非常好，切莫去跟风，做自己感兴趣的题目。很多同学碰到资深的研究者，会问今年 CVRP 有什么新的方向可以跟一跟，其实这属于本末倒置，你的 research 是你自己的故事，要你自己去书写。

第二点，关于写作的角度，马毅老师的观点很好。我反省了一下自己的求学经历，在小学、初中、高中受到的技术论文写作训练还是缺乏的，我是上硕士研究生之后才第一次真正开始写文章，也没有人教过我，但我自己掌握到一点诀窍：去读一些文章，首先学到它的形式，写文章的第一步是能写完整几个部分，然后能成为一个故事。

技术论文还是相对比较好写的，不需要过于华丽的辞藻。看一些真正写得好的英文书，其实里头用的语言还都是比较平实的，也就是能让一般人读懂的语言。写作应该追求的就是简单写作，把问题和道理讲清楚。

最后我想补充一点，你会在学术共同体中会扮演各种角色：投稿人、审稿人、领域主席、程序主席……作为投稿人有义务要去做个好的 reviewer，当大家得到 review 的请求时，还是要尽量帮助程序主席，在 review deadline 之前把 review 提交过去，这是对学术共同体最大的帮助。

屠卓文：对于大量搞计算机视觉研究的学者来说，更多人扮演的是 author 和 reviewer 的双重角色。写文章还是要”帮人帮己”，这是一个原则，要既能帮助自己，也能帮助 reviewer，甚至帮助其他的同事能够真正理解你的工作。

又爱又恨的 arXiv：

它让双盲名存实亡?

王井东：接下来我们聊一聊 arXiv 的话题。arXiv 上的文章需要引用吗？大家是否会在论文投稿前放到 arXiv 上？arXiv 的存在是否让双盲机制变得名存实亡？

arXiv:一个收集物理学、数学、计算机科学、生物学与数理经济学的论文预印本的网站，由物理学家保罗·金斯巴格于 1991 年建立。arXiv 的存在是造就科学出版业中所谓开放获取运动的因素之一。许多研究者习惯先将其论文上传至 arXiv.org，再提交予专业的学术期刊。

双盲：投稿人不知道审稿人的身份，投稿人不能在所投文章里透露自己的身份。人工智能领域里的会议大多采用双盲评审机制。

单盲：投稿人不知道审稿人的身份，投稿人需要在所投文章里加上自己的身份信息。人工智能领域里的杂志通常采用单盲评审机制。

华刚：总体上，我觉得 arXiv 还是一个非常正面的东西，因为它可以尽快地让大家的工作被整个领域知道，并获得一些评价，一些有影响力的工作会在这个过程中涌现出来。arXiv 带来的问题是大量的文章在上面，但又没有经过 peer review，比较鱼龙混杂，需要研究者有一定的判断力。

至于是否要引用 arXiv 文章，CVPR 和 ICCV 都有比较明确的政策，原则上是可以不 cite 的，大家应该在投稿之前仔细看一下相关政策。

我原本其实不是很愿意把没有 peer review 过的工作发表上去。但是在 2015 年之后，因为跟一些学生合作时，学生想把文章放上去，我觉得也未尝不可。

关于双盲的问题，现在完全是“有法不依，执法不严“。

屠卓文：对于 arXiv，变成单盲暂时比较困难的情况下，是不是考虑设定一定的窗口期，对一段时间内的 arXiv 的文章可以放松一下，如果一篇文章已经上传 arXiv 一年甚至是更长时间，要装作完全不知道也不太科学。有些文章放上面很久，已经基本上形成共识了，我们再去不考虑可能并不是那么合适。

马毅：我的看法跟华刚类似，arXiv 最早的领域是物理和数学，是用来收集论文预印本的，它所对应的 review 的模式不是双盲。既然我们允许发表在 arXiv 上，那么我们的 review process 就不要假装是双盲。

这也给程序主席（Program Chair）或领域主席（Area Chair）带来了很多问题，有人在 review 里会说，这篇文章跟某篇文章的想法很一样，这篇文章到底是否借鉴过 arXiv 文章的想法？这增加了大量不必要的工作量：要看发表时间，但中间往往又有重叠，那怎么去判断？从规则和流程上，我非常赞成 arXiv 鼓励尽快分享信息和知识的初衷，但是它并不适应现在 conference review 的政策，这对组织者、reviewer 甚至作者都带来了很多不确定性以及不必要的困惑，我希望会议组织者或是学术社区真的得好好考虑这个事情。

好多 conference 干脆变成单盲的，直接把 author 的名字放上去就好了，大家也都可以放到自己的网上或者是 arXiv 上面，这样就极大程度上保证了公平，也省去很多的麻烦。

罗杰波：我非常赞同马毅说的，我们既然已经走到这一步了，就不要装模做样地，应该把 CVPR 变成像别的会议一样是单盲的，这样对所有人都公平。很多 reviewer、程序主席或领域主席叫他不要去查，但他忍不住会去查。有的人去查，有的人不去查，难免就会带来审稿过程的不公平，所以我很赞成变成单盲。

深度学习与鲁棒 AI：

计算机视觉如何突破局限？

王井东：深度学习在计算机视觉许多任务中去取得了巨大的成功，但是其严重依赖数据，鲁棒性得不到保证，可解释性差。最近，有不少基于结合深度学习和符号的方法的鲁棒人工智能（robust AI）的研究，各位这种 neuro-symbolic 的路线对 AI 的研究特别是计算机视觉的研究有什么看法？

杨明玄：我没有办法回答你，如果我知道的话我就去做了，重要的是必须要有人去做这件事。

屠卓文：计算机视觉我们现在考虑最多的还是 CNN 算法，当然 RNN、Attention 都在进来,但是实际上视觉和语言还是不一样的。计算机视觉改变一两个像素，改变不了太多，但是在语言里我们改变一个字，它的意思差别会很大。

我觉得计算机视觉慢慢会往更 AI 的角度去考虑，这是一个大的方向。最终的融合是需要的，视觉跟语言在融合，但因为他们先天的差异，并不是简单的视觉和语言的融合，而是更往 generic AI 发展。大家有各自的特点，现在这条路还是在探索阶段。

罗杰波：高层次来讲，视觉有识别问题、描述问题、推理问题，CNN 帮我们解决了大部分识别问题，现在视觉进化到描述问题，下一步应该进化到推理问题。现在很多人想把知识图谱和常识这些东西加进去，尝试解释视觉系统或AI系统如何在知识这个层面上来解决问题。其实一直都有人这样做，就是企图把领域知识（domain knowledge）放进去，和比较底层的识别结合起来去解决高层的问题。我们做得比较多的是在医疗领域，因为医疗有很多的领域知识。

计算机视觉的定义，是从视觉信号里提取描述，没说是只做识别。所以说，计算机视觉的初心就是要去进化到语义的层面，把计算机视觉和自然语言结合起来是不可避免的，也是 AI 最终要进化的方向。视觉和语言的模型和处理手段都比较像，它们有个性也有共性，我们不是要局限于要做 CV 和 NLP，我们是要做 AI。

马毅：鲁棒性确实是一个很大的问题，也跟现在深度模型拟合数据做黑盒，以及依赖数据标签、而并不关心数据内在的描述或者结构有关。从方法论来讲，数据驱动能解决一部分问题，也有很多应用，但一旦涉及到高精度要求的问题就会碰壁。我一直做 3D 视觉，虽然深度学习在识别问题上取得了很大的进展，但 3D 是它最大的软肋，3D 大部分应用对精度要求很高，比如 AR、VR 需要像素级别的准确率，要非常鲁棒，而且也有领域知识，不融合很难达到这样的精度。

这说明，要把计算机视觉真正落地到有关痛痒的应用中，就必须解决模型的鲁棒性和精确性问题，而且是要有保障的。很多是至关重要的，比如无人机、无人车或者医疗，都是涉及生命的。我们的视觉系统能不能上，谁敢上？除了刚才罗教授讲的我们要朝着语义方向发展，要往高水平走，我们在真正的performance guarantee 这方面还有很长的路要走。

展望CV领域未来：

重新定义自己，回归研究初衷

王井东：谢谢各位老师的精彩分享，最后我想请大家每人讲一句话，对计算机视觉这个领域将来的发展，特别是计算机视觉 ICCV、CVPR 这些会议的发展有什么看法？

罗杰波：我就说一个吧，COVID-19 搞得很多会议都是线上来开了，大家开了一顿之后觉得线上也没什么不可以的，省得跑来跑去，也很环保。但我觉得线上交流有致命的东西，我去开 CVPR 或者是各种会议，最 enjoy 的不是 oral session，而是 poster session。你可以去跟作者或者旁边的人评论工作，在这个过程中把事情弄清楚。交流围观的特点是线上交流达不到的华刚：，所以我不认为线上交流会很快地取代实体的会议。但将来会怎么样？可能会是一种 hybrid（混合模式），我不太清楚。

华刚：我非常赞同罗教授的看法，新冠病毒使以后的会议会是一个混合模式，因为很多人还是会面临出行的限制，不能线下参加会议的话，在线会议会提供一个非常好的替代品。

从一个 community 的增长来讲，我们可以看到 ICCV、CVPR 在过去的 10 年中差不多是以指数级的速度在增长。一个 research community 有一个 research core，大家都围绕这个 core 来开展自己的研究，当这么多人把 core 已经挤得差不多的时候，如果 community 要继续增长，势必要去扩展一些其他的方向，就像刚才杰波提到的往更高水平的 AI reasoning 上去发展，或者其他应用型的角度。从 neuro-symbolic 的角度来讲，对这个问题思考最多的可能还是 Gary Marcus 教授，大家有兴趣的话可以看看他写的东西，会有一些启发。

杨明玄：conference 跟 workshop 有不同的功能。现在一些比较资深的人去 workshop 会讲比较多，你遇到不同的人、去不同的 workshop 激发不同的 idea，都有不同的好处。

屠卓文：前面各位同仁说得我都很同意，我期待计算机视觉继续发展，我们继续读更多的文章，看到更多激动人心的发展。

马毅：CVPR 会议的发展已经非常令人满意了。当年我是学生和 young faculty 的时候，视觉会议令我非常激动。一个是小，只有两三百人，第二是 topic 新，都是其他领域不敢碰、不知道怎么做的东西，有的甚至连问题都没有怎么定义清楚。对年轻人都很挑战。

所以，我觉得现在视觉领域可能要重新定义自己。虽然领域发展壮大是一个好事情，有一些东西可以水到渠成。但是从研究问题、研究社群来讲，我们可能要重新找一找，有没有更令人兴奋的事情。人一多从众心理就很严重，现在我们不是在做研究，而是把很多研究主题搞得像是在搞网红的东西了，而不是真正地追求理解、追求突破。我们做研究的初衷，回到最早罗教授讲的，做自己喜欢的、真正做有意义的问题。我希望不光我们个人能做到这一点，作为学术社区的一部分，我们能有这个意识，做一些另辟天地的事情，这是最好的时机。

END

备注：CV

计算机视觉交流群

2D、3D目标检测，图像分割，人脸识别等最新资讯，若已为CV君其他账号好友请直接私信。

我爱计算机视觉

微信号:aicvml

QQ群:805388940

微博知乎:@我爱计算机视觉

投稿:[email protected]

网站:www.52cv.net

在看，让更多人看到

10分钟读完《每天最重要的2小时》读书周盛欢读书
关于作者乔西・戴维斯（JoséDavis），美国知名作家、演讲家和效率专家。他长期致力于研究人类行为、认知科学以及时间管理等领域，通过结合前沿科学研究成果与实际案例，为读者提供实用且有效的个人成长建议。其作品风格深入浅出，深受广大读者喜爱与认可。关于本书《每天最重要的2小时》是一本聚焦于时间管理与个人效率提升的实用指南。书中，作者乔西・戴维斯基于神经科学、心理学等多学科研究成果，深入剖析了人们在日
Axure常用交互效果二——拖动效果结构化知识课堂 Axure应用交互设计 axure
亲爱的小伙伴，在您浏览之前，烦请关注一下，在此深表感谢！在很多移动端应用中经常会涉及到界面拖动操作，那么产品经理是怎么做出来的？这节课我们就来展示操作，这里会涉及到的知识点有：移动、动态面板。滑动分为左右拖动和上下拖动，案例中我们分别做了菜单的横向拖动和内页的上下拖动，下边我们以横向菜单的左右拖动为例，进行讲解，更多内容请观看作者视频内容。课程主题：拖动效果效果描述：左右拖动，上下拖动应用场景：横
鸿蒙相机开发实战：从设备适配到性能调优 —— 我的 ArkTS 录像功能落地手记（API 15） harmonyos
引言：为什么我要写这份开发指南？作为一名老技术，最近特别喜欢研究鸿蒙相机功能，而且目前已经更新到API15了，那么咱们更要好好研究一下。而且从手持云台到车载记录仪，每个项目都面临独特挑战：车载场景的高温稳定性、可穿戴设备的低功耗限制、多设备分辨率适配的玄学……这些痛点促使我重新梳理HarmonyOS相机开发的技术脉络——这正是本文的起源。比如之前在一款运动相机项目中，我们最初直接复用Android
Docker 数据持久化核心：挂载（Mounts）与卷（Volumes）的区别与选择指南 z2637305611 docker 容器运维
Docker容器默认是无状态的——这意味着容器停止后，其内部生成的数据也会随之消失。为了持久化保存数据或在容器间共享数据，Docker提供了两种主要机制：挂载（Mounts）和卷（Volumes）。理解它们的区别并正确使用，是优化Docker应用架构的重要一步。一、挂载（Mounts）1.什么是挂载？挂载（通常指BindMounts）允许将宿主机上的目录或文件直接映射到容器内部，提供了一种直接访问
JavaScript反爬技术解析与应对不做超级小白 web逆向知识碎片 web前端 javascript 开发语言 ecmascript
JavaScript反爬技术解析与应对前言在当今Web爬虫与数据抓取的生态环境中，网站运营方日益关注数据安全与隐私保护，因此逐步采用多种反爬技术来限制非授权访问。本文从JavaScript角度出发，深入剖析主流反爬策略的技术原理，并探讨相应的绕过方案，以期为研究者和开发者提供系统性的理解与实践指导。1.JavaScript反爬技术概述1.1右键禁用与开发者工具防护部分网站采用JavaScript拦
SpringBoot项目中读取resource目录下的文件（六种方法） web18285997089 面试学习路线阿里巴巴 spring boot python pycharm
文章目录一、先获取绝对路径再读取文件(jar包里会获取不到)方法一：类加载器的getResource().getPath()获取目录路径方法二：类加载器的getResource().getPath()获取文件路径二、直接获取文件流（jar包可用）方法三：ClassLoader对象的getResourceAsStream()方法四：Class对象的getResourceAsStream()三、使用封
东南亚电商市场研究报告：机遇与挑战并存（Shopee、Lazada、TikTok、Tokopedia）萧十一郎@ 知识科普开发语言
一、引言1.1研究背景与目的在全球数字化浪潮的推动下，电子商务已成为经济发展的重要驱动力。东南亚地区，凭借其庞大的人口基数、快速增长的互联网普及率以及不断提升的经济水平，电商市场呈现出蓬勃发展的态势，成为全球电商领域中备受瞩目的新兴市场。东南亚拥有超过6.5亿的人口，其中年轻人口占比较高，消费潜力巨大。近年来，该地区互联网基础设施不断完善，智能手机的普及使得网络购物变得更加便捷，为电商的发展提供了
*如何在 Mac 上安装 macOS Sequoia 开发测试版* Topstip macos
在WWDC主题演讲中，Apple概述了今年秋季会推出的macOSSequoia版本的新功能。它的亮点包括iPhone镜像、专门的密码应用，以及适用于M1及更高型号的AppleIntelligence功能。Apple现在发布了macOSSequoia的第一个开发者测试版。虽然操作系统更新要到今年秋季才会公开发布，但现在测试版让用户可以立即安装并运行预发布版本。（甚至不需要是Apple开发者）本文就教
记录一次truncate导致MySQL夯住的故障猿小喵 MySQL #故障诊断与恢复 #备份恢复 mysql 数据库
目录环境信息：故障描述：处理过程：原理分析：showprocesslist结果中的systemlock含义：truncate原理：1.TRUNCATE的执行流程2、TRUNCATE表导致数据库夯住的原因3、TRUNCATE表导致数据库夯住的解决方案4、killTRUNCATE语句失败后，主从数据不一致的原因：5、为什么TRUNCATETABLEusers会影响其他表的SQL6、为什么KILL语句无
同一个App开发需求，为什么不同的App开发公司报价天差地别 Haibakeji react native react.js javascript java web app uni-app
在进行App开发项目时，不同公司的报价差异是多方面因素共同作用的结果。以下是导致这种差异的一些主要原因：地域差异不同地区的经济发展水平、生活成本和人力成本存在显著差异，一线城市的人力成本、办公成本等普遍高于二三线城市，因此位于一线城市的开发公司报价往往会更高，位于这些低人力成本地区的App开发公司往往能够提供更具竞争力的价格。技术实力与团队经验技术实力无疑是决定App开发报价的核心要素之一。一家拥
uniapp 和 webview 之间的通信 DT—— 其他 uni-app
1.背景应用使用了uniapp开发跨端应用，在uniapp中内嵌webview页面实现页面热更新效果，不需要用户单独重新安装软件即可实现页面的版本更新。2.webview通知uniapp在开发过程中我们难会遇到需要uniapp和webview来实现数据通信的场景，接下来介绍一种可行的uniapp和webview的数据通信方案。在webview中我们可以使用当前webview实例的postMessa
PX4垂起（Tiltrotor）偏航控制研究 zhao23333 PX4
PX4垂起（Tiltrotor）偏航控制研究PX4垂起（Tiltrotor）偏航控制研究1.问题描述2.过渡过程中为什么没有偏航角度控制问题1：为什么在过渡阶段固定翼位置控制没有起作用？问题2：关于virtual_attitude_setpoint的使用问题3：为什么过渡状态姿态角给定值是固定的姿态控制给出的？3.如何修改固件使倾转旋翼在过渡状态也控制角度PX4垂起（Tiltrotor）偏航控制研
【Jenkins】cmd脚本运行正常，而jenkins卡住报Process leaked file descriptors PostQuitMessage已经解决小黄人软件 jenkins 运维
使用PostQuitMessage(0);(会自动执行ExitInstance())替代exit(0);有效。cmd脚本运行正常，而jenkins卡住报Processleakedfiledescriptors.config.ini路径不对，出现MessageBox导致的。有效。windowsjenkens延时ping-n11127.0.0.1>nul使用timeout/t10/nobreak报错“
一切靠抢的带抢的都是非常赚钱的，比如抢号抢票抢购等小黄人软件经验分享
“带抢”的东西通常意味着供需极度不平衡，信息不对称，或者时间、资源有限，因此具备高利润空间。除了抢号之外，以下这些领域也符合这个特点：1.抢购类抢票：包括演唱会、热门球赛、春运火车票、热门景区门票（如故宫）等，提供代抢服务或者软件。抢鞋、抢限量潮牌：如耐克SNKRS、Supreme等品牌的限量款，通过Bot代抢再高价转卖。抢游戏账号/虚拟物品：抢注游戏ID、游戏道具、限量皮肤，再转卖给需求方。抢新
AI大模型训练教程 Small踢倒coffee_氕氘氚 python自学经验分享笔记
1.引言随着人工智能技术的快速发展，大模型（如GPT-3、BERT等）在自然语言处理、计算机视觉等领域取得了显著的成果。训练一个大模型需要大量的计算资源、数据和专业知识。本教程将带你了解如何从零开始训练一个AI大模型。2.准备工作2.1硬件要求GPU：推荐使用NVIDIA的高性能GPU，如A100、V100等。内存：至少64GBRAM。存储：SSD存储，至少1TB。#2.2软件环境操作系统：Lin
Vue 表单输入绑定，双向绑定天马3798 Vue vue.js javascript 前端 Vue 表单输入绑定 Vue 表单双向绑定
一、v-model指令用于Vue表单双向绑定用户Vue组件属性双向绑定v-model还可以用于各种不同类型的输入，、元素。它会根据所使用的元素自动使用对应的DOM属性和事件组合：文本类型的和元素会绑定valueproperty并侦听input事件；和会绑定checkedproperty并侦听change事件；会绑定valueproperty并侦听change事件。二、v-model使用案例文本姓名
使用Jupyter Notebook进行深度学习编程 - 深度学习教程 shandianfk_com ChatGPT AI jupyter 深度学习 ide
大家好，今天我们要聊聊如何使用JupyterNotebook进行深度学习编程。深度学习是人工智能领域中的一项重要技术，通过模仿人脑神经网络的方式进行学习和分析。JupyterNotebook作为一个强大的工具，可以帮助我们轻松地进行深度学习编程，尤其适合初学者和研究人员。本文将带领大家一步步了解如何在JupyterNotebook中开展深度学习项目。一、什么是JupyterNotebook？Jup
Opencv之计算机视觉一闭月之泪舞计算机视觉计算机视觉 opencv python
一、环境准备使用opencv库来实现简单的计算机视觉。需要安装两个库：opencv-python和opencv-contrib-python，版本可以自行选择，注意不同版本的opencv中的某些函数名和用法可能不同pipinstallopencv-python==3.4.18.65-ihttps://pypi.tuna.tsinghua.edu.cn/simplepipinstallopencv-
大语言模型微调和大语言模型应用的区别？ AI Echoes 人工智能深度学习 deepseek 机器学习算法
大语言模型微调和大语言模型应用的区别？关键要点微调大型语言模型（LLM）是调整预训练模型以适应特定任务或领域的过程，研究表明这能显著提升性能。大型语言模型应用是指将LLM用于实际问题解决或任务执行，如聊天机器人或文本生成。微调和应用的不同在于：微调是准备阶段，应用是最终使用；使用微调模型通常在特定领域表现更好，而预训练模型更适合通用任务。什么是微调大型语言模型？微调大型语言模型是指取一个已经预训练
计算机视觉总结 Trank-Lw 计算机视觉深度学习人工智能
以下是针对上述问题的详细解答，并结合代码示例进行说明：1.改进YOLOv5人脸检测模块，复杂光照场景准确率从98.2%提升至99.5%优化具体过程：光照补偿：在数据预处理阶段，采用自适应光照补偿算法，对图像进行实时增强，以减少光照变化对人脸检测的影响。数据增强：在训练数据中增加复杂光照场景下的样本，如强光、弱光、背光等，通过数据增强提高模型对不同光照条件的适应性。模型调整：对YOLOv5模型的网络
XPipe：一款新型开源终端管理神器修己xj 工具开源
最近，一位朋友在使用Docker时遇到了一个问题：他对宿主机与容器之间的文件复制以及在容器内执行命令等操作感到困惑。这让我开始思考，如果有一款远程管理工具能够直接连接到容器内部，操作是否会变得更加便捷？恰巧，今天在浏览GitHub时，我发现了这样一款名为XPipe的工具。工具介绍XPipe是一款创新的Shell连接中心和远程文件管理器，它能够让你从本地机器轻松访问整个服务器基础设施。这款工具运行在
入门级带你实现一个安卓智能家居APP（2）kotlin版本一粒程序米 android kotlin 智能家居 WiFi 单片机
前言上一篇写过java版本的实现，这一篇就写一下kotlin版本的吧。效果展示本APP是通过tcp/ip协议与连了WiFi的单片机通信。其实除了主活动类和新建项目时有一丢丢不同，其他的都是一样的哈~第一步：你得会一点点kotlin基础，建议看一本书，是郭霖大神些的《第一行代码》第三版，里面除了安卓的基础教学，还有kotlin的。第二步：建议看一本书，是郭霖大神些的《第一行代码》，先入门安卓基础。不
我们应该用尼古拉特斯拉的振动和频率的角度去观察整个世界包括电机万物的旋转呢？热爱电气数学建模
我不能去否定任何科学，也不能说谁的定义不准确，但是我坚信而我想的是是否粒子之间的自旋会扰动时空产生概率性的量子涨落现象呢？那么我们可以想办法设想一下结合尼古拉特斯拉的引力论1.特斯拉的哲学基础：振动、能量与介质特斯拉的理论体系以三个核心概念为基础振动是一切现象的本质：物质是能量的一种振动形式，不同频率的振动对应不同的物质态。以太假说：宇宙中存在一种充满空间的“介质”（以太），它是电磁波和引力的传播
MySQL 中 int (1) 和 int (10) 的区别详解阿贾克斯的黎明游戏开发 mysql 数据库
目录MySQL中int(1)和int(10)的区别详解在MySQL数据库的使用过程中，我们创建数据表时经常会用到整数类型，比如int。而细心的开发者可能会注意到，int后面可以跟一个数字，像int(1)和int(10)，这两者到底有什么区别呢？今天我们就来深入探讨一下。在MySQL中，int类型后面括号里的数字M，代表的是显示宽度，最大取值为255。需要明确的是，这个显示宽度和该类型可以存储的范围
直面失能危机，众托帮守护家庭防线市场
根据中国保险行业协会发布的《中国中老年人风险保障研究》,人生不同阶段面临的风险复杂多变。45-55岁人群主要担忧重疾与高额医疗支出,而步入60岁后,失能风险一跃成为老年人心中的头等大事,与医疗、重疾风险共同构成晚年生活的挑战。中国老龄科学研究中心数据显示,截至2024年末,我国60岁及以上老年人中,失能、半失能群体已达约4400万人,且这一数字正急剧攀升。预计到2050年,失能、半失能老人数量将飙
HTML语言的贪心算法宇瞳月包罗万象 golang 开发语言后端
HTML语言的贪心算法：理论与实践引言在编程和算法研究中，贪心算法是一种广泛应用的解决问题的方法。它通过对每一阶段选择最优解的方式来构建整个问题的解决方案。贪心算法不一定能在所有情况下得到最优解，但在许多实际问题中，它能够提供一个足够好的近似解。本文将探讨贪心算法的基本概念、典型应用、优缺点，并结合HTML语言的特点，提出一些具体的实现示例和思考。一、贪心算法的基本概念贪心算法是一种求解最优化问题
rabbitmq笔记 java
消息可靠性rabbitmq向消费者投递消息后，有可能会丢失，有可能会重复投递。比如：投递过程网络故障消费者收到消息后宕机消费者接收到消息后处理不当导致异常...rabbitmq需要做的事：机制消费者确认机制消费者处理成功后需要通知发幂等性幂等性指同一个业务，执行一次或多次对业务状态的影响是一致的例如唯一消息id业务状态判断但是数据的更新往往不是幂等的，所以需要确保幂等性确保幂等性方法有两种方案唯一
IDC权威认证！永洪科技入选 IDC「GBI图谱」，点亮生成式 BI 价值灯塔永洪科技科技人工智能 BI 大数据数据分析
大数据市场正在稳步前进，生成式AI已成为厂商服务的重点方向，其发展离不开数据底座建设和数据工程管理，反过来AI也会帮助开发运维人员、业务人员和管理层更好地使用、查询数据。IDC调研数据显示，在生成式AI的驱动下，未来5年企业在数据管理和数据分析基础设施建设的投资增长率将分别达到8.7%和9.2%。近日，国际咨询机构IDC发布了《中国数据智能市场生态图谱V5.0》，在这一领域，永洪科技以其创新前沿的
笔记本Win7系统无线网名称显示乱码解决方案 mmoo_python windows
笔记本Win7系统无线网名称显示乱码解决方案在使用Windows7操作系统的笔记本电脑时，用户可能会遇到无线网络名称显示乱码的问题。这一问题不仅影响了用户识别无线网络的便利性，还可能阻碍正常的网络连接。本文将详细介绍解决这一问题的方法，帮助用户恢复无线网名称的正常显示。具体解决方法1.打开控制面板首先，我们需要进入Windows7的控制面板。可以通过点击开始菜单，然后在搜索框中输入“控制面板”来快
景联文科技：以高质量数据标注推动人工智能领域创新与发展景联文科技科技人工智能数据标注
在当今这个由数据驱动的时代，高质量的数据标注对于推动机器学习、自然语言处理（NLP）、计算机视觉等领域的发展具有不可替代的重要性。数据标注过程涉及对原始数据进行加工，通过标注特定对象的特征来生成能够被机器学习模型识别和使用的编码格式，从而使数据更具有意义和可解读性。数据标注的主要类型包括：图像标注：指在图片中标识出目标物体的位置、形状或类别等信息，如自动驾驶技术中的行人、车辆及交通标志的识别。文本
多线程编程之卫生间周凡杨 java 并发卫生间线程厕所
如大家所知，火车上车厢的卫生间很小，每次只能容纳一个人，一个车厢只有一个卫生间，这个卫生间会被多个人同时使用，在实际使用时，当一个人进入卫生间时则会把卫生间锁上，等出来时打开门，下一个人进去把门锁上，如果有一个人在卫生间内部则别人的人发现门是锁的则只能在外面等待。问题分析：首先问题中有两个实体，一个是人，一个是厕所，所以设计程序时就可以设计两个类。人是多数的，厕所只有一个（暂且模拟的是一个车厢）。
How to Install GUI to Centos Minimal sunjing linux Install Desktop GUI
http://www.namhuy.net/475/how-to-install-gui-to-centos-minimal.html I have centos 6.3 minimal running as web server. I’m looking to install gui to my server to vnc to my server. You can insta
Shell 函数 daizj shell 函数
Shell 函数 linux shell 可以用户定义函数，然后在shell脚本中可以随便调用。 shell中函数的定义格式如下： [function] funname [()]{ action; [return int;] } 说明： 1、可以带function fun() 定义，也可以直接fun() 定义,不带任何参数。 2、参数返回
Linux服务器新手操作之一周凡杨 Linux 简单操作
1.whoami 当一个用户登录Linux系统之后，也许他想知道自己是发哪个用户登录的。此时可以使用whoami命令。 [ecuser@HA5-DZ05 ~]$ whoami e
浅谈Socket通信（一）朱辉辉33 socket
在java中ServerSocket用于服务器端，用来监听端口。通过服务器监听，客户端发送请求，双方建立链接后才能通信。当服务器和客户端建立链接后，两边都会产生一个Socket实例，我们可以通过操作Socket来建立通信。首先我建立一个ServerSocket对象。当然要导入java.net.ServerSocket包 ServerSock
关于框架的简单认识西蜀石兰框架
入职两个月多，依然是一个不会写代码的小白，每天的工作就是看代码，写wiki。前端接触CSS、HTML、JS等语言，一直在用的CS模型，自然免不了数据库的链接及使用，真心涉及框架，项目中用到的BootStrap算一个吧，哦，JQuery只能算半个框架吧，我更觉得它是另外一种语言。后台一直是纯Java代码，涉及的框架是Quzrtz和log4j。都说学前端的要知道三大框架，目前node.
You have an error in your SQL syntax; check the manual that corresponds to your 林鹤霄
You have an error in your SQL syntax; check the manual that corresponds to your MySQL server version for the right syntax to use near 'option,changed_ids ) values('0ac91f167f754c8cbac00e9e3dc372
MySQL5.6的my.ini配置 aigo mysql
注意：以下配置的服务器硬件是：8核16G内存 [client] port=3306 [mysql] default-character-set=utf8 [mysqld] port=3306 basedir=D:/mysql-5.6.21-win
mysql 全文模糊查找便捷解决方案 alxw4616 mysql
mysql 全文模糊查找便捷解决方案 2013/6/14 by 半仙 [email protected] 目的: 项目需求实现模糊查找. 原则: 查询不能超过 1秒. 问题: 目标表中有超过1千万条记录. 使用like '%str%' 进行模糊查询无法达到性能需求. 解决方案: 使用mysql全文索引. 1.全文索引 : MySQL支持全文索引和搜索功能。MySQL中的全文索
自定义数据结构链表(单项 ,双向,环形) 百合不是茶单项链表双向链表
链表与动态数组的实现方式差不多, 数组适合快速删除某个元素链表则可以快速的保存数组并且可以是不连续的单项链表;数据从第一个指向最后一个实现代码: //定义动态链表 clas
threadLocal实例 bijian1013 java thread java多线程 threadLocal
实例1： package com.bijian.thread; public class MyThread extends Thread { private static ThreadLocal tl = new ThreadLocal() { protected synchronized Object initialValue() { return new Inte
activemq安全设置—设置admin的用户名和密码 bijian1013 java activemq
ActiveMQ使用的是jetty服务器, 打开conf/jetty.xml文件，找到 <bean id="adminSecurityConstraint" class="org.eclipse.jetty.util.security.Constraint"> <p
【Java范型一】Java范型详解之范型集合和自定义范型类 bit1129 java
本文详细介绍Java的范型，写一篇关于范型的博客原因有两个，前几天要写个范型方法(返回值根据传入的类型而定)，竟然想了半天，最后还是从网上找了个范型方法的写法；再者，前一段时间在看Gson, Gson这个JSON包的精华就在于对范型的优雅简单的处理，看它的源代码就比较迷糊，只其然不知其所以然。所以，还是花点时间系统的整理总结下范型吧。范型内容范型集合类范型类
【HBase十二】HFile存储的是一个列族的数据 bit1129 hbase
在HBase中，每个HFile存储的是一个表中一个列族的数据，也就是说，当一个表中有多个列簇时，针对每个列簇插入数据，最后产生的数据是多个HFile，每个对应一个列族，通过如下操作验证 1. 建立一个有两个列族的表 create 'members','colfam1','colfam2' 2. 在members表中的colfam1中插入50*5
Nginx 官方一个配置实例 ronin47 nginx 配置实例
user www www; worker_processes 5; error_log logs/error.log; pid logs/nginx.pid; worker_rlimit_nofile 8192; events { worker_connections 4096;} http { include conf/mim
java-15.输入一颗二元查找树，将该树转换为它的镜像，即在转换后的二元查找树中，左子树的结点都大于右子树的结点。用递归和循环 bylijinnan java
//use recursion public static void mirrorHelp1(Node node){ if(node==null)return; swapChild(node); mirrorHelp1(node.getLeft()); mirrorHelp1(node.getRight()); } //use no recursion bu
返回null还是empty bylijinnan java apache spring 编程
第一个问题，函数是应当返回null还是长度为0的数组（或集合）？第二个问题，函数输入参数不当时，是异常还是返回null？先看第一个问题有两个约定我觉得应当遵守： 1.返回零长度的数组或集合而不是null（详见《Effective Java》）理由就是，如果返回empty，就可以少了很多not-null判断： List<Person> list
[科技与项目]工作流厂商的战略机遇期 comsci 工作流
在新的战略平衡形成之前，这里有一个短暂的战略机遇期，只有大概最短6年，最长14年的时间，这段时间就好像我们森林里面的小动物，在秋天中，必须抓紧一切时间存储坚果一样，否则无法熬过漫长的冬季。。。。在微软，甲骨文，谷歌，IBM,SONY
过度设计-举例 cuityang 过度设计
过度设计，需要更多设计时间和测试成本，如无必要，还是尽量简洁一些好。未来的事情，比如访问量，比如数据库的容量，比如是否需要改成分布式都是无法预料的再举一个例子，对闰年的判断逻辑：　　1、 if($Year%4==0) return True; else return Fasle; 　　2、if ( ($Year%4==0 &am
java进阶，《Java性能优化权威指南》试读 darkblue086 java性能优化
记得当年随意读了微软出版社的.NET 2.0应用程序调试，才发现调试器如此强大，应用程序开发调试其实真的简单了很多，不仅仅是因为里面介绍了很多调试器工具的使用，更是因为里面寻找问题并重现问题的思想让我震撼，时隔多年，Java已经如日中天，成为许多大型企业应用的首选，而今天，这本《Java性能优化权威指南》让我再次找到了这种感觉，从不经意的开发过程让我刮目相看，原来性能调优不是简单地看看热点在哪里，
网络学习笔记初识OSI七层模型与TCP协议 dcj3sjt126com 学习笔记
协议：在计算机网络中通信各方面所达成的、共同遵守和执行的一系列约定　　计算机网络的体系结构：计算机网络的层次结构和各层协议的集合。　　两类服务：　　面向连接的服务通信双方在通信之前先建立某种状态，并在通信过程中维持这种状态的变化，同时为服务对象预先分配一定的资源。这种服务叫做面向连接的服务。　　面向无连接的服务通信双方在通信前后不建立和维持状态，不为服务对象
mac中用命令行运行mysql dcj3sjt126com mysql linux mac
参考这篇博客：http://www.cnblogs.com/macro-cheng/archive/2011/10/25/mysql-001.html 感觉workbench不好用（有点先入为主了）。 1，安装mysql 在mysql的官方网站下载 mysql 5.5.23 http://www.mysql.com/downloads/mysql/，根据我的机器的配置情况选择了64
MongDB查询（1）——基本查询[五] eksliang mongodb mongodb 查询 mongodb find
MongDB查询转载请出自出处：http://eksliang.iteye.com/blog/2174452 一、find简介 MongoDB中使用find来进行查询。 API:如下 function ( query , fields , limit , skip, batchSize, options ){.....} 参数含义： query:查询参数 fie
base64，加密解密经融加密，对接 y806839048 经融加密对接
String data0 = new String(Base64.encode(bo.getPaymentResult().getBytes(("GBK")))); String data1 = new String(Base64.decode(data0.toCharArray()),"GBK"); // 注意编码格式，注意用于加密，解密的要是同
JavaWeb之JSP概述 ihuning javaweb
什么是JSP？为什么使用JSP？ JSP表示Java Server Page，即嵌有Java代码的HTML页面。使用JSP是因为在HTML中嵌入Java代码比在Java代码中拼接字符串更容易、更方便和更高效。 JSP起源在很多动态网页中，绝大部分内容都是固定不变的，只有局部内容需要动态产生和改变。如果使用Servl
apple watch 指南啸笑天 apple
1. 文档 WatchKit Programming Guide（中译在线版 By @CocoaChina）译文译者原文概览 - 开始为 Apple Watch 进行开发 @星夜暮晨 Overview - Developing for Apple Watch 概览 - 配置 Xcode 项目 - Overview - Configuring Yo
java经典的基础题目 macroli java 编程
1.列举出 10个JAVA语言的优势 a:免费，开源，跨平台(平台独立性)，简单易用，功能完善，面向对象，健壮性，多线程，结构中立，企业应用的成熟平台, 无线应用 2.列举出JAVA中10个面向对象编程的术语 a:包，类，接口，对象，属性，方法，构造器，继承，封装，多态，抽象，范型 3.列举出JAVA中6个比较常用的包 Java.lang;java.util;java.io;java.sql;ja
你所不知道神奇的js replace正则表达式 qiaolevip 每天进步一点点学习永无止境纵观千象 regex
var v = 'C9CFBAA3CAD0'; console.log(v); var arr = v.split(''); for (var i = 0; i < arr.length; i ++) { if (i % 2 == 0) arr[i] = '%' + arr[i]; } console.log(arr.join('')); console.log(v.r
[一起学Hive]之十五-分析Hive表和分区的统计信息(Statistics) superlxw1234 hive hive分析表 hive统计信息 hive Statistics
关键字：Hive统计信息、分析Hive表、Hive Statistics 类似于Oracle的分析表，Hive中也提供了分析表和分区的功能，通过自动和手动分析Hive表，将Hive表的一些统计信息存储到元数据中。表和分区的统计信息主要包括：行数、文件数、原始数据大小、所占存储大小、最后一次操作时间等； 14.1 新表的统计信息对于一个新创建
Spring Boot 1.2.5 发布 wiselyman spring boot
Spring Boot 1.2.5已在7月2日发布，现在可以从spring的maven库和maven中心库下载。这个版本是一个维护的发布版，主要是一些修复以及将Spring的依赖提升至4.1.7(包含重要的安全修复)。官方建议所有的Spring Boot用户升级这个版本。项目首页 | 源

计算机视觉研究那些事 ｜CVPR 2020 论文分享会

你可能感兴趣的:(计算机视觉研究那些事 ｜CVPR 2020 论文分享会)

计算机视觉研究那些事｜CVPR 2020 论文分享会

你可能感兴趣的:(计算机视觉研究那些事｜CVPR 2020 论文分享会)