PaperWeekly

CVPR 2019 | 旷视研究院提出TACNet，刷新时空动作检测技术新高度

全球计算机视觉三大顶级会议之一 CVPR 2019 将于当地时间 6 月 16-20 日在美国洛杉矶举办。届时，旷视研究院将带领团队远赴盛会，助力计算机视觉技术的交流与落地。在此之前，旷视每周会介绍一篇被 CVPR 2019 接收的论文，本文是第 11 篇，旷视研究院（R4D组）出一个过渡感知的上下文网络——TACNet，可以显著提升时空动作检测的性能。

论文名称：TACNet: Transition-Aware Context Network for Spatio-Temporal Action Detection

论文链接：https://arxiv.org/abs/1905.13417

导语
简介
模型
- 框架
- 时序上下文检测器
- 过渡感知分类器
实验
- 与当前最佳的对比
结论
参考文献
往期解读

导语

在时空动作检测（spatio-temporal action detection）领域，当前最佳方法效果优秀，但是在一些方面，比如时序事件检测，依然无法令人满意。原因在于，一些模糊不清的、和真实动作很相似的动作被当作目标动作来处理，即使训练良好的网络也概莫能外。

旷视研究员把这些模糊不清的样本称之为“过渡性状态”，并提出一个过渡感知的上下文网络——TACNet，来辨识这些过渡状态。TACNet 包含两个关键组件：时序上下文检测器和过渡感知分类器。前者通过构建一个循环检测器，可以从连续的时间复杂度中提取长期的上下文信息；后者则通过同时分类动作和过渡性状态以进一步区分过渡性状态。

因此，TACNet 可以显著提升时空动作检测的性能。大量实验也在 UCF101-24 和 J-HMDB 数据集上证明 TACNet 有效，它不仅在剪辑的 J-HMDB 数据集上取得有竞争力的结果，还在未剪辑的 UCF101-24 数据集上 frame-mAP 和 video-mAP 两个指标方面大幅超越当前最佳方法。

简介

动作检测任务旨在同时分类视频中当前的动作并对其进行时空定位，近期由于其广泛的应用场景，受到了越来越多研究者的重视，并成长为异常检测、人机交互、城市管理等领域的关键技术。

当前，绝大多数动作检测方法把时空检测分为两个阶段，即空间检测和时序检测。这些方法首先借助深度检测器从帧中做空间动作检测；接着，通过连接帧层面的检测以及运用一些目标函数，执行时序检测以创造时空行为块。

这些方法把视频帧看作是一个个独立图像，从而无法利用视频的时间连续性，因此其检测结果实际上无法令人满意。

为此，一种称之为 ACT 的方法则通过堆栈策略捡起短期的时间连续性，显著提升时空动作检测的性能。但是，ACT 依然无法提取对于动作检测而言异常关键的长期的时序上下文信息。进而，由于动作检测的两个阶段相互分离，ACT 无法彻底纠正由含糊的样本所造成的时间误差，如图 1 红框所示。

▲ 图1：过渡性状态图示

本文把含糊的样本定义为“过渡性状态”，它与动作持续时间很接近，但并不属于动作的范畴。根据 ACT 检测器的误差分析，35%-40% 的误差是时间误差，它主要由过渡性状态造成。因此，如果要进一步提升时空动作检测的性能，提取长期的语境信息并区分过渡性状态就变得十分关键。

上述发现开启了本文工作。具体而言，旷视研究员提出一个过渡感知上下文网络——TACNet，它包含两个核心组件，即时序语境检测器和过渡感知分类器，前者的设计是基于标准的 SSD 框架，但是通过嵌入若干个多尺度的双向 Conv-LSTM 单元可以编码长期的语境信息（据知，把 Conv-LSTM 和 SSD 相结合，以打造一个用于动作检测的训练检测器，这是第一次）；后者则通过同时分类动作和动作状态，以区分过渡性状态。

更为重要的是，旷视研究院进一步提出一个共模和差模网络加速 TACNet 的收敛，从而使 TACNet 不仅可以提取长期的时序上下文信息，还能区分过渡性状态。在UCF101-24 和 J-HMDB 两个数据集上，TACNet在帧和视频两项指标上均取得了引人注目的提升。

TACNet 框架

▲ 图2：TACNet整体架构

如图 2 所示，TACNet 包含两个模块，双流的时序上下文检测和过渡感知的分类和回归。在时序语境检测器方面，旷视研究员使用双流 SSD 做动作检测，正如 ACT 检测器那样。尽管如此，为提取长期的时序语境信息，旷视研究员还嵌入若干个双向 Conv-LSTM 单元到不同的特征图（不同尺寸）。

在过渡感知分类器方面，为区分过渡性状态，旷视研究员设计两个分类器以同时分类动作和动作状态，并进一步提出一个共模和差模的网络方案，加速 TACNet 整体的收敛。

通过与回归相结合，过渡感知分类器可从空间上检测动作，同时从时间上预测时序边界。需要注意的是，本文基于的则是标准的 SSD，但实际可在不同的检测器基础上进行设计。

时序上下文检测器

长期的时序上下文信息对时空动作检测来说至关重要。然而，标准 SSD 是从不同大小的多个特征图中执行动作检测的，它并不考虑时序语境信息。为提取时序语境，旷视研究员在 SSD 中嵌入 Bi-ConvLSTM 单元，以设计一个检测动作的循环检测器。

作为 LSTM 的一种，ConvLSTM 可以编码长期的信息，并更适宜处理视频这样的数据，因为 ConvLSTM 单元可以用卷积操作替代 LSTM 单元中全连接的相乘操作，从而能随着时间保持帧的空间结构。因此，在本文框架中使用 ConvLSTM 单元提取长期时序信息是可行的。

具体而言，旷视研究员在 SSD 每两个相邻层之间嵌入一个 Bi-ConvLSTM 单元，形成一个时序语境检测器，如图 2 所示。本文考虑了前向与反向两个输入序列，并为此采用一对时序对称 ConvLSTM；接着，旷视研究员借助这一 Bi-ConvLSTM 从每一个视频帧获取两类特征，这些特征被 1 × 1 卷积层连接和转换，以消除多余的通道。

通过这种方法，时序上下文检测器可以利用 SSD 的优势，并提取长期时序语境信息。

过渡感知分类器

过渡性状态中的实例与目标动作具有相似性，因此检测较容易发生混淆。大多数现有方法将其作为背景，并依赖后处理算法剪裁它们。然而，由于这些状态与背景非常不同（比如场景和其他目标），将其看作背景会加大类内差异，降低检测性能。在本文中，旷视研究院提出一个过渡感知的分类器，以同时进行动作分类和过渡状态分类，具体细节如图 3 所示：

▲ 图3：过渡感知分类器图示

实验

与当前最佳的对比

在 frame-mAP 和 video-mAP 两个指标上，本文把 TACNet 与当前最优方法在数据集 J-HMDB 和 UCF101-24 上做了对比，结果如表 3 所示。由表可知，在时序未经修剪的 UCF101-24 数据集上，TACNet 在两个指标上均超越了先前同类方法。

▲ 表3：在J-HMDB和UCF101上，TACNet与当前最佳方法的结果对比

结论

本文旨在推进动作检测的性能。具体而言，旷视研究员发现，提取长期的时序上下文分析并区分过渡性状态十分关键。由此，旷视研究院提出 TACNet，它包含一个时序上下文检测器和一个过渡感知分类器。

由大量的实验结果可知，TACNet 异常奏效，并在有挑战性的、未剪辑的数据集上刷新了当前最佳结果，这主要得益于 TACNet 使用的时序检测和过渡感知方法。

未来，旷视研究院将从行为者与其周遭的人物（或物体）的关系着手，持续探索，进一步提升时序检测的能力。

传送门

欢迎各位同学关注旷视研究院 Detection 组及知乎专栏：

http://zhuanlan.zhihu.com/c_1065911842173468672

简历可以投递给 Detection 组负责人俞刚：

[email protected]

参考文献

[1] V. Kalogeiton, P. Weinzaepfel, V. Ferrari, and C. Schmid. Action tubelet detector for spatio-temporal action localization. In ICCV, 2017.

[2] Z. Li, K. Gavrilyuk, E. Gavves, M. Jain, and C. G. Snoek. Videolstm convolves, attends and flows for action recognition. Computer Vision and Image Understanding, 166:41– 50, 2018.

[3] X. Peng and C. Schmid. Multi-region two-stream r-cnn for action detection. In ECCV, pages 744–759, 2016.

[4] G. Singh, S. Saha, M. Sapienza, P. Torr, and F. Cuzzolin. Online real-time multiple spatiotemporal action localisation and prediction. In CVPR, pages 3637–3646, 2017.

[5] G. Yu and J. Yuan. Fast action proposals for human action detection and search. In CVPR, pages 1302–1311, 2015.

[6] K. Soomro, A. R. Zamir, and M. Shah. Ucf101: A dataset of 101 human actions classes from videos in the wild. arXiv preprint arXiv:1212.0402, 2012.

[7] H. Jhuang, J. Gall, S. Zuffi, C. Schmid, and M. J. Black. Towards understanding action recognition. In ICCV, pages 3192–3199, 2013.

往期解读：

CVPR 2019 | 旷视提出GIF2Video：首个深度学习GIF质量提升方法
CVPR 2019 | 旷视Oral论文提出GeoNet：基于测地距离的点云分析深度网络
CVPR 2019 | 旷视提出超分辨率新方法Meta-SR：单一模型实现任意缩放因子
CVPR 2019 | 旷视实时语义分割技术DFANet：高清虚化无需双摄
CVPR 2019 | 旷视研究院提出ML-GCN：基于图卷积网络的多标签图像识别模型
CVPR 2019 | 旷视研究院提出新型损失函数：改善边界框模糊问题
CVPR 2019 | 旷视研究院提出Geo-CNN：建模3D点云的局部几何结构
CVPR 2019 | 旷视研究院提出DeepLiDAR：通过曲面法线实现稠密深度预测
CVPR 2019 | 旷视研究院提出极轻量级年龄估计模型C3AE
CVPR 2019 | 旷视研究院提出用于全景分割的端到端闭环网络OANet

点击以下标题查看更多往期内容：

CVPR 2019 | 无监督领域特定单图像去模糊
论文盘点：CVPR 2019 - 文本检测专题
近期值得读的10篇GAN进展论文
小样本学习（Few-shot Learning）综述
万字综述之生成对抗网络（GAN）
可逆ResNet：极致的暴力美学
CVPR 2019 | 基于池化技术的显著性目标检测
CVPR 2019 | 天秤座R-CNN：全面平衡目标检测器

#投稿通道#

让你的论文被更多人看到

如何才能让更多的优质内容以更短路径到达读者群体，缩短读者寻找优质内容的成本呢？答案就是：你不认识的人。

总有一些你不认识的人，知道你想知道的东西。PaperWeekly 或许可以成为一座桥梁，促使不同背景、不同方向的学者和学术灵感相互碰撞，迸发出更多的可能性。

PaperWeekly 鼓励高校实验室或个人，在我们的平台上分享各类优质内容，可以是最新论文解读，也可以是学习心得或技术干货。我们的目的只有一个，让知识真正流动起来。

? 来稿标准：

• 稿件确系个人原创作品，来稿需注明作者个人信息（姓名+学校/工作单位+学历/职位+研究方向）

• 如果文章并非首发，请在投稿时提醒并附上所有已发布链接

• PaperWeekly 默认每篇文章都是首发，均会添加“原创”标志

? 投稿邮箱：

• 投稿邮箱：[email protected]

• 所有文章配图，请单独在附件中发送

• 请留下即时联系方式（微信或手机），以便我们在编辑发布时和作者沟通

现在，在「知乎」也能找到我们了

进入知乎首页搜索「PaperWeekly」

点击「关注」订阅我们的专栏吧

关于PaperWeekly

PaperWeekly 是一个推荐、解读、讨论、报道人工智能前沿论文成果的学术平台。如果你研究或从事 AI 领域，欢迎在公众号后台点击「交流群」，小助手将把你带入 PaperWeekly 的交流群里。

▽ 点击 | 阅读原文 | 获取最新论文推荐

Python数据分析高频面试题及答案闲人编程程序员面试 python 数据分析面试题核心
目录1.基础知识2.数据处理3.数据可视化4.机器学习模型5.进阶问题6.数据清洗与预处理7.数据转换与操作8.时间序列分析9.高级数据分析技术10.数据降维与特征选择11.模型评估与优化12.数据操作与转换13.数据筛选与分析14.数据可视化与报告15.数据统计与分析16.高级数据处理以下是一些Python数据分析的高频核心面试题及其答案，涵盖了基础知识、数据1.基础知识问1：Python中列表
《电子制作从零开始》第1章：电子制作入门请向我看齐电子电路电子电路
第1章：电子制作入门1.1走进电子制作的世界电子制作的魅力与应用领域创造力的体现：电子制作就像是一场科技与创意的结合。通过自己的双手，将各种电子元件巧妙地组合在一起，创造出具有各种功能的电子设备，从简单的闪烁灯到复杂的智能机器人，这个过程能够充分发挥个人的创造力。技术探索的乐趣：在制作过程中，可以深入了解电子技术的原理。例如，通过制作一个小型的音频放大器，能直观地理解信号放大的过程，以及电容、电阻
一个非常好用的图片切割工具（c# winform开发）源之缘-OFD解决方案之道 c#winform
本人业余时间开发了一个图片切割工具，非常好用，也很灵活！特别对大型图片切割，更能体现出该软件的优势！开发工具为winform功能说明可以设定切割的高度和宽度。切割线可以上下拖动，可以增加一个切割区域，可设定某个区域不参与切割。主要技术点分析切割区域确定每个切割区域是一个长方形。用一个结构标识该属性。1classSpliteMoveIndex2{3publicenumEN_DIR4{5NON,6HO
2025年全面推广数电票，这些常识你必须知道！源之缘-OFD解决方案之道数电票
数电票（全称：数字化电子发票）是中国税务部门推广的一种新型电子发票形式，旨在通过数字化手段提升发票管理的效率和透明度。数电票是增值税发票的一种，完全以电子形式存在，不再需要纸质打印，具有高效、环保、便捷等特点。1.数电票的背景随着信息技术的快速发展，传统的纸质发票逐渐暴露出管理成本高、易伪造、流转效率低等问题。为了推动税务管理的现代化，中国税务部门推出了数电票，作为增值税发票的数字化升级版本。数电
随机应变：网站的可扩展性架构迈克雷（MichaelRay）架构之美
国内某大型互联网企业经常因为对同行的产品进行微创新，然后推出自己的产品而遭人诟病，不讨论这种做法是否合适，我们分析这些产品，发现大多数都比原创产品有更好的用户体验。这些产品常常后来居上，更速度地推出新功能，吸引用户注意，进而占据市场。微信从发布到拥有1亿用户，仅仅用了一年的时间。而据说摇一摇这个功能是两个实习生用一个星期就开发完成上线的。使用TOP（TaobaoOpenAPI），一个技术熟练的淘宝
Pytorch 三小时极限入门教程 power-辰南人工智能深度学习 pytorch 人工智能
一、引言在当今的人工智能领域，深度学习占据了举足轻重的地位。而Pytorch作为一款广受欢迎的深度学习框架，以其简洁、灵活的特性，吸引了大量开发者投身其中。无论是科研人员探索前沿的神经网络架构，还是工程师将深度学习技术落地到实际项目，Pytorch都提供了强大的支持。本教程将带你从零基础开始，一步步深入了解Pytorch的核心知识，助你顺利踏上深度学习的征程。二、Pytorch基础环境搭建安装An
【YOLOv8杂草作物目标检测】 stsdddd YOLO目标检测目标检测 YOLO 目标检测人工智能
YOLOv8杂草目标检测算法介绍模型和数据集下载算法介绍YOLOv8在禾本科杂草目标检测方面有显著的应用和效果。以下是一些关键信息的总结：农作物幼苗与杂草检测系统：基于YOLOv8深度学习框架，通过2822张图片训练了一个目标检测模型，用于检测田间的农作物幼苗与杂草对象。该系统支持图片、视频以及摄像头进行目标检测，并能保存检测结果。系统界面可实时显示目标位置、目标总数、置信度、用时等信息。YOLO
海康威视SDK常见错误码熊文豪语音识别人工智能
错误码宏定义描述0NET_DVR_NOERROR没有错误1NET_DVR_PASSWORD_ERROR用户名密码错误2NET_DVR_NOENOUGHPRI权限不足3NET_DVR_NOINITSDK未初始化4NET_DVR_CHANNEL_ERROR通道号错误5NET_DVR_OVER_MAXLINK连接到的设备端口超出最大数6NET_DVR_VERSIONNOMATCH版本不匹配7NET_DV
JavaWeb原生框架开发JSP+Servlet+JDBC案例秦老师Q JavaWeb基础 java servlet 开发语言
目录概要功能技术名词解释技术细节1.项目列表2.网页3.Servlet小结概要JavaWeb开发案例，使用JSP、Servlet、JDBC原生框架技术，实现用户模块的功能开发，主要用于学习。功能1.注册2.登录3.用户模块3.1查询用户信息3.2删除用户信息3.3修改用户信息技术名词解释JSP：全称JavaServerPages,是由Sun公司主导创建的一种动态网页技术标准，JSP中可以编写Jav
Qt开发技术【C++ 实现类的二进制序列化与反序列化】增援未来章北海 QT C++学习 qt c++数据库
一、思考Qt本身的QByteArray和QDataStreamQDataStream和QByteArray是Qt框架中用于数据序列化和反序列化的类。QDataStream可以将Qt数据类型（如QString、QByteArray等）序列化为二进制格式，并写入文件或网络流中。同时，也可以从文件或网络流中读取二进制数据并反序列化成相应的数据类型。但是在嵌入式中使用代码比较冗余二、实现一个比较简单的仅对
【视觉惯性SLAM：十五、ORB-SLAM3中的IMU预积分】 KeyPan 视觉惯性SLAM 计算机视觉视觉检测
15.1视觉惯性紧耦合15.1.1视觉惯性紧耦合的重要性视觉惯性紧耦合（Visual-InertialTightCoupling）在ORB-SLAM3中的作用不可替代，是实现高鲁棒性和高精度定位的核心技术。单一的视觉SLAM主要依赖于图像特征进行定位和建图，这种方法虽然能够在许多环境中获得良好的效果，但其鲁棒性容易受到动态变化、光照条件恶化以及环境特征稀缺等因素的限制。例如，昏暗场景或快速运动可能
融云 IM 干货丨获取会话列表或者历史消息报 25101 的错误？融云im即时通讯
出现获取会话列表或者历史消息报25101错误，主要有以下几种原因及解决方法：融云平台1、SDK版本过低：如果未执行撤回动作却出现25101报错，这是低版本SDK的已知问题，建议升级至最新SDK。2、未开通单群聊云存储服务：出现25101报错还可能是由于未开通单群聊云存储服务。可到开发者后台-IM商用版开通该服务，服务开通后30分钟左右生效。其他平台若以上平台的解决方法均不适用，建议检查以下通用方面
如何在Node.js里实现依赖注入前端
什么是依赖注入依赖注入是一种用于在开发过程中实现控制反转（IoC）的技术。在IoC中，对程序流的控制是颠倒的：依赖项不是控制其依赖项的创建和管理的组件，而是从外部源提供给组件。在传统的编程模式中，一个组件可能会直接创建并管理它所依赖的其他组件，这会导致组件之间的耦合度较高，难以维护和测试。控制反转是一种设计原则，它改变了组件之间的控制关系。在IoC中，组件不再自己创建和管理它所依赖的组件，而是将这
记录搭建一个私人搜索引擎
本人很喜欢搜索引擎技术，最近想搭建一个属于自己的私人搜索引擎，自动完成所有的出来流程，记录一下。把某个行业、某个领域，对应的网址放在一个txt文件内，接下来动动鼠标，点几下，从爬取到最后即时搜索，自动全部搞定，效果跟在百度搜索没什么两样。以下是具体的操作流程逻辑：第一步：创建一个索引任务，一键生成这个操作会自动创建对应的表，用来存放爬取的网页内容，不需要人工创建，省去一些过于细化的配置。第二步，开
集成AI离线免费，全平台毫秒级快速处理！纪元A梦资源分享人工智能科技电脑软件抠图
随着PS技术的发展，大家对图像的要求和处理更加的多样化，其中，抠图作为一种常见的图像处理操作，并不是每个小伙伴都完全掌握PS技能，对于那些复杂的抠图操作往往会显得捉襟见肘，近两年随着AI技术的进步，各类软件都和AI集合，希望通过AI快速、高效的实现某些操作；分享一款免费、离线并且内嵌AI模型的抠图工具：鲜艺AI抠图v3.1；获取方式：https://pan.baidu.com/s/1gej6HL4
openwrt下oaf插件编译安装，实现上网行为监控月光技术杂谈 OpenWRT openwrt 健康上网上网管控青少年模式健康使用屏幕 Open App Filter 路由器
文章目录入门级APP青少年模式设备屏幕使用时间电脑浏览器使用时间限制Surpal介绍安装使用进阶级专业级旁路由方案openwrt路由器固件编译OAF(OpenAppFilter）安装编译带有oaf的固件固件烧写设备上电启动应用特征库设置黑白名单及应用访问限制骨灰级ref守护孩子视力，用科技“锁”住屏幕时间的秘籍马上又要寒假，除了说教，如何利用一些技术手段统计和限制孩子电子屏幕使用时间，做到健康上网
1.Spring AI 从入门到实践 laopeng301 Spring AI spring 人工智能 java
SpringAI从入门到实践1.什么是SpringAI2.使用SpringBoot&SpringAI快速构建AI应用程序3.ChatClient&ChatModel简化与AI模型的交互4.SpringAIPrompt:与大模型进行有效沟通5.结构化输出大模型响应6.实战:AI聊天机器人Ben技术站关注Java技术，LLM，计算机科学等内容。关注会持续更新推送详细教程内容和源码。
NVIDIA Hopper解说白总Server redis 数据库缓存 rust mongodb 大数据数据仓库
NVIDIAHopper架构是NVIDIA推出的面向高性能计算（HPC）和人工智能（AI）的最新一代GPU架构。它代表了NVIDIA在加速计算领域的最新进展，旨在为AI训练和推理、HPC应用提供前所未有的性能提升。NVIDIAHopper架构和基于该架构的GPU产品H100的详细信息：NVIDIAHopper架构技术特点：第四代TensorCore：Hopper架构引入了第四代TensorCore
【MySQL】JDBC的连接 m0_74823388 mysql 数据库
目录一.具体操作如下1.注册驱动二.实操JDBC（JavaDataBaseConnectivity）java数据库连接，是JavaEE平台下的技术规范，其定义了在Java语言中连接数据，执行SQL语句的标准，可以为多种关系数据库提供统一访问。一.具体操作如下1.注册驱动Class.forName("com.mysql.cj.jdbc.Driver");2.获取连接DriverManager(驱动管
【架构】前台、中台、后台 m0_74823388 架构
文章目录前台、中台、后台1.前台（Frontend）特点：技术栈：2.中台（Middleware）特点：技术栈：3.后台（Backend）特点：技术栈：示例场景前台：中台：后台：小前台大中台一、定义与概述二、小前台大中台架构的优势三、小前台大中台架构的应用案例前台、中台、后台在企业架构和软件开发中，“前台”、“中台”和“后台”分别指代不同层次的系统或组件。这三个概念通常用来描述企业内部信息系统架构
每日新闻掌握【2024年1月18日星期六】 cdmt 每日新闻掌握科技
2025年1月18日星期六农历腊月十九大公司/大事件SpaceX“星舰”第七次试飞，再现“筷子夹火箭”，二级飞船失联美国太空探索技术公司（SpaceX）新一代重型运载火箭“星舰”实施第七次试飞，第二级飞船失联。马斯克随后发帖并配发视频称，“成功是不确定的，但娱乐是有保证的！”他还写道，改进版星舰和助推器已准备就绪，等待发射。SpaceX“星舰”从美国得克萨斯州发射升空不久后，火箭第二级飞船与地面团
BERT详解 comli_cn 大模型笔记 bert 人工智能深度学习
1.背景结构1.1基础知识BERT（BidirectionalEncoderRepresentationsfromTransformers）是谷歌提出，作为一个Word2Vec的替代者，其在NLP领域的11个方向大幅刷新了精度，可以说是前几年来自残差网络最优突破性的一项技术了。论文的主要特点以下几点：使用了双向Transformer作为算法的主要框架，之前的模型是从左向右输入一个文本序列，或者将l
PHP性能优化折扇掩笑颜 PHP php 性能优化开发语言
PHP性能优化是指通过一系列的技术手段和优化策略来提升PHP程序的执行效率和响应速度，更好地满足用户的需求和提供更好的用户体验。下面列举了一些常见的PHP性能优化方法：一、使用合适的PHP版本不同的版本在性能、功能和语法等方面都有所不同，开发人员可以根据项目需求和服务器环境选择适合的PHP版本。PHP5.6：性能改进、更高效的命名空间使用、常量数组支持、函数参数类型提示等功能的引入。PHP7：大幅
《AI语言模型的关键技术探析：系统提示、评估方法与提示工程》 XianxinMao 人工智能语言模型自然语言处理
文章主要内容摘要1.系统提示(SystemPrompt)定义:用于设置模型行为、角色和工作方式的特殊指令重要性:定义模型行为边界影响输出质量和一致性可将通用模型定制为特定领域助手挑战:技术集成复杂兼容性问题效果难以精确预测2.模型评估方法创新方向:自一致性(Self-Consistency)评估PlanSearch方法强化学习(RL)应用核心特点:多次采样和交叉验证策略空间探索动态权重调整实践价值
《多模态语言模型：一个开放探索的技术新领域》 XianxinMao 语言模型人工智能算法
核心主题多模态语言模型的特点仍处于探索和定义阶段没有固定的标准任务和评估方法研究方向高度开放技术路径主要存在两种方法：后期融合(LateFusion)从语言模型backbone开始添加图像编码器效果稳定，成本可控早期融合(EarlyFusion)从多模态数据集预训练效果尚不明显需要更大规模计算资源开放和透明的重要性促进知识累积和技术迭代降低技术准入门槛避免技术垄断便于安全性审计主要挑战技术层面数据
[python]windows上安装talib最简单方法TA-Lib安装步骤萌萌哒240 python python windows 开发语言
要通过.whl文件安装TA-Lib（即talib，一个广泛使用的技术分析库），你需要先下载与你的Python版本和操作系统架构（32位或64位）相匹配的.whl文件。以下是通过.whl文件安装TA-Lib的详细步骤：一、下载TA-Lib的.whl文件访问https://gitee.com/FIRC/pythonlibs_whl_mirror或其他可靠的源，查找与你的Python版本和操作系统架构相
1.8 GPT-4：开创人工智能的新纪元少林码僧 AI大模型应用实战专栏人工智能
GPT-4：开创人工智能的新纪元自从OpenAI推出GPT-4以来，人工智能领域经历了显著的突破。作为“生成预训练转换器”家族中的最新成员，GPT-4不仅在功能上进行了提升，更在语言处理能力、理解深度以及适应性方面带来了全新的变革。本篇文章将深入探讨GPT-4的特点、创新以及它如何定义未来人工智能技术的发展。GPT-4的技术亮点1.规模与深度的进一步提升GPT-4的规模比前代模型更大，训练数据量和
JavaWeb开发 - Filter过滤器详解秦老师Q JavaWeb基础 java web java-ee
前言本章节主要学习JavaWeb开发中的Filter过滤器技术，收录于JavaWeb基础专栏，该专栏主要学习JavaWeb开发原生框架、Servlet、JSP、请求对象、响应对象、Session会话对象、Filter过滤器、三层开发模型等知识点，欢迎童鞋们互相交流。觉得不错可以三连订阅喔。目标1.概念2.Filter介绍3.入门案例4.验证登录案例4.1登录代码4.2过滤器验证内容1.概念Filt
C++ 的 CTAD 与推断指示（Deduction Guides）王晓华-吹泡泡的小猫现代 C++c++现代 C++类模板参数推导
1类模板参数推导（CTAD）1.1曲线救国CTAD的全称是类模板参数推导（ClassTemplateArgumentDeduction），它允许在实例化类模板时，根据构造函数的参数类型自动推导模板参数，从而避免显式指定模板参数。CTAD是在C++17引入的，在这之前，只有模板函数支持根据函数参数自动推导模板参数，类模板不支持这样的动作。代码中实例化类模板必须显式指定模板参数，十分不便，以致怨声载道
【Python】已解决：ModuleNotFoundError: No module named ‘sklearn‘ 屿小夏 python sklearn 人工智能
个人简介：某不知名博主，致力于全栈领域的优质博客分享|用最优质的内容带来最舒适的阅读体验！文末获取免费IT学习资料！文末获取更多信息精彩专栏推荐订阅收藏专栏系列直达链接相关介绍书籍分享点我跳转书籍作为获取知识的重要途径，对于IT从业者来说更是不可或缺的资源。不定期更新IT图书，并在评论区抽取随机粉丝，书籍免费包邮到家AI前沿点我跳转探讨人工智能技术领域的最新发展和创新，涵盖机器学习、深度学习、自然
html 周华华 html
js 1，数组的排列 var arr=[1,4,234,43,52,]; for(var x=0;x<arr.length;x++){ for(var y=x-1;y<arr.length;y++){ if(arr[x]<arr[y]){ &
【Struts2 四】Struts2拦截器 bit1129 struts2拦截器
Struts2框架是基于拦截器实现的，可以对某个Action进行拦截，然后某些逻辑处理，拦截器相当于AOP里面的环绕通知，即在Action方法的执行之前和之后根据需要添加相应的逻辑。事实上，即使struts.xml没有任何关于拦截器的配置，Struts2也会为我们添加一组默认的拦截器，最常见的是，请求参数自动绑定到Action对应的字段上。 Struts2中自定义拦截器的步骤是：
make:cc 命令未找到解决方法 daizj linux 命令未知 make cc
安装rz sz程序时，报下面错误： [root@slave2 src]# make posix cc -O -DPOSIX -DMD=2 rz.c -o rz make: cc：命令未找到 make: *** [posix] 错误 127 系统：centos 6.6 环境：虚拟机错误原因：系统未安装gcc，这个是由于在安
Oracle之Job应用周凡杨 oracle job
最近写服务，服务上线后，需要写一个定时执行的SQL脚本，清理并更新数据库表里的数据，应用到了Oracle 的 Job的相关知识。在此总结一下。一：查看相关job信息 1、相关视图 dba_jobs all_jobs user_jobs dba_jobs_running 包含正在运行
多线程机制朱辉辉33 多线程
转至http://blog.csdn.net/lj70024/archive/2010/04/06/5455790.aspx 程序、进程和线程：程序是一段静态的代码，它是应用程序执行的蓝本。进程是程序的一次动态执行过程，它对应了从代码加载、执行至执行完毕的一个完整过程，这个过程也是进程本身从产生、发展至消亡的过程。线程是比进程更小的单位，一个进程执行过程中可以产生多个线程，每个线程有自身的
web报表工具FineReport使用中遇到的常见报错及解决办法（一）老A不折腾 web报表 finereport java报表报表工具
FineReport使用中遇到的常见报错及解决办法（一）这里写点抛砖引玉，希望大家能把自己整理的问题及解决方法晾出来，Mark一下，利人利己。出现问题先搜一下文档上有没有，再看看度娘有没有，再看看论坛有没有。有报错要看日志。下面简单罗列下常见的问题，大多文档上都有提到的。 1、address pool is full：含义：地址池满，连接数超过并发数上
mysql rpm安装后没有my.cnf 林鹤霄没有my.cnf
Linux下用rpm包安装的MySQL是不会安装/etc/my.cnf文件的，至于为什么没有这个文件而MySQL却也能正常启动和作用，在这儿有两个说法，第一种说法，my.cnf只是MySQL启动时的一个参数文件，可以没有它，这时MySQL会用内置的默认参数启动，第二种说法，MySQL在启动时自动使用/usr/share/mysql目录下的my-medium.cnf文件，这种说法仅限于r
Kindle Fire HDX root并安装谷歌服务框架之后仍无法登陆谷歌账号的问题 aigo root
原文：http://kindlefireforkid.com/how-to-setup-a-google-account-on-amazon-fire-tablet/ Step 4: Run ADB command from your PC On the PC, you need install Amazon Fire ADB driver and instal
javascript 中var提升的典型实例 alxw4616 JavaScript
// 刚刚在书上看到的一个小问题,很有意思.大家一起思考下吧 myname = 'global'; var fn = function () { console.log(myname); // undefined var myname = 'local'; console.log(myname); // local }; fn() // 上述代码实际上等同于以下代码 m
定时器和获取时间的使用百合不是茶时间的转换定时器
定时器:定时创建任务在游戏设计的时候用的比较多 Timer();定时器 TImerTask();Timer的子类由 Timer 安排为一次执行或重复执行的任务。定时器类Timer在java.util包中。使用时，先实例化，然后使用实例的schedule(TimerTask task, long delay)方法，设定
JDK1.5 Queue bijian1013 java thread java多线程 Queue
JDK1.5 Queue LinkedList： LinkedList不是同步的。如果多个线程同时访问列表，而其中至少一个线程从结构上修改了该列表，则它必须保持外部同步。（结构修改指添加或删除一个或多个元素的任何操作；仅设置元素的值不是结构修改。）这一般通过对自然封装该列表的对象进行同步操作来完成。如果不存在这样的对象，则应该使用 Collections.synchronizedList 方
http认证原理和https bijian1013 http https
一.基础介绍在URL前加https://前缀表明是用SSL加密的。你的电脑与服务器之间收发的信息传输将更加安全。 Web服务器启用SSL需要获得一个服务器证书并将该证书与要使用SSL的服务器绑定。 http和https使用的是完全不同的连接方式，用的端口也不一样,前者是80，后
【Java范型五】范型继承 bit1129 java
定义如下一个抽象的范型类，其中定义了两个范型参数，T1，T2 package com.tom.lang.generics; public abstract class SuperGenerics<T1, T2> { private T1 t1; private T2 t2; public abstract void doIt(T
【Nginx六】nginx.conf常用指令(Directive) bit1129 Directive
1. worker_processes 8; 表示Nginx将启动8个工作者进程，通过ps -ef|grep nginx,会发现有8个Nginx Worker Process在运行 nobody 53879 118449 0 Apr22 ? 00:26:15 nginx: worker process
lua 遍历Header头部 ronin47 lua header 遍历　
local headers = ngx.req.get_headers() ngx.say("headers begin", "<br/>") ngx.say("Host : ", he
java-32.通过交换a,b中的元素，使[序列a元素的和]与[序列b元素的和]之间的差最小(两数组的差最小)。 bylijinnan java
import java.util.Arrays; public class MinSumASumB { /** * Q32.有两个序列a,b，大小都为n,序列元素的值任意整数，无序. * * 要求：通过交换a,b中的元素，使[序列a元素的和]与[序列b元素的和]之间的差最小。 * 例如: * int[] a = {100,99,98,1,2,3
redis 开窍的石头 redis
在redis的redis.conf配置文件中找到# requirepass foobared 把它替换成requirepass 12356789 后边的12356789就是你的密码打开redis客户端输入config get requirepass 返回 redis 127.0.0.1:6379> config get requirepass 1) "require
[JAVA图像与图形]现有的GPU架构支持JAVA语言吗？ comsci java语言
无论是opengl还是cuda，都是建立在C语言体系架构基础上的，在未来，图像图形处理业务快速发展，相关领域市场不断扩大的情况下，我们JAVA语言系统怎么从这么庞大，且还在不断扩大的市场上分到一块蛋糕，是值得每个JAVAER认真思考和行动的事情
安装ubuntu14.04登录后花屏了怎么办 cuiyadll ubuntu
这个情况，一般属于显卡驱动问题。可以先尝试安装显卡的官方闭源驱动。按键盘三个键：CTRL + ALT + F1 进入终端，输入用户名和密码登录终端：安装amd的显卡驱动 sudo apt-get install fglrx 安装nvidia显卡驱动 sudo ap
SSL 与数字证书的基本概念和工作原理 darrenzhu 加密 ssl 证书密钥签名
SSL 与数字证书的基本概念和工作原理 http://www.linuxde.net/2012/03/8301.html SSL握手协议的目的是或最终结果是让客户端和服务器拥有一个共同的密钥，握手协议本身是基于非对称加密机制的，之后就使用共同的密钥基于对称加密机制进行信息交换。 http://www.ibm.com/developerworks/cn/webspher
Ubuntu设置ip的步骤 dcj3sjt126com ubuntu
在单位的一台机器完全装了Ubuntu Server，但回家只能在XP上VM一个，装的时候网卡是DHCP的，用ifconfig查了一下ip是192.168.92.128,可以ping通。转载不是错： Ubuntu命令行修改网络配置方法 /etc/network/interfaces打开后里面可设置DHCP或手动设置静态ip。前面auto eth0，让网卡开机自动挂载. 1. 以D
php包管理工具推荐 dcj3sjt126com PHP Composer
http://www.phpcomposer.com/ Composer是 PHP 用来管理依赖（dependency）关系的工具。你可以在自己的项目中声明所依赖的外部工具库（libraries），Composer 会帮你安装这些依赖的库文件。中文文档入门指南下载安装包列表 Composer 中国镜像
Gson使用四（TypeAdapter） eksliang json gson Gson自定义转换器 gsonTypeAdapter
转载请出自出处：http://eksliang.iteye.com/blog/2175595 一.概述 Gson的TypeAapter可以理解成自定义序列化和返序列化二、应用场景举例例如我们通常去注册时（那些外国网站），会让我们输入firstName，lastName,但是转到我们都
JQM控件之Navbar和Tabs gundumw100 html xml css
在JQM中使用导航栏Navbar是简单的。只需要将data-role="navbar"赋给div即可： <div data-role="navbar"> <ul> <li><a href="#" class="ui-btn-active&qu
利用归并排序算法对大文件进行排序 iwindyforest java 归并排序大文件分治法 Merge sort
归并排序算法介绍，请参照Wikipeida zh.wikipedia.org/wiki/%E5%BD%92%E5%B9%B6%E6%8E%92%E5%BA%8F 基本思想：大文件分割成行数相等的两个子文件，递归（归并排序）两个子文件，直到递归到分割成的子文件低于限制行数低于限制行数的子文件直接排序两个排序好的子文件归并到父文件直到最后所有排序好的父文件归并到输入
iOS UIWebView URL拦截啸笑天 UIWebView
本文译者：candeladiao，原文：URL filtering for UIWebView on the iPhone说明：译者在做app开发时，因为页面的javascript文件比较大导致加载速度很慢，所以想把javascript文件打包在app里，当UIWebView需要加载该脚本时就从app本地读取，但UIWebView并不支持加载本地资源。最后从下文中找到了解决方法，第一次翻译，难免有
索引的碎片整理SQL语句 macroli sql
SET NOCOUNT ON DECLARE @tablename VARCHAR (128) DECLARE @execstr VARCHAR (255) DECLARE @objectid INT DECLARE @indexid INT DECLARE @frag DECIMAL DECLARE @maxfrag DECIMAL --设置最大允许的碎片数量,超过则对索引进行碎片
Angularjs同步操作http请求with $promise qiaolevip 每天进步一点点学习永无止境 AngularJS 纵观千象
// Define a factory app.factory('profilePromise', ['$q', 'AccountService', function($q, AccountService) { var deferred = $q.defer(); AccountService.getProfile().then(function(res) {
hibernate联合查询问题 sxj19881213 sql Hibernate HQL 联合查询
最近在用hibernate做项目，遇到了联合查询的问题，以及联合查询中的N+1问题。针对无外键关联的联合查询，我做了HQL和SQL的实验，希望能帮助到大家。（我使用的版本是hibernate3.3.2） 1 几个常识：（1）hql中的几种join查询，只有在外键关联、并且作了相应配置时才能使用。（2）hql的默认查询策略，在进行联合查询时，会产
struts2.xml wuai struts
<?xml version="1.0" encoding="UTF-8" ?> <!DOCTYPE struts PUBLIC "-//Apache Software Foundation//DTD Struts Configuration 2.3//EN" "http://struts.apache

CVPR 2019 | 旷视研究院提出TACNet，刷新时空动作检测技术新高度

导语

简介

实验

结论

传送门

参考文献

你可能感兴趣的:(CVPR 2019 | 旷视研究院提出TACNet，刷新时空动作检测技术新高度)