凌风探梅

视频行为理解

from:https://x-algo.cn/index.php/2019/08/31/3220/
行为识别是用来识别“人自身”、“人和人”、“人和物”的“行为”。比如“抽烟”，“打架”。这个任务有好几个数据集，接下来先介绍一下各个数据集。
数据集

HMDB-51（2011）

其中包含51 action，7k clips；
这个数据集合包含不同种类的视频（camera motion, viewpoint, video quality and occlusion）
和以往的数据集比较，这个视频数据更加真实，并且会有遮挡机位变化等。
当前数据集通过静态的人体关节变化不能识别对应的行为
51个action中，每一个至少包含101个clip

下图为和其他数据集的对比：

视频行为理解_第1张图片

和其他数据集合的对比

数据样例：点击我；

包含的行为种类有：

面部表情：微笑，大笑，咀嚼，交谈
面部和物体行为：吸烟，吃，喝
身体动作：车轮翻，鼓掌，爬
身体和物体之间行为：梳头发，抓东西，击剑

视频行为理解_第2张图片

51个种类的分组

论文：H. Kuehne, et al. HMDB: A large video database for human motion recognition. In ICCV, pages 2556-2563, 2011.

UCF-101（2012）

101类别，13k样本，27小时时长
整个数据可以分为五类，每一类数据都会有25个元数据（不同的 background or actors ）：
1. 人物交互：呼啦圈，杂耍球，跳绳
2. 单人行为：开合跳：弓步压腿，引体向上
3. 多人行为：军事游行，双人舞蹈，乐队前进
4. 演奏乐器：吉他，钢琴
5. 运动：棒球投球，篮球投球

视频行为理解_第3张图片

数据整体情况

论文：K. Soomro, et al. UCF101: A dataset of 101 human action classes from videos in the wild. CoRR, abs/1212.0402, 2012.

Sports-1M（2014）

487 classes，1 millionYouTube videos
数据并不是通过人工标注的，而是通过视频的文本信息标注，会有一定的错误率

论文：A. Karpathy, G. Toderici, S. Shetty, T. Leung, R. Sukthankar, and F.-F. Li. Large-scale video classification with convolutional neural networks. In CVPR, pages 1725-1732, 2014.

ActivityNet v1.3（2015）

203类，28k个视频，平均每个类有137个untrimmed视频，每个视频平均1.41个行为
提供三个场景的行为理解：
1. 没有剪辑的视频分类
2. 剪辑之后的行为分类
3. 剪辑之后的行为检测（detection）
层级结构标注，例如: /家庭行为/家务/内部清洁/擦窗，别的数据集一般是两层结构，后期不好维护和扩展
样本为覆盖人们日常高频行为而设计

视频行为理解_第4张图片

一个四层的例子

论文：B. G. F. C. Heilbron, V. Escorcia, B. Ghanem, J. C. Niebles. ActivityNet: A large-scale video benchmark for human activity understanding. In CVPR, pages 961-970, 2015.

Charades（2016）

157 类action，46类object，15个场景，9848个视频，平均长度12秒，2.7w描述
Charades是非常真实的生活化的视频，这些视频往往不会出现在movie、TV、YouTuBe上面，尝试用关键词搜索在网上也不会找到这些视频，因为这些视频多数都是生活中非常“无聊”的场景
Hollywood in Homes，其实就是在自己家里“演戏”，然后采集样本。数据集主打 daily activities
数据集地址：https://allenai.org/plato/charades/

看书、喝水、开冰箱的动作在生活中，和在youtube上面的差异非常大，youtube上面多数是娱乐类的非典型的视频，如下图：

和其他的数据集的比较：

视频行为理解_第5张图片

Charades和其他数据集的比较

论文：Hollywood in Homes: Crowdsourcing Data Collection for Activity Understanding

Gunnar Sigurdsson, Gül Varol, Xiaolong Wang, Ali Farhadi, Ivan Laptev, Abhinav Gupta

YouTube-8M（2016）

4800类（visual entity），8百万视频，500k小时，一个视频可以有多个类别实体
尝试使用实体标签对视频主要内容描述
机器打的分类，通过元信息和点击数据校验，类别均为图谱中的实体且视觉可识别，实体包括：
1. 活动（体育运动，游戏）
2. 物体（汽车，食物，产品）
3. 场景（旅行）
4. 事件
提供1.9 billion frame feature下载，特征提取器是Inception网络
Sports-1M专注于运动，ActivityNet专注于行为，不够多样性和通用；在迁移学习场景YouTube-8M比前两者更加具有优势

数据级别的分布：

S. Abu-El-Haija, N. Kothari, J. Lee, P. Natsev, G. Toderici, B. Varadarajan, and S. Vijayanarasimhan. YouTube-8M: A large-scale video classification benchmark. CoRR, abs/1609.08675, 2016.

Kinetics （2017）

动机：构造large scale、high quality、challenging enough的数据集
仅仅用于分类，每一个片段大概10秒，包含语音信息，都是剪辑过的视频。不能用于temporal localization
自称为HMDB-51和UCF-101的继任者，前两者类别少、样本少、多样性少
类别是一个两层结构，包括下面几类行为：
1. 单人：画图、喝水、笑、压腿
2. 人和人之间：接吻、握手、拥抱
3. 人和物：打开盒子、洗盘子、修剪草坪
一个clip只会有一个action分类，但是实际中会有多个行为（一边刷牙一边跳舞、一边发短信一边开车）

视频行为理解_第8张图片

Kinetics数据对比

W. Kay, J. Carreira, K. Simonyan, B. Zhang, C. Hillier, S. Vijayanarasimhan, F. Viola, T. Green, T. Back, P. Natsev, M. Suleyman, and A. Zisserman. The Kinetics human action video dataset. CoRR, abs/1705.06950, 2017.

常用模型

深度学习之前常用模型

一般是三步走：

局部特征提取，一般是特征点的提取
定长处理，一般是直方图统计
词袋模型的分类器，例如SVM

DT：https://hal.inria.fr/hal-00725627v2/document

iDT：https://hal.inria.fr/hal-00873267v2/document

3D卷积和2D卷积

如下图：来自知乎我不坏

视频行为理解_第10张图片

2D卷积

视频行为理解_第11张图片

3D卷积

最初的探索（2014）

文章尝试在时序维度做不同的组合，所有的模型最后都是通过加权平均进行分类：

探索目标：
1. 什么样的时序cnn结构可以更好的对局部动作建模
2. 什么样的动作信息会影响性能，以及影响的量
加速方法：两路处理
1. 一路在低分辨率处理；
2. 一路在高分辨率处理，但是只处理中间一部分

提出时序模型Fusion的集中方式：

两路融合：

输入是178*178的大小，一路是全局的89*89，一路是中心的89*89，输入像素个数是原来的一半。具体如下图：

双路采样

并未在视频行为识别的任务上打败手工设计特征的方法

Large-scale Video Classification with Convolutional Neural Networks（2014）

Two-Stream ConvNet（2014）

使用RGB+光流作为模型输入
1. RGB对场景、物体建模
2. 光流对相机运动、物体运动建模
尝试对光流的加工：
- 原始光流
- 轨迹（累计求和）
- 双向光流
- 平均光流（相机运动）
网络并未对时序建模

模型的整体结构如下图，两路模型最后的输出都是softmax

在第二路的输入中是光流的信息，那么输入的光流其实是可以有不同的形式的，一种就是两帧之间的位移，一种是多帧之间的位移，也就是从开始帧到t帧之间的轨迹，如下图：

视频行为理解_第14张图片

左边为两帧之间光流，右边为轨迹

Two-Stream Convolutional Networks for Action Recognition in Videos

LRCN（2014）

使用LSTM进行上层的融合，LRCN( LONG-TERM RECURRENT CONVOLUTIONAL NETWORK)属于late-fusion，论文中output为分类结果，后面在加一层求平均就可以得到最终输出，模型的缺点是采样不够的话会导致区分不出来开门还是关门：

视频行为理解_第15张图片

基础结构

视频行为理解_第16张图片

可以用到的更多的场景

Long-term recurrent convolutional networks for visual recognition and description

Pooling位置探索（2015）

更多的上层融合方式的探索
更长的融合长度（120帧）
RGB和光流分别预测，然后融合
Feature Pooling都使用Max-pooling，效果较好的原因是对分类影响比较大的是几个稀疏的关键帧

视频行为理解_第18张图片

对各种Pooling的探索,maxpooling/蓝色,全连接/黄色,3d卷积/绿色

不同的pooling方式效果

Beyond Short Snippets: Deep Networks for Video Classification

Rank-Pooling （2016）

在最后一层融合的时候，采用pooling的方式直接融合
增加后面帧的重要性

Learning End-to-end Video Classification with Rank-Pooling

TSN（2016）

TSN（Temporal Segments Network）特点：

长序列建模的框架
Two-Stream的处理的是单帧输入+多帧光流，无法对长视频很好建模
模型流程：
1. 长视频均匀切为K段
2. 从每一段选择一个子片段送入模型
3. 模型进行前向传播，每一个片段得到自己对应的分类结果
4. 对分类结果融合（本论文是求平均）并输出结果

TRN（2018）

Temporal Relation Network

不同粒度抽帧，不同采样步长模型的ensemble，是对TSN的一种升级版
多帧融合采用两层的MLP，不同的步长的模型MLP不共享

Temporal Segment Networks: Towards Good Practices for Deep Action Recognition

C3D（2015）

模型简称为C3D，提出了一个结构简单的end2end的处理视频的模型

对各种超参数的探索，3D卷积更加适合捕获时序特征
所有层都是可用3x3x3 kernel和 2x2的pooling可以得到最好性能
C3D可以对视频提取好特征，然后使用线性分类器就可以得到很好的性能
训练速度快，容易收敛，训练Sports-1M的时候抽取5个2秒的视频片段

Learning Spatiotemporal Features with 3D Convolutional Networks（2015）

P3D（2017）

C3D太耗费资源，尝试分解3x3x3卷积进行加速
在时间维度进行分解下图中S=1x3x3，T=3x1x1
把层数扩展到199层

P3D 不同种类的block

Learning Spatio-Temporal Representation with Pseudo-3D Residual Networks

I3D（2017）

Inflated 3D ConvNet ：

本文惊艳之处在于提出一种将2D卷积膨胀为3D的方法，可以更好的利用ImageNet模型积累
通过对膨胀的卷积权重除以膨胀长度，实现从2D到3D权重的初始化且等同训练boring视频，boring视频的定义是在时间维度重复一张图片生成的视频，这里还是为了更好的继承InceptionV1
下图中，前三种是已有的模型，后两种（主要是最后一种）是提出来的I3D模型
膨胀之后三个维度的感受野计算如下图
e方案是最优的方案，分别对RGB和光流进行3D卷积。然后bagging到一起

下图为InceptionV1的结构：

视频行为理解_第24张图片

InceptionV1

视频行为理解_第25张图片

左图为膨胀之后的结构

Quo Vadis, Action Recognition? A New Model and the Kinetics Dataset

SlowFast Network(2018)

Slow 一秒采2帧，侧重单帧理解
Fast 一秒采8帧，侧重时序理解
Fast部分虽然处理的图片多，但是计算量只有整体的20%，减少模型的参数量（卷积个数）
不在时间维度进行pooling，time维度的卷积stride=1
HW维度卷积大小和stride都一致，SlowFast融合的时候就是在T和C之间转换
Fast的作用类似光流，好处是不用以来外部方法提取特征了

视频行为理解_第27张图片

SlowFast Networks for Video Recognition

参考

https://zhuanlan.zhihu.com/p/36330561

你可能感兴趣的:(视频特征,图像分析)

如何用 Python 实现树结构不辉放弃 python 开发语言
一、树结构基础认知1.1树的四大特征层级关系：父子节点的从属关系唯一根节点：访问起点无循环：从根到叶的路径不形成环N叉分支：每个节点可有多个子节点1.2核心组件解析classTreeNode:def__init__(self,data):self.data=data#节点存储的数据self.children=[]#子节点容器（多叉树特性）defadd_child(self,node):self.c
五个冷门的Adobe系列软件小技巧 reddingtons adobe
在当今的数字时代，Adobe系列软件在设计、视频编辑和创意制作领域占据着重要地位。许多学校和教育机构为学生提供教育邮箱，允许他们免费使用Adobe全系列软件的教育订阅。这意味着无论是Photoshop、Illustrator还是PremierePro等热门软件，学生都能轻松获取。然而，本文将分享一些冷门的Adobe软件小技巧，这些技巧主要适用于付费用户，可能不适用于某些免费用户。小技巧一：使用Ad
景联文科技：以高质量数据标注推动人工智能领域创新与发展景联文科技科技人工智能数据标注
在当今这个由数据驱动的时代，高质量的数据标注对于推动机器学习、自然语言处理（NLP）、计算机视觉等领域的发展具有不可替代的重要性。数据标注过程涉及对原始数据进行加工，通过标注特定对象的特征来生成能够被机器学习模型识别和使用的编码格式，从而使数据更具有意义和可解读性。数据标注的主要类型包括：图像标注：指在图片中标识出目标物体的位置、形状或类别等信息，如自动驾驶技术中的行人、车辆及交通标志的识别。文本
如何一键修改MDK代码风格以及error in include chain (cmsis_armcc.h): expected identfieror报错解决方法 superior tigre 单片机单片机 stm32 嵌入式硬件
目录一、修改MDK代码风格的两种方法1.直接设置2.替换global.prop文件，一键设置二、errorinincludechain(xxxxxxx.h):expectedidentfieror等报错的解决方法一、修改MDK代码风格的两种方法最近在学习某原子stm32的HAL库视频，被教学代码的风格深深吸引，感觉keil默认代码风格是越看越别扭，所以决定自己修改一下代码的格式，总结了两种方法，这
编译QT5.15.2 qtwebengine模块以支持mp4 m0_74822999 qt 开发语言
由于版权限制，Qt官方无法在其二进制包中提供某些解码器，这导致QtWebEngine无法支持一些常见的视频格式（如MP4）。为了解决这一问题，我们可以通过重新编译QtWebEngine来集成所需的解码器一、编译准备1.获取源码qtwebengine-everywhere-src-5.15.2.zip2.编译环境Python2.7.5:Python2.7.5Perl:StrawberryPerlfo
微信小程序的旅游服务助手景点酒店旅游规划的设计与实现 QQ1304979694 微信小程序旅游小程序
文章目录具体实现截图本项目支持的技术语言研究思路、方法和步骤本系统开发思路主要软件与实现手段系统可行性分析源码获取详细视频演示：文章底部获取博主联系方式！！！！java类核心代码部分展示微信小程序技术现状源码获取/详细视频演示具体实现截图本项目支持的技术语言前端开发框架:vue.js+uniapp数据库mysql版本不限微信开发者工具/hbuiderx数据库工具：Navicat/SQLyog等都可
统一的视频动作模型三谷秋水计算机视觉机器学习人工智能计算机视觉深度学习机器学习人工智能
25年3月来自斯坦福大学的论文“UnifiedVideoActionModel”。统一的视频和动作模型对机器人技术具有重大意义，其中视频为动作预测提供丰富的场景信息，而动作为视频预测提供动态信息。然而，有效地结合视频生成和动作预测仍然具有挑战性，当前基于视频生成的方法在动作准确性和推理速度方面难以与直接策略学习的性能相匹配。为了弥补这一差距，引入统一的视频动作模型（UVA），它联合优化视频和动作预
使用AI识别语音和B站视频并通过GPT生成思维导图思维导图gpt-4
AI脑图除了对文本、网页链接和文件生成思维导图外，现在也支持了对语音和B站视频的内容识别，并自动生成思维导图。语音生成思维导图直接发送语音：对AI脑图公众号直接发送语音（如使用语音说厦门三天两夜的旅行攻略），AI脑图会自动识别语音内容然后根据内容要求生成思维导图上传语音文件：支持多种音频格式，上传完成后AI脑图会识别音频内容，然后提炼内容关键信息、结构化梳理，并生成思维导图，同时也可以下载识别好的
使用AI识别语音和B站视频并通过GPT生成思维导图思维导图gpt-4
AI脑图除了对文本、网页链接和文件生成思维导图外，现在也支持了对语音和B站视频的内容识别，并自动生成思维导图。语音生成思维导图直接发送语音：对AI脑图公众号直接发送语音（如使用语音说厦门三天两夜的旅行攻略），AI脑图会自动识别语音内容然后根据内容要求生成思维导图上传语音文件：支持多种音频格式，上传完成后AI脑图会识别音频内容，然后提炼内容关键信息、结构化梳理，并生成思维导图，同时也可以下载识别好的
Git使用从入门到入土收藏吃灰系列 (十三) git stash、git check-pick、git tag、git diff 张时贰 Git &原理 &指令学习 git github
文章目录一、前言二、gitstash存储到堆栈三、Gittag标签四、gitcherry-pick挑选合并五、gitdiff本节速览gitstash堆栈gittag标签gitcherry-pick挑选合并gitdiff比较信息差异本节开始都是一些不怎么用的命令,或者一些使用技巧,了解即可一、前言参考安装Git详细安装教程参考视频B站Git最新教程通俗易懂，这个有点长，感觉讲的精华不多参考视频『Gi
Nginx核心知识100讲 janthinasnail linux
详见：作者网站：http://www.taohui.pub/视频原网站：https://time.geekbang.org/course/intro/138?device=geekTime.android视频地址：https://www.bilibili.com/video/BV1w7411v74u文档地址：https://github.com/russelltao/geektime-nginx
抖音视频数据获取实战：从API调用到热门内容挖掘爱搞技术的猫猫 API 音视频
在短视频流量为王的时代，掌握抖音热门视频数据已成为内容运营、竞品分析及营销决策的关键。本文将手把手教你通过抖音开放平台API获取视频详情数据，并提供完整的代码实现及商业化应用思路。一、抖音API权限申请与核心接口抖音API需企业资质认证，个人开发者权限受限。以下是接入流程：企业开发者认证•登录开放平台，选择注册，提交信息等材料。•完成认证后，创建应用（如“视频数据分析工具”），获取ClientKe
【视频】m3u8相关操作郭老二视频音视频
1、视频文件转m3u81.1常用命令1）默认只保留5个ts文件ffmpeg-iinput.mp4-start_number0-hls_time10-hls_list_size0-fhlsstream1.m3u82）去掉音频-an，保留全部ts文件ffmpeg-iinput.mp4-vfscale=640:480-an-start_number0-hls_time10-hls_list_size0-
基于Python编程语言实现“机器学习”，用于车牌识别项目我的sun&shine Python python 机器学习计算机视觉
基于Python的验证码识别研究与实现1.摘要验证码的主要目的是区分人类和计算机，用来防止自动化脚本程序对网站的一些恶意行为，目前绝大部分网站都利用验证码来阻止恶意脚本程序的入侵。验证码的自动识别对于减少自动登录时长，识别难以识别的验证码图片有着重要的作用。对验证码图像进行灰度化、二值化、去离散噪声、字符分割、归一化、特征提取、训练和字符识别等过程可以实现验证码自动识别。首先将原图片进行灰度化处理
Hadoop 集群规划与部署最佳实践 AI天才研究院 Python实战 DeepSeek R1 &大数据AI人工智能大模型自然语言处理人工智能语言模型编程实践开发语言架构设计
作者：禅与计算机程序设计艺术1.简介2009年2月2日，ApacheHadoop项目诞生。它是一个开源的分布式系统基础架构，用于存储、处理和分析海量的数据。Hadoop具有高容错性、可靠性、可扩展性、适应性等特征，因而广泛应用于数据仓库、日志分析、网络流量监测、推荐引擎、搜索引擎等领域。由于Hadoop采用“分而治之”的架构设计理念，因此可以轻松应对数据量、计算能力和存储成本的增长。2013年底，
线性代数介绍 ZhuBin365 其它机器学习线性代数人工智能
线性代数介绍线性代数是数学的一个重要分支，它研究向量空间、线性变换和线性方程组。其概念抽象，应用广泛，是现代科学技术中不可或缺的数学工具。本篇将详细解释线性代数中的核心概念，包括行列式、矩阵、向量与向量空间、线性方程组、特征值与特征向量以及二次型，力求深入浅出，帮助读者全面理解。一、行列式(Determinants)行列式是线性代数中一个fundamental的概念，它是一个将方阵映射到一个标量的
java将动态图转换成静态图_如何用最简单的方法把静态图变成动图？ PEI Lobster java将动态图转换成静态图
在今日头条浏览文章时，我们经常会看到有些作者在文章中插入了一些动态图片，不但美化了页面，而且起到了简明扼要的说明作用，让读者对文章内容加深了理解，也提高了文章的阅读量和点击量。这样的动态效果是如何制作的呢？主要有两个步骤：首先要制作出图片动态效果的视频，一般是MP4格式，第二步用格式工厂等文件格式转换软件，把MP4转换为gif动画格式，然后就可以把它插入到网页中。这其中的难点和重点就在于制作图片的
头条原创文章一键转换剪映生成视频 Mr数据杨 Python 视频剪辑 python moveipy 图文转视频西瓜视频剪映
随着技术的进步，平台逐渐为创作者提供了更多便捷的功能来增强内容的表达效果。近期，某平台新增了一个实用功能，允许用户将自己发布的文章通过后台的视频生成工具一键转换为短视频。然而，这一功能的使用存在一些限制，比如仅支持原创文章，并且生成的视频只能在该平台发布，暂时无法同步至其他社交平台。尽管如此，通过对生成视频的观察与分析，可以发现其处理方式与剪映等主流视频编辑软件有相似之处，这为进一步扩展视频的应用
【深度学习|地学应用】滑坡灾害早期隐患的概念、特征及识别方法，同时解释其与人工边坡、滑坡易发性之间的联系与区别。 985小水博一枚呀深度学习人工智能
【深度学习|地学应用】滑坡灾害早期隐患的概念、特征及识别方法，同时解释其与人工边坡、滑坡易发性之间的联系与区别。【深度学习|地学应用】滑坡灾害早期隐患的概念、特征及识别方法，同时解释其与人工边坡、滑坡易发性之间的联系与区别。文章目录【深度学习|地学应用】滑坡灾害早期隐患的概念、特征及识别方法，同时解释其与人工边坡、滑坡易发性之间的联系与区别。1.滑坡灾害早期隐患的概念与特征概念主要特征2.通过光学
免费影视片库 ta叫我小白免费片库电影
1.欧乐影院：https://www.olenew.com支持搜索和观看。有账号登录入口。试看10分钟，完整观看本视频需要登录。2.爱壹帆：https://www.iyf.lv支持免登录搜索和观看。有账号登录入口。视频中嵌入广告。3.独播库：https://dubocool.com支持搜索和观看。【无】账号登录入口；视频中嵌入广告。4.唐人街影院：https://www.chinatownfilm
VideoView视频组件 Android洋芋 Android控件音视频
简介VideoView在Android中是一个用户界面组件，它允许开发者在Android设备的屏幕上播放视频文件。它是AndroidSDK的一部分，位于android.widget包中。VideoView提供了一种简单的方法来嵌入和控制视频播放，包括设置视频源、开始、暂停、seek（跳转到视频的特定位置）以及显示视频的控件等基本功能。开发人员可以轻松地将VideoView添加到布局文件中，并通过J
位图思想详解：用一个小小的比特征服整个世界 Joseit 优选算法 java 算法
位图思想详解：用一个小小的比特征服整个世界一、什么是位图？二、位图的形象理解三、位图的Java实现四、位图的算法原理剖析五、实际应用案例：网站用户活跃度统计五、真实的应用场景：布隆过滤器的基础六、算法题：判断字符是否唯一（easy）一、什么是位图？位图是一种超级节省空间的数据结构，他利用二进制位（0/1）来表示某个元素是否存在或某种状态是否为真。想象一下，用一个小小的比特位就能记录一个信息，这简直
给普通人看的深度学习说明书：用快递系统理解AI如何思考嵌入式Jerry Python AI 人工智能深度学习
第一章：理解AI的思维方式（快递版）1.1快递分拣站的故事假设你管理一个快递分拣站：传统方法：手动制定规则（比如根据邮编分拣）机器学习：观察老员工的分拣记录，总结规律深度学习：搭建自动分拣流水线，自主发现隐藏规则1.2神经网络就像智能分拣机传送带（输入层）：接收包裹信息（图片像素/文字等）#就像扫描快递单input_data=[0.2,0.7,0.1]#归一化后的特征数据分拣工人（隐藏层）：每个工
C++基础系列【26】排序和查找算法程序喵大人 C++基础系列 c语言算法开发语言 c++
博主介绍：程序喵大人35-资深C/C++/Rust/Android/iOS客户端开发10年大厂工作经验嵌入式/人工智能/自动驾驶/音视频/游戏开发入门级选手《C++20高级编程》《C++23高级编程》等多本书籍著译者更多原创精品文章，首发gzh，见文末记得订阅专栏，以防走丢C++基础系列专栏C语言基础系列专栏C++大佬养成攻略专栏C++训练营排序与查找算法的重要性不用过多介绍了吧，面试也经常考察。
使用Pygame实现记忆拼图游戏点我头像干啥 Ai pygame python 开发语言
引言记忆拼图游戏是一种经典的益智游戏，玩家需要通过翻转卡片来匹配相同的图案。这类游戏不仅能够锻炼玩家的记忆力，还能带来很多乐趣。本文将详细介绍如何使用Pygame库来实现一个简单的记忆拼图游戏。我们将从Pygame的基础知识开始，逐步构建游戏的各个部分，最终完成一个完整的游戏。1.Pygame简介Pygame是一个用于编写视频游戏的Python库，它基于SDL库（SimpleDirectMedia
深入解析深度学习中的过拟合与欠拟合诊断、解决与工程实践古月居GYH 深度学习人工智能
一、引言：模型泛化能力的核心挑战在深度学习模型开发中，欠拟合与过拟合是影响泛化能力的两个核心矛盾。据GoogleBrain研究统计，工业级深度学习项目中有63%的失败案例与这两个问题直接相关。本文将从基础概念到工程实践，系统解析其本质特征、诊断方法及解决方案，并辅以可复现的代码案例。二、核心概念与通熟易懂解释简单而言，欠拟合是指模型不能在训练集上获得足够低的误差。换句换说，就是模型复杂度低，模型在
CBNet--一种新的目标检测的复合骨干网体系结构 weixin_45963617 深度学习系列
一、Introduction一般来说，在一个典型的基于CNN的目标检测器中，使用主干网络来提取检测对象的基本特征，该网络通常是为图像分类任务而设计的，并在ImageNet上预训练。毫无疑问，更强大的主干网可以带来更好的检测性能。尽管最先进的基于深度的大骨干网络的探测器取得了很好的结果，但仍有很大改进空间。此外，通过设计一个新的更强大的主干网络并在ImageNet上预训练来获取好的检测性能是十分昂贵
05.列表标签龙哥带你学编程 #html css
一、列表简介列表是网页中最常用的一种数据排列方式。有序列表：有先后顺序之分无序列表：无先后顺序之分定义列表：带有特殊含义的列表二、有序列表1、语法格式有序列表中的各个列表项是有顺序的…列表项列表项注意：ol和li是配合一起使用的，不可以单独使用；ol的子标签只能是li标签，不能是其他标签。2、基本特征有序列表是由有顺序的列表项组成的有序列表一般采用数字或字母作为顺序，默认采用数字顺序是块元素独占一
初始OpenCV 指尖下的技术 OpenCV opencv 人工智能计算机视觉
OpenCV是一个功能强大、应用广泛的计算机视觉库，它为开发人员提供了丰富的工具和算法，可以帮助他们快速构建各种视觉应用。随着计算机视觉技术的不断发展，OpenCV也将会继续发挥重要的作用。OpenCV提供了大量的计算机视觉算法和图像处理工具，广泛应用于图像和视频的处理、分析以及机器学习领域。所以学习人计算机视觉或者图像处理方面的知识，OpenCV是一个要重点学习的工具库。首先介绍一下OpenCV
深入探讨盘古大模型的高精度多尺度能力 Hardess-god WRF 人工智能算法
随着人工智能技术的快速发展，大模型的研究逐渐进入新的阶段。其中，盘古大模型以其卓越的高精度和多尺度处理能力成为研究热点。本文将详细分析盘古模型在高精度多尺度问题上的技术特征、优势和应用潜力，并探讨其深入研究的方向。一、盘古模型概述盘古模型是华为推出的中文预训练大模型系列，拥有数十亿甚至千亿级的参数规模。它以Transformer架构为基础，通过海量文本数据进行训练，表现出优异的自然语言理解和生成能
算法单链的创建与删除换个号韩国红果果 c 算法
先创建结构体 struct student { int data; //int tag;//标记这是第几个 struct student *next; }; // addone 用于将一个数插入已从小到大排好序的链中 struct student *addone(struct student *h,int x){ if(h==NULL) //??????
《大型网站系统与Java中间件实践》第2章读后感白糖_ java中间件
断断续续花了两天时间试读了《大型网站系统与Java中间件实践》的第2章，这章总述了从一个小型单机构建的网站发展到大型网站的演化过程---整个过程会遇到很多困难，但每一个屏障都会有解决方案，最终就是依靠这些个解决方案汇聚到一起组成了一个健壮稳定高效的大型系统。看完整章内容，
zeus持久层spring事务单元测试 deng520159 java DAO spring jdbc
今天把zeus事务单元测试放出来,让大家指出他的毛病, 1.ZeusTransactionTest.java 单元测试 package com.dengliang.zeus.webdemo.test; import java.util.ArrayList; import java.util.List; import org.junit.Test; import
Rss 订阅开发周凡杨 html xml 订阅 rss 规范
RSS是 Really Simple Syndication的缩写（对rss2.0而言，是这三个词的缩写，对rss1.0而言则是RDF Site Summary的缩写，1.0与2.0走的是两个体系）。 RSS
分页查询实现 g21121 分页查询
在查询列表时我们常常会用到分页，分页的好处就是减少数据交换，每次查询一定数量减少数据库压力等等。按实现形式分前台分页和服务器分页：前台分页就是一次查询出所有记录，在页面中用js进行虚拟分页，这种形式在数据量较小时优势比较明显，一次加载就不必再访问服务器了，但当数据量较大时会对页面造成压力，传输速度也会大幅下降。服务器分页就是每次请求相同数量记录，按一定规则排序，每次取一定序号直接的数据
spring jms异步消息处理 510888780 jms
spring JMS对于异步消息处理基本上只需配置下就能进行高效的处理。其核心就是消息侦听器容器，常用的类就是DefaultMessageListenerContainer。该容器可配置侦听器的并发数量，以及配合MessageListenerAdapter使用消息驱动POJO进行消息处理。且消息驱动POJO是放入TaskExecutor中进行处理，进一步提高性能，减少侦听器的阻塞。具体配置如下：
highCharts柱状图布衣凌宇 hightCharts 柱图
第一步：导入 exporting.js,grid.js,highcharts.js;第二步：写controller @Controller@RequestMapping(value="${adminPath}/statistick")public class StatistickController { private UserServi
我的spring学习笔记2-IoC（反向控制依赖注入） aijuans spring mvc Spring 教程 spring3 教程 Spring 入门
IoC（反向控制依赖注入）这是Spring提出来了，这也是Spring一大特色。这里我不用多说，我们看Spring教程就可以了解。当然我们不用Spring也可以用IoC，下面我将介绍不用Spring的IoC。 IoC不是框架，她是java的技术，如今大多数轻量级的容器都会用到IoC技术。这里我就用一个例子来说明：如：程序中有 Mysql.calss 、Oracle.class 、SqlSe
TLS java简单实现 antlove java ssl keystore tls secure
1. SSLServer.java package ssl; import java.io.FileInputStream; import java.io.InputStream; import java.net.ServerSocket; import java.net.Socket; import java.security.KeyStore; import
Zip解压压缩文件百合不是茶 Zip格式解压 Zip流的使用文件解压
ZIP文件的解压缩实质上就是从输入流中读取数据。Java.util.zip包提供了类ZipInputStream来读取ZIP文件,下面的代码段创建了一个输入流来读取ZIP格式的文件; ZipInputStream in = new ZipInputStream(new FileInputStream(zipFileName)); &n
underscore.js 学习（一） bijian1013 JavaScript underscore
工作中需要用到underscore.js，发现这是一个包括了很多基本功能函数的js库，里面有很多实用的函数。而且它没有扩展 javascript的原生对象。主要涉及对Collection、Object、Array、Function的操作。学
java jvm常用命令工具——jstatd命令(Java Statistics Monitoring Daemon) bijian1013 java jvm jstatd
1.介绍 jstatd是一个基于RMI（Remove Method Invocation）的服务程序，它用于监控基于HotSpot的JVM中资源的创建及销毁，并且提供了一个远程接口允许远程的监控工具连接到本地的JVM执行命令。 jstatd是基于RMI的，所以在运行jstatd的服务
【Spring框架三】Spring常用注解之Transactional bit1129 transactional
Spring可以通过注解@Transactional来为业务逻辑层的方法(调用DAO完成持久化动作)添加事务能力，如下是@Transactional注解的定义： /* * Copyright 2002-2010 the original author or authors. * * Licensed under the Apache License, Version
我(程序员)的前进方向 bitray 程序员
作为一个普通的程序员,我一直游走在java语言中,java也确实让我有了很多的体会.不过随着学习的深入,java语言的新技术产生的越来越多,从最初期的javase,我逐渐开始转变到ssh,ssi,这种主流的码农,.过了几天为了解决新问题,webservice的大旗也被我祭出来了,又过了些日子jms架构的activemq也开始必须学习了.再后来开始了一系列技术学习,osgi,restful.....
nginx lua开发经验总结 ronin47
使用nginx lua已经两三个月了，项目接开发完毕了，这几天准备上线并且跟高德地图对接。回顾下来lua在项目中占得必中还是比较大的，跟PHP的占比差不多持平了，因此在开发中遇到一些问题备忘一下 1：content_by_lua中代码容量有限制，一般不要写太多代码，正常编写代码一般在100行左右（具体容量没有细心测哈哈，在4kb左右），如果超出了则重启nginx的时候会报 too long pa
java-66-用递归颠倒一个栈。例如输入栈{1,2,3,4,5}，1在栈顶。颠倒之后的栈为{5,4,3,2,1}，5处在栈顶 bylijinnan java
import java.util.Stack; public class ReverseStackRecursive { /** * Q 66.颠倒栈。 * 题目：用递归颠倒一个栈。例如输入栈{1,2,3,4,5}，1在栈顶。 * 颠倒之后的栈为{5,4,3,2,1}，5处在栈顶。 *1. Pop the top element *2. Revers
正确理解Linux内存占用过高的问题 cfyme linux
Linux开机后，使用top命令查看，4G物理内存发现已使用的多大3.2G，占用率高达80%以上： Mem: 3889836k total, 3341868k used, 547968k free, 286044k buffers Swap: 6127608k total,&nb
[JWFD开源工作流]当前流程引擎设计的一个急需解决的问题 comsci 工作流
当我们的流程引擎进入IRC阶段的时候，当循环反馈模型出现之后，每次循环都会导致一大堆节点内存数据残留在系统内存中，循环的次数越多，这些残留数据将导致系统内存溢出，并使得引擎崩溃。。。。。。而解决办法就是利用汇编语言或者其它系统编程语言，在引擎运行时，把这些残留数据清除掉。
自定义类的equals函数 dai_lm equals
仅作笔记使用 public class VectorQueue { private final Vector<VectorItem> queue; private class VectorItem { private final Object item; private final int quantity; public VectorI
Linux下安装R语言 datageek R语言 linux
命令如下：sudo gedit /etc/apt/sources.list1、deb http://mirrors.ustc.edu.cn/CRAN/bin/linux/ubuntu/ precise/ 2、deb http://dk.archive.ubuntu.com/ubuntu hardy universesudo apt-key adv --keyserver ke
如何修改mysql 并发数(连接数)最大值 dcj3sjt126com mysql
MySQL的连接数最大值跟MySQL没关系，主要看系统和业务逻辑了方法一：进入MYSQL安装目录打开MYSQL配置文件 my.ini 或 my.cnf查找 max_connections=100 修改为 max_connections=1000 服务里重起MYSQL即可　　方法二：MySQL的最大连接数默认是100客户端登录：mysql -uusername -ppass
单一功能原则 dcj3sjt126com 面向对象的程序设计软件设计编程原则
单一功能原则[ 编辑] SOLID 原则单一功能原则开闭原则 Liskov代换原则接口隔离原则依赖反转原则查论编在面向对象编程领域中，单一功能原则（Single responsibility principle）规定每个类都应该有
POJO、VO和JavaBean区别和联系 fanmingxing VO POJO javabean
POJO和JavaBean是我们常见的两个关键字，一般容易混淆，POJO全称是Plain Ordinary Java Object / Plain Old Java Object，中文可以翻译成：普通Java类，具有一部分getter/setter方法的那种类就可以称作POJO，但是JavaBean则比POJO复杂很多，JavaBean是一种组件技术，就好像你做了一个扳子，而这个扳子会在很多地方被
SpringSecurity3.X--LDAP：AD配置 hanqunfeng SpringSecurity
前面介绍过基于本地数据库验证的方式，参考http://hanqunfeng.iteye.com/blog/1155226，这里说一下如何修改为使用AD进行身份验证【只对用户名和密码进行验证，权限依旧存储在本地数据库中】。将配置文件中的如下部分删除：
mac mysql 修改密码 IXHONG mysql
$ sudo /usr/local/mysql/bin/mysqld_safe –user=root & //启动MySQL(也可以通过偏好设置面板来启动)$ sudo /usr/local/mysql/bin/mysqladmin -uroot password yourpassword //设置MySQL密码（注意，这是第一次MySQL密码为空的时候的设置命令，如果是修改密码，还需在-
设计模式--抽象工厂模式 kerryg 设计模式
抽象工厂模式：工厂模式有一个问题就是，类的创建依赖于工厂类，也就是说，如果想要拓展程序，必须对工厂类进行修改，这违背了闭包原则。我们采用抽象工厂模式，创建多个工厂类，这样一旦需要增加新的功能，直接增加新的工厂类就可以了，不需要修改之前的代码。总结：这个模式的好处就是，如果想增加一个功能，就需要做一个实现类，
评"高中女生军训期跳楼” nannan408
首先，先抛出我的观点，各位看官少点砖头。那就是，中国的差异化教育必须做起来。孔圣人有云：有教无类。不同类型的人，都应该有对应的教育方法。目前中国的一体化教育，不知道已经扼杀了多少创造性人才。我们出不了爱迪生，出不了爱因斯坦，很大原因，是我们的培养思路错了，我们是第一要“顺从”。如果不顺从，我们的学校，就会用各种方法，罚站，罚写作业，各种罚。军
scala如何读取和写入文件内容？ qindongliang1922 java jvm scala
直接看如下代码： package file import java.io.RandomAccessFile import java.nio.charset.Charset import scala.io.Source import scala.reflect.io.{File, Path} /** * Created by qindongliang on 2015/
C语言算法之百元买百鸡 qiufeihu c 算法
中国古代数学家张丘建在他的《算经》中提出了一个著名的“百钱买百鸡问题”，鸡翁一，值钱五，鸡母一，值钱三，鸡雏三，值钱一，百钱买百鸡，问翁，母，雏各几何？代码如下： #include <stdio.h> int main() { int cock,hen,chick; /*定义变量为基本整型*/ for(coc
Hadoop集群安全性：Hadoop中Namenode单点故障的解决方案及详细介绍AvatarNode wyz2009107220 NameNode
正如大家所知，NameNode在Hadoop系统中存在单点故障问题，这个对于标榜高可用性的Hadoop来说一直是个软肋。本文讨论一下为了解决这个问题而存在的几个solution。 1. Secondary NameNode 原理：Secondary NN会定期的从NN中读取editlog，与自己存储的Image进行合并形成新的metadata image 优点：Hadoop较早的版本都自带，

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他