新缸中之脑

【无标题】

在本博客中，我们将使用 UCF101 数据集深入探索动作识别的迷人世界。动作识别是计算机视觉中的一项关键任务，其应用范围从监视到人机交互。 UCF101 数据集是我们进行此探索的游乐场。我们的目标是建立一个结合卷积神经网络 (CNN) 和长短期记忆 (LSTM) 网络的动作识别模型，以取得令人印象深刻的结果。

NSDT工具推荐： Three.js AI纹理开发包 - YOLO合成数据生成器 - GLTF/GLB在线编辑 - 3D模型格式在线转换 - 可编程3D场景编辑器 - REVIT导出3D模型插件 - 3D模型语义搜索引擎 - Three.js虚拟轴心开发包

1、了解 UCF101 数据集

UCF101 数据集是动作识别研究人员的金矿。它由 101 个操作类别组成，适合广泛的应用。每个动作都记录在不同的场景中，增加了数据集的复杂性。在本节中，我们将深入研究数据集的细节，包括其大小、标签和视频格式。我们还将讨论为什么 UCF101 数据集是动作识别实验的首选。

1.1 长短期记忆网络

长短期记忆 (LSTM) 网络已成为动作识别领域的关键组成部分，它们的采用已经改变了该领域。引入这些专门的循环神经网络 (RNN) 是为了解决传统 RNN 在处理顺序数据时的局限性，使其成为对视频中固有的时间动态进行建模的理想选择。在动作识别中，运动的背景和随时间的变化起着至关重要的作用。与静态图像分类任务（CNN 通常就足够了）不同，识别动作需要深入了解视觉模式在视频序列中如何演变。

LSTM 凭借其独特的记忆单元，擅长捕获数据中的时间依赖性。每个细胞都可以长时间存储信息，确保过去的观察对预测产生重大影响，甚至遥远的事件也可能影响识别过程。这种时间建模能力与动作识别带来的挑战完美契合，其中动作的细微差别可能会逐渐演变，跨越多个帧。例如，在区分“跑步”和“跳跃”时，腿部运动和身体姿势随时间的顺序至关重要，而 LSTM 擅长捕捉这些微妙之处。

此外，LSTM 在处理不同长度的序列方面提供了灵活性，这在动作识别数据集中很常见。动作可以以不同的速度展开，LSTM 网络可以自然地适应这些动态。这种适应性，加上它们处理远程依赖性的鲁棒性，导致它们在动作识别研究中得到广泛采用。 LSTM 层的输出可以封装整个视频序列的抽象表示，然后可用于进行准确的动作预测。本质上，LSTM 充当模型的时间记忆，弥合了卷积神经网络 (CNN) 提取的空间特征与最终动作识别决策之间的差距。

LSTM 是动作识别机制中的重要齿轮，因为它们能够有效地对顺序数据进行建模。它们将时间元素带入识别过程中，这使得它们对于时间动态很重要的任务来说是不可或缺的。随着我们继续通过视频数据探索人类行为的细微差别，LSTM 很可能仍然是这个令人兴奋的领域的基石，帮助我们在监控、人机交互等应用中解锁新的可能性。

1.2 LSTM + CNN

2、预处理和数据准备

在将 UCF101 数据集输入到我们的模型之前，我们需要对其进行适当的准备。这涉及几个基本步骤。我们将介绍数据预处理技术，例如调整大小、标准化和数据增强，以确保我们的模型有效学习。我们还将演示如何将数据集分为训练集、验证集和测试集以进行稳健评估。

from google.colab import drive
drive.mount('/content/drive')
!pip install tensorflow

import os
import cv2
import math
import random
import numpy as np
import datetime as dt
import tensorflow as tf
from collections import deque
import matplotlib.pyplot as plt

from moviepy.editor import *
%matplotlib inline

from sklearn.model_selection import train_test_split

from tensorflow.keras.layers import *
from tensorflow.keras.models import Sequential
from tensorflow.keras.utils import to_categorical
from tensorflow.keras.callbacks import EarlyStopping
from tensorflow.keras.utils import plot_model

!unrar x UCF50.rar

import random

plt.figure(figsize=(20, 20))
all_classes_names = os.listdir('UCF50')

for counter, selected_class_Name in enumerate(all_classes_names, 1):
    video_files_names_list = os.listdir(f'UCF50/{selected_class_Name}')

    # Check if there are video files in the folder
    if video_files_names_list:
        selected_video_file_name = random.choice(video_files_names_list)
        video_reader = cv2.VideoCapture(f'UCF50/{selected_class_Name}/{selected_video_file_name}')
        _, bgr_frame = video_reader.read()
        video_reader.release()
        rgb_frame = cv2.cvtColor(bgr_frame, cv2.COLOR_BGR2RGB)
        cv2.putText(rgb_frame, selected_class_Name, (10, 30), cv2.FONT_HERSHEY_SIMPLEX, 1, (255, 255, 255), 2)
        plt.subplot(5, 10, counter)  # Adjust the number of rows and columns as needed
        plt.imshow(rgb_frame)
        plt.axis('off')
    else:
        print(f"No video files found in folder {selected_class_Name}")

plt.show()

IMAGE_HEIGHT,IMAGE_WIDTH = 64,64
SEQUENCE_LENGTH = 20
DATASET_DIR="UCF50"
CLASSES_LIST=["PlayingTabla","PommelHorse","JumpingJack","PushUps","PoleVault","HorseRace","HighJump","Drumming","HorseRiding","Diving","BreastStroke",
              "Basketball","TrampolineJumping","YoYo","SalsaSpin","WalkingWithDog","VolleyballSpiking","ThrowDiscus","TennisSwing","TaiChi","Swing",
              "SoccerJuggling","Skijet","Skiing","SkateBoarding","Rowing","RopeClimbing","RockClimbingIndoor","Punch","PullUps","PlayingViolin","PlayingPiano","PlayingGuitar",
              "PizzaTossing","Nunchucks","Mixing","MilitaryParade","Lunges","Kayaking","JumpRope","JugglingBalls","JavelinThrow","HulaHoop","GolfSwing","Fencing",
              "CleanAndJerk","Billiards","Biking","BenchPress","BaseballPitch"]

3、用于特征提取的卷积神经网络 (CNN)

CNN 是我们动作识别模型的支柱。在本节中，我们将探讨 CNN 在从视频帧中提取空间特征方面的作用。我们将讨论流行的 CNN 架构，例如 VGG16 和 ResNet，它们可用作强大的特征提取器。此外，我们将介绍为 UCF101 数据集量身定制的自定义 CNN 架构。将提供用于构建和训练 CNN 模型的代码示例。

def frames_extraction(video_path):
  frames_list=[]
  video_reader = cv2.VideoCapture(video_path)
  video_frames_count = int(video_reader.get(cv2.CAP_PROP_FRAME_COUNT))
  skip_frames_window = max(int(video_frames_count/SEQUENCE_LENGTH),1)
  for frame_counter in range(SEQUENCE_LENGTH):
    video_reader.set(cv2.CAP_PROP_POS_FRAMES,frame_counter*skip_frames_window)
    success,frame = video_reader.read()
    if not success:
      break

    resized_frame = cv2.resize(frame,(IMAGE_HEIGHT,IMAGE_WIDTH))
    normalized_frame = resized_frame / 255
    frames_list.append(normalized_frame)
  video_reader.release()

  return frames_list

def create_dataset():
  features = []
  labels = []
  video_files_paths = []
  for class_index,class_name in enumerate(CLASSES_LIST[:40]):
    print(f'Extracting Data of CLass: {class_name}')

    files_list = os.listdir(os.path.join(DATASET_DIR,class_name))
    for file_name in files_list:
      video_file_path = os.path.join(DATASET_DIR,class_name,file_name)

      frames = frames_extraction(video_file_path)
      if len(frames) == SEQUENCE_LENGTH:
        features.append(frames)
        labels.append(class_index)
        video_files_paths.append(video_file_path)
  features = np.asarray(features)
  labels = np.array(labels)

  return features,labels,video_files_paths
features,labels,video_files_paths = create_dataset()
one_hot_encoded_labels = to_categorical(labels)

seed_constant = 27
np.random.seed(seed_constant)
random.seed(seed_constant)
tf.random.set_seed(seed_constant)

features_train,features_test,labels_train,lables_test = train_test_split(features,one_hot_encoded_labels,
                                                                         test_size = 0.25,shuffle = True,
                                                                         random_state = seed_constant)

4、用于时间建模的长短期记忆 (LSTM) 网络

动作识别不仅仅涉及空间特征；还涉及空间特征。它还与时间依赖性有关。 LSTM 网络可以帮助捕捉这些时间关系。我们将深入研究 LSTM 背后的理论及其有效建模序列的独特能力。你将深入了解我们为 UCF101 设计的基于 LSTM 的模型的架构。我们将解决处理视频序列作为输入数据的挑战。

def create_LRCN_model():


    model = Sequential()

    #Model Architecture.
    #---------------------------------------------------------------------------------------------------------------------------------------------------#

    model.add(TimeDistributed(Conv2D(16, (3, 3), padding='same',activation = 'relu'),
                              input_shape = (SEQUENCE_LENGTH, IMAGE_HEIGHT, IMAGE_WIDTH, 3)))

    model.add(TimeDistributed(MaxPooling2D((4, 4))))
    model.add(TimeDistributed(Dropout(0.25)))

    model.add(TimeDistributed(Conv2D(32, (3, 3), padding='same',activation = 'relu')))
    model.add(TimeDistributed(MaxPooling2D((4, 4))))
    model.add(TimeDistributed(Dropout(0.25)))

    model.add(TimeDistributed(Conv2D(64, (3, 3), padding='same',activation = 'relu')))
    model.add(TimeDistributed(MaxPooling2D((2, 2))))
    model.add(TimeDistributed(Dropout(0.25)))

    model.add(TimeDistributed(Conv2D(64, (3, 3), padding='same',activation = 'relu')))
    model.add(TimeDistributed(MaxPooling2D((2, 2))))
    #model.add(TimeDistributed(Dropout(0.25)))

    model.add(TimeDistributed(Flatten()))

    #K-LAYERED LSTM K=1
    model.add(LSTM(32))

    model.add(Dense(len(CLASSES_LIST[:10]), activation = 'softmax'))

    #------------------------------------------------------------------------------------------------------------------------------------------------#

    model.summary()


    return model
LRCN_model = create_LRCN_model()

print("Model Created Successfully!")

层数：TimeDistributed 层中卷积层和池化层数量的选择基于从视频帧中提取空间特征的通用架构模式，逐渐增加深度（滤波器数量），同时减少空间维度以捕获分层特征。
激活函数：卷积层选择 ReLU（修正线性单元）激活函数，因为它们向模型引入了非线性，使其能够有效地学习数据中的复杂模式。
Dropout：在每个 MaxPooling2D 层之后添加了 dropout 率为 0.25 的 Dropout 层，以通过在训练期间随机停用一部分神经元来防止过度拟合。
LSTM 层：选择具有 32 个单元的单个 LSTM 层来有效捕获视频序列中的时间依赖性。
输出层激活：输出层使用softmax激活函数，将模型的logits转换为类概率，适用于多类分类任务。

Model: "sequential"
_________________________________________________________________
 Layer (type)                Output Shape              Param #   
=================================================================
 time_distributed (TimeDist  (None, 20, 64, 64, 16)    448       
 ributed)                                                        
                                                                 
 time_distributed_1 (TimeDi  (None, 20, 16, 16, 16)    0         
 stributed)                                                      
                                                                 
 time_distributed_2 (TimeDi  (None, 20, 16, 16, 16)    0         
 stributed)                                                      
                                                                 
 time_distributed_3 (TimeDi  (None, 20, 16, 16, 32)    4640      
 stributed)                                                      
                                                                 
 time_distributed_4 (TimeDi  (None, 20, 4, 4, 32)      0         
 stributed)                                                      
                                                                 
 time_distributed_5 (TimeDi  (None, 20, 4, 4, 32)      0         
 stributed)                                                      
                                                                 
 time_distributed_6 (TimeDi  (None, 20, 4, 4, 64)      18496     
 stributed)                                                      
                                                                 
 time_distributed_7 (TimeDi  (None, 20, 2, 2, 64)      0         
 stributed)                                                      
                                                                 
 time_distributed_8 (TimeDi  (None, 20, 2, 2, 64)      0         
 stributed)                                                      
                                                                 
 time_distributed_9 (TimeDi  (None, 20, 2, 2, 64)      36928     
 stributed)                                                      
                                                                 
 time_distributed_10 (TimeD  (None, 20, 1, 1, 64)      0         
 istributed)                                                     
                                                                 
 time_distributed_11 (TimeD  (None, 20, 64)            0         
 istributed)                                                     
                                                                 
 lstm (LSTM)                 (None, 32)                12416     
                                                                 
 dense (Dense)               (None, 10)                330       
                                                                 
=================================================================
Total params: 73258 (286.16 KB)
Trainable params: 73258 (286.16 KB)
Non-trainable params: 0 (0.00 Byte)
_________________________________________________________________
Model Created Successfully!

def plot_metric(model_training_history,metric_name1,metric_name2,plot_name):
  metric_value1 = model_training_history.history[metric_name1]
  metric_value2 = model_training_history.history[metric_name2]

  epochs = range(len(metric_value1))

  plt.plot(epochs,metric_value1,'blue',label=metric_name1)
  plt.plot(epochs,metric_value2,'red',label=metric_name2)
  plt.title(str(plot_name))

  plt.legend()

Learning Rate: The choice of the learning rate (lr) was based on experimentation to find a value that allowed the model to converge effectively without causing divergence, and a value of 0.001 (default for Adam optimizer) was found to work well.

Optimizer: The Adam optimizer was chosen because it combines the benefits of both AdaGrad and RMSProp, providing effective optimization for training deep neural networks.

Epochs: The number of epochs (100) was selected based on early stopping to prevent overfitting while allowing the model to train until convergence.

Batch Size: A batch size of 4 was chosen to strike a balance between computation efficiency and model stability during training.

Loss Function: Categorical Crossentropy was chosen as the loss function because it is suitable for multi-class classification tasks and encourages the model to minimize the difference between predicted and actual class probabilities.

import time

# before training
start_time = time.time()

early_stopping_callback = EarlyStopping(monitor='accuracy', patience=10, mode='max', restore_best_weights=True)

LRCN_model.compile(loss='categorical_crossentropy', optimizer='Adam', metrics=["accuracy"])

# Start training
LRCN_model_training_history = LRCN_model.fit(x=features_train, y=labels_train, epochs=100, batch_size=4,
                                             shuffle=True, validation_split=0.2, callbacks=[early_stopping_callback])

# end time after training
end_time = time.time()

# total training time
total_training_time = end_time - start_time
print(f"Total training time: {total_training_time:.2f} seconds")
model_evaluation_history = LRCN_model.evaluate(features_test,lables_test)

5、模型集成：CNN + LSTM

当我们将 CNN 和 LSTM 层结合起来形成我们的动作识别模型时，奇迹就发生了。我们将探索 3D 卷积的概念，它无缝地融合了空间和时间特征。我们将展示集成 CNN-LSTM 模型的架构，包括输入形状和层连接。为了获得实践经验，我们将提供用于构建这个强大模型的代码示例。

6、训练与评估

训练我们的模型是关键的一步，它涉及选择适当的损失函数和优化器。我们将解释超参数调整以实现最佳性能的重要性。将详细讨论评估指标，例如准确性、混淆矩阵和 F1 分数。准备好深入分析我们的模型在 UCF101 测试集上的结果。

import os
from moviepy.editor import VideoFileClip
test_videos_directory='test_videos'
os.makedirs(test_videos_directory,exist_ok=True)


input_video_file_path = '/content/drive/MyDrive/Cognitica/Test_dir/v_Diving_g25_c02.avi'


video_title = os.path.splitext(os.path.basename(input_video_file_path))[0]

print(f"Video Name: {video_title}")

def predict_on_video(video_file_path, output_file_path, SEQUENCE_LENGTH):
    video_reader = cv2.VideoCapture(video_file_path)

    original_video_width = int(video_reader.get(cv2.CAP_PROP_FRAME_WIDTH))
    original_video_height = int(video_reader.get(cv2.CAP_PROP_FRAME_HEIGHT))

    video_writer = cv2.VideoWriter(output_file_path, cv2.VideoWriter_fourcc('M', 'P', '4', 'V'),
                                  video_reader.get(cv2.CAP_PROP_FPS), (original_video_width, original_video_height))

    frames_queue = deque(maxlen=SEQUENCE_LENGTH)

    predicted_class_name = ''

    while video_reader.isOpened():
        ok, frame = video_reader.read()
        if not ok:
            break  # Exit the loop when there are no more frames

        # Check if the frame is empty before resizing
        if not frame.size:
            continue

        resized_frame = cv2.resize(frame, (IMAGE_HEIGHT, IMAGE_WIDTH))
        normalized_frame = resized_frame / 255
        frames_queue.append(normalized_frame)

        if len(frames_queue) == SEQUENCE_LENGTH:
            predicted_labels_probabilities = LRCN_model.predict(np.expand_dims(frames_queue, axis=0))[0]
            predicted_label = np.argmax(predicted_labels_probabilities)

            predicted_class_name = CLASSES_LIST[predicted_label]

            cv2.putText(frame, predicted_class_name, (10, 30), cv2.FONT_HERSHEY_SIMPLEX, 1, (0, 255, 0), 2)
            video_writer.write(frame)

    video_reader.release()
    video_writer.release()

%%capture


output_dir = "/content/drive/MyDrive/Cognitica/Output"
output_video_file_path = f'{output_dir}/{video_title}-Output-SeqLen{SEQUENCE_LENGTH}.mp4'
predict_on_video(input_video_file_path, output_video_file_path, SEQUENCE_LENGTH)


processed_video = VideoFileClip(output_video_file_path, audio=False, target_resolution=(300, None))
processed_video.ipython_display()

分类报告：

%%capture

true_labels = []  # true labels for each frame
predicted_labels = []  # predicted labels for each frame
#predict labels for a video
def predict_on_video(video_file_path, true_label):
    video_reader = cv2.VideoCapture(video_file_path)
    frames_queue = deque(maxlen=SEQUENCE_LENGTH)

    while video_reader.isOpened():
        ok, frame = video_reader.read()
        if not ok:
            break


        if not frame.size:
            continue

        resized_frame = cv2.resize(frame, (IMAGE_HEIGHT, IMAGE_WIDTH))
        normalized_frame = resized_frame / 255
        frames_queue.append(normalized_frame)

        if len(frames_queue) == SEQUENCE_LENGTH:

            predicted_labels_probabilities = LRCN_model.predict(np.expand_dims(frames_queue, axis=0))[0]
            predicted_label = np.argmax(predicted_labels_probabilities)

            predicted_class_name = CLASSES_LIST[predicted_label]


            true_labels.append(true_label)
            predicted_labels.append(predicted_class_name)

    video_reader.release()

    return true_labels, predicted_labels

#test vids
class_name_mapping = {
    'v_Diving_g25_c02': 'Diving',
    'v_Drumming_g25_c07': 'Drumming',
    'v_HighJump_g25_c04': 'HighJump',
    'v_HorseRace_g25_c04': 'HorseRace',
    'v_HorseRiding_g25_c21': 'HorseRiding',
    'v_JumpingJack_g25_c07': 'JumpingJack',
    'v_PlayingTabla_g22_c04': 'PlayingTabla',
    'v_PoleVault_g17_c09': 'PoleVault',
    'v_PommelHorse_g05_c04': 'PommelHorse',
    'v_PushUps_g26_c04': 'PushUps',
}

all_true_labels = []
all_predicted_labels = []


test_videos_directory = '/content/drive/MyDrive/Cognitica/Test_dir'

for video_file in os.listdir(test_videos_directory):
    if video_file.endswith(".avi"):
        video_file_path = os.path.join(test_videos_directory, video_file)
        video_title = os.path.splitext(os.path.basename(video_file_path))[0]

        # Map video_title
        class_name = class_name_mapping.get(video_title, 'Unknown')


        true_labels_video, predicted_labels_video = predict_on_video(video_file_path, true_label=class_name)

        all_true_labels.extend(true_labels_video)
        all_predicted_labels.extend(predicted_labels_video)


with warnings.catch_warnings():
    warnings.filterwarnings("ignore", category=UndefinedMetricWarning)

    report = classification_report(all_true_labels, all_predicted_labels)

    print(report)

混淆矩阵：


confusion = confusion_matrix(all_true_labels, all_predicted_labels)

print("Confusion Matrix:")
print(confusion)

7、实际应用

LSTM+CNN（长短期记忆+卷积神经网络）架构由于能够捕获空间和时间特征，因此在各个领域都有应用。以下是一些值得注意的应用：

视频中的动作识别：LSTM+CNN模型广泛用于识别视频序列中的人类动作。他们可以使用 CNN 捕获空间细节，并使用 LSTM 对跨帧的时间依赖性进行建模，从而有效区分复杂的动作。
手势识别：手语或人机交互场景中的手势识别受益于LSTM+CNN架构。他们可以解释手势的静态手部位置（空间特征）和随时间的动态变化（时间特征）。
视频监控：对监控录像中的活动进行检测和分类对于安全至关重要。 LSTM+CNN 模型擅长通过分析视频流中的空间和时间模式来识别可疑行为。
自动驾驶：自动驾驶汽车采用 LSTM 与 CNN 相结合来解释交通场景。他们可以识别物体，预测它们的运动，并根据时间背景做出决策，从而为更安全的自动驾驶汽车做出贡献。
人体姿势估计：从图像或视频估计人体姿势通常需要捕获身体部位的空间关系及其时间演变。 LSTM+CNN 可以有效地处理这个任务。
语音识别：虽然不是直接视觉化的，但 LSTM+CNN 架构可用于自动语音识别系统。它们处理音频频谱图（空间特征）并对语音信号的顺序性质（时间特征）进行建模。
医学图像分析：在医学成像中，识别异常情况或跟踪患者扫描随时间的变化至关重要。 LSTM+CNN 模型有助于有效分析 3D 或时间序列医学图像。
自然语言处理：LSTM+CNN 主要用于图像和视频，但也适用于处理自然语言处理任务中的时空数据。它们可以处理词嵌入序列并捕获文本数据中的上下文。
金融时间序列预测：预测股票价格或金融市场趋势涉及分析具有时间依赖性的历史数据。 LSTM+CNN 模型可以捕获金融时间序列数据中的复杂模式。
手势控制设备：手势控制电视或智能家电等设备使用 LSTM+CNN 模型来解释手部动作和手势，从而实现直观的用户交互。
机器人技术：配备摄像头和传感器的机器人可以受益于 LSTM+CNN 架构，以导航复杂的环境、识别物体并根据视觉和时间线索做出决策。
情绪识别：从视频中的面部表情中理解人类情绪需要分析面部的空间细节和表情的时间演变，这使得 LSTM+CNN 在这种情况下很有价值。

这些应用展示了 LSTM+CNN 架构在处理涉及时空数据的各种任务方面的多功能性。它们结合空间和时间信息的能力使它们成为上下文和时间至关重要的任务的有力选择。

8、结束语

当我们结束对 UCF101 数据集的动作识别的探索时，让我们总结一下关键要点。我们见证了该数据集的重要性、CNN 和 LSTM 的强大功能以及它们组合的协同作用。我们鼓励你踏上动作识别之旅，尝试 CNN-LSTM 模型，并利用 UCF101 数据集来突破人工智能的界限。如果你喜欢亲手实践，本文的代码可以从这里获取。

原文链接：LSTM+CNN动作识别 - BimAnt

基于人体骨架动作识别的神经信息处理技术（2 相关工作-2.4提高信号质量）路由跳变动作识别人工智能
2相关工作在本节中，我们将回顾本论文的相关工作。我们根据文献的功能将文献分为四类，包括1)数据集，2)提取空间特征，3)捕获时间模式，4)提高信号质量。对于每个组件，我们将其进一步分解为细分区域。最后，我们展示了现有方法在不同数据集上的SOTA改进。总之，该分类法如下：1)数据集2)提取空间特征利用拓扑结构、设计空间操作符、分离通道功能、学习参数化拓扑、分区层次结构。3)捕获时间模式提取多尺度特征
AI人工智能中LSTM在视频行为识别的应用
AI人工智能中LSTM在视频行为识别的应用关键词：LSTM、视频行为识别、深度学习、时序建模、计算机视觉、神经网络、动作识别摘要：本文将深入探讨LSTM（长短期记忆网络）在视频行为识别领域的应用。我们将从基础概念出发，逐步讲解LSTM如何解决视频时序建模的挑战，分析其核心算法原理，并通过实际代码示例展示LSTM在行为识别中的具体实现。文章还将探讨当前的应用场景、工具资源以及未来发展趋势，为读者提供
cnn 一维时序数据_AI顶会解读|时序动作分割与检测，附代码链接
时序动作分割与检测时序动作的分割与检测是视频计算机视觉技术的一大常规任务，对自动驾驶和机器人等应用至关重要，下面3篇论文是腾讯AILab在这一方向的探索成果。1.动作识别中的时序帧间差异表征学习TemporalDistinctRepresentationLearningforActionRecognition本文由腾讯AILab、腾讯优图实验室、新加坡南洋理工大学、美国纽约州立大学布法罗分校合作完
AI人工智能领域的体育竞技智能分析 AIGC应用创新大全人工智能 ai
AI人工智能领域的体育竞技智能分析关键词：体育竞技分析、计算机视觉、动作识别、数据挖掘、运动表现预测、智能训练系统、实时决策支持摘要：本文将深入探讨AI在体育竞技领域的创新应用，从基础概念到核心技术，再到实际应用案例。我们将了解计算机如何"看懂"体育比赛，分析运动员动作，预测比赛结果，并帮助教练制定更科学的训练计划。通过生动的比喻和实际代码示例，揭示AI如何成为现代体育竞技中的"数字教练"。背景介
智能分析：视频摘要生成_（3）.视频内容理解与分析 zhubeibei168 检验检测&人脸识别音视频人工智能深度学习
视频内容理解与分析视频内容理解与分析是视频摘要生成的关键步骤之一。这一节将详细介绍如何通过计算机视觉技术对视频内容进行理解和分析，包括视频分割、目标检测、动作识别、场景理解等多个方面。这些技术的结合使用，可以为后续的视频摘要生成提供丰富的信息和结构化的数据。视频分割视频分割是指将视频分成多个有意义的片段或场景。这一步骤有助于减少后续处理的复杂度，并提高视频内容的可解释性。视频分割的方法可以分为基于
PyTorchVideo实战：从零开始构建高效视频分类模型 deephub 人工智能 pytorch 深度学习视频分类
视频理解作为机器学习的核心领域，为动作识别、视频摘要和监控等应用提供了技术基础。本教程将详细介绍如何利用PyTorchVideo和PyTorchLightning两个强大框架，构建基于Kinetics数据集训练的3DResNet模型，实现高效的视频分类流程。PyTorchVideo与PyTorchLightning的技术优势PyTorchVideo提供了视频处理专用的预构建模型、数据集和增强功能，
基于人工智能的智能健身评分系统方案编码追梦人 AI人工智能人工智能 python
以下是智能健身评分系统的技术方案设计，涵盖人体关键点识别、动作识别与评分计数功能，可应用于智能硬件、健身APP或在线课程平台：一、系统架构设计二、核心技术选型1.人体关键点检测算法选择：PP-TinyPose：百度飞桨轻量化模型，FP16精度下实现122FPS检测速度，COCO数据集AP达51.8%。MoveNetThunder：Google轻量级模型，支持移动端实时推理，关键点检测精度80.6%
Move AI技术浅析（五）：动作识别与分类爱研究的小牛 AIGC—虚拟现实 AIGC—游戏制作 AIGC—深度伪造人工智能分类大数据 AIGC 深度学习
一、动作识别与分类模块概述动作识别与分类的主要任务是从提取到的运动特征中，识别出具体的动作类型，并对动作进行分类。该模块包括动作识别和动作分类。动作识别：从运动特征中识别出具体的动作类型，如走路、跑步、跳跃等。动作分类：对识别出的动作进行更细致的分类，如区分不同的舞蹈动作或不同的运动项目。二、动作识别详解2.1动作识别步骤详解2.1.1特征提取动作识别的第一步是从视频帧中提取出有意义的运动特征。特
行为识别的方法人工智能专属驿站深度学习
行为识别主要有以下几大类方法，每类方法各有特点及典型算法：传统方法特点：利用手工设计特征对行为进行表征，再用统计学习的分类方法进行识别。需一定专业知识设计特征，耗费人力物力，对复杂场景、遮挡等适应性差，但对简单背景、规则动作识别效果尚可。典型算法：时空关键点（Space-TimeInterestPoints）：基于视频图像中的关键点在时空维度上的变化来提取动作特征，但可能忽略视频细节，泛化能力较弱
MoveNet: PyTorch实现的轻量级人体姿态估计框架侯深业Dorian
MoveNet:PyTorch实现的轻量级人体姿态估计框架movenet.pytorch项目地址:https://gitcode.com/gh_mirrors/mo/movenet.pytorchMoveNet是一个基于PyTorch的人体姿态估计算法实现，由开发者fire717贡献至GitCode平台。该项目旨在提供一个高效、易用的解决方案，用于实时处理视频或图像中的人体动作识别。通过其强大的性
仿华为车机功能之--修改Launcher3,增加横向滑动桌面空白处切换壁纸的功能 Kwanvin Android Launcher3深度定制开发华为 java android
本功能基于Android13Launcher3需求：模仿华为问界车机，实现横向滑动桌面空白处，切换壁纸功能（本质只是切换背景，没有切换壁纸）。实现效果：实现思路：第一步首先得增加手势识别第二步切换底图，不切换壁纸是因为切换壁纸动作太大，需要调用到WallpaperManager,耗时且会触发应用activity重启原生系统有识别上滑与下滑的动作，那我们应该增加一个左滑和右滑的动作识别禁止上滑出所有
三件好事0512 行者2022
第一件好事：“吸”就是胸部打开，空气进入，能量跟着往上。“呼”就是胸部收紧，空气呼出，身体放松。昨天做呼吸的舞动学习，呼吸特别棒，开始分别从动作表达情感的空间、力量、时间纬度体验了呼吸的感受，让我真正体验到了呼吸的过程。然后又从动作识别人人格的“吮吸”“咬”、“扭”“压”、“流动”“中断”、“摇”“分娩”、“激情”“爆发”五种状态，去深度体验了呼吸，感觉非常棒，很滋养，等与呼吸建立深度关系，深度连
姿态估计概述 Diros1g 姿态估计
定义和优势单目摄像机拍摄的二维图像中预测行人的人体关键点坐标，为其他任务做支持如行人重识别、动作识别。目前分类两类：单人和多人基于计算机视觉的人体姿态佶计不需要额外的穿戴设备，该技术比传统的穿戴式动作捕捉技术成本更加低廉且灵活性更高人体姿态表示形式1.二位坐标关键点（人体主要关节）表达方式以二位坐标的形式（x,y），方法简洁，无序后处理2.空间热力图回归的数据是关键点落在该坐标的概率，优点定位更精
[文献翻译]Towards Good Practices for Very Deep Two-Stream ConvNets 夏迪End
摘要：深度卷积网络已经在静态图像目标识别中取得了了的巨大成功。但是，对于视频的动作识别，深度卷积网络的改进不是那么明显。我们认为这样子的结果可能有两个原因。首先，与图像中非常深的模型（例如VGGNet[13]，GoogLeNet[15]）相比，当前的网络体系结构（例如，双流ConvNets[12]）相对较浅，因此它们的建模能力受到其深度的限制。其次，更重要的可能是，动作识别的训练数据集与Image
一文读懂：图卷积在基于骨架的动作识别中的应用陌然_5236
姓名：张璐学号：19021210845转载自：https://new.qq.com/omn/20191208/20191208A09M4G00.html【嵌牛导读】基于骨架的动作识别（skeleton-basedactionrecognition）一直是计算机视觉领域中的一个研究热点，在计算机视觉的各大顶会AAAI、CVPR、NeurIPS等会议中都能见到它的身影。【嵌牛鼻子】动作识别、深度传感器
《Learning Spatiotemporal Features with 3D Convolutional Networks》算法详解 ce0b74704937
论文:LearningSpatiotemporalFeatureswith3DConvolutionalNetworks官方代码(caffe):http://vlg.cs.dartmouth.edu/c3d/由Facebook和Dartmouth学院提出被ICCV2015收录一、核心创新网络全部使用3D卷积和3D池化方便在不同的任务中使用，如动作识别、相同动作判断、动态场景识别等网络简单且高效二、
基于TriDet的时序动作检测算法训练自己的slowfast数据骑走的小木马动作识别算法 pytorch 计算机视觉 python
最近一直在研究时序动作识别和检测，也一直关注着目前的最新进展，有好的算法，我都会在我自己的数据集上运行看看，一方面是为自己累积相关算法，另一方面也是想看看，目前最新的算法是否可以应用到一些项目上。这次我运行2023年新出来的算法-时序动作检测TriDet。算法的论文地址和github地址如下：论文地址：https://arxiv.org/pdf/2303.07347.pdfGitHub地址：htt
人类行为动作数据集大合集地理探险家用于深度学习的数据集行为动作人类数据集图像深度学习
最近收集了一大波关于人类行为动作的数据集，主要包括：动作识别、行为识别、活动预测、动作行为分类等数据集。废话不多说，接下来就给大家介绍这些数据集！！1、用于自动视频编辑的视频Blooper数据集用于自动视频编辑的视频Blooper数据集数据说明：根据网上的消息，基本的视频编辑每分钟需要30分钟到一个小时。这就不鼓励用户制作周期性的内容。目前，自动视频编辑仅限于视频增强和简单的机制，如沉默或鼓掌检测
视频动作识别终极指南【2024】新缸中之脑音视频
让我们从尝试构建问题开始。但是，我会马上说，在一般情况下，这是不可能的。什么是动作（action）？如果我们看一下研究任务动作识别（actionrecognition），这里也没有达成共识。第一个最受欢迎的学术数据集包含2-20秒涉及人员的情况片段：CRCV|CenterforResearchinComputerVisionattheUniversityofCentralFlorida第二个最受欢
机器学习笔记 - 基于自定义数据集 + 3D CNN进行视频分类坐望云起深度学习从入门到精通机器学习深度学习 3D CNN 视频分类动作识别
一、简述这里主要介绍了基于自定义动作识别数据集训练用于视频分类的3D卷积神经网络(CNN)。3DCNN使用三维滤波器来执行卷积。内核能够在三个方向上滑动，而在2DCNN中它可以在二维上滑动。这里的模型主要基于D.Tran等人2017年的论文“动作识别的时空卷积研究”。https://arxiv.org/abs/1711.11248v3https://arxiv.org/abs/1711.11248
大模型学习与实践笔记（十） AllYoung_362 学习笔记人工智能 langchain AIGC llama
一、模型测评的意义二、如何对模型进行测评三、OpenCompass评测流水线设计四、大模型评测带来的挑战五、OpenCompass评测示例1.多模态优势：1.基于感知与推理，将评估维度逐级细分2.约3000道单选题，覆盖目标检测，文本识别，动作识别，图像理解，关系推理等20个细粒度评估维度2.法律优势：1.三级认知维度（法律知识理解，法律知识记忆，法律知识应用）2.20个法律任务，10000到测评
【无标题】新缸中之脑动作识别
在本博客中，我们将使用UCF101数据集深入探索动作识别的迷人世界。动作识别是计算机视觉中的一项关键任务，其应用范围从监视到人机交互。UCF101数据集是我们进行此探索的游乐场。我们的目标是建立一个结合卷积神经网络(CNN)和长短期记忆(LSTM)网络的动作识别模型，以取得令人印象深刻的结果。NSDT工具推荐：Three.jsAI纹理开发包-YOLO合成数据生成器-GLTF/GLB在线编辑-3D模
商务沟通（十六）小动作识别法做最完美的小开心
第18个商务沟通技巧叫做小动作识别法小动作学问大，小动作代表客户身心分离，要引导客户安定情绪，创造客户身心合一的安全感，这样的话才能加速客户购买的意愿。细心观察客户的身心情绪秘密，拨弄鼻子是有压力的行为，摸头发是不专心听讲的行为，他有不同的意见，看手表是不想听这个东西，起身接电话也是没有专心听讲，他如果开始打歌并不是消化不良，而是跟自己的情绪有关是不想听了，讲话的时候声音提得很高就说明他很激动，如
YOLOv7姿态估计pose estimation(姿态估计-目标检测-跟踪) 毕设阿力 YOLO 目标检测目标跟踪
YOLOv7姿态估计（poseestimation）是一种基于YOLOv7算法的姿态估计方法。该算法使用深度学习技术，通过分析图像中的人体关键点位置，实现对人体姿态的准确估计。姿态估计是计算机视觉领域的重要任务，它可以识别人体的关节位置和姿势，从而为人体行为分析、动作识别、运动捕捉等应用提供基础支持。YOLOv7姿态估计算法通过端到端的训练和推理过程，能够快速、准确地检测和估计人体的姿态信息。YO
基于 Python+Django 构建智能互动拍照系统 Python数据开发学习笔记 python 开发语言算法 AI 计算机视觉
本系统旨在探索先进的计算机视觉算法在大熊猫主题的互动拍照场景上的应用。系统结合人脸及人体关键点识别，人像分割，目标检测，图像风格迁移，以及自己设计实现的熊猫分割PandaSeg，动作识别PoseRecognition等算法，依托Django框架搭建的Web应用，在服务器端使用tensorflow、pytorch等深度学习框架搭建的智能图像处理模块处理前端通过单目相机捕获的图片并实时返回处理结果，目
一种安防场景下融合注意力机制和时空图卷积神经网络的人体动作识别方法与流程 baidu_huihui cnn 人工智能神经网络
本发明涉及模式识别与计算机视觉领域，尤其涉及一种安防场景下融合注意力机制和时空图卷积神经网络的人体动作识别方法。背景技术：视觉一直是人类获取外界信息的最重要、最直观的途径，据有关统计，人类获取信息的80％都是通过视觉。随着摄像头等图像传感器的质量不断上升，同时价格的不断下降，图像传感器得到大规模的部署和应用，每天都会因此产生海量的信息。单纯地依靠眼睛去获取所需要的信息已经不能满足人们对与新信息、新
STM32 手势识别传感器模块(PAJ7620)学习三马分享家 STM32与模块 stm32 学习单片机
目录模块介绍：基本部分：引脚配置：工作原理：展示部分：代码部分展示(在正点的基础上加了一个读手势去控制舵机)：视频展示：模块介绍：基本部分：手势模块搭载的芯片是PAJ7620，无论是正点原子的还是别的手势模块的底层是一致的，甚至代码也是通用的。芯片内部集成了光学数组式传感器，以使复杂的手势和光标模式输出，自带九种手势识别，支持上、下、左、右、前、后、顺时针旋转、逆时针旋转和挥动的手势动作识别，有效
基于骨骼的动作识别：DD-Net AIRV_Gao 论文笔记计算机视觉动态手势识别
MakeSkeleton-basedActionRecognitionModelSmaller,FasterandBetter论文解读概述1.简介2.relatedworks3.方法2.1基于关节的位置视点不变特征建模集合的距离（JointCollectionDistances(JCD)）2.2用双尺度建模全局尺度不变运动运动特性2.3基于嵌入的关节关联建模3.实验3.1实验数据集3.2评价设置3
综述：基于骨骼（skeleton）的动作识别方法 AIRV_Gao 论文笔记人工智能计算机视觉深度学习
Deeplearning‐basedactionrecognitionwith3Dskeleton:Asurvey1.简介1.13DSkeleton‐basedActionRecognition1.简介1.13DSkeleton‐basedActionRecognition用途：基于骨骼的人体动作识别是计算机视觉领域的一个热门研究课题，已广泛应用于视频理解、视频监控、人机交互、机器人视觉、自动驾驶
深度学习在人体动作识别领域的应用：开源工具、数据集资源及趋动云GPU算力不可或缺 virtaitech gpu 计算机视觉深度学习
人体动作识别检测是一种通过使用计算机视觉和深度学习技术，对人体姿态和动作进行实时监测和分析的技术。该技术旨在从图像或视频中提取有关人体姿态、动作和行为的信息，以便更深入地识别和理解人的活动。人体动作识别检测的基本步骤包括：数据采集：收集包含人体动作的图像或视频数据，这可以通过摄像头、深度传感器或其他传感器来完成。预处理：对采集到的数据进行预处理，包括图像去噪、颜色调整等，以确保输入数据质量。特征提
tomcat基础与部署发布暗黑小菠萝 Tomcat java web
从51cto搬家了，以后会更新在这里方便自己查看。做项目一直用tomcat，都是配置到eclipse中使用，这几天有时间整理一下使用心得，有一些自己配置遇到的细节问题。 Tomcat：一个Servlets和JSP页面的容器，以提供网站服务。一、Tomcat安装安装方式：①运行.exe安装包 &n
网站架构发展的过程 ayaoxinchao 数据库应用服务器网站架构
1.初始阶段网站架构：应用程序、数据库、文件等资源在同一个服务器上 2.应用服务和数据服务分离：应用服务器、数据库服务器、文件服务器 3.使用缓存改善网站性能：为应用服务器提供本地缓存，但受限于应用服务器的内存容量，可以使用专门的缓存服务器，提供分布式缓存服务器架构 4.使用应用服务器集群改善网站的并发处理能力：使用负载均衡调度服务器，将来自客户端浏览器的访问请求分发到应用服务器集群中的任何
[信息与安全]数据库的备份问题 comsci 数据库
如果你们建设的信息系统是采用中心-分支的模式,那么这里有一个问题如果你的数据来自中心数据库,那么中心数据库如果出现故障,你的分支机构的数据如何保证安全呢? 是否应该在这种信息系统结构的基础上进行改造,容许分支机构的信息系统也备份一个中心数据库的文件呢? &n
使用maven tomcat plugin插件debug关联源代码商人shang maven debug 查看源码 tomcat-plugin
*首先需要配置好'''maven-tomcat7-plugin'''，参见[[Maven开发Web项目]]的'''Tomcat'''部分。 *配置好后，在[[Eclipse]]中打开'''Debug Configurations'''界面，在'''Maven Build'''项下新建当前工程的调试。在'''Main'''选项卡中点击'''Browse Workspace...'''选择需要开发的
大访问量高并发 oloz 大访问量高并发
大访问量高并发的网站主要压力还是在于数据库的操作上，尽量避免频繁的请求数据库。下面简要列出几点解决方案： 01、优化你的代码和查询语句，合理使用索引 02、使用缓存技术例如memcache、ecache将不经常变化的数据放入缓存之中 03、采用服务器集群、负载均衡分担大访问量高并发压力 04、数据读写分离 05、合理选用框架，合理架构(推荐分布式架构)。
cache 服务器小猪猪08 cache
Cache 即高速缓存.那么cache是怎么样提高系统性能与运行速度呢？是不是在任何情况下用cache都能提高性能？是不是cache用的越多就越好呢？我在近期开发的项目中有所体会，写下来当作总结也希望能跟大家一起探讨探讨，有错误的地方希望大家批评指正。　　1.Cache 是怎么样工作的? 　　Cache 是分配在服务器上
mysql存储过程香水浓 mysql
Description:插入大量测试数据 use xmpl; drop procedure if exists mockup_test_data_sp; create procedure mockup_test_data_sp( in number_of_records int ) begin declare cnt int; declare name varch
CSS的class、id、css文件名的常用命名规则 agevs JavaScript UI 框架 Ajax css
CSS的class、id、css文件名的常用命名规则 (一)常用的CSS命名规则　　头：header 　　内容：content/container 　　尾：footer 　　导航：nav 　　侧栏：sidebar 　　栏目：column 　　页面外围控制整体布局宽度：wrapper 　　左右中：left right
全局数据源 AILIKES java tomcat mysql jdbc JNDI
实验目的：为了研究两个项目同时访问一个全局数据源的时候是创建了一个数据源对象，还是创建了两个数据源对象。 1：将diuid和mysql驱动包（druid-1.0.2.jar和mysql-connector-java-5.1.15.jar）copy至%TOMCAT_HOME%/lib下；2：配置数据源，将JNDI在%TOMCAT_HOME%/conf/context.xml中配置好,格式如下：&l
MYSQL的随机查询的实现方法 baalwolf mysql
MYSQL的随机抽取实现方法。举个例子，要从tablename表中随机提取一条记录，大家一般的写法就是：SELECT * FROM tablename ORDER BY RAND() LIMIT 1。但是，后来我查了一下MYSQL的官方手册，里面针对RAND()的提示大概意思就是，在ORDER BY从句里面不能使用RAND()函数，因为这样会导致数据列被多次扫描。但是在MYSQL 3.23版本中，
JAVA的getBytes()方法 bijian1013 java eclipse unix OS
在Java中，String的getBytes()方法是得到一个操作系统默认的编码格式的字节数组。这个表示在不同OS下，返回的东西不一样！ String.getBytes(String decode)方法会根据指定的decode编码返回某字符串在该编码下的byte数组表示，如： byte[] b_gbk = "
AngularJS中操作Cookies bijian1013 JavaScript AngularJS Cookies
如果你的应用足够大、足够复杂，那么你很快就会遇到这样一咱种情况：你需要在客户端存储一些状态信息，这些状态信息是跨session(会话)的。你可能还记得利用document.cookie接口直接操作纯文本cookie的痛苦经历。幸运的是，这种方式已经一去不复返了，在所有现代浏览器中几乎
[Maven学习笔记五]Maven聚合和继承特性 bit1129 maven
Maven聚合在实际的项目中，一个项目通常会划分为多个模块，为了说明问题，以用户登陆这个小web应用为例。通常一个web应用分为三个模块： 1. 模型和数据持久化层user-core, 2. 业务逻辑层user-service以 3. web展现层user-web， user-service依赖于user-core user-web依赖于user-core和use
【JVM七】JVM知识点总结 bit1129 jvm
1. JVM运行模式 1.1 JVM运行时分为-server和-client两种模式，在32位机器上只有client模式的JVM。通常，64位的JVM默认都是使用server模式，因为server模式的JVM虽然启动慢点，但是，在运行过程，JVM会尽可能的进行优化 1.2 JVM分为三种字节码解释执行方式：mixed mode, interpret mode以及compiler
linux下查看nginx、apache、mysql、php的编译参数 ronin47
在linux平台下的应用，最流行的莫过于nginx、apache、mysql、php几个。而这几个常用的应用，在手工编译完以后，在其他一些情况下（如：新增模块），往往想要查看当初都使用了那些参数进行的编译。这时候就可以利用以下方法查看。 1、nginx [root@361way ~]# /App/nginx/sbin/nginx -V nginx: nginx version: nginx/
unity中运用Resources.Load的方法？ brotherlamp unity视频 unity资料 unity自学 unity unity教程
问：unity中运用Resources.Load的方法？答：Resources.Load是unity本地动态加载资本所用的方法,也即是你想动态加载的时分才用到它,比方枪弹,特效,某些实时替换的图像什么的,主张此文件夹不要放太多东西,在打包的时分,它会独自把里边的一切东西都会集打包到一同,不论里边有没有你用的东西,所以大多数资本应该是自个建文件放置 1、unity实时替换的物体即是依据环境条件
线段树-入门 bylijinnan java 算法线段树
/** * 线段树入门 * 问题：已知线段[2,5] [4,6] [0,7]；求点2,4,7分别出现了多少次 * 以下代码建立的线段树用链表来保存，且树的叶子结点类似[i,i] * * 参考链接：http://hi.baidu.com/semluhiigubbqvq/item/be736a33a8864789f4e4ad18 * @author lijinna
全选与反选 chicony 全选
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/TR/html4/loose.dtd"> <html> <head> <title>全选与反选</title>
vim一些简单记录 chenchao051 vim
mac在/usr/share/vim/vimrc linux在/etc/vimrc 1、问：后退键不能删除数据，不能往后退怎么办？答：在vimrc中加入set backspace=2 2、问：如何控制tab键的缩进？答：在vimrc中加入set tabstop=4 (任何
Sublime Text 快捷键 daizj 快捷键 sublime
[size=large][/size]Sublime Text快捷键：Ctrl+Shift+P：打开命令面板Ctrl+P：搜索项目中的文件Ctrl+G：跳转到第几行Ctrl+W：关闭当前打开文件Ctrl+Shift+W：关闭所有打开文件Ctrl+Shift+V：粘贴并格式化Ctrl+D：选择单词，重复可增加选择下一个相同的单词Ctrl+L：选择行，重复可依次增加选择下一行Ctrl+Shift+L：
php 引用(&)详解 dcj3sjt126com PHP
在PHP 中引用的意思是：不同的名字访问同一个变量内容. 与Ｃ语言中的指针是有差别的．Ｃ语言中的指针里面存储的是变量的内容在内存中存放的地址变量的引用 PHP 的引用允许你用两个变量来指向同一个内容复制代码代码如下: <? $a="ABC"; $b =&$a; echo
SVN中trunk,branches,tags用法详解 dcj3sjt126com SVN
Subversion有一个很标准的目录结构，是这样的。比如项目是proj，svn地址为svn://proj/，那么标准的svn布局是svn://proj/|+-trunk+-branches+-tags这是一个标准的布局，trunk为主开发目录，branches为分支开发目录，tags为tag存档目录（不允许修改）。但是具体这几个目录应该如何使用，svn并没有明确的规范，更多的还是用户自己的习惯。
对软件设计的思考 e200702084 设计模式数据结构算法 ssh 活动
软件设计的宏观与微观软件开发是一种高智商的开发活动。一个优秀的软件设计人员不仅要从宏观上把握软件之间的开发，也要从微观上把握软件之间的开发。宏观上，可以应用面向对象设计，采用流行的SSH架构，采用web层，业务逻辑层，持久层分层架构。采用设计模式提供系统的健壮性和可维护性。微观上，对于一个类，甚至方法的调用，从计算机的角度模拟程序的运行情况。了解内存分配，参数传
同步、异步、阻塞、非阻塞 geeksun 非阻塞
同步、异步、阻塞、非阻塞这几个概念有时有点混淆，在此文试图解释一下。同步：发出方法调用后，当没有返回结果，当前线程会一直在等待（阻塞）状态。场景：打电话，营业厅窗口办业务、B/S架构的http请求-响应模式。异步：方法调用后不立即返回结果，调用结果通过状态、通知或回调通知方法调用者或接收者。异步方法调用后，当前线程不会阻塞，会继续执行其他任务。实现：
Reverse SSH Tunnel 反向打洞實錄 hongtoushizi ssh
實際的操作步驟： # 首先，在客戶那理的機器下指令連回我們自己的 Server，並設定自己 Server 上的 12345 port 會對應到幾器上的 SSH port ssh -NfR 12345:localhost:22 [email protected] # 然後在 myhost 的機器上連自己的 12345 port，就可以連回在客戶那的機器 ssh localhost -p 1
Hibernate中的缓存 Josh_Persistence 一级缓存 Hiberante缓存查询缓存二级缓存
Hibernate中的缓存一、Hiberante中常见的三大缓存：一级缓存，二级缓存和查询缓存。 Hibernate中提供了两级Cache，第一级别的缓存是Session级别的缓存，它是属于事务范围的缓存。这一级别的缓存是由hibernate管理的，一般情况下无需进行干预；第二级别的缓存是SessionFactory级别的缓存，它是属于进程范围或群集范围的缓存。这一级别的缓存
对象关系行为模式之延迟加载 home198979 PHP 架构延迟加载
形象化设计模式实战 HELLO!架构一、概念 Lazy Load：一个对象，它虽然不包含所需要的所有数据，但是知道怎么获取这些数据。延迟加载貌似很简单，就是在数据需要时再从数据库获取，减少数据库的消耗。但这其中还是有不少技巧的。二、实现延迟加载实现Lazy Load主要有四种方法：延迟初始化、虚
xml 验证 pengfeicao521 xml xml解析
有些字符，xml不能识别，用jdom或者dom4j解析的时候就报错 public static void testPattern() { // 含有非法字符的串 String str = "Jamey친Ñ&#1282
div设置半透明效果 spjich css 半透明
为div设置如下样式： div{filter:alpha(Opacity=80);-moz-opacity:0.5;opacity: 0.5;} 说明： 1、filter：对win IE设置半透明滤镜效果，filter:alpha(Opacity=80)代表该对象80%半透明，火狐浏览器不认2、-moz-opaci
你真的了解单例模式么？ w574240966 java 单例设计模式 jvm
单例模式，很多初学者认为单例模式很简单，并且认为自己已经掌握了这种设计模式。但事实上，你真的了解单例模式了么。一，单例模式的5中写法。（回字的四种写法，哈哈。） 1，懒汉式（1）线程不安全的懒汉式 public cla