论文笔记:SelfHAR: Improving Human Activity Recognition through Self-training with Unlabeled Data

Proc. ACM Interact. Mob. Wearable Ubiquitous Technol. 2021

1 intro

1.1 背景—— 人类活动识别(HAR)

  • 旨在准确分类人类的物理活动
    • 传统方法——依赖于滑动窗口分割和手工特征提取,然后通过各种监督学习技术来识别简单和复杂的活动,如行走、跑步、骑自行车
    • 深度学习方法
      • 自动提取目标任务的有用特征——>更有效
  • 两种方法的局限性
    • 受到常规实验室HAR数据集引入的偏见和限制的不利影响
      • 数据的研究通常规模较小,大多涉及不到50名参与者
      • 这些研究遵循固定的实验协议,要求参与者在短时间内(通常不到一个小时)执行特定活动
      • ——>限制了所得数据集的规模、多样性和质量

1.2 本文内容

论文笔记:SelfHAR: Improving Human Activity Recognition through Self-training with Unlabeled Data_第1张图片

  • 提出了SelfHAR
    • 半监督框架
    • 通过自监督预训练补充有标记数据的监督训练,以利用大规模未标记数据集在HAR任务中捕获的信息
  • ——>引入了更多样化的传感器数据到训练范式中

2 方法

2.1 问题描述

  • 给定:
    • 一组时间序列数据
    • 一组个活动标签的集合 = {, . . . , }
    • 一组个时间窗口的集合 = {1, . . . ,},定义开始和结束时间点
  •  任务:
    • 找到一个映射函数,使得 (,)输出一个活动标签,其中应代表在时间窗口期间由受试者实际进行的活动
  • 除了带标签的数据集,论文还考虑了这样的情况:存在一个补充数据集,这个数据集从与相似的传感器收集而来,但没有标签
  • 目标:
    • 训练模型,使得通过使用∪而不是仅使用(即利用未标记的数据集)可以提高识别准确性
  • 评估:
    • 通过要求模型预测中未见子集的活动标签来进行评估

2.2 主体框架

论文笔记:SelfHAR: Improving Human Activity Recognition through Self-training with Unlabeled Data_第2张图片

3 实验

3.1 数据

论文笔记:SelfHAR: Improving Human Activity Recognition through Self-training with Unlabeled Data_第3张图片

 3.2 baseline 比较

论文笔记:SelfHAR: Improving Human Activity Recognition through Self-training with Unlabeled Data_第4张图片

3.3 ablation study

  • fully supervised——只用(1)
  • transformation discrimination——信号转换(也就是第3部分前提,后面记为第0部分)+(1)
  • self-training——(1)+(2)+(4)
  • tranformation knowledge distillation(0)+(1)+(2)+(4)
  • selfHAR——(1)+(2)+(3)+(4)

论文笔记:SelfHAR: Improving Human Activity Recognition through Self-training with Unlabeled Data_第5张图片

你可能感兴趣的:(论文笔记,论文阅读)