Proc. ACM Interact. Mob. Wearable Ubiquitous Technol. 2021
1 intro
1.1 背景—— 人类活动识别(HAR)
- 旨在准确分类人类的物理活动
- 传统方法——依赖于滑动窗口分割和手工特征提取,然后通过各种监督学习技术来识别简单和复杂的活动,如行走、跑步、骑自行车
- 深度学习方法
- 两种方法的局限性
- 受到常规实验室HAR数据集引入的偏见和限制的不利影响
- 数据的研究通常规模较小,大多涉及不到50名参与者
- 这些研究遵循固定的实验协议,要求参与者在短时间内(通常不到一个小时)执行特定活动
- ——>限制了所得数据集的规模、多样性和质量
1.2 本文内容
- 提出了SelfHAR
- 半监督框架
- 通过自监督预训练补充有标记数据的监督训练,以利用大规模未标记数据集在HAR任务中捕获的信息
- ——>引入了更多样化的传感器数据到训练范式中
2 方法
2.1 问题描述
- 给定:
- 一组时间序列数据
- 一组个活动标签的集合 = {, . . . , }
- 一组个时间窗口的集合 = {1, . . . ,},定义开始和结束时间点
- 任务:
- 找到一个映射函数,使得 (,)输出一个活动标签,其中应代表在时间窗口期间由受试者实际进行的活动
- 除了带标签的数据集,论文还考虑了这样的情况:存在一个补充数据集,这个数据集从与相似的传感器收集而来,但没有标签
- 目标:
- 训练模型,使得通过使用∪而不是仅使用(即利用未标记的数据集)可以提高识别准确性
- 评估:
2.2 主体框架
3 实验
3.1 数据
3.2 baseline 比较
3.3 ablation study
- fully supervised——只用(1)
- transformation discrimination——信号转换(也就是第3部分前提,后面记为第0部分)+(1)
- self-training——(1)+(2)+(4)
- tranformation knowledge distillation(0)+(1)+(2)+(4)
- selfHAR——(1)+(2)+(3)+(4)