pytorch1.1 半精度训练 Adam RMSprop 优化器 Nan 问题

2019/5/5更新
pytorch 1.1 版本相比1.0版本,对 half 训练优化了许多,nan发生的情况少了很多,现在应该可以日常使用 half 训练了
使用Adam优化器时,加入参数eps=1e-4

optimizer1 = optim.Adam(model.parameters(), lr=1e-3, eps=1e-4)

pytorch 半精度浮点数表示的范围比单精度的少很多

  1. 使网络输入 值域缩放到 [-1, 1] 或 [0, 1]
  2. 定义Adam优化器时,加入参数eps=1e-3
  3. 定义RMSprop优化器时,加入参数eps=1e-2
  4. 降低学习率
optimizer1 = optim.Adam(model.parameters(), lr=0.001, eps=1e-3)
optimizer2 = optim.RMSprop(model.parameters(), lr=0.001, eps=1e-2)

你可能感兴趣的:(神经网络,python,深度学习的经验)