【无标题】

[1]

S. S. Shinde and D. Tarchi, ‘Collaborative Reinforcement Learning for Multi-Service Internet of Vehicles’, IEEE Internet of Things Journal, vol. 10, no. 3, pp. 2589–2602, Feb. 2023, doi: 10.1109/JIOT.2022.3213993.

每一个 VN (Vehicle Node)可以由多个EN(edge Node)覆盖,选择最优的EN。

决策变量: assignment (binary)and partial offloading【0,1】

【无标题】_第1张图片

 【无标题】_第2张图片

 Mobility 考虑的是停留时间 

【无标题】_第3张图片

 state:

【无标题】_第4张图片

 Action:

【无标题】_第5张图片

 Reward Function (R):

【无标题】_第6张图片

 定义了多种训练场景,对于每个训练场景,Q-table的维度是不同的。

【无标题】_第7张图片

 

【无标题】_第8张图片

 

你可能感兴趣的:(#,文献阅读,RL+Resource,allocation,网络)