AOI and DRL

本文主要是介绍AOI and DRL，对大家解决编程问题具有一定的参考价值，需要的程序猿们随着小编来一起学习吧！

首先给出论文地址和代码， Reinforcement Learning Based Scheduling Algorithm for Optimizing Age of Information in Ultra Reliable Low Latency Networks

从题目可以得知，这是一篇有关强化学习的论文，具体的工作是用A3C算法来优化10个sensor的AOI以及保证URLLC，所谓URLLC，即给每一个sensor都设定一个阈值，接着通过训练来保证每一个sensor的AOI不超过这个阈值，否则就会受到惩罚，给一个很负的奖励，通俗的来讲就是保证可靠性，这是优化目标。状态的设置是10个sensor的AOI和最后5个包的下载时间和吞吐量，将这些状态送往神经网络最后整合一下，再通过一个全连接神经网络得到10个概率分布，作者选择动作的方式和一般A3C选择动作的方式些许不同，但影响不大，感兴趣的可以在代码里面查看，里面涉及到了很多知识，模型的保存、交叉熵、tensorboard的可视化，模型的保存用于Test并给出最后的结果，也就是论文中的表格数据和图，Train文件夹是用来训练模型的，以上是作者所用的A3C算法，尽管这个模型还有很多的不足，但是很简单，作为学习入门是可以的了。

另外，我用最基本的DQN也实现了一下这篇论文，最后的结果如下：
DQN
结果不比A3C差，我写的代码有时间也会上传到GitHub，以上。

这篇关于AOI and DRL的文章就介绍到这儿，希望我们推荐的文章对大家有所帮助，也希望大家多多支持为之网！

Java教程

AOI and DRL

首先给出论文地址和代码， Reinforcement Learning Based Scheduling Algorithm for Optimizing Age of Information in Ultra Reliable Low Latency Networks

前端开发

后端开发

移动端开发

数据库

服务器运维

人工智能

区块链

游戏开发

网站运营

大数据/云计算

软件工程

软件/开发工具使用

资讯