Java教程

学习日志-2021.10.09

本文主要是介绍学习日志-2021.10.09，对大家解决编程问题具有一定的参考价值，需要的程序猿们随着小编来一起学习吧！

学习日志-2021.10.09

今日主要内容：

成功运行两个sarsa算法相关的项目(用于路径规划)：

项目地址

每轮迭代：Agent走到障碍物上或到达目标。
- RL_Sarsa_E1(小地图)：
  
  迭代1000轮后，自己寻找路径的结果
- RL_Sarsa_E2(大地图)：
  
  跑了快一个小时。。。。（迭代6000轮）
  
  与项目地址Q-Learning算法示例结果不同，应该是算法差异造成的。
解析项目基本结构：
- 学习模块
  - 初始化参数（动作空间、学习率、折扣率、ε等）
  - 选择动作（策略函数）
  - 学习函数（此处应用Sarsa算法，用于更新Q表；此处应该还另外添加了一个Q表状态的查询，若目前状态不存在于Q表，则将该状态加入Q表）
- 环境模块
  - 初始化环境（迷宫大小、障碍设置）
  - 接受Agent的动作（返回新的状态和奖励）
- 运行模块
  - 将前面两个模块连贯起来（负责显示画面，判断是否达到结束状态，输出最终结果）
后续实现可能会参考以上的算法，具体的应用想去实现小鸟飞行的例子（简单）。

这篇关于学习日志-2021.10.09的文章就介绍到这儿，希望我们推荐的文章对大家有所帮助，也希望大家多多支持为之网！

您可能喜欢

栏目导航

前端开发

HTML5教程

CSS教程

Javascript

jQuery教程

AJAX教程

Node.js教程

XML教程

正则表达式

后端开发

Go教程

C/C++教程

消息队列MQ

Net Core教程

Asp.net教程

Java教程

PHP教程

移动端开发

微信公众号开发

小程序开发

Swift教程

IOS教程

Kotlin教程

Android开发

数据库

Redis教程

MongoDB教程

PostgreSQL教程

Oracle教程

MariaDB教程

SqLite教程

MySql教程

SqlServer教程

服务器运维

Kubernetes

Docker容器

linux shell

Nginx教程

网站安全

PowerShell教程

Linux教程

人工智能

TensorFlow教程

Python教程

机器学习

人工智能学习

区块链

区块链技术

游戏开发

游戏编程

Unity3D教程

网站运营

网站策划

网站优化

建站知识

大数据/云计算

云计算

Hadoop教程

软件工程

软件/开发工具使用

Git教程

资讯