1823469 devilmaycry812839668 1594717245
2
About Tools for generating mini-ImageNet dataset and processing batches https://mtl.yyliu.net/download/
Python
3年前
1823469 devilmaycry812839668 1594717245
2
强化学习中q-learning和Sarsa算法的经典对比问题------走悬崖问题
Python
4年多前
1823469 devilmaycry812839668 1594717245
1
A Python3 NES emulator and OpenAI Gym interface.任天堂游戏模拟器,devilmaycry812839668/gym-tetris 游戏依赖于这个环境
3年多前
1823469 devilmaycry812839668 1594717245
1
使用强化学习算法玩mario游戏
3年多前
1823469 devilmaycry812839668 1594717245
1
gym下简单的CarlPole环境作为仿真环境,以reinforce算法作为实例算法,讨论了强化学习在多仿真环境下单步交互并行化设计的可行性,并给出了几种个人设计的架构,同时对各架构的性能进行了一定的分析。
Python
接近4年前
1823469 devilmaycry812839668 1594717245
1
多标签分类任务,VOC2007,VOC2012数据集,进行图像数据的预处理
Python
4年前
1823469 devilmaycry812839668 1594717245
1
《深度强化学习——边做边学》第二章 在走迷宫任务中策略迭代方法(修改后的代码)
Python
4年多前
1823469 devilmaycry812839668 1594717245
1
结构化任务的元强化学习论文《Learning to reinforcement learn》实现代码,Implementation of Meta-RL A3C algorithm
Python
11个月前
1823469 devilmaycry812839668 1594717245
0
网上找到的一个外国小哥写的DQN及扩展变体算法的代码库。小哥的个人主页:https://by571.github.io/,Github地址:https://github.com/BY571
Python
2年多前
1823469 devilmaycry812839668 1594717245
0
OpenAI Baselines: high-quality implementations of reinforcement learning algorithms
Python
2年多前
1823469 devilmaycry812839668 1594717245
0
Rainbow: Combining Improvements in Deep Reinforcement Learning
3年多前
1823469 devilmaycry812839668 1594717245
0
A little logger for machine learning research
3年多前
1823469 devilmaycry812839668 1594717245
0
Spaces types for reinforcement learning
3年多前
1823469 devilmaycry812839668 1594717245
0
设计了一种带有经验池回放机制的reinforce算法(reinforce with experience buffer),算法的主题部分使用多环境并行化的reinforce算法,并使用经验池回放机制来进一步改进算法。仿真环境使用gym的cartpole。
Python
接近4年前
1823469 devilmaycry812839668 1594717245
0
强化学习中的策略网络算法。《TensorFlow实战》一书中强化学习部分的策略网络算法,仿真环境为gym的CartPole,本项目是对原书代码进行了部分重构,是在以前的版本CartPole_PolicyNetwork项目基础上的改进版本,主要加入了更新网络策略时不同的奖励值设定来观察不同形式下的性能区别。
Python
接近4年前

搜索帮助

0d507c66 1850385 C8b1a773 1850385