开源软件 - Gitee.com

鬼＆泣/CartPole_PolicyNetwork

强化学习中的策略网络算法。《TensorFlow实战》一书中强化学习部分的策略网络算法，仿真环境为gym的CartPole，本项目是对原书代码进行了部分重构，并加入了些中文注释，同时给出了30次试验的运行结果。

待处理的项目

Python

4年前

鬼＆泣/image_preprocessing

tensorflow官方给出的对图像（image）进行预处理（preprocessing）的模块，一般在进行神经网络训练之前可以选择对投给网络的图像数据进行预处理操作

待处理的项目

Python

4年多前

鬼＆泣/scalable_agent

Reinforcement Learning经典论文《IMPALA: Scalable Distributed Deep-RL with Importance WeightedActor-Learner Architectures》的Deepmind官方实现，TensorFlow框架的。

待处理的项目

Python

2年前

鬼＆泣/tf-agents

tensorflow官方给出的reinforcement learning框架，该框架设计过于复杂现已停止维护，但是由于其作为Google官方推出的强化学习框架还是有一定学习价值的，原地址：https://github.com/tensorflow/agents

待处理的项目

Python

接近2年前

鬼＆泣/reverb

Google公司为reinforcement learning算法推出的分布式经验池框架，底层实现为Google的 Protocol Buffer以及gRpc。由于该框架主要为Google的TensorFlow框架以及Google推出的其它各种reinforcement learning框架服务，因此该框架相关文档较少，可用性较差。

待处理的项目

Python

接近2年前

鬼＆泣/es_maml

论文“ES-MAML: Simple Hessian-Free Meta Learning”的官方原作者代码；论文地址：https://arxiv.org/abs/1910.01215 代码原地址：https://github.com/google-research/google-research

待处理的项目

Python

1年多前

鬼＆泣/CartPole_PolicyNetwork

鬼＆泣/image_preprocessing

鬼＆泣/scalable_agent

鬼＆泣/tf-agents

鬼＆泣/reverb

鬼＆泣/es_maml

搜索帮助