开源软件 - Gitee.com

登录注册

开源
企业版
高校版
搜索
帮助中心
使用条款
关于我们

开源企业版高校版私有云 Gitee AI ^NEW

查看详情

登录注册

12月28日，「开源中国源创会年终盛典」珠海站再次回归！点击免费报名参会

#待处理的项目

有31个公开仓库匹配此标签

开源许可

MulanPSL-2.0 0BSD AFL-3.0 AGPL-3.0 Apache-2.0 Artistic-2.0 BSD-2-Clause BSD-3-Clause BSD-3-Clause-Clear BSD-4-Clause BSL-1.0 CC-BY-4.0 CC-BY-SA-4.0 CC0-1.0 CECILL-2.1 CERN-OHL-P-2.0 CERN-OHL-S-2.0 CERN-OHL-W-2.0 ECL-2.0 EPL-1.0 EPL-2.0 EUPL-1.1 EUPL-1.2 GFDL-1.3 GPL-2.0 GPL-3.0 ISC LGPL-2.1 LGPL-3.0 LPPL-1.3c MIT MIT-0 MPL-2.0 MS-PL MS-RL MulanPSL-1.0 MulanPubL-1.0 MulanPubL-2.0 NCSA ODbL-1.0 OFL-1.1 OSL-3.0 PostgreSQL UPL-1.0 Unlicense Vim WTFPL Zlib

全部语言

Java JavaScript HTML CSS Python C Shell C++ TypeScript PHP C# Go Objective-C Android Kotlin Ruby Assembly Swift NodeJS Perl Dart Lua Matlab Rust 其他 PowerShell HTML/CSS 微信 Scala Groovy C/C++ XSLT Verilog R QML Pascal Docker CoffeeScript FORTRAN Erlang Emacs Lisp ActionScript SQL Smalltalk Delphi VHDL M TeX/LaTeX ASP Visual Basic Clojure Common Lisp Awk LiveScript Haskell Scheme Elixir Julia 易语言 OCaml YAML AutoHotkey Pawn Puppet Ada D Standard ML XML Logos Arduino Prolog VimL 汇编 Coq Haxe ColdFusion Vala Crystal Scilab Racket Lisp Slash Eiffel eC DOT Zephir Nemerle

Stars

Starred 最新推荐最近更新

鬼＆泣/Rainbow

Rainbow: Combining Improvements in Deep Reinforcement Learning

待处理的项目

3年多前

鬼＆泣/dowel

A little logger for machine learning research

待处理的项目

3年多前

鬼＆泣/akro

Spaces types for reinforcement learning

待处理的项目

3年多前

鬼＆泣/reinforce_with_ExperienceBuffer

设计了一种带有经验池回放机制的reinforce算法（reinforce with experience buffer），算法的主题部分使用多环境并行化的reinforce算法，并使用经验池回放机制来进一步改进算法。仿真环境使用gym的cartpole。

待处理的项目

Python

接近4年前

鬼＆泣/CartPole_PolicyNetwork_Reinforce

强化学习中的策略网络算法。《TensorFlow实战》一书中强化学习部分的策略网络算法，仿真环境为gym的CartPole，本项目是对原书代码进行了部分重构，是在以前的版本CartPole_PolicyNetwork项目基础上的改进版本，主要加入了更新网络策略时不同的奖励值设定来观察不同形式下的性能区别。

待处理的项目

Python

接近4年前

鬼＆泣/Final_Version_Parallelism_Reinforce_CartPole

结合了前面几个版本的并行化强化学习的设计，给出了最终版本。gym下简单的CarlPole环境作为仿真环境，以reinforce算法作为实例算法，讨论了强化学习在多仿真环境下并行化设计的可行性，并给出了几种个人设计的架构，同时对各架构的性能进行了一定的分析。

待处理的项目

Python

接近4年前

鬼＆泣/Parallelism_Multi_Step_Reinforce_CartPole

gym下简单的CarlPole环境作为仿真环境，以reinforce算法作为实例算法，讨论了强化学习在多仿真环境下多步交互并行化设计的可行性，并给出了几种个人设计的架构，同时对各架构的性能进行了一定的分析。

待处理的项目

Python

接近4年前

鬼＆泣/image_preprocessing

tensorflow官方给出的对图像（image）进行预处理（preprocessing）的模块，一般在进行神经网络训练之前可以选择对投给网络的图像数据进行预处理操作

待处理的项目

Python

4年多前

鬼＆泣/tic_tac_toe

强化学习中经典的棋牌类双方博弈问题--------三连棋（黑白棋）问题

待处理的项目

Python

4年多前

鬼＆泣/maze_random

《深度强化学习——边做边学》第二章在走迷宫任务中随机探索（修改后的代码）

待处理的项目

Python

4年多前

鬼＆泣/scalable_agent

Reinforcement Learning经典论文《IMPALA: Scalable Distributed Deep-RL with Importance WeightedActor-Learner Architectures》的Deepmind官方实现，TensorFlow框架的。

待处理的项目

Python

2年前

鬼＆泣/tf-agents

tensorflow官方给出的reinforcement learning框架，该框架设计过于复杂现已停止维护，但是由于其作为Google官方推出的强化学习框架还是有一定学习价值的，原地址：https://github.com/tensorflow/agents

待处理的项目

Python

接近2年前

鬼＆泣/reverb

Google公司为reinforcement learning算法推出的分布式经验池框架，底层实现为Google的 Protocol Buffer以及gRpc。由于该框架主要为Google的TensorFlow框架以及Google推出的其它各种reinforcement learning框架服务，因此该框架相关文档较少，可用性较差。

待处理的项目

Python

接近2年前