登录
注册
开源
企业版
高校版
搜索
帮助中心
使用条款
关于我们
开源
企业版
高校版
私有云
Gitee AI
NEW
我知道了
查看详情
登录
注册
12月28日,「开源中国源创会年终盛典」珠海站再次回归!点击免费报名参会
#待处理的项目
有20个公开仓库匹配此标签
MIT
全部项目
MulanPSL-2.0
0BSD
AFL-3.0
AGPL-3.0
Apache-2.0
Artistic-2.0
BSD-2-Clause
BSD-3-Clause
BSD-3-Clause-Clear
BSD-4-Clause
BSL-1.0
CC-BY-4.0
CC-BY-SA-4.0
CC0-1.0
CECILL-2.1
CERN-OHL-P-2.0
CERN-OHL-S-2.0
CERN-OHL-W-2.0
ECL-2.0
EPL-1.0
EPL-2.0
EUPL-1.1
EUPL-1.2
GFDL-1.3
GPL-2.0
GPL-3.0
ISC
LGPL-2.1
LGPL-3.0
LPPL-1.3c
MIT-0
MPL-2.0
MS-PL
MS-RL
MulanPSL-1.0
MulanPubL-1.0
MulanPubL-2.0
NCSA
ODbL-1.0
OFL-1.1
OSL-3.0
PostgreSQL
UPL-1.0
Unlicense
Vim
WTFPL
Zlib
全部语言
Java
JavaScript
HTML
CSS
Python
C
Shell
C++
TypeScript
PHP
C#
Go
Objective-C
Android
Kotlin
Ruby
Assembly
Swift
NodeJS
Perl
Dart
Lua
Matlab
Rust
其他
PowerShell
HTML/CSS
微信
Scala
Groovy
C/C++
XSLT
Verilog
R
QML
Pascal
Docker
CoffeeScript
FORTRAN
Erlang
Emacs Lisp
ActionScript
SQL
Smalltalk
Delphi
VHDL
M
TeX/LaTeX
ASP
Visual Basic
Clojure
Common Lisp
Awk
LiveScript
Haskell
Scheme
Elixir
Julia
易语言
OCaml
YAML
AutoHotkey
Pawn
Puppet
Ada
D
Standard ML
XML
Logos
Arduino
Prolog
VimL
汇编
Coq
Haxe
ColdFusion
Vala
Crystal
Scilab
Racket
Lisp
Slash
Eiffel
eC
DOT
Zephir
Nemerle
Stars
Starred
最新推荐
最近更新
鬼&泣/mini-imagenet-tools
2
About Tools for generating mini-ImageNet dataset and processing batches https://mtl.yyliu.net/download/
待处理的项目
Python
3年前
鬼&泣/cliff_walking
2
强化学习中q-learning和Sarsa算法的经典对比问题------走悬崖问题
待处理的项目
Python
4年多前
鬼&泣/nes-py
1
A Python3 NES emulator and OpenAI Gym interface.任天堂游戏模拟器,devilmaycry812839668/gym-tetris 游戏依赖于这个环境
待处理的项目
3年多前
鬼&泣/playing-mario-with-deep-reinforcement-learning
1
使用强化学习算法玩mario游戏
待处理的项目
3年多前
鬼&泣/Parallelism_Reinforce_CartPole
1
gym下简单的CarlPole环境作为仿真环境,以reinforce算法作为实例算法,讨论了强化学习在多仿真环境下单步交互并行化设计的可行性,并给出了几种个人设计的架构,同时对各架构的性能进行了一定的分析。
待处理的项目
Python
接近4年前
鬼&泣/VOC_DATASET_MultiLabels_Preprocess
1
多标签分类任务,VOC2007,VOC2012数据集,进行图像数据的预处理
待处理的项目
Python
4年前
鬼&泣/maze_policygradient
1
《深度强化学习——边做边学》第二章 在走迷宫任务中策略迭代方法(修改后的代码)
待处理的项目
Python
4年多前
鬼&泣/Meta-RL
1
结构化任务的元强化学习论文《Learning to reinforcement learn》实现代码,Implementation of Meta-RL A3C algorithm
待处理的项目
Python
11个月前
鬼&泣/DQN-Atari-Agents
0
网上找到的一个外国小哥写的DQN及扩展变体算法的代码库。小哥的个人主页:https://by571.github.io/,Github地址:https://github.com/BY571
待处理的项目
Python
2年多前
鬼&泣/baselines
0
OpenAI Baselines: high-quality implementations of reinforcement learning algorithms
待处理的项目
Python
2年多前
鬼&泣/Rainbow
0
Rainbow: Combining Improvements in Deep Reinforcement Learning
待处理的项目
3年多前
鬼&泣/dowel
0
A little logger for machine learning research
待处理的项目
3年多前
鬼&泣/akro
0
Spaces types for reinforcement learning
待处理的项目
3年多前
鬼&泣/reinforce_with_ExperienceBuffer
0
设计了一种带有经验池回放机制的reinforce算法(reinforce with experience buffer),算法的主题部分使用多环境并行化的reinforce算法,并使用经验池回放机制来进一步改进算法。仿真环境使用gym的cartpole。
待处理的项目
Python
接近4年前
鬼&泣/CartPole_PolicyNetwork_Reinforce
0
强化学习中的策略网络算法。《TensorFlow实战》一书中强化学习部分的策略网络算法,仿真环境为gym的CartPole,本项目是对原书代码进行了部分重构,是在以前的版本CartPole_PolicyNetwork项目基础上的改进版本,主要加入了更新网络策略时不同的奖励值设定来观察不同形式下的性能区别。
待处理的项目
Python
接近4年前
1
2
点此查找更多帮助
搜索帮助
Git 命令在线学习
如何在 Gitee 导入 GitHub 仓库
Git 仓库基础操作
企业版和社区版功能对比
SSH 公钥设置
如何处理代码冲突
仓库体积过大,如何减小?
如何找回被删除的仓库数据
Gitee 产品配额说明
GitHub仓库快速导入Gitee及同步更新
什么是 Release(发行版)
将 PHP 项目自动发布到 packagist.org
回到顶部