开源软件 - Gitee.com

开源
企业版
高校版
搜索
帮助中心
使用条款
关于我们

开源企业版高校版私有云 Gitee AI ^NEW

12月28日，「开源中国源创会年终盛典」珠海站再次回归！点击免费报名参会

#待处理的项目

有20个公开仓库匹配此标签

MIT

全部项目 MulanPSL-2.0 0BSD AFL-3.0 AGPL-3.0 Apache-2.0 Artistic-2.0 BSD-2-Clause BSD-3-Clause BSD-3-Clause-Clear BSD-4-Clause BSL-1.0 CC-BY-4.0 CC-BY-SA-4.0 CC0-1.0 CECILL-2.1 CERN-OHL-P-2.0 CERN-OHL-S-2.0 CERN-OHL-W-2.0 ECL-2.0 EPL-1.0 EPL-2.0 EUPL-1.1 EUPL-1.2 GFDL-1.3 GPL-2.0 GPL-3.0 ISC LGPL-2.1 LGPL-3.0 LPPL-1.3c MIT-0 MPL-2.0 MS-PL MS-RL MulanPSL-1.0 MulanPubL-1.0 MulanPubL-2.0 NCSA ODbL-1.0 OFL-1.1 OSL-3.0 PostgreSQL UPL-1.0 Unlicense Vim WTFPL Zlib

全部语言

Java JavaScript HTML CSS Python C Shell C++ TypeScript PHP C# Go Objective-C Android Kotlin Ruby Assembly Swift NodeJS Perl Dart Lua Matlab Rust 其他 PowerShell HTML/CSS 微信 Scala Groovy C/C++ XSLT Verilog R QML Pascal Docker CoffeeScript FORTRAN Erlang Emacs Lisp ActionScript SQL Smalltalk Delphi VHDL M TeX/LaTeX ASP Visual Basic Clojure Common Lisp Awk LiveScript Haskell Scheme Elixir Julia 易语言 OCaml YAML AutoHotkey Pawn Puppet Ada D Standard ML XML Logos Arduino Prolog VimL 汇编 Coq Haxe ColdFusion Vala Crystal Scilab Racket Lisp Slash Eiffel eC DOT Zephir Nemerle

Stars

Starred 最新推荐最近更新

鬼＆泣/mini-imagenet-tools

2

About Tools for generating mini-ImageNet dataset and processing batches https://mtl.yyliu.net/download/

待处理的项目

3年前

鬼＆泣/cliff_walking

2

强化学习中q-learning和Sarsa算法的经典对比问题------走悬崖问题

待处理的项目

4年多前

鬼＆泣/nes-py

1

A Python3 NES emulator and OpenAI Gym interface.任天堂游戏模拟器，devilmaycry812839668/gym-tetris 游戏依赖于这个环境

待处理的项目

3年多前

鬼＆泣/playing-mario-with-deep-reinforcement-learning

1

使用强化学习算法玩mario游戏

待处理的项目

3年多前

鬼＆泣/Parallelism_Reinforce_CartPole

1

gym下简单的CarlPole环境作为仿真环境，以reinforce算法作为实例算法，讨论了强化学习在多仿真环境下单步交互并行化设计的可行性，并给出了几种个人设计的架构，同时对各架构的性能进行了一定的分析。

待处理的项目

接近4年前

鬼＆泣/VOC_DATASET_MultiLabels_Preprocess

1

多标签分类任务，VOC2007,VOC2012数据集，进行图像数据的预处理

待处理的项目

4年前

鬼＆泣/maze_policygradient

1

《深度强化学习——边做边学》第二章在走迷宫任务中策略迭代方法（修改后的代码）

待处理的项目

4年多前

鬼＆泣/Meta-RL

1

结构化任务的元强化学习论文《Learning to reinforcement learn》实现代码，Implementation of Meta-RL A3C algorithm

待处理的项目

11个月前

鬼＆泣/DQN-Atari-Agents

0

网上找到的一个外国小哥写的DQN及扩展变体算法的代码库。小哥的个人主页：https://by571.github.io/，Github地址：https://github.com/BY571

待处理的项目

2年多前

鬼＆泣/baselines

0

OpenAI Baselines: high-quality implementations of reinforcement learning algorithms

待处理的项目

2年多前

鬼＆泣/Rainbow

0

Rainbow: Combining Improvements in Deep Reinforcement Learning

待处理的项目

3年多前

鬼＆泣/dowel

0

A little logger for machine learning research

待处理的项目

3年多前

鬼＆泣/akro

0

Spaces types for reinforcement learning

待处理的项目

3年多前

鬼＆泣/reinforce_with_ExperienceBuffer

0

设计了一种带有经验池回放机制的reinforce算法（reinforce with experience buffer），算法的主题部分使用多环境并行化的reinforce算法，并使用经验池回放机制来进一步改进算法。仿真环境使用gym的cartpole。

待处理的项目

接近4年前

鬼＆泣/CartPole_PolicyNetwork_Reinforce

0

强化学习中的策略网络算法。《TensorFlow实战》一书中强化学习部分的策略网络算法，仿真环境为gym的CartPole，本项目是对原书代码进行了部分重构，是在以前的版本CartPole_PolicyNetwork项目基础上的改进版本，主要加入了更新网络策略时不同的奖励值设定来观察不同形式下的性能区别。

待处理的项目

接近4年前

1 2

深圳市奥思网络科技有限公司版权所有

Git 命令学习

CopyCat 代码克隆检测

APP与插件下载

Gitee 封面人物

Gitee 公益计划

Gitee 持续集成

在线自助服务

技术交流QQ群

微信服务号

client#oschina.cn

企业版在线使用：400-606-0201

专业版私有部署：

开放原子开源基金会

合作代码托管平台

违法和不良信息举报中心

粤ICP备12009483号

简体 / 繁體 / English

点此查找更多帮助

搜索帮助

Git 命令在线学习如何在 Gitee 导入 GitHub 仓库

Git 仓库基础操作

企业版和社区版功能对比

SSH 公钥设置

如何处理代码冲突

仓库体积过大，如何减小？

如何找回被删除的仓库数据

Gitee 产品配额说明

GitHub仓库快速导入Gitee及同步更新

什么是 Release（发行版）

将 PHP 项目自动发布到 packagist.org

回到顶部

0d507c66 1850385

C8b1a773 1850385