代码拉取完成,页面将自动刷新
import gym
from ddpg import Agent
if __name__ == '__main__':
env = gym.make('Pendulum-v1')
env.reset()
env.render()
params = {
'env': env,
'gamma': 0.99,
'actor_lr': 0.001,
'critic_lr': 0.001,
'tau': 0.02,
'capacity': 10000,
'batch_size': 32,
}
agent = Agent(**params)
for episode in range(100):
s0 = env.reset()
episode_reward = 0
for step in range(500):
env.render()
a0 = agent.act(s0)
s1, r1, done, _ = env.step(a0)
agent.put(s0, a0, r1, s1)
episode_reward += r1
s0 = s1
agent.learn()
print(episode, ': ', episode_reward)
此处可能存在不合适展示的内容,页面不予展示。您可通过相关编辑功能自查并修改。
如您确认内容无涉及 不当用语 / 纯广告导流 / 暴力 / 低俗色情 / 侵权 / 盗版 / 虚假 / 无价值内容或违法国家有关法律法规的内容,可点击提交进行申诉,我们将尽快为您处理。