lineCode
diff --git a/‎.gitignore
Lines changed: 2 additions & 0 deletions b/‎.gitignore
Lines changed: 2 additions & 0 deletions
diff --git a/‎Pong-v0_monitor/openaigym.episode_batch.0.3438.stats.json
Lines changed: 1 addition & 0 deletions b/‎Pong-v0_monitor/openaigym.episode_batch.0.3438.stats.json
Lines changed: 1 addition & 0 deletions
diff --git a/‎Pong-v0_monitor/openaigym.manifest.0.3438.manifest.json
Lines changed: 1 addition & 0 deletions b/‎Pong-v0_monitor/openaigym.manifest.0.3438.manifest.json
Lines changed: 1 addition & 0 deletions
diff --git a/‎Pong-v0_monitor/openaigym.video.0.3438.video000000.meta.json
Lines changed: 1 addition & 0 deletions b/‎Pong-v0_monitor/openaigym.video.0.3438.video000000.meta.json
Lines changed: 1 addition & 0 deletions
diff --git a/‎Pong-v0_monitor/openaigym.video.0.3438.video000000.mp4
583 KB b/‎Pong-v0_monitor/openaigym.video.0.3438.video000000.mp4
583 KB
diff --git a/‎Pong-v0_monitor/openaigym.video.0.3438.video000001.meta.json
Lines changed: 1 addition & 0 deletions b/‎Pong-v0_monitor/openaigym.video.0.3438.video000001.meta.json
Lines changed: 1 addition & 0 deletions
diff --git a/‎Pong-v0_monitor/openaigym.video.0.3438.video000001.mp4
381 KB b/‎Pong-v0_monitor/openaigym.video.0.3438.video000001.mp4
381 KB
diff --git a/‎checkpoints/Pong-v0.model
12.4 MB b/‎checkpoints/Pong-v0.model
12.4 MB
diff --git a/‎config.json
Lines changed: 52 additions & 0 deletions b/‎config.json
Lines changed: 52 additions & 0 deletions
diff --git a/‎environment.py
Lines changed: 62 additions & 0 deletions b/‎environment.py
Lines changed: 62 additions & 0 deletions
@@ -0,0 +1,2 @@
+__pycache__/
+.idea/
@@ -0,0 +1 @@
+{"initial_reset_timestamp": 1501897257.560941, "timestamps": [1501897419.795865, 1501897524.366334, 1501897667.15831], "episode_lengths": [9679, 6266, 8561], "episode_rewards": [-1.0, 11.0, -6.0], "episode_types": ["t", "t", "t", "t"]}
@@ -0,0 +1 @@
+{"stats": "openaigym.episode_batch.0.3438.stats.json", "videos": [["openaigym.video.0.3438.video000000.mp4", "openaigym.video.0.3438.video000000.meta.json"], ["openaigym.video.0.3438.video000001.mp4", "openaigym.video.0.3438.video000001.meta.json"]], "env_info": {"gym_version": "0.9.2", "env_id": "Pong-v0"}}
@@ -0,0 +1 @@
+{"episode_id": 0, "content_type": "video/mp4", "encoder_version": {"backend": "ffmpeg", "version": "b'ffmpeg version 3.2.4 Copyright (c) 2000-2017 the FFmpeg developers\\nbuilt with Apple LLVM version 8.0.0 (clang-800.0.42.1)\\nconfiguration: --prefix=/usr/local/Cellar/ffmpeg/3.2.4 --enable-shared --enable-pthreads --enable-gpl --enable-version3 --enable-hardcoded-tables --enable-avresample --cc=clang --host-cflags= --host-ldflags= --enable-libmp3lame --enable-libx264 --enable-libxvid --enable-opencl --disable-lzma --enable-vda\\nlibavutil      55. 34.101 / 55. 34.101\\nlibavcodec     57. 64.101 / 57. 64.101\\nlibavformat    57. 56.101 / 57. 56.101\\nlibavdevice    57.  1.100 / 57.  1.100\\nlibavfilter     6. 65.100 /  6. 65.100\\nlibavresample   3.  1.  0 /  3.  1.  0\\nlibswscale      4.  2.100 /  4.  2.100\\nlibswresample   2.  3.100 /  2.  3.100\\nlibpostproc    54.  1.100 / 54.  1.100\\n'", "cmdline": ["ffmpeg", "-nostats", "-loglevel", "error", "-y", "-r", "30", "-f", "rawvideo", "-s:v", "160x210", "-pix_fmt", "rgb24", "-i", "-", "-vcodec", "libx264", "-pix_fmt", "yuv420p", "/Volumes/xs/CodeSpace/AISpace/rl_space/rl_atari_pytorch/Pong-v0_monitor/openaigym.video.0.3438.video000000.mp4"]}}
@@ -0,0 +1 @@
+{"episode_id": 1, "content_type": "video/mp4", "encoder_version": {"backend": "ffmpeg", "version": "b'ffmpeg version 3.2.4 Copyright (c) 2000-2017 the FFmpeg developers\\nbuilt with Apple LLVM version 8.0.0 (clang-800.0.42.1)\\nconfiguration: --prefix=/usr/local/Cellar/ffmpeg/3.2.4 --enable-shared --enable-pthreads --enable-gpl --enable-version3 --enable-hardcoded-tables --enable-avresample --cc=clang --host-cflags= --host-ldflags= --enable-libmp3lame --enable-libx264 --enable-libxvid --enable-opencl --disable-lzma --enable-vda\\nlibavutil      55. 34.101 / 55. 34.101\\nlibavcodec     57. 64.101 / 57. 64.101\\nlibavformat    57. 56.101 / 57. 56.101\\nlibavdevice    57.  1.100 / 57.  1.100\\nlibavfilter     6. 65.100 /  6. 65.100\\nlibavresample   3.  1.  0 /  3.  1.  0\\nlibswscale      4.  2.100 /  4.  2.100\\nlibswresample   2.  3.100 /  2.  3.100\\nlibpostproc    54.  1.100 / 54.  1.100\\n'", "cmdline": ["ffmpeg", "-nostats", "-loglevel", "error", "-y", "-r", "30", "-f", "rawvideo", "-s:v", "160x210", "-pix_fmt", "rgb24", "-i", "-", "-vcodec", "libx264", "-pix_fmt", "yuv420p", "/Volumes/xs/CodeSpace/AISpace/rl_space/rl_atari_pytorch/Pong-v0_monitor/openaigym.video.0.3438.video000001.mp4"]}}
@@ -0,0 +1,52 @@
+{
+  "Default": {
+    "crop1": 34,
+    "crop2": 34,
+    "dimension2": 80
+  },
+  "Asteroids": {
+    "crop1": 16,
+    "crop2": 34,
+    "dimension2": 94
+  },
+  "BeamRider": {
+    "crop1": 20,
+    "crop2": 20,
+    "dimension2": 80
+  },
+  "Breakout": {
+    "crop1": 34,
+    "crop2": 34,
+    "dimension2": 80
+  },
+  "Centipede": {
+    "crop1": 36,
+    "crop2": 56,
+    "dimension2": 90
+  },
+  "MsPacman": {
+    "crop1": 2,
+    "crop2": 10,
+    "dimension2": 84
+  },
+  "Pong": {
+    "crop1": 34,
+    "crop2": 34,
+    "dimension2": 80    
+  },
+  "Seaquest": {
+    "crop1": 30,
+    "crop2": 30,
+    "dimension2": 80
+  },
+  "SpaceInvaders": {
+    "crop1": 8,
+    "crop2": 36,
+    "dimension2": 94
+  },
+  "VideoPinball": {
+    "crop1": 42,
+    "crop2": 60,
+    "dimension2": 89
+  }
+}
@@ -0,0 +1,62 @@
+from __future__ import division
+import gym
+import numpy as np
+from gym.spaces.box import Box
+from universe import vectorized
+from universe.wrappers import Unvectorize, Vectorize
+from skimage.color import rgb2gray
+import cv2
+
+
+def atari_env(env_id, env_conf):
+    env = gym.make(env_id)
+    if len(env.observation_space.shape) > 1:
+        env = Vectorize(env)
+        env = AtariRescale(env, env_conf)
+        env = NormalizedEnv(env)
+        env = Unvectorize(env)
+    return env
+
+
+def _process_frame(frame, conf):
+    frame = frame[conf["crop1"]:conf["crop2"] + 160, :160]
+    frame = cv2.resize(rgb2gray(frame), (80, conf["dimension2"]))
+    frame = cv2.resize(frame, (80, 80))
+    frame = np.reshape(frame, [1, 80, 80])
+    return frame
+
+
+class AtariRescale(vectorized.ObservationWrapper):
+    def __init__(self, env, env_conf):
+        super(AtariRescale, self).__init__(env)
+        self.observation_space = Box(0.0, 1.0, [1, 80, 80])
+        self.conf = env_conf
+
+    def _observation(self, observation_n):
+        return [
+            _process_frame(observation, self.conf)
+            for observation in observation_n
+        ]
+
+
+class NormalizedEnv(vectorized.ObservationWrapper):
+    def __init__(self, env=None):
+        super(NormalizedEnv, self).__init__(env)
+        self.state_mean = 0
+        self.state_std = 0
+        self.alpha = 0.9999
+        self.num_steps = 0
+
+    def _observation(self, observation_n):
+        for observation in observation_n:
+            self.num_steps += 1
+            self.state_mean = self.state_mean * self.alpha + \
+                observation.mean() * (1 - self.alpha)
+            self.state_std = self.state_std * self.alpha + \
+                observation.std() * (1 - self.alpha)
+
+        unbiased_mean = self.state_mean / (1 - pow(self.alpha, self.num_steps))
+        unbiased_std = self.state_std / (1 - pow(self.alpha, self.num_steps))
+
+        return [(observation - unbiased_mean) / (unbiased_std + 1e-8)
+                for observation in observation_n]
Original file line number	Diff line number	Diff line change
`@@ -0,0 +1 @@`
	`1`	`+{"initial_reset_timestamp": 1501897257.560941, "timestamps": [1501897419.795865, 1501897524.366334, 1501897667.15831], "episode_lengths": [9679, 6266, 8561], "episode_rewards": [-1.0, 11.0, -6.0], "episode_types": ["t", "t", "t", "t"]}`
Original file line number	Diff line number	Diff line change
`@@ -0,0 +1 @@`
	`1`	`+{"stats": "openaigym.episode_batch.0.3438.stats.json", "videos": [["openaigym.video.0.3438.video000000.mp4", "openaigym.video.0.3438.video000000.meta.json"], ["openaigym.video.0.3438.video000001.mp4", "openaigym.video.0.3438.video000001.meta.json"]], "env_info": {"gym_version": "0.9.2", "env_id": "Pong-v0"}}`
Original file line number	Diff line number	Diff line change
`@@ -0,0 +1 @@`
	`1`	+{"episode_id": 0, "content_type": "video/mp4", "encoder_version": {"backend": "ffmpeg", "version": "b'ffmpeg version 3.2.4 Copyright (c) 2000-2017 the FFmpeg developers\\nbuilt with Apple LLVM version 8.0.0 (clang-800.0.42.1)\\nconfiguration: --prefix=/usr/local/Cellar/ffmpeg/3.2.4 --enable-shared --enable-pthreads --enable-gpl --enable-version3 --enable-hardcoded-tables --enable-avresample --cc=clang --host-cflags= --host-ldflags= --enable-libmp3lame --enable-libx264 --enable-libxvid --enable-opencl --disable-lzma --enable-vda\\nlibavutil 55. 34.101 / 55. 34.101\\nlibavcodec 57. 64.101 / 57. 64.101\\nlibavformat 57. 56.101 / 57. 56.101\\nlibavdevice 57. 1.100 / 57. 1.100\\nlibavfilter 6. 65.100 / 6. 65.100\\nlibavresample 3. 1. 0 / 3. 1. 0\\nlibswscale 4. 2.100 / 4. 2.100\\nlibswresample 2. 3.100 / 2. 3.100\\nlibpostproc 54. 1.100 / 54. 1.100\\n'", "cmdline": ["ffmpeg", "-nostats", "-loglevel", "error", "-y", "-r", "30", "-f", "rawvideo", "-s:v", "160x210", "-pix_fmt", "rgb24", "-i", "-", "-vcodec", "libx264", "-pix_fmt", "yuv420p", "/Volumes/xs/CodeSpace/AISpace/rl_space/rl_atari_pytorch/Pong-v0_monitor/openaigym.video.0.3438.video000000.mp4"]}}
Original file line number	Diff line number	Diff line change
`@@ -0,0 +1 @@`
	`1`	+{"episode_id": 1, "content_type": "video/mp4", "encoder_version": {"backend": "ffmpeg", "version": "b'ffmpeg version 3.2.4 Copyright (c) 2000-2017 the FFmpeg developers\\nbuilt with Apple LLVM version 8.0.0 (clang-800.0.42.1)\\nconfiguration: --prefix=/usr/local/Cellar/ffmpeg/3.2.4 --enable-shared --enable-pthreads --enable-gpl --enable-version3 --enable-hardcoded-tables --enable-avresample --cc=clang --host-cflags= --host-ldflags= --enable-libmp3lame --enable-libx264 --enable-libxvid --enable-opencl --disable-lzma --enable-vda\\nlibavutil 55. 34.101 / 55. 34.101\\nlibavcodec 57. 64.101 / 57. 64.101\\nlibavformat 57. 56.101 / 57. 56.101\\nlibavdevice 57. 1.100 / 57. 1.100\\nlibavfilter 6. 65.100 / 6. 65.100\\nlibavresample 3. 1. 0 / 3. 1. 0\\nlibswscale 4. 2.100 / 4. 2.100\\nlibswresample 2. 3.100 / 2. 3.100\\nlibpostproc 54. 1.100 / 54. 1.100\\n'", "cmdline": ["ffmpeg", "-nostats", "-loglevel", "error", "-y", "-r", "30", "-f", "rawvideo", "-s:v", "160x210", "-pix_fmt", "rgb24", "-i", "-", "-vcodec", "libx264", "-pix_fmt", "yuv420p", "/Volumes/xs/CodeSpace/AISpace/rl_space/rl_atari_pytorch/Pong-v0_monitor/openaigym.video.0.3438.video000001.mp4"]}}