mwalton
diff --git a/‎bin/__init__.py‎ b/‎bin/__init__.py‎
diff --git a/‎bin/interactive.py‎
Lines changed: 39 additions & 0 deletions b/‎bin/interactive.py‎
Lines changed: 39 additions & 0 deletions
@@ -0,0 +1,39 @@
+#!/usr/bin/env python
+import os,sys
+sys.path.insert(1, os.path.join(sys.path[0], '..'))
+import argparse
+
+from multiagent.environment import MultiAgentEnv
+from multiagent.policy import InteractivePolicy
+import multiagent.scenarios as scenarios
+
+if __name__ == '__main__':
+ # parse arguments
+ parser = argparse.ArgumentParser(description=None)
+ parser.add_argument('-s', '--scenario', default='', help='Path of the scenario Python script.')
+ args = parser.parse_args()
+
+ # load scenario from script
+ scenario = scenarios.load(args.scenario).Scenario()
+ # create world
+ world = scenario.make_world()
+ # create multiagent environment 
+ env = MultiAgentEnv(world, scenario.reset_world, scenario.reward, scenario.observation, shared_viewer = False)
+ # render call to create viewer window (necessary only for interactive policies)
+ env.render()
+ # create interactive policies for each agent
+ policies = [InteractivePolicy(env,i) for i in range(env.n)]
+ # execution loop
+ obs_n = env.reset()
+ while True:
+ # query for action from each agent's policy
+ act_n = []
+ for i, policy in enumerate(policies):
+ act_n.append(policy.action(obs_n[i]))
+ # step environment
+ obs_n, reward_n, done_n, _ = env.step(act_n)
+ # render all agent views
+ env.render() 
+ # display rewards 
+ for agent in env.world.agents:
+ print(agent.name + " reward: %0.3f" % env._get_reward(agent))