File:Cena2

Description
Na segunda cena o agente terá acesso a área de recompensa negativa, podendo então aprender a desviar da mesma e escolher o menor caminho para recompensa positiva.