Algoritmo de Ajuste de parametros no problema do Canhão

Algoritmo de Ajuste de parâmetros
O algoritmo de aprendizado mais simples, onde os parâmetros de um agente serão ajustados de acordo com o resultado de testes, para que este agente chegue no comportamento desejável, ou o mais próximo possível.

No decorrer do funcionamento, se o comportamento do agente não for o desejável, seu parâmetro será ajustado de acordo com o resultado deste comportamento. Até pequenos ajustes podem, resultar em comportamentos totalmente diferentes. É observado o novo comportamento após o ajuste para analisar o quão eficiente o agente pode ou não ter se tornado.

Problema do canhão
No nosso problema do canhão, estamos tentando fazer o canhão acertar o alvo, o único parâmetro existente é o ângulo do canhão.

A primeiro momento, o algoritmo fará o calculo do erro(distancia) do tiro em relação ao alvo: Um valor de ajuste será previamente definido.
 * posição do tiro - posição do alvo.

A partir daí começaremos a realizar os possíveis ajustes:
 * Se o tiro passar do alvo:
 * O valor de ajuste será dividido por 2
 * Será subtraído do ângulo usado este ajuste
 * Informaremos o valor deste ângulo
 * Se o tiro não alcançar o alvo:
 * Será adicionado o valor de ajuste ao ângulo utilizado.
 * Informaremos o valor deste ângulo
 * Se acertou o alvo, apenas informaremos ao usuário o sucesso e o ângulo utilizado.

Segue aqui um link do vídeo exemplificando este funcionamento.

Página feita por: Johann Robert Ribeiro Moia