Estou com uma dúvida sobre a seguinte parte do enunciado do EP2:
O labirinto deverá ser 5x5. O alvo, "ponto proibido", posição inicial do robô e configuração do labirinto devem ser dados de entrada, obtidos através da leitura de um arquivo-texto, formatado segundo sua preferência.
A saída do EP não é apenas a política ótima considerando os parâmetros fornecidos? Se sim, para que seria usada a posição inicial do robô?
Obrigado.
Obs.: Desculpem-me por fazer uma pergunta sobre o EP2 neste fórum, mas foi o único lugar que achei disponível.
def __init__(self, grid, terminals, init=(0, 0), gamma=.9):
No que nos afeta o fato do labirinto ser 5x5? Testes?
E outra dúvida: abrindo o código mdp.py no Eclipse com PyDev ele mostra alguns erros que não estou conseguindo resolver. Deixamos assim mesmo, professor?
Obrigado!
Oi,
quanto ao limite de tamanho, isso significa que o programa deve funcionar para mapas 5x5. O programa deve ser bem feito e cuidar de exceções.
Quanto ao erro, talvez fosse o caso de você publicar que erro é esse e colocar em discussão. Minha expectativa é da entrega de um programa de boa qualidade e funcionando.
O problema era que o mdp.py deve ser usado em conjunto com dois outros arquivos do pacote de códigos: doctests.py e utils.py.
Não acho que entregar esses dois arquivos junto do EP vão causar problemas. =)
Oi,
é exatamente por esse motivo.
Oi,
vamos combinar assim: estará igualmente correto tanto fixar a dimensão como 5x5 como deixar variável. No segundo caso, só verificaremos, para efeito de correção, labirintos cujos dados de entrada fixem o tamanho em 5x5.
"Junto com o código de seu programa, você deve entregar um arquivo texto indicando os parâmetros usados e os pontos no mapa onde as diferenças de políticas ocorreram."
O fato do mapa ser passado como parâmetro pro programa faz com que não podemos dizer muitas coisas gerais a respeito dele, então entregar um arquivo texto com "os pontos no mapa onde as diferenças de políticas ocorreram" não me parece fazer muito sentido.
Acho que faria sentido se tivéssemos que entregar um mapa qualquer como exemplo, ou então fazer o EP soltar um arquivo de saída com essas informações.
O que faço?
Obrigado!
Oi,
vou tentar explicar um pouco melhor o que eu espero que seja entregue, além obviamente do fonte. Fixando os parâmetros que caracterizam o labirinto e ponto de partida do robô, os demais parâmetros podem ser manipulados, de forma que em algumas células as flechas mudem de direção (ou seja, a política seja alterada). O que eu quero é uma evidência empírica desse fato, ou seja, quero que sejam produzidos dados de entrada que alterem uma política.
Encontrei um tal "gamma" no código original e não descobri a relação dele com algum dos parâmetros de entrada dado na grande lista no enunciado.
Queria saber se faltou citá-lo, se ele deve continuar do jeito que está ou se é o horário e eu não tô lendo mais nada direito.
Valeu!
A minha dúvida é:
Posso supor que sempre o alvo ou o ponto proibido podem ser alcançados, nesse caso poderia usar gamma = 1.
Ou o gamma deve ser mais um parâmetro da entrada?
Ou uso o valor padrão que está no código em python (se não me engano, 0.9).
Nesse problema específico do labirinto, conforme sugerido no livro, o gamma pode ser igual a 1. Ele pode ser assumido como fixo com esse valor.
Teria como adiar o EP pra amanha de noite?
Oi,
atendendo a pedidos, alterei o prazo para entrega do EP2 para o dia 30.
"Os valores do prêmio por atingir o alvo, punição por atingir o 'ponto proibido' e custo de cada movimento do robô devem ser fornecidos como dados de entrada."
Os valores do custo e pontos terminais não são fixos. Devem ser fornecidos como dados de entrada.
Da uma boa olhada no arquivo que vc baixou no site do livro. Depois da definição das classes, tem um exemplo de um objeto que define todos esses custos.