El desarrollo de los computadores ha permitido la generacion de modelos que permiten simular el comportamiento de los organismos vivos en condiciones controladas donde la manipulacion de las variables se puede hacer de manera precisa. En la actualidad, los modelos de simulacion se basan en el comportamiento de sistemas dinamicos, como las Redes Neuronales. Dentro de estos modelos se destaca uno que se basa en el condicionamiento operante y se denomina Aprendizaje por Reforzamiento. En la presente investigacion se simulo a traves de este modelo el Dilema del Prisionero (DP), manipulando una variable que determinaba un nivel motivacional de los organismos que los incitaba a ser cooperativos. Se realizaron alrededor de 187.800 ensayos en los que los organismos digitales tenian que enfrentarse al DP manipulando 6 niveles de motivacion. Los resultados permiten identificar una caracteristica intrinseca al DP y es que bajo ciertas condiciones los organismos optaron por no confesar de manera consistente, sin que por esto se pueda afirmar que estan siendo cooperativos o autocontrolados. Lo anterior se debe a que en la simulacion se decidio que los organismos no iban a tener conocimiento de la existencia del otro ni del efecto que sus acciones tenian sobre las consecuencias que su companero recibia. Palabras Clave: dilema del prisionero, aprendizaje por reforzamiento, cooperacion, autocontrol, conexionismo, simulacion.