adicionada a explicação sobre recompensas

2024-09-04 12:01:53 +01:00
parent 940e33b781
commit 7c6e89023a
1 changed files with 34 additions and 2 deletions
--- a/README.md
+++ b/README.md
@ -13,9 +13,9 @@ https://pt.wikipedia.org/wiki/Dilema_do_prisioneiro
                                |             |             |
                                |      C      |      D      |
    ____________________________|_____________|_____________|
-                        |       |          1  |          0  |
+                        |       |         0.5 |          0  |
                        |   C   |             |             |
-        Prisioneiro     |       |  1          |  10         |
+        Prisioneiro     |       |  0.5        |  10         |
            A           |-------|---------------------------|
                        |       |         10  |          5  |
                        |   D   |             |             |
@ -47,6 +47,36 @@ Na variante "Confrontos Globais", o estado do jogo a cada iteração, reflecte a
 A escolha inicial das estratégias dos jogadores, assim como a sua localização, influencia o estado do jogo a cada iteração. Será que o estado de jogo entra em equilibrio? Existirão grandes desvios de resultados entre as estratégias?
 # Recompensas
 Para a aplicação desta teoria em jogo, fica mais fácil a sua percepção quando as recompensas são positivas e no final do jogo ganha o jogador que tiver mais pontos.
 Por isso, e ao contrário do exemplo dos prisioneiros dado em cima, as recompensas são positivas, isto é, o jogador ganha mais pontos por desertar, ao invés de reduzir a sua pena (no exemplo dos prisioneiros, o objectivo é ter menos pontos).
 Tendo os seguintes termos:
 - d -> recompensa por desertar quando o adversário coopera
 - r -> recompensa pela cooperação mútua
 - c -> recompensa quando ambos os jogadores cooperam
 - p -> recompensa por cooperar quando o adversário deserta
 Podemos definir a seguinte fórmula:
  d > r > c > p
 na condição:
 (d+c)/2 < r
 p = 0
 c = 1
 Desta forma, os possiveis valores (inteiros e mais baixos) para as recompensas são:
 p = 0
 c = 1
 r = 3
 d = 4
 # Tipos de estratégias
 Os diferentes tipos de estratégias possíveis são variações de um conjunto fixo de características, que passarei a chamar de *traços de personalidade*.
@ -57,6 +87,8 @@ Eis o conjunto de traços de personalidade:
 - Perdão
 - Coerência
 A este conjunto pode ser adicionados outros traços de personalidade, o que permite também aumentar o número e complexidade das estratégias. No entanto, é aconselhável manter o número de traços baixo, para não tornar a complexidade exponencial.
 ## Amabilidade
 "Não desertar a menos que o adversário deserte."