adicionada a explicação sobre recompensas
This commit is contained in:
36
README.md
36
README.md
@ -13,9 +13,9 @@ https://pt.wikipedia.org/wiki/Dilema_do_prisioneiro
|
||||
| | |
|
||||
| C | D |
|
||||
____________________________|_____________|_____________|
|
||||
| | 1 | 0 |
|
||||
| | 0.5 | 0 |
|
||||
| C | | |
|
||||
Prisioneiro | | 1 | 10 |
|
||||
Prisioneiro | | 0.5 | 10 |
|
||||
A |-------|---------------------------|
|
||||
| | 10 | 5 |
|
||||
| D | | |
|
||||
@ -47,6 +47,36 @@ Na variante "Confrontos Globais", o estado do jogo a cada iteração, reflecte a
|
||||
|
||||
A escolha inicial das estratégias dos jogadores, assim como a sua localização, influencia o estado do jogo a cada iteração. Será que o estado de jogo entra em equilibrio? Existirão grandes desvios de resultados entre as estratégias?
|
||||
|
||||
# Recompensas
|
||||
|
||||
Para a aplicação desta teoria em jogo, fica mais fácil a sua percepção quando as recompensas são positivas e no final do jogo ganha o jogador que tiver mais pontos.
|
||||
|
||||
Por isso, e ao contrário do exemplo dos prisioneiros dado em cima, as recompensas são positivas, isto é, o jogador ganha mais pontos por desertar, ao invés de reduzir a sua pena (no exemplo dos prisioneiros, o objectivo é ter menos pontos).
|
||||
|
||||
Tendo os seguintes termos:
|
||||
|
||||
- d -> recompensa por desertar quando o adversário coopera
|
||||
- r -> recompensa pela cooperação mútua
|
||||
- c -> recompensa quando ambos os jogadores cooperam
|
||||
- p -> recompensa por cooperar quando o adversário deserta
|
||||
|
||||
Podemos definir a seguinte fórmula:
|
||||
|
||||
d > r > c > p
|
||||
|
||||
na condição:
|
||||
|
||||
(d+c)/2 < r
|
||||
p = 0
|
||||
c = 1
|
||||
|
||||
Desta forma, os possiveis valores (inteiros e mais baixos) para as recompensas são:
|
||||
|
||||
p = 0
|
||||
c = 1
|
||||
r = 3
|
||||
d = 4
|
||||
|
||||
# Tipos de estratégias
|
||||
|
||||
Os diferentes tipos de estratégias possíveis são variações de um conjunto fixo de características, que passarei a chamar de *traços de personalidade*.
|
||||
@ -57,6 +87,8 @@ Eis o conjunto de traços de personalidade:
|
||||
- Perdão
|
||||
- Coerência
|
||||
|
||||
A este conjunto pode ser adicionados outros traços de personalidade, o que permite também aumentar o número e complexidade das estratégias. No entanto, é aconselhável manter o número de traços baixo, para não tornar a complexidade exponencial.
|
||||
|
||||
## Amabilidade
|
||||
|
||||
"Não desertar a menos que o adversário deserte."
|
||||
|
||||
Reference in New Issue
Block a user