adicionada a explicação sobre recompensas
This commit is contained in:
36
README.md
36
README.md
@ -13,9 +13,9 @@ https://pt.wikipedia.org/wiki/Dilema_do_prisioneiro
|
|||||||
| | |
|
| | |
|
||||||
| C | D |
|
| C | D |
|
||||||
____________________________|_____________|_____________|
|
____________________________|_____________|_____________|
|
||||||
| | 1 | 0 |
|
| | 0.5 | 0 |
|
||||||
| C | | |
|
| C | | |
|
||||||
Prisioneiro | | 1 | 10 |
|
Prisioneiro | | 0.5 | 10 |
|
||||||
A |-------|---------------------------|
|
A |-------|---------------------------|
|
||||||
| | 10 | 5 |
|
| | 10 | 5 |
|
||||||
| D | | |
|
| D | | |
|
||||||
@ -47,6 +47,36 @@ Na variante "Confrontos Globais", o estado do jogo a cada iteração, reflecte a
|
|||||||
|
|
||||||
A escolha inicial das estratégias dos jogadores, assim como a sua localização, influencia o estado do jogo a cada iteração. Será que o estado de jogo entra em equilibrio? Existirão grandes desvios de resultados entre as estratégias?
|
A escolha inicial das estratégias dos jogadores, assim como a sua localização, influencia o estado do jogo a cada iteração. Será que o estado de jogo entra em equilibrio? Existirão grandes desvios de resultados entre as estratégias?
|
||||||
|
|
||||||
|
# Recompensas
|
||||||
|
|
||||||
|
Para a aplicação desta teoria em jogo, fica mais fácil a sua percepção quando as recompensas são positivas e no final do jogo ganha o jogador que tiver mais pontos.
|
||||||
|
|
||||||
|
Por isso, e ao contrário do exemplo dos prisioneiros dado em cima, as recompensas são positivas, isto é, o jogador ganha mais pontos por desertar, ao invés de reduzir a sua pena (no exemplo dos prisioneiros, o objectivo é ter menos pontos).
|
||||||
|
|
||||||
|
Tendo os seguintes termos:
|
||||||
|
|
||||||
|
- d -> recompensa por desertar quando o adversário coopera
|
||||||
|
- r -> recompensa pela cooperação mútua
|
||||||
|
- c -> recompensa quando ambos os jogadores cooperam
|
||||||
|
- p -> recompensa por cooperar quando o adversário deserta
|
||||||
|
|
||||||
|
Podemos definir a seguinte fórmula:
|
||||||
|
|
||||||
|
d > r > c > p
|
||||||
|
|
||||||
|
na condição:
|
||||||
|
|
||||||
|
(d+c)/2 < r
|
||||||
|
p = 0
|
||||||
|
c = 1
|
||||||
|
|
||||||
|
Desta forma, os possiveis valores (inteiros e mais baixos) para as recompensas são:
|
||||||
|
|
||||||
|
p = 0
|
||||||
|
c = 1
|
||||||
|
r = 3
|
||||||
|
d = 4
|
||||||
|
|
||||||
# Tipos de estratégias
|
# Tipos de estratégias
|
||||||
|
|
||||||
Os diferentes tipos de estratégias possíveis são variações de um conjunto fixo de características, que passarei a chamar de *traços de personalidade*.
|
Os diferentes tipos de estratégias possíveis são variações de um conjunto fixo de características, que passarei a chamar de *traços de personalidade*.
|
||||||
@ -57,6 +87,8 @@ Eis o conjunto de traços de personalidade:
|
|||||||
- Perdão
|
- Perdão
|
||||||
- Coerência
|
- Coerência
|
||||||
|
|
||||||
|
A este conjunto pode ser adicionados outros traços de personalidade, o que permite também aumentar o número e complexidade das estratégias. No entanto, é aconselhável manter o número de traços baixo, para não tornar a complexidade exponencial.
|
||||||
|
|
||||||
## Amabilidade
|
## Amabilidade
|
||||||
|
|
||||||
"Não desertar a menos que o adversário deserte."
|
"Não desertar a menos que o adversário deserte."
|
||||||
|
|||||||
Reference in New Issue
Block a user