adicionada a explicação sobre recompensas

This commit is contained in:
2024-09-04 12:01:53 +01:00
parent 940e33b781
commit 7c6e89023a

View File

@ -13,9 +13,9 @@ https://pt.wikipedia.org/wiki/Dilema_do_prisioneiro
| | | | | |
| C | D | | C | D |
____________________________|_____________|_____________| ____________________________|_____________|_____________|
| | 1 | 0 | | | 0.5 | 0 |
| C | | | | C | | |
Prisioneiro | | 1 | 10 | Prisioneiro | | 0.5 | 10 |
A |-------|---------------------------| A |-------|---------------------------|
| | 10 | 5 | | | 10 | 5 |
| D | | | | D | | |
@ -47,6 +47,36 @@ Na variante "Confrontos Globais", o estado do jogo a cada iteração, reflecte a
A escolha inicial das estratégias dos jogadores, assim como a sua localização, influencia o estado do jogo a cada iteração. Será que o estado de jogo entra em equilibrio? Existirão grandes desvios de resultados entre as estratégias? A escolha inicial das estratégias dos jogadores, assim como a sua localização, influencia o estado do jogo a cada iteração. Será que o estado de jogo entra em equilibrio? Existirão grandes desvios de resultados entre as estratégias?
# Recompensas
Para a aplicação desta teoria em jogo, fica mais fácil a sua percepção quando as recompensas são positivas e no final do jogo ganha o jogador que tiver mais pontos.
Por isso, e ao contrário do exemplo dos prisioneiros dado em cima, as recompensas são positivas, isto é, o jogador ganha mais pontos por desertar, ao invés de reduzir a sua pena (no exemplo dos prisioneiros, o objectivo é ter menos pontos).
Tendo os seguintes termos:
- d -> recompensa por desertar quando o adversário coopera
- r -> recompensa pela cooperação mútua
- c -> recompensa quando ambos os jogadores cooperam
- p -> recompensa por cooperar quando o adversário deserta
Podemos definir a seguinte fórmula:
d > r > c > p
na condição:
(d+c)/2 < r
p = 0
c = 1
Desta forma, os possiveis valores (inteiros e mais baixos) para as recompensas são:
p = 0
c = 1
r = 3
d = 4
# Tipos de estratégias # Tipos de estratégias
Os diferentes tipos de estratégias possíveis são variações de um conjunto fixo de características, que passarei a chamar de *traços de personalidade*. Os diferentes tipos de estratégias possíveis são variações de um conjunto fixo de características, que passarei a chamar de *traços de personalidade*.
@ -57,6 +87,8 @@ Eis o conjunto de traços de personalidade:
- Perdão - Perdão
- Coerência - Coerência
A este conjunto pode ser adicionados outros traços de personalidade, o que permite também aumentar o número e complexidade das estratégias. No entanto, é aconselhável manter o número de traços baixo, para não tornar a complexidade exponencial.
## Amabilidade ## Amabilidade
"Não desertar a menos que o adversário deserte." "Não desertar a menos que o adversário deserte."