formatação do ficheiro README.md para aderir ao padrão e regras de ficheiro Markdown
This commit is contained in:
83
README.md
83
README.md
@ -2,10 +2,18 @@
|
|||||||
|
|
||||||
## Dilema do Prisioneiro - A experiencia original
|
## Dilema do Prisioneiro - A experiencia original
|
||||||
|
|
||||||
https://pt.wikipedia.org/wiki/Dilema_do_prisioneiro
|
[Dilema do Prisioneiro - Wikipedia](<https://pt.wikipedia.org/wiki/Dilema_do_prisioneiro>)
|
||||||
|
|
||||||
"Dois suspeitos, A e B, são presos pela polícia. A polícia tem provas insuficientes para os condenar, mas, separando os prisioneiros, oferece a ambos o mesmo acordo: se um dos prisioneiros, confessando, testemunhar contra o outro e esse outro permanecer em silêncio, o que confessou sai livre enquanto o cúmplice silencioso cumpre 10 anos de sentença. Se ambos ficarem em silêncio, a polícia só pode condená-los a 6 meses de cadeia cada um. Se ambos traírem o comparsa, cada um leva 5 anos de cadeia. Cada prisioneiro faz a sua decisão sem saber que decisão o outro vai tomar, e nenhum tem certeza da decisão do outro. A questão que o dilema propõe é: o que vai acontecer? Como o prisioneiro vai reagir?"
|
|
||||||
|
|
||||||
|
"Dois suspeitos, A e B, são presos pela polícia. A polícia tem provas
|
||||||
|
insuficientes para os condenar, mas, separando os prisioneiros, oferece a ambos
|
||||||
|
o mesmo acordo: se um dos prisioneiros, confessando, testemunhar contra o outro
|
||||||
|
e esse outro permanecer em silêncio, o que confessou sai livre enquanto o
|
||||||
|
cúmplice silencioso cumpre 10 anos de sentença. Se ambos ficarem em silêncio, a
|
||||||
|
polícia só pode condená-los a 6 meses de cadeia cada um. Se ambos traírem o
|
||||||
|
comparsa, cada um leva 5 anos de cadeia. Cada prisioneiro faz a sua decisão sem
|
||||||
|
saber que decisão o outro vai tomar, e nenhum tem certeza da decisão do outro.
|
||||||
|
A questão que o dilema propõe é: o que vai acontecer? Como o prisioneiro vai
|
||||||
|
reagir?"
|
||||||
|
|
||||||
| Prisioneiro |
|
| Prisioneiro |
|
||||||
| B |
|
| B |
|
||||||
@ -22,7 +30,6 @@ https://pt.wikipedia.org/wiki/Dilema_do_prisioneiro
|
|||||||
| | 0 | 5 |
|
| | 0 | 5 |
|
||||||
____________________|_______|_____________|_____________|
|
____________________|_______|_____________|_____________|
|
||||||
|
|
||||||
|
|
||||||
Legenda:
|
Legenda:
|
||||||
|
|
||||||
C -> Cooperar
|
C -> Cooperar
|
||||||
@ -31,27 +38,51 @@ D -> Desertar
|
|||||||
|
|
||||||
## Dilema do Prisioneiro Iterado
|
## Dilema do Prisioneiro Iterado
|
||||||
|
|
||||||
A mesma situação que a anterior, mas a situação é colocada repetidamente, e os jogadores lembram-se da(s) jogada(s) anterior(es) do adversário. Pode haver número máximo de situações (no torneio de Robert Axelrod, haviam 200 iterações) ou ser infinito (jogadores não sabem quando termina o jogo).
|
A mesma situação que a anterior, mas a situação é colocada repetidamente, e os
|
||||||
|
jogadores lembram-se da(s) jogada(s) anterior(es) do adversário. Pode haver
|
||||||
|
número máximo de situações (no torneio de Robert Axelrod, haviam 200 iterações)
|
||||||
|
ou ser infinito (jogadores não sabem quando termina o jogo).
|
||||||
|
|
||||||
## Multiplos jogadores (Sociedade)
|
## Multiplos jogadores (Sociedade)
|
||||||
|
|
||||||
Aplicam-se as mesmas regras do "Dilema do Prisioneiro Iterado", mas deixa de haver um confronto apenas entre dois jogadores por iteração (1v1) e passa a ser um confronto de um jogador contra vários por iteração (1vM).
|
Aplicam-se as mesmas regras do "Dilema do Prisioneiro Iterado", mas deixa de
|
||||||
|
haver um confronto apenas entre dois jogadores por iteração (1v1) e passa a ser
|
||||||
|
um confronto de um jogador contra vários por iteração (1vM).
|
||||||
|
|
||||||
Neste modo, os jogadores só actualizam a memória quando terminam todos os confrontos (fim da iteração)
|
Neste modo, os jogadores só actualizam a memória quando terminam todos os
|
||||||
|
confrontos (fim da iteração)
|
||||||
|
|
||||||
Para este modo de jogo, existem duas variantes:
|
Para este modo de jogo, existem duas variantes:
|
||||||
- Confrontos Globais -> por cada iteração, cada jogador confronta à vez todos os adversários do jogo (o jogador tem todos os adversários à distancia de 1 unidade))
|
|
||||||
- Confrontos Locais -> por cada iteração, cada jogados contronta à vez apenas os adversários locais (o jogador tem adversários à distancia de 1 unidade, adversários a distancia de 2 unidades, etc...))
|
|
||||||
|
|
||||||
Na variante "Confrontos Globais", o estado do jogo a cada iteração, reflecte a performance de estratégias à escala global, ao passo que na variante "Confrontos Locais" é introduzido uma componente dinâmica das estratégias, e o sucesso das estratégias depende não apenas dos adversários locais, mas também dos confrontos desses adversários locais com adversários indirectos.
|
- Confrontos Globais:
|
||||||
|
por cada iteração, cada jogador confronta à vez todos os adversários do jogo
|
||||||
|
(o jogador tem todos os adversários à distancia de 1 unidade))
|
||||||
|
|
||||||
A escolha inicial das estratégias dos jogadores, assim como a sua localização, influencia o estado do jogo a cada iteração. Será que o estado de jogo entra em equilibrio? Existirão grandes desvios de resultados entre as estratégias?
|
- Confrontos Locais:
|
||||||
|
por cada iteração, cada jogados contronta à vez apenas os adversários locais
|
||||||
|
(o jogador tem adversários à distancia de 1 unidade, adversários a distancia de
|
||||||
|
2 unidades, etc...))
|
||||||
|
|
||||||
# Recompensas
|
Na variante "Confrontos Globais", o estado do jogo a cada iteração, reflecte a
|
||||||
|
performance de estratégias à escala global, ao passo que na variante
|
||||||
|
"Confrontos Locais" é introduzido uma componente dinâmica das estratégias, e o
|
||||||
|
sucesso das estratégias depende não apenas dos adversários locais, mas também
|
||||||
|
dos confrontos desses adversários locais com adversários indirectos.
|
||||||
|
|
||||||
Para a aplicação desta teoria em jogo, fica mais fácil a sua percepção quando as recompensas são positivas e no final do jogo ganha o jogador que tiver mais pontos.
|
A escolha inicial das estratégias dos jogadores, assim como a sua localização,
|
||||||
|
influencia o estado do jogo a cada iteração. Será que o estado de jogo entra em
|
||||||
|
equilibrio? Existirão grandes desvios de resultados entre as estratégias?
|
||||||
|
|
||||||
Por isso, e ao contrário do exemplo dos prisioneiros dado em cima, as recompensas são positivas, isto é, o jogador ganha mais pontos por desertar, ao invés de reduzir a sua pena (no exemplo dos prisioneiros, o objectivo é ter menos pontos).
|
## Recompensas
|
||||||
|
|
||||||
|
Para a aplicação desta teoria em jogo, fica mais fácil a sua percepção quando
|
||||||
|
as recompensas são positivas e no final do jogo ganha o jogador que tiver mais
|
||||||
|
pontos.
|
||||||
|
|
||||||
|
Por isso, e ao contrário do exemplo dos prisioneiros dado em cima, as
|
||||||
|
recompensas são positivas, isto é, o jogador ganha mais pontos por desertar, ao
|
||||||
|
invés de reduzir a sua pena (no exemplo dos prisioneiros, o objectivo é ter
|
||||||
|
menos pontos).
|
||||||
|
|
||||||
Tendo os seguintes termos:
|
Tendo os seguintes termos:
|
||||||
|
|
||||||
@ -77,18 +108,22 @@ Desta forma, os possiveis valores (inteiros e mais baixos) para as recompensas s
|
|||||||
- r = 3
|
- r = 3
|
||||||
- d = 4
|
- d = 4
|
||||||
|
|
||||||
# Tipos de estratégias
|
## Tipos de estratégias
|
||||||
|
|
||||||
Os diferentes tipos de estratégias possíveis são variações de um conjunto fixo de características, que passarei a chamar de *traços de personalidade*.
|
Os diferentes tipos de estratégias possíveis são variações de um conjunto fixo
|
||||||
|
de características, que passarei a chamar de *traços de personalidade*.
|
||||||
|
|
||||||
Eis o conjunto de traços de personalidade:
|
Eis o conjunto de traços de personalidade:
|
||||||
- Amabilidade
|
|
||||||
- Retaliação
|
|
||||||
- Perdão
|
|
||||||
- Coerência
|
|
||||||
- Memória
|
|
||||||
|
|
||||||
A este conjunto pode ser adicionados outros traços de personalidade, o que permite também aumentar o número e complexidade das estratégias. No entanto, é aconselhável manter o número de traços baixo, para não tornar a complexidade exponencial.
|
- Amabilidade
|
||||||
|
- Retaliação
|
||||||
|
- Perdão
|
||||||
|
- Coerência
|
||||||
|
- Memória
|
||||||
|
|
||||||
|
A este conjunto pode ser adicionados outros traços de personalidade, o que
|
||||||
|
permite também aumentar o número e complexidade das estratégias. No entanto, é
|
||||||
|
aconselhável manter o número de traços baixo, para não tornar a complexidade exponencial.
|
||||||
|
|
||||||
## Amabilidade
|
## Amabilidade
|
||||||
|
|
||||||
@ -111,5 +146,5 @@ A este conjunto pode ser adicionados outros traços de personalidade, o que perm
|
|||||||
"Capacidade de lembrar interacções mais antigas."
|
"Capacidade de lembrar interacções mais antigas."
|
||||||
|
|
||||||
## Outros tópicos relevantes
|
## Outros tópicos relevantes
|
||||||
[Soma zero e soma diferente zero](https://pt.wikipedia.org/wiki/Teoria_dos_jogos#Soma_zero_e_soma_diferente_zero)
|
|
||||||
|
|
||||||
|
[Soma zero e soma diferente zero](https://pt.wikipedia.org/wiki/Teoria_dos_jogos#Soma_zero_e_soma_diferente_zero)
|
||||||
|
|||||||
Reference in New Issue
Block a user