martes, 22 de julio de 2008

¿SOY MEJOR QUE MI OPONENTE?

¿Gané por mis cartas superiores?
¿Gané por suerte?
¿Fué una gran victoria porque mi oponente es mejor que yo?
¿Era una victoria esperada porque mi oponente era principiante y yo un experto?
¿En verdad, soy mejor que mi oponente?


El siguiente artículo aplica a YuGiOh!, Versus System y World of WarCraft.

Elefante:¡¿Qué?! Yo tengo las cartas mas caras, las mas brillantes, el mazo que usan todos, he jugado y aplastado a muchos, tengo mucha experiencia… aunque saquen cartas comunes de mis raras yo si se como usarlas, ¡mi rating lineal así lo dice!

Ratón:Yo tengo un rating no lineal, tengo sinergía de cartas y se que hacer, dado que conozco la probabilidad de vencer, ahora verás lo que es el verdadero duelo…

¿Quién ha visto esto antes?

Primero hablaremos de los antecedentedes, luego del sistema actual y por último del sistema propuesto por Arpard Elo.

Como nota preliminar, hablaremos de un sistema estadístico confiable, no de un sistema de recompensa, las puntuaciones (rankings) que maneja UDE son un sistema de premiación lineal de recompensa, sirve muy bien para saber “quien” está arriba en el ranking, pero no te dice quien es mejor. Consideramos UDE debería modificar esto en el corto plazo. (¿MANTIS 3?)

Evidentemente si hablamos de un torneo el ganador del torneo es solo eso, el ganador, pero no necesariamente es el mejor, es el mejor en ese torneo porque es el ganador, pero no por ser el ganador implica necesariamente ser el mejor.

Si cuantificaramos todos los partidos donde participa a lo largo de la temporada y lo comparamos contra todos los demás jugadores en periodos regulares de juego, ¿como sabríamos es el “mejor”?

La historia confirma esto, cuantas veces no hemos visto jugadores que ganan los torneos regionales al hilo y pierden el nacional…, entonces no eran los mejores.

También hemos visto personas que ganan siempre en sus torneos locales pero al llegar al torneo nacional de yugioh estan en media tabla…, por lo tanto no eran los mejores…

También hay personas que con el ranking actual de UDE están en los primeros lugares pero no son capaces de ganar el torneo mas importante de todos.

Todos ellos en estos ejemplos ¿son ganadores? Sí, ¿los mejores? no necesariamente.

Y por supuesto también hemos visto personas que han mantenido un bajo perfil por el sistema actual de UDE y al llegar al nacional son los ¡campeones!

¿Cómo podemos explicar esto?

Olvídese por un momento de la “habilidad” que un jugador “experto” contra un “principiante” cosa que debemos definir posteriormente en otro artículo, ya que en yugioh! una época muy recordada por todos era cuando en la primera mano tenías: Sinister Serpent, Delinquent Duo, Graceful Charity, Pot Of Greed, Magician of Faith…, era victoria prácticamente asegurada desde la mano inicial.

También vemos la tendencia de los jugadores a tener decks similares, donde factores como “suerte”, habilidad del jugador (entiéndase como toma de desiciones correctas) son cada vez mas similares.

Por otra parte esta habilidad del jugador se vuelve similar con otros jugadores.

Todo lo anterior nos lleva tener un mejor sistema puntuación y ranking, donde podamos probabilísticamente saber quien es mejor que otro.

Debemos ubicarnos muy bien en el entorno a discutir para evitar confusiones, como ejemplo citaremos la teoría de la evolución de Darwin, quien nunca dijo que decendemos del mono, el dijo tenemos un ancestro comun, tampoco dijo sobrevive el mas fuerte dijo que sobrevive el mas apto. ¿Ven la diferencia? Esa diferencia marcará una mejor comprensión.

Así pues hay ver el ambito global para actuar localmente.

Veamos como es el sistema actual de UDE:

Los jugadores que registren un número de UDE obtendrán automáticamente una puntuación de 2500. A medida que los jugadores participen en torneos, sus puntuaciones aumentarán o disminuirán. La puntuación de un jugador se calcula con una fórmula que tiene en cuenta su puntuación actual, la puntuación del oponente y el Valor C del torneo. Ejemplo: Carlos está jugando en un torneo de Valor C 10 y tiene una puntuación de 2500. Juana, su oponente, tiene una puntuación de 2500. Juana gana la ronda. La puntuación de Juana aumentará a 2505, y la de su oponente disminuirá a 2495.

Es decir es +/-C/2

El valor “C” se modifica acorde al tipo de torneo desde 10 (tienda) hasta 50 (mundial) y por el nivel del juez en jefe.

Este sistema es bueno, aunque es lineal porque no toma en cuenta la probabilidad de victoria de un oponente sobre otro, ambos obtienen lo mismo.

Ejemplo:

El campéon del nacional juega con una persona con un deck similar pero que acaba de aprender a jugar.

Lo mas probable es que el campéon gane…, y si gana era una victoria esperada. ¿Me explico?

Y lo mismo al revés, es poco probable el principiante pueda ganarle al campéon…, y ¿si le gana?

Acorde al sistema de UDE si gana el campeón obtendrá en un evento con “C”=10; 10/2=5, es decir 2505 y el oponente 2495.

¡No se toma en cuenta la experiencia, ni la habilidad, ni el número de partidos y mucho menos la probabilidad o fuerza tanto del oponente como del campeón!

Entonces si el oponente le gana al campeón no sería considerado una “gran victoria” acorde a este sistema.

Veamos a un jugador que inicia con 2500 puntos UDE después de 17 juegos completados (ya sea 1-Game Match en Versus System ó 3-Game Match en Yugioh!)

La siguiente gráfica nos dice que al principio hiba ganando luego perdiendo y luego ganando, al final es una recta!.

MANTIS reporta las victorias al servidor de UDE, donde se publican no solo las victorias sino los ratings.

Los ratings lineales de UDE no contemplan los puntos señalados como la fuerza o probabilidad de victoria de un jugador, ¿son útiles? Sí. ¿Nos dice quien es el mejor? No.

¿Entonces como se quién es el mejor?

Profesor Arpad Emrick Elo

Observa esta foto



¿Jugarías con ella ajedrez? Seguramente que sí, ¿Le ganarías? Seguramente No.

Ella en realidad juega ajedrez de forma profesional y su nombre es Alexandra Kosteniuk de Rusia.

¿Porque decimos que seguramente no le ganarías?

Porque ella es una de las mejores jugadoras del mundo.

¿Cómo sabemos eso?



Ella usa un sistema de puntuación que mide la fuerza o probabilidad de victoria ( estimación de la habilidad), un sistema no lineal. En este sistema los puntos de Alexandra son de verdadero miedo, piensalo 2 veces antes de jugar con ella. Actualmente tiene 2540 y pasar de 2516 a 2540 en este sistema no es trivial. Vencer a personas con rating similar no es nada sencillo. Y si quieres aumentar mas rápido tus puntos debes vencer a personas con un rating mayor que ¡el tuyo!

Con un sistema lineal como el planteado al principio se pasaría tan solo en 5 partidas ganadas sin importar !contra quien!

Ahora te preguntarás que es eso de sistema no lineal y fuerza o probabilidad de victoria.

Hablaremos del sistema que desarrollo el Profesor Arpad Emrick Elo quien en 1959 diseñó el sistema de evaluación deportiva más sofisticado y preciso que existe.




¿Has tirado una moneda al aire?

LAS PROBABILIDADES DE CARA O CRUZ
El echar una moneda al aire es un ejercicio de teoría de la probabilidad que todo el mundo ha probado: decir cara o cruz constituye una apuesta justa ya que la posibilidad de uno u otro resultado es por mitad. En un número grande de tiradas los resultados tienden a nivelarse.

Mientras mas veces lances la moneda y anotes los resultados los resultados se distribuyen cierta forma.

Lo mismo pasa en nuestos TCG

Se define “Probabilidad de que ocurra un suceso” como el numero de casos favorables dividido entre el numero de casos posibles”. El área bajo la curva normal y sobre el eje x es igual a la probabilidad de que la variable aleatoria x tome un valor dentro de cierto intervalo.

Calma!

Vamos a explicarlo:

En esta curva que se llama curva “normal” la mayor probabilidad está en el centro, es decir es mas frecuente que pase algo que está en el centro de la curva que lo que está en los extremos.



Si Susana juega y después de muchos matches ella tiene este resultado, significa que ella está por arriba del 84% de todos los jugadores.

En la naturaleza esta distribución se presenta en muchos ámbitos: en los jugadores de ajedrez en los deportistas e incluso en la naturaleza:

También la estatura de los niños sigue esta forma:

Donde los niños mal altos estan a la derecha pero son pocos y los mas bajos están a la izquierda y son pocos, la mayoría de los niños están en el centro, es decir si te dijeran por ejemplo que la estatura promedio es “x” significa la mayoría de los niños tienen esa estatura.

El Dr. Elo desarrolló esta fórmula con base a sus estudios:

Nuevo ELO = ELO ACTUAL + K*(W-We)

K = factor de ajuste
W = Número de victorias
We= Valor esperado de ganar

Es justamente en We donde radica la probabilidad o fuerza de victoria de un jugador, es decir la probabilidad de vencer de un jugador sobre otro y al graficarse sigue una curva de distribución normal, ese es el gran descubrimiento del Dr. Elo.

La fórmula completa es:

Acorde al matemático Jeff Jonas el mejor valor de K es 24, ya que habitualmente toma valores de 32 hasta 10, donde si es alto el valor de K ayuda a jugadores con un rating menor a 2400 y si es bajo como 10 es para jugadores con rating de 2400 o mas ya que el valor o rating final se mueve mas despacio.

Observarás que hay 400 en la fórmula, indica que tan amplio es el espacio para moverse, 400 es muy bueno, ya que mas grande relaja mucho mas cosas.

No profundizaremos mas de la cuenta en el Elo.

Ahora bien regresemos a lo que nos interesa.

¿Recuerdan nuestro caso de ejemplo con los puntos UDE?

Verán que es algo lineal que no mide la fuerza de un jugador, y ¿si perdí por tener un mal día? en el caso del Elo aun perdiendo podría subir tu puntuación dado que se toman en cuenta las victorias de todas las partidas.

“Podemos ver que un jugador que le saque 253 puntos a su contrario equivale a que tiene un 82% de posibilidades de triunfo. Así, si el jugador de menor nivel gana, le quitará a su rival una cantidad de puntos, basada en una constante K, Así, de acuerdo a la fórmula Elo, si gana el jugador más débil en este hipotético caso, ganará 12.5 puntos. En cambio, si gana el favorito, le quitará al perdedor solamente 2.8 puntos.”

¿Ven? es la enorme ventaja del sistema Elo, asigna puntos de victoria mas justos.

Siguiendo con el ejemplo de los puntos UDE de ese jugador con los 17 duelos que deciamos al principio lo conviertéramos a un sistema Elo pasaría esto:



La forma de la curva sigue a una curva normal, claro para tener Elos mas precisos es mejor tener por lo menos 20 partidas. El área bajo la curva indica la probabilidad o fuerza de un jugador.

Ahora bien, después de estas explicaciones será más fácil comprender porque cada vez mas instancias a nivel mundial usan el sistema Elo, por ejemplo Microsoft en su servicio de xbox.live usa el sistema Elo, ellos lo modificaron y se llama True Skill en juegos por ejemplo Splinter Cell Pandora tomorrow, también los resultados del futbol soccer usan Elo, muchas competencias deportivas también lo usan.

En el ajedrez fué la primera aplicación de Elo,

Es un sistema muy fácil que se basa en esto: Si dos jugadores se enfrentan entre sí un número determinado de partidas, aquel que gane más veces tiene mayor Elo que el rival y Si dos jugadores se enfrentan entre sí, aquel que tenga el mayor coeficiente Elo es el que tiene mayores probabilidades de ganar, a priori.

Al comienzo todos los jugadores tienen un Elo inicial de 1000 puntos.

Bueno y ¿qué pasa con yugioh! y versus system?

Afortunadamente en Japón los jugadores usan el sistema Elo!

Veamos que sucede en Japón acorde a su web site:


Rn = Rating nuevo
Ro = Rating viejo
W = Puntos de victoria, 3 si ganas un duelo, 1 si lo empatas, 0 si lo pierdes
We = Probabilidad de vencer al oponente.

Or = Rating del oponente
Pr = Rating del jugador

Afortunadamente ellos ya usan una variante de Elo, Confiemos pronto se use aquí en los territorios UDE (Asumiendo América Latina se considere territorio UDE en el futuro)

Hagamos un ejemplo de cálculo para yugioh:
Supongamos A: tiene 1100 Elo y B: tiene 1000 Elo

A: jugó 1 match en yugioh y ganó el primer duelo y empató los siguientes 2.

Para el valor de W será 5 (3 + 1 + 1)

We = 0.56% de probabilidad de ganar.

Al final sus puntos Elo pasarían de 1100 a 1171

Hagamos otro ejemplo pero ahora A: tiene 1100 y B: 1300 con las mismas condiciones

W = 5
We = 0.36 % (tiene lógica porque A: es mas debil que B:, por lo tanto tiene menos oportunidad de vencerle)

Los puntos de A: pasarían de 1100 a 1174

Aquí la belleza del sistema Elo. Mientras en un sistema lineal ganas iguales puntos en un sistema Elo obtienes puntos mas justos. En el ejemplo como eres mas débil y venciste a uno mas fuerte tiene mas puntos! y si eres mas fuerte y vences a alguien mas débil obtienes menos puntos.

Como decíamos mas arriba, Vencer a personas con rating similar no es nada sencillo. Y si quieres aumentar mas rápido tus puntos debes vencer a personas con un rating mayor que ¡el tuyo!, ganaras menos puntos si vences personas con menor rating que el tuyo..

O prefieres aún después de toda esta lectura con un sistema lineal hacer puntos para subir un rating sin importar si tu oponente era mejor que tu?



Espero que les haya gustado. En unos dias publicare otro reportaje.

1 comentario:

Anónimo dijo...

Está my bien, solo pon la fuente original!