LA DÓCIMA CHI CUADRADO.


Para explicar el fundamento de la dócima chi-cuadrado emplearemos un ejemplo bastante simple pero que permitirá comprender el fundamento de la prueba. Si desea saber para que puede servir esto consulte el término “Gonzalo Garcia Pelayo” en Internet.

Supongamos que somos el dueño de un casino y nos acaban de entregar una ruleta. Estamos interesados en saber si la ruleta está bien construida, y en particular si el número cero aparece con la frecuencia que le corresponde. No está de mal recordar que cuando sale el cero la banca gana todas las apuestas. Nuestro crupier realiza 500 tiradas con la ruleta y nos anuncia que el cero ha salido 24 veces.

La ruleta europea normal tiene 37 números, del 0 al 36 ambos inclusive. Si está bien construida todos deben salir con la misma frecuencia, es decir una vez de cada 37 tiradas. La probabilidad esperada para un determinado número (en este caso el cero) es 1/37 o lo que es lo mismo 0,027. En 500 tiradas el cero debería salir 500*0,027= 13,514 veces. Es interesante anotar que es un resultado imposible ya que, en el mejor de los casos el cero podría salir 13 o 14 veces, pero no 13,514 (este es el problema de asimilar una distribución discreta a una continua). Sin embargo nosotros mantendremos el valor calculado.

Así es que esperamos que el cero salga 13,514 veces y ha salido 24 veces. Por supuesto también esperamos que no salga en 486,486 veces y en realidad no ha salido en 476 veces.

La pregunta que se nos plantea es: si la máquina está bien hecha (hipótesis cero) ¿es razonable admitir que salga lo que ha salido?. Planteado de otra manera ¿podría ser que estando bien hecha la máquina haya pasado esto por casualidad?. Por supuesto, que es posible que ocurra alguna vez, pero ¿cuantas?.

De manera absoluta no es posible contestar a la pregunta. Tendríamos que disponer de un número grande de ruletas bien construidas (¿y como sabemos que lo están?) y hacer en cada una 500 tiradas y ver si sale alguna vez 24 veces el cero. Ahora la cuestión que nos tenemos que plantear es cuantas ruletas bien construidas tendríamos que tener para confiar en los resultados. Pongamos que tenemos 50 ruletas, hemos tirado la bola 500 veces en cada una y nunca han salido 24 ceros o mas. El fabricante de la nuestra siempre podría decir que probar con 50 es poco y que a lo mejor probando con 100 si sale el cero 24 veces en algún caso. Está claro que el fabricante siempre puede argumentar que hay que probar con más ruletas.

Es posible abordar el problema desde otro punto de vista. Es evidente que si la hipótesis cero es cierta, es decir cuando la ruleta está bien construida, lo razonable es pensar que la diferencia entre el valor observado (es decir lo que nos ha pasado) y el valor esperado será pequeña. A esta diferencia la denominamos:

di = Oi-Ei

Cuando empleamos diferencias podemos obtener resultados positivos o negativos. Si tenemos varias observaciones puede ocurrir que los valores positivos y negativos se cancelen si los sumamos, así es que antes que nada, evitamos los inconvenientes del signo elevando las diferencias al cuadrado

di2 = (Oi-Ei)2

Por otra parte el valor absoluto de la diferencia variará mucho en función del valor absoluto que esperamos y observamos. Por ejemplo si en vez de 500 tiradas hacemos 1000 y tenemos 48 ceros la diferencia entre lo observado y lo esperado es 48-27,027=20,973 en lugar de 24-13,514=10,486. Sin embargo si dividimos el resultado por el valor esperado tendremos 0,776 en ambos casos. Por lo tanto hacemos algo parecido con nuestra diferencia y tendremos:

X2 = di2 / Ei = (Oi-Ei)2 / Ei

Cuando tenemos un conjunto de observaciones calcularemos la suma de todas ellas con la fórmula:

Ahora bien los valores de di son, conceptualmente un error o desviación con esperanza matemática cero y [di2 / Ei ] es el cuadrado del error dividido por el valor teórico. Pues bien, en 1900 Pearson demostró que la distribución de estos valores sigue una distribución que se denomina distribución chi cuadrada de Pearson y que está tabulada, de manera que una vez conocida k y el valor de X2 podemos consultar cual es la probabilidad de encontrar al azar un valor tan grande o mayor que el que hemos encontrado en nuestro caso.

Cuando la hipótesis cero es cierta las diferencias entre los valores observados y los esperados serán pequeñas y en consecuencia el estadístico X2 también será pequeño, por supuesto teniendo en cuenta el numero de parejas empleadas en la suma. Dado un valor de k cuanto mayor es el valor de X2 más pequeña es la probabilidad que nos muestra la tabla, es decir mas pequeña es la probabilidad de que la hipótesis nula sea cierta. La cuestión ahora es cuan pequeña tiene que ser esta posibilidad para que rechacemos la hipótesis cero.

En nuestro caso la situación que tenemos es :



observado

esperado

(Oi-Ei)

(Oi-Ei)2

(Oi-Ei)2 / Ei

Sale el cero

24,000

13,514

10,486

109,956

8,136

No sale el cero

476,000

486,486

-10,486

109,956

0,226

suma





8,362


El grado de libertad es gl=k-1 siendo k el número de grupos empleados en el cálculo.

En la tabla de la distribución chi cuadrado tenemos para un grado de libertad:


0,9000

0,8000

0,7000

0,6000

0,5000

0,4000

0,3000

0,2000

0,1000

0,0500

0,0250

0,0100

0,0050

0,0010

0,0005

0,0158

0,0642

0,1480

0,2750

0,4550

0,7080

1,0740

1,6420

2,7060

3,8410

5,0240

6,6350

7,8790

10,8280

12,1160

Lo que nos indica que si la ruleta estuviese bien construida la probabilidad de encontrar por azar un valor del estadístico chi cuadrado tan grande como 8,362 estaría entre 0,005 y 0,001 o dicho de otra forma ocurriría entre 1 de cada 200 a 1 de cada 1000 casos.

La conclusión es que rechazamos la hipótesis nula y por lo tanto nos acogemos a su alternativa de que la ruleta está mal construida.

Sin embargo esto no quiere decir que hemos podido demostrar que la ruleta está bien o mal construida, simplemente que para nosotros algo que puede ocurrir solamente una vez cada 200 veces es tan poco probable que nos parece inverosímil. En investigación biológica se consideran igualmente inverosímiles situaciones con probabilidad menor de 0,05 es decir que ocurren menos de una vez cada veinte.

¿Qué diríamos si el crupier nos dice que el cero ha salido 15 veces?

Utilizando el mismo criterio obtenemos para chi cuadrado el valor 0,1681 (calculelo Vd. como ejercicio de comprobación) por lo tanto la probabilidad está entre 0,2 y 0,1 es decir una de cada cinco a una de cada 10 veces. Lo razonable es admitir que este resultado no permite rechazar la hipótesis cero y por lo tanto que es verosímil pensar que la ruleta está bien construida a pesar de que el cero ha salido con más frecuencia de lo esperado.

De hecho con esta prueba y a un nivel p<= 0,05 pensaremos que la ruleta está mal hecha si el cero sale 8 o menos veces o 20 o más veces en lugar de las 13 o 14 esperadas. Si piensa apostar mucho puede exigir un mejor nivel, por ejemplo una de cada dos veces p<=0,5 y entonces pensará que es rechazable una ruleta en la que el cero sale menos de 12 veces o mas de 15 veces en 500 tiradas. Bueno..., si piensa apostar solo le preocupará si el cero sale más de 15 de cada 500 ya que si sale menos de 12 veces el problema es de la banca .


RESUMEN DEL PROCEDIMIENTO.

  1. Diseñar el experimento.

  2. Obtener los resultados: valores observados.

  3. Plantear el tipo de distribución teórica que pensamos que coincide con los datos observados.

  4. Obtener los valores esperados.

  5. Calcular el estadístico chi cuadrado

  6. Calcular los grados de libertad.

  7. Consultar en la tabla la probabilidad de obtener un valor chi cuadrado por azar tan alto como el calculado para esos grados de libertad.

  8. Si la probabilidad es menor o igual que el valor fijado (normalmente menor que 0,05) se rechaza la hipótesis cero por ser poco probable y se concluye que las distribución observada no es como la teórica

  9. Si la probabilidad es mayor que el valor fijado se admite la hipótesis cero y se considera como no probado que las distribuciones sean distintas (que no es exactamente igual que probar que son iguales).



Para volver atrás utilice el botón de su navegador o pulse aquí.