Cuando no se puede asumir
normalidad en los datos, no se debe utilizar lo que conocemos como “estadística
paramétrica”. Toca entonces adentrarse en la estadística no-paramétrica.
Expongo a continuación algunas
notas acerca de las pruebas o Tests No Paramétricos más conocidos son (vale decir que he
escrito post acerca de algunos de ellos):
- Kruskal-Wallis: es un método no paramétrico para probar si un grupo de datos proviene de la misma población. Intuitivamente, es idéntico al ANOVA con los datos reemplazados por categorías. Este contraste permite decidir si puede aceptarse la hipótesis de que k muestras independientes proceden de la misma población o de poblaciones idénticas con la misma mediana.
- Mann-Whitney: es un test no paramétrico aplicado a dos muestras independientes. En palabras simples podría decirse que es una versión no paramétrica de la prueba t de Student. Se aplica cuando las observaciones de ambos grupos son independientes.
- Friedman: es la alternativa no paramétrica a la prueba ANOVA de una vía cuando los datos son dependientes/pareados. Se trata de una extensión de la prueba de los rangos con signo de Wilcoxon para más de dos grupos (basada en suma de rangos).
- Wilcoxon: se basa en rangos y no en signos. Es una prueba no paramétrica para comparar el rango medio de dos muestras relacionadas y determinar si existen diferencias entre ellas.
- Prueba de la Mediana de Mood: se utiliza para comparar las medianas de dos muestras y determinar si pertenecen a la misma población o no. Está basada en la prueba Chi-cuadrado.
Cuando se trata de correlación,
también hay excelentes opciones:
- Coeficiente de Correlación de Spearman: es una alternativa de correlación para datos ordinales. Está basado en valores jerarquizados. Los datos deben ser previamente ordenados y se reemplazan por el orden respectivo. Siempre cabe la posibilidad de que existan datos que coincidan en la misma posición al ordenar.
- Coeficiente de Concordancia de Kendall: Es una de las técnicas no paramétricas que mide el grado de correlación entre las variables de una muestra, así como el sentido de dicha relación.
Cabe destacar que para muestras
muy grandes la estadística no paramétrica puede ser menos potente que la
paramétrica.
Otra consideración importante es que no todos los
programas automatizados tienen opciones para aplicar todos los test o pruebas no paramétricas.
No hay comentarios:
Publicar un comentario