Análisis Estadísticos para Ensayos Clínicos y Estudios Epidemiológicos. Asesoría estadística para investigación, en general, incluyendo Tesis. Asesoría Metodológica. Diseño de Posters para Congresos y Eventos Científicos.

lunes, 3 de junio de 2019

Test de Friedman


El test de Friedman es la alternativa no paramétrica a la prueba ANOVA de una vía cuando los datos son dependientes/pareados. Se trata de una extensión de la prueba de los rangos con signo de Wilcoxon para más de dos grupos (basada en suma de rangos).

Asumiendo ciertas simplificaciones, puede considerarse como una comparación entre las medianas de varios grupos.

El test de Friedman es el test adecuado cuando los datos tienen un orden natural, (cuando para darles sentido tienen que estar ordenados) y además son pareados. Por ejemplo, si se quiere estudiar la diferencia en el rendimiento de un grupo de atletas dependiendo del plan de alimentación, vegetariano o mixto, se hace competir al mismo grupo, bajo las condiciones más similares posibles, a excepción de la alimentación. En tal caso se dispondrá de dos tipos de datos: los tiempos,  en cuyo caso se aplicaría ANOVA para datos pareados, o las posiciones en las cuales quedó cada competidor, en cuyo caso se aplicaría el Test de Friedman.

El concepto es similar a la suma de rangos de Wilcoxon para dos grupos pero esta vez asignando los rangos dentro de cada fila (ya que hay más de dos medidas para cada individuo) y después haciendo la suma de rangos para cada columna.

El test de Friedman genera un estadístico conocido como Fr o Q que se distribuye:

  • Si el número total de individuos (N) es mayor de 10 la distribución de Fr se aproxima a una distribución χ2 con k-1 grados de libertad (siendo k el número de grupos a comparar).
  • Si el número de individuos es menor de 10 se recurre a tablas con los valores de significancia para un test de Friedman.


Se utiliza cuando se seleccionan n grupos de k elementos de forma que los elementos de cada grupo sean lo más parecidos posible entre sí, y a cada uno de los elementos del grupo se le aplica uno de entre k "tratamientos", o bien cuando a cada uno de los elementos de una muestra de tamaño n se le aplican los k "tratamientos".

La hipótesis nula es que las respuestas asociadas a cada uno de los "tratamientos" tienen la misma distribución de probabilidad, y la hipótesis alternativa es que por lo menos la distribución de una de las respuestas difiere de las demás.

Como ya se mencionó, para poder utilizar esta prueba las respuestas deben estar medidas por lo menos en una escala ordinal.

Los datos se disponen en una tabla en la que en cada fila se recogen las respuestas de los k elementos de cada grupo a los k tratamientos.

A las observaciones de cada fila se les asignan rangos de menor a mayor desde 1 hasta k; a continuación se suman los rangos correspondientes a cada columna, siendo “RJ” la suma correspondiente a la columna j-ésima.

Si la hipótesis nula es cierta, la distribución de los rangos en cada fila se debe al azar, y es de esperar que la suma de los rangos correspondientes a cada columna sea aproximadamente igual a n(k + 1)/2. La prueba de Friedman determina si las “RJ” observadas difieren significativamente del valor esperado bajo la hipótesis nula.

Si H0 es cierta y el número de columnas y/o de filas es moderadamente grande, la distribución de F se aproxima a un chi-cuadrado con k-1 grados de libertad; en ese caso se rechaza la hipótesis nula para los valores de F mayores al valor crítico fijado para el nivel de significación. 


---------------------------------------------------------------------------
Universidad de Barcelona. http://www.ub.edu/aplica_infor/
Sinopsis de pruebas estadísticas no paramétricas. Gómez, Manuel, et al.
Test de Friedman. Alternativa no paramétrica al ANOVA de datos dependientes. Amat, Joaquín.

martes, 7 de mayo de 2019

Análisis de Varianza de Una Vía (One-Way ANOVA)


El análisis de varianza de una vía (One-Way ANOVA) se utiliza para determinar si existen diferencias estadísticamente significativas entre las medias de tres o más grupos.

Es una técnica estadística paramétrica de contraste de hipótesis.

Se aplica en grupos independientes (no relacionados). Este procedimiento se basa en comparar la varianza entre las medias de grupo (entre-grupos) versus la varianza dentro de los grupos (intra-sujetos). Es decir, cuantifica la dispersión de los valores con respecto a sus correspondientes medias; y, cuantifica la dispersión de las medias con respecto a la media global.

Una vía significa que se cuenta con una variable única explicativa o predictora, también llamada variable independiente, la cual debe tener tres o más niveles o categorías.

Cuando se trata de un experimento que se refiere a la aplicación de n tratamientos a una muestra, es importante tomar en cuenta que la muestra debe seleccionarse al azar de la población en estudio, buscando siempre que los grupos sean homogéneos, con lo cual se evita que se introduzcan factores de variación distintos del que se desea controlar. Asimismo, la asignación de los tratamientos a cada grupo debe hacerse al azar. Adicionalmente, cada muestra debe ser independiente de las otras.

También deben cumplirse los criterios de normalidad, es decir, que la población tenga una distribución normal, y de homocedasticidad, es decir, que las poblaciones tengan igual varianza.

La hipótesis de que los tratamientos evaluados no producen efecto alguno, en términos estadísticos,  que las medias de todas las poblaciones son iguales, es lo que se contrasta mediante ANOVA de una vía, que compara la variabilidad entre grupos con la variabilidad dentro de los grupos.

Un detalle a veces olvidado, es que los grupos no deben incluir valores “pico”, o, valores atípicos. Es decir, valores muy alejados a la media +/- desviación estándar. De incluirlos podrían afectar el resultado del ANOVA disminuyendo la validez de los resultados.

Los paquetes estadísticos permiten identificar los valores atípicos, haciendo uso, por ejemplo, de gráficos de dispersión.

Es importante recordar que la prueba ANOVA no indica qué grupos específicos son los que presentan diferencia.

Luego de realizar el ANOVA, si los grupos presentan un comportamiento distinto, se podrá determinar entre qué grupos específicos existen diferencias estadísticamente significativas mediante pruebas de comparación múltiple.

En general, para emitir una conclusión, hay que basarse en el nivel de significación, usualmente 5% o 1%, es decir, 0,05 o 0,01; respectivamente.

Cuando el valor de p de la prueba ANOVA es inferior al nivel alfa de significación elegido se rechaza la hipótesis nula, es decir, se concluye que hay al menos dos grupos diferentes, o, en términos matemáticos, al menos dos de las medias grupales evaluadas son diferentes entre sí. En caso contrario se concluye que no existe diferencia estadísticamente significativa entre los grupos.