Aldanálisis: febrero 2014

domingo, 16 de febrero de 2014

Distribución y Tablas de Frecuencia.

En estadística, se le llama distribución de frecuencias a una ordenación tabulada de los datos recopilados en categorías mutuamente excluyentes que indican el número, de acuerdo a la clase o intervalo a que pertenece y con el número de veces o frecuencias que se repite cada observación en cada categoría. Esto proporciona un valor añadido a la agrupación de datos.

En resumen, la distribución de frecuencias presenta las observaciones clasificadas de modo que se pueda ver el número existente en cada clase. Estas agrupaciones de datos suelen estar agrupadas en forma de tablas y gráficos.

1 - Frecuencia absoluta: La frecuencia absoluta de una variable estadística, es el número de veces que aparece en la muestra dicho valor de la variable, la representaremos por f_i.

2- Frecuencia relativa: Es una medida útil para poder comparar. La frecuencia relativa es el cociente entre la frecuencia absoluta y el tamaño de la muestra. Generalmente se expresa en porcentaje. Se denota por f_r.

Donde f_ies la frecuencia absoluta, y n = es el tamaño de la muestra.

3 - Frecuencia absoluta acumulada: Para poder calcularla la variable estadística ha de ser cuantitativa. La frecuencia absoluta acumulada de un valor de la variable, es el número de veces que ha aparecido en la muestra un valor menor o igual que el de la variable y lo representaremos por F_i.

4 - Frecuencia relativa acumulada: Al igual que en el caso anterior la frecuencia relativa acumulada es la frecuencia absoluta acumulada dividido por el tamaño de la muestra, y la denotaremos por F_r.

Donde f_ies la frecuencia absoluta acumulada, y n = es el tamaño de la muestra.

Sigamos un mismo ejemplo para representar todas las frecuencias.

Supongamos 10 profesores cuántos alumnos tienen en sus respectivas secciones.

1- Primero se ordenan los datos de menor a mayor.

2- Se determina la amplitud que tendrá cada rango de clase. Estos rangos deben ser del mismo tamaño. Incluso pueden ser individuales, si se prestara, la pregunta para ello.

3- Se determina y forma el número de clases. No es recomendable tener 2 ó 3, como tampoco lo es tener una cantidad exorbitante.

4- Se determina la amplitud (X_min (máximo valor) y X_max (máximo valor)) que se denota con la letra C.

5- Se calcula la marca de clase, que es la diferencia entre el límite superior y el límite inferior entre 2 y se denota con X_i.

Comencemos el ejemplo:

Tenemos la tabla con los valores originales. Aplicando los pasos descritos, la Tabla de Frecuencia quedaría, con 6 Intervalos con una amplitud de 4, y resultaría como sigue:

Para el próximo Post espero continuar con el tema y hablar de la Representación Gráfica de las Frecuencias: Polígonos de Frecuencia, Ojivas e Histogramas.

miércoles, 12 de febrero de 2014

Índice de Concordancia de Kappa (k)

El coeficiente o índice kappa (k) se basa en comparar la concordancia observada en un conjunto de datos, respecto a la que podría ocurrir por mero azar, y puede ser calculado en tablas de cualquier dimensión, siempre y cuando se contrasten dos observadores.

La máxima concordancia posible corresponde a κ = 1. El valor κ = 0 se obtiene cuando la concordancia observada es precisamente la que se espera a causa exclusivamente del azar.

El coeficiente kappa se construye en base a un cociente, el cual incluye en su numerador la diferencia entre la sumatoria de las concordancias observadas y la sumatoria de las concordancias atribuibles al azar, mientras que sudenominador incluye la diferencia entre el total de observaciones y la sumatoria de las concordancias atribuibles al azar. La fórmula vendría a ser:

El coeficiente kappa fue propuesto originalmente por Cohen (1960) para el caso de dos evaluadores o dos métodos, por lo que a menudo se le conoce como kappa de Cohen. El caso más sencillo se presenta cuando la variable cualitativa es dicotómica (dos posibilidades) y se está comparando dos métodos de clasificación (por ejemplo dos escalas clínicas). Esta situación se puede representar en una tabla de frecuencias.

Posteriormente fue generalizado para el caso de más de dos evaluadores por Fleiss, por lo que a veces también se habla del índice kappa de Fleiss. Landis y Koch también propusieron unos márgenes para valorar el grado de acuerdo en función del índice kappa.

El índice kappa (k) se usa para evaluar la concordancia o reproducibilidad de instrumentos de medida cuyo resultado es categórico.
Representa la proporción de acuerdos observados más allá del azar respecto del máximo acuerdo posible más allá del azar.
En la interpretación del índice kappa (k) hay que tener en cuenta que el índice depende del acuerdo observado, pero también de la prevalencia del carácter estudiado y de la simetría de los totales marginales.

Desde la propuesta inicial de Cohen el índice k ha sido progresivamente generalizado a clasificaciones multinomiales (con más de dos categorías), ordinales, a más de dos observadores, a diseños incompletos y a todas estas situaciones combinadas, generalizaciones que suponen una mayor complejidad en el cálculo pero que mantienen la misma interpretación.

--------------------------------

Agradecimientos a las siguientes fuentes:

Medidas de concordancia: el índice de Kappa. López de Ullibarri Galparsoro I, Pita Fernández, S.España.

Evaluación de la concordancia inter-observador eninvestigación pediátrica: Coeficiente de Kappa. Jaime Cerda L., Luis Villarroel del P. Chile

Medidas de concordancia para variables cualitativas. Luis M. Molinero. España.

El índice kappa. V. Abraira. Unidad de Bioestadística Clínica. Hospital Ramón y Cajal. Madrid. España.