Análisis Estadísticos para Ensayos Clínicos y Estudios Epidemiológicos. Asesoría estadística para investigación, en general, incluyendo Tesis. Asesoría Metodológica. Diseño de Posters para Congresos y Eventos Científicos.

sábado, 5 de noviembre de 2011

Análisis de Correlación



Durante los años que llevo trabajando en estadística, en muchos casos he enfrentado el problema de investigadores que desean saber si una variable tiene un efecto importante en la variación de otra, pero no están seguros de cómo plantearlo, mucho menos de como procesarlo.


Hablemos de correlación.

En este caso, estaremos hablando de tratar de encontrar relación entre dos o más variables. 

Enfoquémonos hoy en la correlación lineal entre dos variables. Existen varios índice de correlación cononocidos en general por los grandes investigadores que dieron origen a dichos métodos estadísticos.

El coeficiente Pearson es un índice (r) que mide la magnitud de la relación lineal entre 2 variables cuantitativas, así como el sentido, positivo o negativo, de dicha relación. Indica en qué grado 2 variables X e Y fluctúan simultáneamente, es decir cuánto aumenta X al aumentar Y (correlación positiva), o cuánto aumenta X al disminuir Y (correlación negativa). 

Estamos hablando acá de variables cuantitativas.

Por ejemplo, algo sencillo de comprender es que existe una correlación positiva entre la estatura de escolares y su peso. Estoy acá hablando de escolares promedio, donde no hay problemas extremos de obesidad, ni de desnutrición. Simplemete, mientras los niños crecen, el peso aumentará. La talla y el peso son dos variables cuantitativas con correlación positiva.

Cabe decir que del análisis de correlación de Paerson, el valor de r puede ir de -1 a 1, donde la correlación será más fuerte mientras más cercano sea el valor del coeficiente a la unidad. El símbolo positivo o negativo nos dará el sentido de la correlación.

Los coeficientes cercanos a 0 indican que no hay correlación entre las variables.

Es importante destacar que el coeficiente r de Pearson mide correlación lineal. Súpongamos que la correlación entre dos variables es curvilínea, digamos parabólica, aún cuano la correlación fuera alta el valor obtenido del coeficiente r de Pearson sería bajo.

De allí la importancia de saber qué método utilizar para cada caso, y qué variables permiten la aplicación de dichos métodos.

En posteriores entradas seguiremos hablando un poco de otros índices de correlación.

7 comentarios:

Rosalba dijo...

Hola. No entiendo bien la correlación. Cuando hay correlación las dos variables suben igual????

Carlos Alberto dijo...

Hola.
¿El coeficiente r es el mismo coefeiciente r2 (r al cuadrado)? Es que una compañera que terminó el año antepasado me dijo que en mi trabajo aplicara correlación y trabajara con el r2. Que eso fue lo que le hicieron a ella (de hecho creo que fue Ud.) y como los trabajos se parecen....
Le agradecería me sacara de la duda.
Gracias!

Carolina dijo...

Buenas tardes.
He oído de la regresión lineal también. ¿Es lo mismo? ¿Va a publicar luego sobre eso?
Gracias.

Aldanalisis dijo...

Hola Rosalba. No es exactamente que suban igual, puede ser que una aumente menos que la otra, pero cada vez que una aumenta, la otra también, y al aplicar el análisis se demuestra que están correlacionadas.
Lo mismo es válido cuando las variables disminuyen juntas.
Espero que te sea de ayuda.
Saludos!

Aldanalisis dijo...

Hola Carlos Alberto.

El Coeficiente de Correlación r es una cosa y el coeficiente de determinación r2 es otra. El r cuadrado muestra el porcentaje de la variabilidad de los datos que se explica por la asociación entre las dos variables.
Es una medida habitual en el análisis de regresión.
El r cuadrado ajustado tiene en cuenta el tamaño del conjunto de datos, y su valor siempre será un poco menor que el coeficiente de correlación r.

Espero haberte aclarado las dudas.

Saludos!

Aldanalisis dijo...

Hola Carolina:

La regresión lineal no es exactamente lo mismo.
Luego escribiré sobre eso.

Saludos!!!

Aldanalisis dijo...

Hola Carolina:

Ya escribí sobre la Regresión LineaL.

Saludos!