Uno de los aspectos más relevantes de la Estadística es el análisis de la
relación o dependencia entre variables.
Muchos estudios se basan en la creencia de que es posible identificar y
cuantificar alguna Relación Funcional entre dos o más variables, donde una
variable depende de la otra variable.
En el Modelo de Regresión es muy importante identificar cuál es la variable
dependiente y cuál es la variable independiente.
En el Modelo de Regresión Simple se establece que Y es una función de sólo
una variable independiente.
Para poder crear un modelo de regresión lineal es necesario que se cumpla
con los siguientes supuestos:
- Que la relación entre las variables sea lineal.
- Que los errores en la medición de las variables explicativas sean independientes entre sí.
- Que los errores tengan varianza constante. (Homocedasticidad)
- Que los errores tengan una esperanza matemática igual a cero (los errores de una misma magnitud y distinto signo son equiprobables).
- Que el error total sea la suma de todos los errores.
En la Regresión Lineal Simple sólo se maneja una variable independiente,
por lo que sólo cuenta con dos parámetros.
En el estudio de la relación funcional entre dos variables poblacionales,
una variable X, llamada
independiente, explicativa o de predicción y una variable Y, llamada dependiente o variable respuesta, presenta la siguiente
notación:
Y = a + b X + e
Donde:
a es el valor de la ordenada donde la línea de regresión
se intercepta con el eje Y.
b es el coeficiente de regresión poblacional (pendiente de
la línea recta)
e es el error
En esta expresión estamos admitiendo que todos los factores o causas que influyen
en la variable respuesta Y pueden
dividirse en dos grupos: el primero contiene a una variable explicativa X y el segundo incluye un conjunto
amplio de factores no controlados que englobaremos bajo el nombre de
perturbación o error aleatorio, e,
que provoca que la dependencia entre las variables dependiente e independiente
no sea perfecta, sino que esté sujeta a incertidumbre.
Una forma de determinar si puede existir o no dependencia entre variables,
y en caso de haberla deducir de qué tipo puede ser, es gráficamente
representando los pares de valores observados. A dicho gráfico se le llama diagrama
de dispersión.
Si la relación lineal de dependencia entre Y y X fuera exacta, las
observaciones se situarían a lo largo de una recta.
En a) hay ausencia de relación (independencia).
En b) existe asociación lineal positiva (varían en general en el mismo
sentido).
En c) existe asociación lineal negativa (varían en sentido contrario).
En d) existe fuerte asociación, pero no lineal.
3 comentarios:
Hola.
Hago actualmente una investigación para determinar la relación entre la obesidad y una falla cardiaca específica.
Pero no estoy seguro si es una correlación o una regresión.
¿Me asesora?
Gracias.
Hola.
¿Es como la correlación?
¿Y si tengo 2 variables y no una sola?
Gracias.
Hola "Unknown". Puedes enviarme un correo a aldanalisis@gmail.com y con gusto te asesoraré.
Hola Dra. María. Se parece a la correlación, toda vez que se está evaluando la posibilidad de que el comportamiento de una o más variables independientes afecten a una variable dependiente.
Si tienes dos o más variables independientes, normalmente no se usaría correlación como tal.
A la orden.
¡Saludos!
Publicar un comentario