Para
realizar una investigación es necesario definir las variables que van a ser
observadas y analizadas y a partir de esa definición se establecen los datos a
ser recolectados. A dichos datos se aplicarán las diferentes herramientas y
métodos estadísticos, con el fin de obtener los resultados necesarios para
establecer las conclusiones del caso.
En
términos sencillos las variables son características o cualidades de una
población susceptibles a tomar diferentes valores medibles de una unidad a otra
y que pueden ser objeto de análisis.
La
estadística busca estudiar, describir y explicar las variables. Así pues en un
análisis estadísticos las variables vienen a ser el principal insumo,
susceptible a ser analizado a través de las herramientas disponibles. Adicionalmente
para las variables que tiene asociada una ley determinada de probabilidad, a cada
valor le corresponde una probabilidad específica.
Una
variable cualitativa (o categóricas) no se expresan aparecen en forma numérica,
sino como categorías o atributos y se expresan en palabras. Por ejemplo: sexo,
procedencia.
Una
variable aleatoria o variable estocástica es una variable estadística cuyos
valores se obtienen de mediciones en experimento aleatorio. Viene a ser una
función que asigna un valor numérico a cada resultado en el espacio muestral de
un experimento.
El
rango de una variable aleatoria es el conjunto de valores que puede tomar.
Las
variables aleatorias son cuantitativas, es decir, se expresan numéricamente, y se
clasifican en:
Variables
Aleatorias Discretas: variable que toman valores aislados, es decir, expresados
en números naturales, o en un espacio finito, y no pueden tomar valores
intermedios entre dos consecutivos fijados. Por ejemplo: nro. de hijos,
cantidad de partos.
Variables
Aleatorias Continuas: variables que toman valores infinitos, es decir,
expresados en números reales, en un intervalo dado, de forma que, teóricamente,
pueden tomar cualquier valor intermedio en su rango de variación. Por ejemplo:
peso, presión arterial.
La
distribución de probabilidad de una variable aleatoria, o función de
distribución, describe teóricamente la forma en que varían los resultados de un
experimento aleatorio.
Para
una variable X, la distribución de probabilidad es la función:
Fx(X)
Esta
función asigna a cada evento definido sobre X una probabilidad que viene dada
por la siguiente expresión:
Fx(X) = P(x ≤ X)
Estas
probabilidades pueden ser estimadas o modeladas.
Es
frecuentemente útil representar gráficamente la distribución de probabilidades
por un histograma.
Distribución
Conjunta de Dos Variables:
Si
se necesita analizar conjuntamente dos variables aleatorias dadas X e Y se debe
establecer una relación que una los valores de una variable con los valores de
la otra.
Toda
relación puede ser estudiada, aún cuando en la práctica, sólo se utilicen aquellas
que tengan una relación considerada lógica.
Entonces
para variables discretas, se puede establecer una función de probabilidad para
las posibles parejas de valores de ambas variables.
A esta función se le llama
función de probabilidad conjunta:
F(x,y)
Una
función de probabilidad conjunta de las variables X e Y es una función de las
dos variables tal que, al sustituir la "x" por un valor de la
variable X y la "y" por un valor de la variable Y, el valor de la
función nos da la probabilidad de que X e Y tomen simultáneamente la pareja de
valores citados.
P[(X = x)∩(Y = y)] = f(x,y)
Lea más en:
http://bit.ly/1raUGbt
http://bit.ly/1raUBVq
http://bit.ly/Z2rpp6
http://bit.ly/1rqsJwU