viernes, 14 de noviembre de 2014

CORRELACIÓN

CORRELACIÓN 

La correlación es la forma numérica en la que la estadística ha podido evaluar la relación de dos o más variables, es decir, mide la dependencia de una variable con respecto de otra variable independiente.


Para poder entender esta relación tendremos que analizarlo en forma gráfica:


Si tenemos los datos que se presentan en la tabla y consideramos que la edad determina el peso de las personas entonces podremos observar la siguiente gráfica:
REFERENCIA: Imagen estudio education.ti

Donde los puntos representan cada uno de los pares ordenados y la línea podría ser una recta que represente la tendencia de los datos, que en otras palabras podría decirse que se observa que a     mayor edad mayor peso.

La correlación se puede explicar con la pendiente de esa recta estimada y de esta forma nos podemos dar cuenta que también existe el caso en el que al crecer la variable independiente decrezca la variable dependiente. En aquellas rectas estimadas cuya pendiente sea cero entonces podremos decir que no existe correlación.

Así en estadística podremos calcular la correlación para datos no agrupados con la siguiente formula.

Supóngase que que deseamos obtener la correlación de los datos de la tabla anterior:
Ahora podemos observar que:

Se debe aclarar que el coeficiente de correlación sólo puede variar de la siguiente manera:   y que para entenderlo mejor se debe obtener el coeficiente de determinación que se obtiene con “ r “ cuadrada, ya que este representa el porcentaje que se explica “ y ” mediante los datos de “ x ”.

En nuestro ejemplo decimos que la correlación es casi perfecta, ya que, esta muy cerca de 1 y que el porcentaje de datos que explican a “ y “ es  (0.65638606)2= 0.430842 o sea el 43.08 %

En el caso de que fueran datos agrupados tendremos lo siguiente:

Primero tendremos que pensar que se genera una matriz, ya que, ahora estamos juntando dos tablas de distribución de frecuencias y por ello nuestros cálculos serán más laboriosos, por lo que les recomiendo el uso de una hoja de calculo o al menos una calculadora con regresión para datos agrupados.

De cualquier forma aquí tambien estamos evaluando numéricamente si existe relación entre dos variables y lo haremos con la siguiente ecuación.

En donde podemos encontrar k como el número de clases para la variable "y" y l para el número de clases de "x".
También podemos observar que hay varios tipos de "f" es decir, la que se encuentra sola (sin subíndice) que nos habla de las frecuencias celdares (cada una de las frecuencias que se encuentran en la intersección entre una columna y un renglón) y las "f" con subíndices que representan las frecuencias de cada una de las variables.

Para entender el uso de esta formula usaremos un ejemplo:
Los resultados que se presentan en la siguiente tabla representan los pesos y las estaturas de 48 alumnos entrevistados el "día anáhuac"

La sustitución de la fórmula es la siguiente:

Al interpretar nuestro resultado podemos concluir que si existe relación entre el peso y la estatura, es decir, que a mayor estatura mayor peso.

En muchas ocasiones el resultado de la correlación es negativo y lo que debemos pensar es que la relación de las variables involucradas en el calculo es inverso es decir que en la medida que crece la variable independiente la variable dependiente decrece:
REFERENCIA: Imagen estudio education.ti
REFERENCIA:

education.ti.com/sites/LATINOAMERICA/.../pdf/.../Correlacion.doc

COMPROBACIÓN DE HIPOTESIS

LABORATORIO
“COMPROBACIÓN DE HIPÓTESIS”

CASO:
El dueño de un café desea saber si la edad promedio de las personas que entran a su negocio es de 20 años, si es verdad se piensa realizar una remodelación de dicho café para hacerlo más juvenil.  Para hacer lo anterior se realiza un muestreo aleatorio de 40 personas, dando un promedio de las muestra de 22 años y una desviación estándar de 3.74 años.

PASO UNO:  Determinar la hipóetesis Nula "Ho" y Alternativa "Ha"
Ho: El promedio de las edades de los clientes es de 20 años 
Ha: El promedio de las edades de los clientes NO es de 20 años 

PASO DOS:  Determinar el nivel de significancia

Este nivel representa la probabilidad de rechazar una hipótesis nula verdades, matemáticamente se puede considerar cualquier valor entre cero y uno, pero parea estudios de pruebas de hipóteses normalmente está entre 0.05 y 0.1.  Este nivel está determinado por el analista y debe basarse en las carácterísticas del estudio y el riesgo que se considera aceptable de cometer el error tipo 1.  Nivel de significancia del estudio para el ejemplo :  alfa= 0.1


PASO TRES:  Calcular los intervalos que implican ese nivel de significancia

NIVEL DE CONFIANZA 90%
Z= 1.644854

Usar la distribución de probabilidad inversa del EXCEL
INTERVALO:   (-1.644854, 1.644854)

PASO CUATRO:  Calcular el "estadístico" de la prueba

DATOS:
 μ= 20 años  (promedio calculado por la hipótesis nula)
σ= 3.74 años (desviación estándar de la muestra)
n=40 personas (número de los elementos muestrados)

σ= 0.591346  (Desviación estándar tipificada)
z= 3.382115 (valor z tipificado)

 
 






PASO 5:  Determinar si el estadístico cae dentro de la región que hace la Hipótesis nula verdadera

El estadístico de prueba cae fuera del área de aceptación de H0.

PASO 6:  Aceptar o rechazar la hipótesis nula
Se rechaza la hipótesis nula y se acepta la alternativa




REFERENCIA:  Fuente: http://www.youtube.com/watch?v=TZlcEKlgo7Y

lunes, 3 de noviembre de 2014

HOJA DE TRABAJO PUNTEO Z


HOJA DE TRABAJO PUNTEO Z

1.       Hallar el area bajo la curva normal
a.       Entre Z=0 y Z=0.80    28.81%

REFERENCIA:  Realización propia efectos de tarea



b.      Entre Z=0 y Z=-1.30    40.32%
REFERENCIA:  Realización propia efectos de tarea



 




c.       Entre Z=1.00 y Z= - 2.30 =   34.13+48.93= 83.06%

REFERENCIA:  Realización propia efectos de tarea


 



d.      Entre Z=2.22 y Z=2.45      48.61-49.29=  0.68%





REFERENCIA:  Realización propia efectos de tarea






e.      Entre Z=-2 y Z=2 47.72+47.72= 95.44%

REFERENCIA:  Realización propia efectos de tarea


f.       Entre Z=1 y Z=2    34.12-47.72= 13.60%

REFERENCIA:  Realización propia efectos de tarea

g. A la derecha de z= -2.65  = 49.60+5.0= 99.60


REFERENCIA:  Realización propia efectos de tarea

h. A la derecha de Z=0.95 = 32.89 - 5.0= 17.11


REFERENCIA:  Realización propia efectos de tarea
i. A la izquierda de Z= 2.5 = 49.38 + 5.0= 99.38
REFERENCIA:  Realización propia efectos de tarea

j. A la derecha de Z=2.00 y a la izquierda de Z=-1.50
47.75+5.0= 02.25
43.32+5.0=06.68
02.25+06.68= 08.93
REFERENCIA:  Realización propia efectos de tarea