Cómo hacer una prueba T en Excel

Tabla de contenido:

Cómo hacer una prueba T en Excel
Cómo hacer una prueba T en Excel
Anonim

Una prueba T es una forma de decidir si existen diferencias estadísticamente significativas entre conjuntos de datos, utilizando una distribución t de Student. La prueba T en Excel es una prueba T de dos muestras que compara las medias de dos muestras. Este artículo explica qué significa la significancia estadística y muestra cómo hacer una prueba T en Excel.

Las instrucciones de este artículo se aplican a Excel 2019, 2016, 2013, 2010, 2007; Excel para Microsoft 365 y Excel Online.

Image
Image

¿Qué es la significación estadística?

Imagina que quieres saber cuál de los dos dados te dará una mejor puntuación. Tiras el primer dado y obtienes un 2; lanzas el segundo dado y obtienes un 6.¿Te dice esto que el segundo dado suele dar puntuaciones más altas? Si respondió: "Por supuesto que no", entonces ya tiene cierta comprensión de la importancia estadística. Entiendes que la diferencia se debió al cambio aleatorio en la puntuación, cada vez que se lanza un dado. Debido a que la muestra era muy pequeña (solo un rollo), no mostró nada significativo.

Ahora imagina que lanzas cada dado 6 veces:

  • El primer dado tira 3, 6, 6, 4, 3, 3; Media=4.17
  • El segundo dado tira 5, 6, 2, 5, 2, 4; Media=4.00

¿Esto prueba ahora que el primer dado da puntuaciones más altas que el segundo? Probablemente no. Una muestra pequeña con una diferencia relativamente pequeña entre las medias hace probable que la diferencia todavía se deba a variaciones aleatorias. A medida que aumentamos el número de tiradas de dados, se vuelve difícil dar una respuesta de sentido común a la pregunta: ¿la diferencia entre las puntuaciones es el resultado de una variación aleatoria o es más probable que una dé puntuaciones más altas que la otra?

La importancia es la probabilidad de que una diferencia observada entre muestras se deba a variaciones aleatorias. La significación a menudo se denomina nivel alfa o simplemente 'α'. El nivel de confianza, o simplemente 'c', es la probabilidad de que la diferencia entre las muestras no se deba a una variación aleatoria; en otras palabras, que hay una diferencia entre las poblaciones subyacentes. Por tanto: c=1 – α

Podemos establecer 'α' en el nivel que queramos, para sentirnos seguros de que hemos demostrado su importancia. Muy a menudo se usa α=5% (95% de confianza), pero si queremos estar realmente seguros de que las diferencias no son causadas por una variación aleatoria, podemos aplicar un nivel de confianza más alto, usando α=1% o incluso α=0.1 %.

Se utilizan varias pruebas estadísticas para calcular la importancia en diferentes situaciones. Las pruebas T se usan para determinar si las medias de dos poblaciones son diferentes y las pruebas F se usan para determinar si las varianzas son diferentes.

¿Por qué probar la significación estadística?

Al comparar diferentes cosas, necesitamos usar pruebas de significancia para determinar si una es mejor que la otra. Esto se aplica a muchos campos, por ejemplo:

  • En los negocios, la gente necesita comparar diferentes productos y métodos de marketing.
  • En los deportes, la gente necesita comparar diferentes equipos, técnicas y competidores.
  • En ingeniería, las personas necesitan comparar diferentes diseños y configuraciones de parámetros.

Si desea probar si algo funciona mejor que otra cosa, en cualquier campo, necesita probar la significancia estadística.

¿Qué es la distribución T de Student?

La distribución t de Student es similar a una distribución normal (o gaussiana). Ambas son distribuciones en forma de campana con la mayoría de los resultados cerca de la media, pero algunos eventos raros están bastante lejos de la media en ambas direcciones, lo que se conoce como las colas de la distribución.

La forma exacta de la distribución t de Student depende del tamaño de la muestra. Para muestras de más de 30 es muy similar a la distribución normal. A medida que se reduce el tamaño de la muestra, las colas se hacen más grandes, lo que representa la mayor incertidumbre que surge al hacer inferencias basadas en una muestra pequeña.

Cómo hacer una prueba T en Excel

Antes de poder aplicar una prueba T para determinar si existe una diferencia estadísticamente significativa entre las medias de dos muestras, primero debe realizar una prueba F. Esto se debe a que se realizan diferentes cálculos para la prueba T dependiendo de si existe una diferencia significativa entre las varianzas.

Necesitará el complemento Analysis Toolpak habilitado para realizar este análisis.

Comprobación y carga del complemento Analysis Toolpak

Para verificar y activar el paquete de herramientas de análisis, siga estos pasos:

  1. Seleccione la pestaña ARCHIVO >seleccione Opciones.

  2. En el cuadro de diálogo Opciones, seleccione Complementos en las pestañas del lado izquierdo.
  3. En la parte inferior de la ventana, seleccione el menú desplegable Administrar, luego seleccione Complementos de Excel. Seleccionar Ir.

    Image
    Image
  4. Asegúrese de que la casilla de verificación junto a Analysis Toolpak esté marcada, luego seleccione OK.
  5. El paquete de herramientas de análisis ahora está activo y está listo para aplicar pruebas F y pruebas T.

Realización de una prueba F y una prueba T en Excel

  1. Ingrese dos conjuntos de datos en una hoja de cálculo. En este caso, estamos considerando las ventas de dos productos durante una semana. También se calcula el valor medio de las ventas diarias de cada producto, junto con su desviación estándar.

    Image
    Image
  2. Seleccione la pestaña Datos > Análisis de datos

    Image
    Image
  3. Seleccione F-Test Two-Sample for Variances de la lista, luego seleccione OK.

    Image
    Image

    La prueba F es muy sensible a la no normalidad. Por lo tanto, puede ser más seguro usar una prueba de Welch, pero esto es más difícil en Excel.

  4. Seleccione el rango de la variable 1 y el rango de la variable 2; configure el Alfa (0.05 da un 95% de confianza); seleccione una celda para la esquina superior izquierda de la salida, considerando que esto llenará 3 columnas y 10 filas. Seleccione OK.

    Image
    Image

    Para el Rango de la Variable 1, se debe seleccionar la muestra con la mayor desviación estándar (o varianza).

  5. Ver los resultados de la prueba F para determinar si existe una diferencia significativa entre las varianzas. Los resultados dan tres valores importantes:

    • F: La relación entre las varianzas.
    • P(F<=f) one-tail: La probabilidad de que la variable 1 en realidad no tenga una varianza mayor que la variable 2. Si es mayor que alfa, ¿cuál es generalmente 0.05, entonces no hay una diferencia significativa entre las varianzas.
    • F Crítica de una cola: El valor de F que sería necesario para dar P(F<=f)=α. Si este valor es mayor que F, esto también indica que no hay una diferencia significativa entre las varianzas.

    P(F<=f) también se puede calcular usando la función FDIST con F y los grados de libertad para cada muestra como sus entradas. Los grados de libertad son simplemente el número de observaciones en una muestra menos uno.

  6. Ahora que sabe si existe una diferencia entre las varianzas, puede seleccionar la prueba T apropiada. Seleccione la pestaña Datos > Análisis de datos, luego seleccione Prueba t: dos muestras suponiendo varianzas igualeso Prueba t: dos muestras suponiendo varianzas desiguales

    Image
    Image
  7. Independientemente de la opción que haya elegido en el paso anterior, se le presentará el mismo cuadro de diálogo para ingresar los detalles del análisis. Para comenzar, seleccione los rangos que contienen las muestras para Rango de variable 1 y Rango de variable 2.

    Image
    Image
  8. Suponiendo que desea comprobar que no hay diferencia entre las medias, establezca la Diferencia de medias hipotética en cero.
  9. Establezca el nivel de significación Alfa (0,05 da un 95 % de confianza) y seleccione una celda para la esquina superior izquierda de la salida, teniendo en cuenta que esto llenará 3 columnas y 14 filas. Seleccione OK.
  10. Revise los resultados para decidir si hay una diferencia significativa entre las medias.

    Al igual que con la prueba F, si el valor p, en este caso P(T<=t), es mayor que alfa, entonces no hay una diferencia significativa. Sin embargo, en este caso se dan dos valores de p, uno para una prueba de una cola y otro para una prueba de dos colas. En este caso, use el valor de las dos colas ya que cualquier variable que tenga una media mayor sería una diferencia significativa.

Recomendado: