Qué es ANOVA de un factor y cómo analizarla

ANOVA de un factor

ANOVA de un factor (también llamada ANOVA unifactorial o one-way ANOVA en inglés) es una técnica estadística que señala si dos variables (una independiente y otra dependiente) están relacionadas en base a si las medias de la variable dependiente son diferentes en las categorías o grupos de la variable independiente. Es decir, señala si las medias entre dos o más grupos son similares o diferentes.

como analizar ANOVA

ANOVA son las siglas de Analysis of Variance. Hay varios subtipos de ANOVA. Hoy nos centramos en ANOVA de un factor. Se le denomina ANOVA de un factor porque a la variable independiente se le conoce como factor. En el siguiente tutorial veremos:


1. ¿Cuándo usar ANOVA de un factor?

Usamos ANOVA de un factor cuando queremos saber si las medias de una variable son diferentes entre los niveles o grupos de otra variable. Por ejemplo, si comparamos el número de hijos entre los grupos o niveles de clase social: los que son clase baja, clase trabajadora, clase media-baja, clase media-alta y clase alta. Es decir, vamos a comprobar mediante ANOVA si la variable “número de hijos” está relacionada con la variable “clase social”. Concretamente, se analizará si la media del número de hijos varía según el nivel de clase social a la que pertenece la persona.

Condiciones:

  • En ANOVA de un factor solo se relacionan dos variables: una variable dependiente (o a explicar) y una variable independiente (que en esta técnica se suele llamar factor)
  • La variable dependiente es cuantitativa (escalar) y la variable independiente es categórica (nominal u ordinal).
  • Se pide que las variables sigan la distribución normal, aunque como siempre esto es difícil de cumplir en investigaciones sociales. 
  • También que las varianzas (es decir, las desviaciones típicas al cuadrado) de cada grupo de la variable independiente sean similiares (fenómeno que se conoce como homocedasticidad). Aunque esto es lo ideal, en la realidad cuesta de cumplir, e igualmente se puede aplicar ANOVA

2. ¿En qué se basa ANOVA de un factor? 

ANOVA de un factor compara las medias de la variable dependiente entre los grupos o categorías de la variable independiente. Por ejemplo, comparamos las medias de la variable “Número de hijos” según los grupos o categorías de la variable “Clase social”.

Si las medias de la variable dependiente son iguales en cada grupo o categoría de la variable independiente, los grupos no difieren en la variable dependiente, y por tanto no hay relación entre las variables. En cambio, y siguiendo con el ejemplo, si las medias del número de hijos son diferentes entre los niveles de la clase social es que las variables están relacionadas. 

3. ¿Qué estadísticos se calculan en ANOVA?

Al aplicar ANOVA de un factor se calcula un estadístico o test denominado F y su significación. El estadístico F o F-test (se llama F en honor al estadístico Ronald Fisher) se obtiene al estimar la variación de las medias entre los grupos de la variable independiente y dividirla por la estimación de la variación de las medias dentro de los grupos. El cálculo del estadístico F es algo complejo de entender, pero lo que hace es dividir la variación entre los grupos por la variación dentro de los grupos. Si las medias entre los grupos varían mucho y la media dentro de un grupo varía poco, es decir, los grupos son heterogéneos entre ellos y similares internamente, el valor de F será más alto, y por tanto, las variables estarán relacionadas. En conclusión, cuanto más difieren las medias de la variable dependiente entre los grupos de la variable independiente, más alto será el valor de F. Si hacemos varios análisis de ANOVA de un factor, aquel con F más alto indicará que hay más diferencias y por tanto una relación más fuerte entre las variables.

La significación de F se interpretará como la probabilidad de que este valor de F se deba al azar. Siguiendo un nivel de confianza del 95%, el más utilizado en ciencias sociales, cuando la significación de F sea menor de 0,05 es que las dos variables están relacionadas.

4. ¿Cómo se interpreta el test de F y la signifiación?

Hemos de analizar e interpretar al aplicar ANOVA de un factor:

  • Significación: si es menor de 0,05 es que las dos variables están relacionadas y por tanto que hay diferencias significativas entre los grupos
  • Valor de F: cuanto más alto sea F, más están relacionadas las variables, lo que significa que las medias de la variable dependiente difieren o varían mucho entre los grupos de la variable independiente.

5. Ejemplo de ANOVA de un factor

Quiero averiguar si el número de hijos varían según el nivel educativo. Para ello comparo las medias de números de hijos entre los diversos niveles educativos: sin estudios, primarios, secundarios y universitarios. Utilizaré los datos de la Encuesta Mundial de Valores realizada entre 2010 y 2014 en 58 países del mundo.

En SPSS realizaré una comparación de medias y ANOVA de un factor.

Análisis > Comparar medias > ANOVA de un factor

analisis de la varianza

Introduciré las dos variables que quiero analizar:

  • "Número de hijos" (How many children do you have): es una variable cuantitativa (escalar) que va de 0 hasta 8 o más hijos. Esta será la variable dependiente o a explicar
  • "Clase social" (Social class): variable ordinal. Es la variable independiente o factor. Las categorías o grupos de la clase social son: clase baja, clase trabajadora, clase media baja, clase media alta, y clase alta.

ANOVA one way

 

Para obtener la comparación de medias y las desviaciones típicas, nos dirigimos a Opciones y marcamos la opción de Descriptivos

anova de un factor spss

El resultado es el siguiente:

En la tercera columna se observan las medias para cada grupo de clase social. Si nos fijamos en las medias del número de hijos en cada grupo de clase social, podemos observar que a medida que aumenta la clase social desciende la media del número de hijos. Las personas de clase baja (lower class) tienen de media 2,18 hijos, las de clase trabajadora (working class) 1,88 hijos, las de clase media-baja (lower middle class) 1,78, las de clase media alta 1,70 hijos y las de clase alta (upper class) tienen de media 1,69 hijos.

spss anova

que-es-anova

El valor de F es 137,477 y la significación es 0,000. Al ser la significación menor de 0,05 es que las diferencias de media de hijos entre los grupos de la clase social son significativas. Aunque aparentemente podamos pensar que las diferencias no son exageradas, la decisión de si las diferencias son significativas no depende de nuestro criterio, sino de la significación de F. Este es el objetivo de aplicar ANOVA de un factor: valorar estadísticamente si las diferencias de medias son significativas o no.

Otro ejemplo:

Relacionamos la variable "Número de hijos" con la variable "¿Es una persona religiosa?". Se le preguntó a las personas si eran religiosos y se les dió 3 opciones de respuesta:

  1. soy es una persona religiosa (a religious person)
  2. no soy una persona religiosa (not a religious person)
  3. soy ateo (an atheist)

Comparamos la media de hijos por los grupos de la variable "¿Es un persona religiosa?". Nos fijamos en la columna de las media, y observamos que las personas religiosas (a religious person) tienen de media 2,02 hijos, los no religiosos (not a religious person) tienen de media 1,54 hijos y los ateos (atheist) 1,29 hijos de media.

anova unifactorialcomo-hacer-anova-spss

La significación de F es 0,000, al ser menor de 0,05 es que hay relación significativa entre las variables, y el valor de F es 777,078.

Podemos comparar el valor de F de este ejemplo con el del ejemplo anterior

  • "Número de hijos" según "Clase Social"  F = 134,477 
  • "Número de hijos" según "¿Es una persona religiosa?" F = 777,078

El valor de F es más grande en la relación de "Número de hijos" y "¿Es una persona religiosa? porque las diferencias de medias del número de hijos son más grandes que las diferencias de medias según la clase social. Cuanto más alto sea el valor de F, más diferencias de medias habrá y por tanto más fuerte es la relación entre las variables. 

6. Conclusión

ANOVA de un factor se utiliza muchísimo en las ciencias sociales. Es muy popular en psicología y en análisis comparativo para poder saber si las diferencias de un grupo respecto a otro son significativas y qué fortaleza tienen.  

A la hora de presentar ANOVA en un informe, artículo de investigación o tesis, se debe presentar la tabla de las medias y desviaciones típicas, y seguidamente el estadístico F y su significación.

Sin ANOVA de un factor, las diferencias entre un grupo y otro quedarían a juicio subjetivo del observador, y donde una persona ve diferencias otra quizás no las verías. Es mejor usar la estadística para saber si hay similitud o diferencia entre los grupos. ¡Larga vida a ANOVA!

Si te gustó este artículo, por favor, compártelo por Twitter, Facebook, Google+ o LinkedIn. Muchas gracias

Escrito por Julián Cárdenas

Acerca de Julian Cardenas

Soy profesor de técnicas de investigación social: análisis cuantitativo. Doctor en Sociología, ahora en FU Berlin. Casi todo lo que aprendí, fue haciendo contactos y redes, networkiando

Esta entrada fue publicada en ANOVA, desviación típica, estadística, spss, técnicas de investigación y etiquetada , , . Guarda el enlace permanente.