Odd ratio: qué es y cómo se interpreta

Odd, odd ratio... wtf?

Los odds y odd ratios son de esos conceptos estadísticos por los que la gente se asusta de la estadística y termina odiándola. Podríamos pasar olímpicamente de estos conceptos e ignorarlos, pero son imprescindibles para interpretar los resultados de las regresiones logísticas ya que están basados en la idea de probabilidad, y además se usan mucho en el mundo de las apuestas y las predicciones. Los odd y odd ratio son complejos de entender y explicar. Hasta hoy. En el siguiente artículo explico de forma detallada qué son, para qué sirven, por qué se usan en la regresión logística y cómo se interpretan. Empecemos paso por paso y con ejemplos claros y reales.

odd ratio interpretacion facil


1. La probabilidad de un fenómeno o evento

La probablidad es una medida que señala que tan posible es que ocurra un fenómeno o evento. La probabilidad de que ocurra un evento oscila entre 0 y 1. Cuanto más cerca de 0 menos probabilidad, y cuanto más cerca del 1 indica más probabilidad. Se puede expresar en porcentajes de 0 a 100%. Por ejemplo, hay elecciones en una ciudad de 1000 habitantes con derecho a voto y se presentan 3 partidos: el partido conservador, el partido liberal y el partido socialista. Tenemos datos de las últimas elecciones y al partido liberal lo votaron 350 personas de las 1000 con derecho a voto. Idealmente y sin tener en cuenta ningún factor o causa, la probabilidad de sí-votar al partido liberal es 350 dividido 1000 = 0,35. 

También existe la probabilidad de que no ocurra el evento. Simplemente es 1 menos la probabilidad. En nuestro ejemplo, la probabilidad de no-votar al partido liberal es 1 – 0,35 = 0,65

¿Cómo se interpretan las probabilidades?

Pues muy fácilmente, cuanto más cerca de 0 menos probabilidad y cuanto más cerca del 1 indica más probabilidad. Imaginemos que seleccionamos una persona de las 1000 con derecho a voto al azar. ¿Es más probable que haya votado al partido liberal o que no lo haya votado? Obviamente es más grande la probabilidad que no haya votado al partido liberal, ya que la probabilidad de no-votar al partido liberal es 0,65 frente al 0,35 de sí-votar al partido liberal. De las 1000 personas que pudieron votar, 650 no-votaron a los liberales y 350 sí los votaron. Por eso, si seleccionamos a alguien al azar y apostamos a si es liberal o no lo es, y queremos minimizar riesgos, apostaríamos por que no es liberal, ya que en la ciudad hay más no-liberales que liberales.

Vamos a complicar la cosa, pero no te asustes.

2. Qué es un odd

El odd es la probabilidad de que suceda un evento dividido por la probabilidad de que no suceda. No hay una traducción clara al español, así que usamos el término odd. Los odd oscilan entre 0 e infinito y se pueden calcular para la ocurrencia del evento como para la no ocurrencia del evento. Es decir,

El odd de sí-votar al partido liberal es 0,35 / 0,65 = 0,53

El odd de no-votar al partido liberal es 0,65 / 0,35 = 1,86

¿Cómo se interpretan los odds?

Sigamos con el ejemplo de seleccionar una persona al azar de las 1000 que tienen derecho a voto en las elecciones. Interpretando los odds, diremos que es 1,86 veces más probable que alguien no sea liberal a que lo sea. Los odds se interpretan como ratios, es decir, la cantidad de veces que algo pueda suceder sobre que no pueda suceder.

Los odds se usan mucho en el mundo de las apuestas. En las webs o casas de apuestas a los odds se les suele llamar cuotas. En la televisión o en internet a veces escuchamos que la victoria de un equipo de futbol, por ejemplo la del RCD Espanyol, se paga 4 a 1. Esto significa que si apostamos 1 euro por la victoria del RCD Espanyol y el equipo gana, recibiremos 4 euros. O si apostamos 5 euros por la victoria del RCD Espanyol y gana, nosotros recibiremos 20 euros (= 4 x 5 euros). Si apostamos en un partido entre el Real Madrid contra un equipo muy malo de segunda división, seguramente la victoria del Real Madrid se pagará 1,05 ya que es muy probable que el Real Madrid gane, así que si apostamos 5 euros por el Real Madrid y gana, recibimos 5,25 euros (= 1,05 x 5). Cuanto más probable es que suceda el evento, más bajo es el ratio de apuesta o cuota. Ese ratio de apuesta es el odd. Es la probabilidad de que sucede un evento (por ejemplo que gane un equipo de futbol) entre la probabilidad de que no suceda (es decir que pierda o empate el partido).

odd ratio probabilidad

Como te habrás dado cuenta los odds de que gane un equipo están determinados en base a una serie de variables: valor de la plantilla, victorias previas, clasificación en la tabla, etc. Es decir, se han relacionado variables independientes con una variable dependiente binaria (1-que gane el equipo, 0-que no gane). Los odds de un evento se calculan a partir de una conjunto de variables explicativas o predictoras.

Volviendo al ejemplo anterior de votar al partido liberal o no votarlo, la elección de a qué partido votamos puede estar influida por variables como la edad del votante, la ideología del votante y la creencia en Dios de los votantes. Esto quiere decir que si estas variables están relacionadas con el voto, al seleccionar una persona al azar en la población y preguntarle por quién cree que ganará las elecciones, cuál es su nivel de ingresos y su creencia en Dios será más probable que podamos predecir o deducir si es ha votado al partido liberal o no lo ha votado. Pero vamos por pasos. Hasta el momento, sabemos que el odd de un evento (votar al partido liberal) es la probabilidad de que ocurra dividido por la probabilidad de que no-ocurra. Pero cuando se relacionan variables, se pasan a calcular los odd ratios.

3. Qué es un odd ratio

El odd ratio es una medida de asociación entre dos variables (como la correlación bivariada) que indica la fortaleza de relación entre dos variables. El odd ratio se utiliza cuando estamos relacionando dos variables. Sigamos con el ejemplo anterior y con una situación de qué tan probable es votar al partido liberal. Pero ahora vamos a calcular qué tan probable es votar al partido liberal teniendo en cuenta si las personas creen en Dios o no. Relacionamos las dos variables para comprobar si hay relación, la fortaleza y la dirección de la asociación. El odd ratio de estas dos variables es el odd de sí-votar al partido liberal cuando crees en Dios dividido por el odd de sí-votar al partido liberal cuando no crees en Dios. Veamos el ejemplos paso por paso:

a) Relacionamos las dos variables (votar al partido liberal y creer en Dios) para comprobar si hay relación, la fortaleza y la dirección de la asociación.

  • Variable 1: votar al partido liberal (1-Sí vota liberal, 0-no vota al partido liberal)
  • Variable 2: creer en Dios (1-Sí cree en Dios, 0-No cree en Dios).

b) Estos son los resultados de relacionar a las dos variables en valores absolutos

odd-ratio-significado

c) El siguiente paso es calcular el odd ratio. El odd ratio de estas dos variables es el odd de sí-votar al partido liberal cuando crees en Dios dividido por el odd de sí-votar al partido liberal cuando no crees en Dios.

Para los que sí creen en Dios:

  • La probabilidad de sí-votar al partido liberal y creer en Dios es 100 / 400 = 0,25
  • La probabilidad de no-votar al partido liberal y creer en Dios es 300 / 400 = 0,75

El odd de sí-votar al partido liberal para los creyentes en Dios es 0,25 / 0,75 = 0,33

Para los que no creen en Dios:

  • La probabilidad de sí-votar al partido liberal y no creer en Dios es 250 / 600 = 0,42
  • La probabilidad de no-votar al partido liberal y no cree en Dios es 350 / 600 = 0,58

El odd de sí-votar al partido liberal para los no-creyentes en Dios es 0,42 / 0,58 = 0,72

El cálculo del odd ratio

Por tanto, el odd ratio entre votar a los liberales y creer en Dios es 0,33 / 0,72 = 0,46

El odd ratio también se podría haber calculado así:

Odd ratio = (100 x 350) / (250 x 300) = 35000 / 75000 = 0,46

¿Cómo se interpretan los odd ratio?

Recordemos que el odd ratio es una medida de asociación entre variables.

  • Los odd ratio oscilan entre 0 e infinito.
  • Cuando el odd ratio es 1 indica ausencia de asociación entre las variables.
  • Los valores menores de 1 señalan una asociación negativa entre las variables y los valores mayores de 1 indican asociación positiva entre las variables.
  • Cuanto más se aleje el odd ratio de 1, más fuerte es la relación.
  • En nuestro ejemplo, el odd ratio es menos de 1 (odd ratio de sí-votar al partido liberal y creer en Dios = 0,46), y se interpreta diciendo que los sí creen en Dios tienen menos probabilidad de votar al partido liberal. O también podemos decir que los que no creen en Dios tienen más probabilidad de votar al partido liberal.
  • Cuando el odd ratio es menor de 1 es conveniente calcular la inversa, es decir, 1 / 0,46 = 2,17. De esta manera podemos expresar mejor la fortaleza de la relación. Recordemos que cuanto más alejado de 1, más fuerte es la asociación entre las maneras. Así, para una persona que no cree en Dios los odds de votar al partido liberal son 2,17 veces más grandes que los odds de una persona que sí cree en Dios de votar liberal. Ufff, parece difícil entenderlo y seguramente has tenido que releerlo. Míralo de esta manera: si seleccionamos una persona al azar en la ciudad de 1000 personas con derecho a voto y queremos saber qué tan probable es que haya votado al partido liberal y nos dice que NO cree en Dios, podemos “apostar” con menos riesgo que es más probable que sí haya votado al partido liberal, ya que los odds de los no creyentes en Dios de votar liberal (la probabilidad de que haya votado al partido liberal entre la probabilidad que no haya votado liberal) es 2,17 veces más alta que los odds de que un creyente en Dios y sí haya votado liberal. Por tanto, hay una asociación negativa entre creer en Dios y sí-votar al partido liberal. 
  • Los odd ratios son usados en modelos de regresión logística para comparar la influencia de las variables independientes sobre la variable dependiente. Al realizar regresiones logísticas, los odd ratios se denominan exponencial de b y se expresan así: Exp(b). Veámoslo en el siguiente apartado.

4. Odd ratios y regresión logística

Los modelos de regresión logística (tanto binaria como multinomial) están basadas en probabilidades, y concretamente en logaritmos. (Qué es una regresión logística y cómo interpretarla) Para saber si las variables independientes están relacionadas con la variable dependiente se calculan primero los coeficientes b que son los logit. Otra manera de expresar los logit o coeficientes b es mediante los odd ratios, y para ello se eleva al número exponencial “e” (que es 2,71) a a los logit o coeficiente b. Por ejemplo, si un coeficiente b es 0,5, para calcular el exponencial de b, se debería hacer calcular el número e elevado a 0,5, es decir, 2,71 elevado a 0,5. ¿Por qué se hace esta transformación? ¿Por qué se pasa de los coeficientes b a los exponenciales de b u odd ratios?

La regresión logística recurre a los odd ratios porque son medidas estandarizadas que permiten comparar el nivel de influencia o fortaleza de las variables independientes sobre la variable dependiente. Las variables independientes están en diferentes escalas (algunas en años, otras en una escala de 1 a 10, otras en dólares), y además están expresadas en logaritmos, y se necesita estandarizar las escalas. La manera de estandarizar y así poder comparar las variables independientes es a través de los odd ratios, aquí denominados exponenciales de b (su abreviatura es exp(b)). Veamos un ejemplo que clarifica todo esto que suena complicado:

Ejemplo de regresión logística binaria para interpretar los odd ratios:

A) El modelo explicativo a probar es el siguiente:

La variable dependiente es

  • Votar al partido liberal: 1-Sí votar al partido liberal, 0-No votar al partido liberal

Y las variables independientes o predictoras son:

  • Creer en Dios: 1-Sí cree en Dios, 0-No cree en Dios
  • Edad
  • Ideología: 1-Extrema izquierda.... 10-Extrema derecha

B) Los resultados, tras realizar el proceso en SPSS, son:

odd-ratio-definicion

Cómo interpreto los resultados:

  • Los exponenciales de b (Exp(b)) son odd ratios y pueden comparase entre sí para saber qué variable tienen más influencia o está asociada de manera más fuerte
  • Cuando el Exp(b) es mayor de 1 señala que un aumento de la variable independiente, aumenta los odds que ocurra el evento (es decir, la variable dependiente). Cuando el exp(b) es menor de 1 indica que un aumento de la variable independiente, reduce los odds que ocurra el evento (variable dependiente). Siguiendo nuestro ejemplo diríamos: un aumento del nivel de ingresos aumentaría los odds de que sí-se vote al partido liberal. En cambio, ser creyente en Dios reduce los odds que sí-se vote al partido liberal.
  • Cuanto más se aleja de 1, más fuerte es la relación entre las dos variables.
  • Pero OJO, cuando el odd ratio (o Exp(b)) es menor de 1 es conveniente calcular su inversa para no equivocarnos y poder comparar todos los exp(b). En nuestro ejemplo, la creencia en Dios tiene un Exp(b) = 0,577. Para comparar este Exp(b) con el resto, calcula la inversa (1 / 0,577 = 1,73 ). Ahora sí puedo comparar el Exp(b) de Creer en Dios con el resto de Exp(b) que son mayores de 1. El Exp(b) más alto indica la relación entre las variables es más fuerte, es decir, que la variable independiente es más explicativa.
  • Los Exp(b) que son odd ratios se deben leer o expresar académicamente de la siguiente manera si estamos escribiendo un artículo científico o tesis: el aumento de una unidad de nivel de ingresos y si el resto de variables se mantuvieran constantes, aumentaría los odds de votar al partido liberal en 1,508 veces más que si no se aumentara esa unidad del nivel de ingresos. Otro ejemplo, si se aumenta la edad en una unidad y todos los valores de las otras variables del modelo permanecen constantes, los odds de votar al partido liberal (probabilidad de sí-votar liberal sobre probabilidad de no-votar liberal) aumentan 1,01 veces más que los odds de si no aumentara el nivel educativo. Finalmente, los que no creen en Dios tienen más odds de votar al partido liberal en 1,73 que los que sí creen en Dios.
  • Si estás presentando los resultados a un público que no es académico o que no tiene ni idea de estadística ni de números, lo mejor es decir: lo que más explica la probabilidad de votar a los liberales es la creen en Dios. Las personas con más sí creen Dios tienen menos posibilidades de votar al partido liberal. Si aumentamos el nivel de ingresos de la población aumentará la probabilidad de que la gente vote al partido liberal. También a más edad, más posibilidades de victoria del partido liberal. Por tanto, el perfil de las personas que votan al partido liberal son no creyentes en Dios, con nivel de ingresos altos, y edades adultas.

En próximos artículos, contaré cómo hacer predicciones de probabilidad a partir de modelos de regresión logística.

5. Conclusiones

Siempre digo lo mismo a mis estudiantes. Hemos de ser capaces de usar la estadística para entender el mundo y comunicar nuestros resultados al público. Usar la estadística para la investigación, y sacar la investigación fuera de la academia. Para ello debemos volver al origen de toda esta lección, que son las probabilidades. A pesar que ahora ya sepamos que son odds, odd ratios y regresiones logísticas, hemos de comprender que todo se basa en la idea de que algo suceda teniendo en cuenta diversas causas.odd ratio calculo

En la vida “normal” se utilizan los odds sobre todo en el mundo de las apuestas ya que toda predicción futura de la realidad se basa en términos de que tan probable es que algo suceda y que tan probable es que no-suceda.

Si te gustó o sirvió este artículo, por favor, compártelo por Facebook, Twitter, Google+ o LinkedIn. Muchas gracias. Hasta pronto

Escrito por Julián Cárdenas

Acerca de Julian Cardenas

Soy profesor de técnicas de investigación social: análisis cuantitativo. Doctor en Sociología, ahora en FU Berlin. Casi todo lo que aprendí, fue haciendo contactos y redes, networkiando

Esta entrada fue publicada en estadística, odd ratio, regresion logistica binaria y etiquetada , . Guarda el enlace permanente.