Guía para Realizar e Interpretar Tablas de Contingencia en SPSS

Introducción a las Tablas de Contingencia

Las tablas de contingencia, también conocidas como tablas cruzadas o crosstabs, son una técnica estadística fundamental y ampliamente utilizada en el análisis de datos. Su propósito principal es determinar si existe una relación entre dos variables categóricas y cómo se distribuyen los porcentajes entre ellas. Esta metodología es de gran utilidad en estudios de vulnerabilidad social, donde permite explorar y entender las interconexiones entre diversos factores sociodemográficos, como el nivel educativo, el género, el acceso a servicios básicos o la situación laboral.

En este tutorial, se mostrará cómo analizar estas tablas y, de manera práctica, cómo construirlas en el software SPSS para interpretar fácilmente sus resultados.

Condiciones para el Análisis de Tablas de Contingencia

Para aplicar las tablas de contingencia como estrategia de análisis de datos, se deben cumplir dos condiciones esenciales:

Tipos de Variables Aptas

Las variables a analizar deben ser nominales u ordinales. Las variables nominales son aquellas que no tienen un orden interno establecido (por ejemplo, género o estado civil), mientras que las variables ordinales son las que sí poseen un orden interno, aunque el paso de una categoría a otra no sea igual (por ejemplo, nivel educativo, interés en la política: alto-medio-bajo-ninguno).

Las tablas de contingencia no se utilizan para analizar relaciones de variables escalares con muchas categorías, como la edad, ya que la tabla resultante sería inmensa e ilegible. Si se desea usar una variable escalar como la edad en una tabla de contingencia, esta debe recodificarse por rangos, convirtiéndola así en una variable ordinal. Un ejemplo sería analizar el interés en la política según grupos de edad.

infografía sobre tipos de variables: nominales, ordinales y escalares con ejemplos claros

Número de Variables

En su forma básica, solo se pueden relacionar dos variables. Aunque es posible construir tablas de contingencia con tres o más variables, esto constituye un análisis más complejo que no se aborda en profundidad en este tutorial.

Formulación de la Hipótesis de Partida

Las tablas de contingencia se aplican para comprobar hipótesis donde se postula una relación entre dos variables. Por ejemplo, se podría querer analizar si la creencia en Dios explica el interés en la política. La hipótesis de partida sería que las personas creyentes en Dios tienen más interés en la política. En este caso, las dos variables a relacionar son "interés en la política" y "creencia en Dios".

Para este ejemplo práctico, se utilizará la Encuesta Mundial de Valores realizada en Alemania en 2013. La variable "interés en la política" se preguntó con cuatro categorías de respuesta (mucho, algo, poco, nada), y la variable "creencia en Dios" con dos categorías (sí, no). El software utilizado será SPSS.

Identificación de Variables: Independiente y Dependiente

Según el criterio o hipótesis inicial del investigador, es fundamental distinguir entre la variable dependiente (o a explicar) y la variable independiente (o explicativa). Esta distinción es importante porque la variable independiente se sitúa en las columnas de la tabla, y la variable dependiente en las filas.

En nuestro ejemplo, si se considera que la creencia en Dios explica el interés en la política, entonces la variable "creencia en Dios" será la variable independiente (o explicativa) y se colocará en las columnas. La variable "interés en la política" será la variable dependiente (o a explicar) y se situará en las filas. Esta decisión de ubicación depende enteramente de la hipótesis del investigador.

Construcción de Tablas de Contingencia en SPSS

A continuación, se detallan los pasos a seguir para realizar una tabla de contingencia en el software SPSS.

Preparación Previa: Tablas de Frecuencias

Antes de cruzar o relacionar las variables, es útil revisar las tablas de frecuencias de cada variable por separado. Para el ejemplo, los resultados muestran que el 41,6% de los encuestados en Alemania manifiestan estar "algo interesados" en la política, el 27,8% "poco interesados", el 20,8% "muy interesados" y solo un 9,8% "nada interesados". En cuanto a la creencia en Dios, la mayoría (65,1%) sí cree en Dios, mientras que el 34,9% no son creyentes.

Pasos Detallados en SPSS

  1. Primero, siga la ruta: Analizar > Estadísticos Descriptivos > Tablas de contingencia.
  2. captura de pantalla de SPSS mostrando el menú Analizar > Estadísticos Descriptivos > Tablas de contingencia
  3. En el cuadro de diálogo de Tablas de Contingencia, coloque la variable independiente ("creencia en Dios") en la sección de Columnas y la variable dependiente ("interés en la política") en la sección de Filas.
  4. captura de pantalla de SPSS con variables
  5. Posteriormente, diríjase al botón "Casillas" y active únicamente la opción de "Porcentajes por columnas" para que se calculen los porcentajes de forma adecuada.
  6. captura de pantalla de SPSS con la ventana de opciones de Casillas, mostrando
  7. Finalmente, pulse "Continuar" y luego "Aceptar" para generar la tabla de contingencia.

Cálculo de Porcentajes por Columnas

Al relacionar las dos variables, es de suma importancia que los porcentajes se calculen por columnas para una interpretación correcta. Aunque SPSS realiza estos cálculos automáticamente, es útil entender el proceso.

En cada celda de la tabla de contingencia, se muestra el total de casos que cumplen con las categorías donde se cruzan las variables. Por ejemplo, en una celda, el número de personas que manifestaron "sí ser creyentes en Dios" y además dijeron tener "mucho interés en la política" (en nuestro ejemplo, 283 personas).

Para calcular los porcentajes por columnas, se divide el número de casos de cada casilla por el total de casos de su respectiva columna, y se multiplica por 100 para expresarlo en porcentaje. Siguiendo el ejemplo:

  • Para creyentes con "mucho interés": (283 / 1286) * 100 = 22,0%.
  • Para no creyentes con "mucho interés": (122 / 691) * 100 = 17,7%.

Y así sucesivamente para todas las casillas de la tabla. Es fundamental presentar la tabla de contingencia con los porcentajes por columna calculados, ya que sin ellos, la lectura es incorrecta debido a que los números de casos absolutos pueden variar significativamente entre columnas.

ejemplo visual de tabla de contingencia con datos ficticios demostrando el cálculo de porcentajes por columna

Análisis e Interpretación de Tablas de Contingencia

Una vez que la tabla de contingencia se ha generado y está expresada en porcentajes por columnas, se procede a su lectura e interpretación. Las tablas de contingencia se leen fila por fila y de derecha a izquierda, centrándose en los porcentajes.

  • El proceso consiste en analizar si la distribución de porcentajes de la variable dependiente (en filas) se repite por igual en las categorías de la variable independiente (en columnas).
  • Si los porcentajes en una misma fila muestran grandes diferencias entre las categorías de la variable independiente, esto indica una relación más fuerte entre las variables.
  • Por el contrario, si los porcentajes en una misma fila son muy similares, sugiere que no hay relación o que esta es muy débil entre las variables.

Ejemplo de Interpretación Práctica

Siguiendo con el ejemplo de la "creencia en Dios" y el "interés en la política", la interpretación correcta de la tabla de contingencia sería la siguiente:

  • El 20,5% de los encuestados en Alemania están muy interesados en la política. Este porcentaje es mayor en las personas creyentes en Dios (22% de los que sí creen en Dios están muy interesados en la política) frente a los no creyentes (17,7% de los que no creen en Dios).
  • El 42,2% de los alemanes dijeron estar algo interesados (somewhat interested), siendo este porcentaje mayor en los no creyentes en Dios.
  • El 27,6% de las personas manifestaron estar poco interesadas en la política (not very interested), siendo este porcentaje casi igual para creyentes (27,7%) y no creyentes (27,5%).
  • Finalmente, el 9,7% de los encuestados afirmó no estar nada interesados en la política (not at all interested), siendo este porcentaje levemente mayor en los no creyentes en Dios (10,6% frente al 9,3% de los creyentes).

A partir de estos resultados, se puede concluir que la creencia en Dios sí explica el interés en la política, aunque la relación observada es débil. Las diferencias entre creyentes y no creyentes solo son medianamente considerables en la categoría de "muy interesados". En el resto de las categorías del interés en la política, las diferencias son pequeñas o inexistentes. Estos hallazgos sugieren que el interés por la política no depende fuertemente de cuestiones de fe religiosa, y que el debate religioso no ejerce una gran influencia sobre la movilización política. Futuros análisis podrían profundizar en otros aspectos, como el nivel educativo o el nivel de ingresos, para comprender mejor el interés en la política.

Para una cuantificación más robusta de si las variables están relacionadas y con qué fortaleza, existen estadísticos como el Chi-cuadrado y la V de Cramer, aunque su análisis se aborda en tutoriales más avanzados.

Puntos Clave a Recordar

  • La tabla de contingencia es una técnica de análisis bivariado que relaciona dos variables con el objetivo de averiguar si una explica a la otra.
  • Permite relacionar variables nominales y ordinales, pero no variables escalares (a menos que se recodifiquen por rangos).
  • Es crucial distinguir la variable dependiente (a explicar), que se coloca en las filas, de la variable independiente (explicativa), que se sitúa en las columnas.
  • Es indispensable calcular los porcentajes por columna para poder leer e interpretar correctamente la tabla de contingencia.
  • La lectura de la tabla se realiza fila por fila y de derecha a izquierda.
  • El objetivo principal de la interpretación es determinar si los porcentajes de la variable a explicar (filas) se diferencian mucho, poco o nada entre las categorías de la variable explicativa (columnas). Si hay altas diferencias de porcentajes, las dos variables están relacionadas; si no hay diferencias significativas, no existe relación.

tags: #spss #casen #vulnerabilidad #social #tabla #contingencia