Medidas compuestas

Construir medidas que nos permitan capturar determinados conceptos en el mundo real es un proceso complicado. Los conceptos acostumbran a tener diferentes formas de entenderlos, de interpretarlos y, por lo tanto, de ser medidos. Para capturar un concepto solemos pensar normalmente en determinadas situaciones en las que el concepto está presente. Pongámonos a pensar: ¿Cuándo hay democracia? Podríamos hacer una lista de todas las situaciones que pensamos que nos permiten identificar una democracia: cuando haya elecciones periódicamente, cuando toda la población tenga derecho a voto, cuando estas libertades estén protegidas, etc. Por lo tanto, podemos establecer una serie de indicadores que nos permitan identificar la presencia o ausencia del concepto que estamos buscando (Babbie, 2013: 169). Este proceso se denomina crear una medida compuesta: una combinación matemática de indicadores que no comparten necesariamente una unidad de medida común ni tampoco un procedimiento obvio para ponderarlos (OECD, 2008; Saisana & Tarantola, 2002). Hoy en día es muy frecuente encontrarnos estas medidas en la red. En este apartado aprenderemos a crearlas y a detectar sus puntos fuertes y puntos débiles.

En este módulo descubriremos que no hay una manera obvia de agrupar estas variables en una medida única. Un ejemplo bastante ilustrativo es la nota final de cualquier asignatura. La intención de todo profesor es que la nota refleje un concepto parecido al «aprovechamiento de la asignatura» o los «conocimientos y habilidades adquiridos» por parte del estudiante. Con esta idea, durante el curso se establecen varias pruebas que indicarán cómo de bien el estudiante está logrando los objetivos establecidos. En cada prueba recogemos información y elaboramos cada uno de los indicadores que configurarán la nota final. Estos indicadores son formas numéricas u ordinales –expresadas en escala de 0 a 10, en porcentajes, en escala de 0 a 4, en escala alfabética, etc.– que tendrán un valor próximo a su máximo si el estudiante cumple los objetivos y un valor próximo al mínimo si el estudiante no los cumple. Al final de curso tenemos que encontrar una fórmula que intente resumir lo mejor posible este «aprovechamiento de la asignatura». Para este motivo tendremos que decidir qué valor damos a cada prueba y cómo agregamos las pruebas para configurar la nota final.

El módulo se centra en las técnicas cuantitativas y del análisis comparado que combinan la información de diferentes indicadores en una única medida que representa una dimensión más general de un determinado concepto. Estas medidas permiten comparar y ordenar las observaciones (Babbie, 2013).

Veamos un pequeño ejemplo que ilustra de una manera muy general tres técnicas diferentes de combinar información. En la Tabla 1 hemos creado un marco de datos denominado measures, donde vemos diferentes medidas compuestas que nos permiten responder a la pregunta: ¿cómo de desarrollado está un país? Para simplificar el ejemplo, hemos escogido dos indicadores: el producto interior bruto (PIB) per cápita (pib), que representa el desarrollo económico, y la media de años de escolarización (edu), que representa el desarrollo educativo. Cada indicador solo puede tomar el valor 1 si hay presencia del fenómeno (niveles altos) y valor 0 si hay ausencia (niveles bajos). Tenemos que pensar como si hubiera un umbral a partir del que podemos considerar que hay presencia del concepto: por ejemplo, cuando el país tiene más de 10.000 dólares per cápita y más de 8 años de escolarización.

Para combinar los indicadores hemos establecido tres procedimientos:

En la columna Suma, el primer procedimiento representa una simple suma de los indicadores donde el fenómeno está presente. Si está presente en los dos indicadores, recibe el valor 2. Si está presente en solo uno, recibe el valor 1. Y si no está presente en ninguno, recibe el valor 0.
En la columna Escala nos hemos inspirado en la escala de Likert (véase Babbie, 2013: 217), que asume que algunos ítems reflejan un grado relativamente bajo de la variable, mientras que otros reflejan un grado más alto. Así, podríamos considerar que hay una cierta ordinalidad entre los indicadores: para estar desarrollados, primero necesitamos un cierto nivel económico y después un cierto nivel educativo. De nada serviría tener una buena educación si no podemos llegar a final de mes. Bajo esta lógica, asignaremos un valor 2 si tenemos ingresos y educación, un valor 1 si tenemos ingresos y un valor 0 si no tenemos ingresos.
Finalmente, en la columna Ordinal hemos considerado otro procedimiento: solo podemos considerar que un país está desarrollado si cumple los dos requisitos. De lo contrario, obtendrá el valor 0.

measures <- tribble(~País,  ~pib,   ~edu,   ~Índex, ~Escala, ~Ordinal,
                   "A",     1,      1,      2,      2,          1,
                   "B",     1,      0,      1,      1,          0,
                   "C",     0,      1,      1,      0,          0,
                   "D",     0,      0,      0,      0,          0)

Tabla 1: Ejemplos de medidas compuestas
País	pib	edu	Suma	Escala	Ordinal
A	1	1	2	2	1
B	1	0	1	1	0
C	0	1	1	0	0
D	0	0	0	0	0

Como observamos en las tres últimas columnas de la Tabla 1, el procedimiento que utilizamos para transformar los indicadores puede tener una gran incidencia en la medida final:

En el primer caso, hemos agregado los indicadores a través de una suma, de forma que todos los indicadores cuentan lo mismo en el índice final (ver apartado Agregación).
En el segundo caso, hemos establecido una jerarquía entre los indicadores. Para entenderlo, lo tenemos que pensar en forma de pirámide con varias capas. Solo cuando la capa de base esté cubierta podremos mirar la siguiente capa. En el ejemplo, el indicador de escolarización solo se tendrá en cuenta cuando el indicador económico esté presente.
En el último caso, hemos combinado los ítems con criterios de necesidad y suficiencia (ver Otros). Hemos establecido que las dos medidas son necesarias para tener desarrollo. La presencia de solo uno de los dos indicadores, por lo tanto, no sería suficiente para que haya desarrollo.

No hay una única forma de agrupar varios indicadores en un solo índice. En este módulo veremos los retos que se nos plantean cuando creamos una medida compuesta. Aunque hacia el final del módulo veremos medidas diferentes como las escalas, el módulo se centra especialmente en la elaboración de índices compuestos. Para explicar los procedimientos utilizaremos como ejemplo el índice de desarrollo humano (IDH). Veremos que en la construcción de un índice tendremos que responder a tres preguntas principales:

¿Son igual de importantes todos los indicadores que conforman el índice? Es posible que pensemos que algún indicador es más importante que los otros porque nos ayuda de una manera más clara a identificar el concepto que queremos capturar. En este caso, tendremos que ponderar el índice y hacer que este indicador valga más que el resto.
¿Cómo unimos los indicadores en uno solo? El primer pensamiento que nos viene a la cabeza es con una suma de los diferentes indicadores, pero hay otras maneras de agregar los indicadores, que evidentemente tendrán consecuencias en la medida final.
¿Cómo unimos indicadores que representan escalas diferentes? Imaginad que queremos juntar el PIB per cápita, medido en dólares, y la esperanza de vida, medida en años. ¿Convertimos los dólares en años? ¿Los años en dólares? Mezclar manzanas y peras siempre ha sido difícil, pero no imposible. Veremos más adelante la técnica que se usa para resolver este problema, que se llama normalizar.