2  El análisis cuantitativo

Cuando hablamos de el análisis cuantitativo, nos referimos a las técnicas que tienen por objetivo sistematizar y representar una realidad determinada en valores normalmente numéricos mediante modelos matemáticos y estadísticos. Para entender qué hace el análisis cuantitativo, fijémonos como punto de partida en Figura 2.1. Dentro el planeta Tierra hay miles de fenómenos que pueden ser sistematizados y representados mediante el análisis cuantitativo. Por sistematizar, entendemos el proceso de convertir la información en una forma estructurada y manejable (en un sistema). Hace centenares de años que las ciencias naturales empezaron a sistematizar el mundo natural. Los científicos clasificaban elementos como las especies, las plantas o las nubes. Establecían categorías y cuantificaban sus propiedades como la longitud de los tallos de las plantas, años de vida de un animal, el peso de los elementos como el agua, etc. Pensaban que esta sistematización de los fenómenos del medio natural ayudaría a encontrar regularidades generalizables mediante experimentos científicos.

Figura 2.1: El planeta Tierra (Pixabay).

En ciencias sociales el proceso ha sido muy parecido, con la diferencia de que la realidad que queremos observar y sistematizar es la realidad social. Así pues, los científicos sociales también han identificado y delimitado “objetos” del mundo social como los estados, los partidos políticos o los conflictos y han establecido propiedades cuantificables como la población o el régimen político de un estado, el número de votos o la ubicación ideológica de un partido político y el número de muertes o la duración de un conflicto. Del mismo modo que ha pasado en el mundo natural, una rama de la ciencia ha creído que la sistematización y la cuantificación del mundo social era un paso imprescindible para avanzar en el conocimiento. La creación de “objetos sociales” cuantificables permitiría aplicar técnicas estadísticas y analizarlos para determinar regularidades en su comportamiento.

Por lo tanto, un requisito indispensable del análisis cuantitativo para generar conocimiento es pasar del mundo abstracto y desconocido de la Figura 2.1 a una estructura definida y de apariencia cierta que almacenaremos en una base de datos, como la que vemos a continuación. La Tabla 2.1 muestra un fragmento de la Global Terrorism Database (tabla a)(START, 2022), una base de datos que recopila información sobre los ataques terroristas que se han producido en el mundo desde 1970. Hay contabilizadas más de 200.000 observaciones. La parte derecha (tabla b) muestra un fragmento de la Militarized Interstate Dispute (MID) Dyadic dataset (Maoz et al., 2018), una base de datos de más de 10.000 observaciones que registra las disputas militarizadas entre estados desde 1816.

(a) Global Terrorism Database (START, 2022).
iyear country_txt city latitude longitude attacktype1_txt targtype1_txt
1970 Dominican Republic Santo Domingo 18.45679 -69.95116 Assassination Private Citizens & Property
1970 Mexico Mexico city 19.37189 -99.08662 Hostage Taking (Kidnapping) Government (Diplomatic)
1970 Philippines Unknown 15.47860 120.59974 Assassination Journalists & Media
1970 Greece Athens 37.99749 23.76273 Bombing/Explosion Government (Diplomatic)
1970 Japan Fukouka 33.58041 130.39636 Facility/Infrastructure Attack Government (Diplomatic)
1970 United States Cairo 37.00511 -89.17627 Armed Assault Police
1970 Uruguay Montevideo -34.89115 -56.18721 Assassination Police
1970 United States Oakland 37.79193 -122.22591 Bombing/Explosion Utilities
(b) MID dyadic dataset (Maoz et al., 2018).
namea nameb strtyr outcome settlmnt fatlev highact hihost duration revstatb severity
USA UKG 1902 0 0 0 7 3 184 1 49
USA UKG 1902 6 1 0 7 3 25 1 49
UKG USA 1902 0 0 0 7 3 184 1 49
UKG USA 1902 6 1 0 7 3 25 1 49
AUH YUG 1913 4 3 0 10 3 177 0 20
YUG AUH 1913 3 3 0 10 3 177 1 20
UKG ALB 1946 5 3 2 19 4 183 0 65
ALB UKG 1946 5 3 2 19 4 183 0 65

Tabla 2.1: Cuantificación del mundo social.

Bases de datos como las que acabamos de ver serán las formas habituales que adoptará el mundo social cuando queramos estudiar el ámbito internacional a través del análisis cuantitativo. Como “base de datos” es un término muy amplio (incluye cualquier manera de almacenar datos), precisaremos que la forma más habitual con que trabajaremos son los conjuntos de datos, un formato de base de datos en dos dimensiones que acostumbra a tener las siguientes características (Wickham, 2014):

La mayoría de conjuntos de datos que nos encontraremos son parecidos a la tabla de la izquierda. A estos conjuntos de datos los llamamos monádicos porque la unidad de análisis acostumbra a ser un actor o fenómeno internacional. Por ejemplo, si registramos información de todos los países del mundo de 1945 hasta 2011 habremos creado un marco monádico que tendrá como unidad de análisis el país-año. En el mundo de las RRII, sin embargo, también será habitual encontrarnos marcos de datos diádicos, que tienen como unidad de análisis la relación entre dos actores. Fijémonos en que en la tabla de la derecha necesitamos dos actores para construir cada observación, porque lo que queremos mirar son las relaciones –conflictivas, en este caso– entre ellos.

Leer un marco de datos: estructura y libro de códigos

A menudo, la multitud de variables y observaciones de los marcos de datos hace difícil nuestra orientación cuando los exploramos. Es por eso que hay que tener en cuenta que la mayoría de marcos de datos acostumbran a seguir una mínima estructura de tres partes. Si tomamos esta división como referencia, muchas veces nos será más fácil empezar a navegar entre tantas variables. En la Figura 2.2 vemos un fragmento de la Democracy-Dictatorship (DD) dataset (Cheibub et al., 2010), que hemos dividido en tres partes señaladas con cuadros rojos (más información disponible aquí). En la primera parte figuran las variables relacionadas con la unidad de análisis y todas sus codificaciones. En la segunda parte observamos las variables sustantivas de la base de datos. En este caso, los autores tenían por objetivo desarrollar una clasificación binaria de democracia (democracy) a partir de características como la selección del ejecutivo (exselec) o del legislativo (legselec), entre otros. Y al final del marco de datos figuran otras variables, que no son centrales, pero pueden ayudar a dar contexto a las otras variables.

Figura 2.2: DD dataset (Cheibub et al., 2010).

El libro de códigos es una herramienta de navegación imprescindible para navegar por un marco de datos. Este documento acostumbra a acompañar el marco de datos y describe su contenido, estructura y variables. Sin él no podemos entender el significado y la codificación de muchas variables. Como mínimo, el libro de códigos está formado por una introducción y un apartado de descripción de las variables:

  • En la introducción se presenta la base de datos y el motivo que ha impulsado su construcción. En este apartado normalmente se comentan algunas consideraciones previas a tener en cuenta a la hora de leer los datos, así como las definiciones más importantes.
  • En la descripción de las variables, normalmente se presenta una tabla con el código de la variable en el marco de datos y una descripción de su significado. La Tabla 2.2 simula la descripción de algunas de las variables de la DD dataset. Así, vemos por ejemplo que ccow es el código numérico de país que usa el proyecto COW, que con el código numérico de la variable “exselec” podemos conocer el sistema de elección del ejecutivo o que con “agedem” podemos saber los años consecutivos que lleva el país siendo una democracia en un año determinado. Los libros de códigos pueden incluir también una descripción de las unidades con que las variables están medidas y la fuente de información de procedencia.
Tabla 2.2: Libro de códigos
Variable Descripción
ctryname Nombre del país
year Año
ccow Código de identificación del país numérico de Correlates of War
...
exselec Tipo de selección del ejecutivo: 1 (Elección Directa); 2 (Elección Indirecta); 3 (No escogido).
legselec Tipo de selección del legislativo: 0 (No hay legislativo); 1 (No Escogido); 2 (Escogido).
democracy Variable binaria que indica si el país es una democracia.
...
regime Tipo de régimen: 0 (Democracia parlamentaria); 1 (Democracia semipresidencial); 2 (Democracia presidencial); 3 (Dictadura civil); 4 (Dictadura militar); 5 (Dictadura real).
agedem Años consecutivos que el régimen clasifica como democracia.

Los libros de códigos no son siempre fáciles de encontrar. Algunos vendrán adjuntos en el mismo archivo comprimido donde se encuentra la base de datos que nos interesa. Otros los deberemos buscar por la página web de la organización que aloja los datos. También nos podemos encontrar con que algunos marcos de datos se pueden cargar directamente en programas estadísticos como R. En estos casos, es muy posible que los libros de códigos vengan incluidos con la documentación de los datos.