2  L’anàlisi quantitativa

Quan parlem de l’anàlisi quantitativa, ens referim a les tècniques que tenen per objectiu sistematitzar i representar una realitat determinada en valors normalment numèrics mitjançant models matemàtics i estadístics. Per entendre què fa l’anàlisi quantitativa, fixem-nos com a punt de partida en Figura 2.1. A dins el planeta Terra hi ha milers de fenòmens que poden ser sistematitzats i representats mitjançant l’anàlisi quantitativa. Per sistematitzar, entenem el procés de convertir la informació en una forma estructurada i manejable (en un sistema). Fa centenars d’anys que les ciències naturals van començar a sistematitzar el món natural. Els científics classificaven elements com les espècies, les plantes o els núvols. N’establien categories i quantificaven les seves propietats com la longitud de les tiges de les plantes, anys de vida d’un animal, el pes dels elements com l’aigua, etc. Pensaven que aquesta sistematització dels fenòmens del medi natural ajudaria a trobar regularitats generalitzables mitjançant experiments científics.

Figura 2.1: El planeta Terra (Pixabay).

En ciències socials el procés ha estat molt semblant, amb la diferència que la realitat que volem observar i sistematitzar és la realitat social. Així doncs, els científics socials també han identificat i delimitat “objectes” del món social com els estats, els partits polítics o els conflictes i n’han establert propietats quantificables com la població o el règim polític d’un estat, el nombre de vots o la ubicació ideològica d’un partit polític i el nombre de morts o la durada d’un conflicte. De la mateixa manera que ha passat en el món natural, una branca de la ciència ha cregut que la sistematització i la quantificació del món social era un pas imprescindible per avançar en el coneixement. La creació d’“objectes socials” quantificables permetria aplicar-hi tècniques estadístiques i analitzar-los per determinar regularitats en el seu comportament.

Per tant, un requisit indispensable de l’anàlisi quantitativa per generar coneixement és passar del món abstracte i desconegut de la Figura 2.1 a una estructura definida i d’aparença certa que emmagatzemarem en una base de dades, com la que veiem a continuació. La Taula 2.1 mostra un fragment de la Global Terrorism Database (taula a)(START, 2022), una base de dades que recopila informació sobre els atacs terroristes que s’han produït al món des de 1970. Hi ha comptabilitzades més de 200.000 observacions. La part dreta (taula b) mostra un fragment de la Militarized Interstate Dispute (MID) Dyadic dataset (Maoz et al., 2018), una base de dades de més de 10.000 observacions que registra les disputes militaritzades entre estats des de 1816.

(a) Global Terrorism Database (START, 2022).
iyear country_txt city latitude longitude attacktype1_txt targtype1_txt
1970 Dominican Republic Santo Domingo 18.45679 -69.95116 Assassination Private Citizens & Property
1970 Mexico Mexico city 19.37189 -99.08662 Hostage Taking (Kidnapping) Government (Diplomatic)
1970 Philippines Unknown 15.47860 120.59974 Assassination Journalists & Media
1970 Greece Athens 37.99749 23.76273 Bombing/Explosion Government (Diplomatic)
1970 Japan Fukouka 33.58041 130.39636 Facility/Infrastructure Attack Government (Diplomatic)
1970 United States Cairo 37.00511 -89.17627 Armed Assault Police
1970 Uruguay Montevideo -34.89115 -56.18721 Assassination Police
1970 United States Oakland 37.79193 -122.22591 Bombing/Explosion Utilities
(b) MID dyadic dataset (Maoz et al., 2018).
namea nameb strtyr outcome settlmnt fatlev highact hihost duration revstatb severity
USA UKG 1902 0 0 0 7 3 184 1 49
USA UKG 1902 6 1 0 7 3 25 1 49
UKG USA 1902 0 0 0 7 3 184 1 49
UKG USA 1902 6 1 0 7 3 25 1 49
AUH YUG 1913 4 3 0 10 3 177 0 20
YUG AUH 1913 3 3 0 10 3 177 1 20
UKG ALB 1946 5 3 2 19 4 183 0 65
ALB UKG 1946 5 3 2 19 4 183 0 65

Taula 2.1: Quantificació del món social.

Bases de dades com les que acabem de veure seran les formes habituals que adoptarà el món social quan vulguem estudiar l’àmbit internacional a través de l’anàlisi quantitativa. Com que “base de dades” és un terme molt ampli (inclou qualsevol manera d’emmagatzemar dades), precisarem que la forma més habitual amb què treballarem són els conjunts de dades, un format de base de dades en dues dimensions que acostuma a tenir les següents característiques (Wickham, 2014):

La majoria de conjunts de dades que ens trobarem són semblants a la taula de l’esquerra. D’aquests conjunts de dades en diem monàdics perquè la unitat d’anàlisi acostuma a ser un actor o fenomen internacional. Per exemple, si registrem informació de tots els països del món de 1945 fins a 2011 haurem creat un marc monàdic que tindrà com a unitat d’anàlisi el país-any. En el món de les RRII, però, també serà habitual trobar-nos marcs de dades diàdics, que tenen com a unitat d’anàlisi la relació entre dos actors. Fixem-nos que a la taula de la dreta necessitem dos actors per construir cada observació, perquè el que volem mirar són les relacions –conflictives, en aquest cas– entre ells.

Llegir un marc de dades: estructura i llibre de codis

Sovint, la multitud de variables i observacions dels marcs de dades ens fa difícil la nostra orientació quan els explorem. És per això que cal tenir en compte que la majoria de marcs de dades acostumen a seguir una mínima estructura de tres parts. Si prenem aquesta divisió com a referència, moltes vegades ens serà més fàcil començar a navegar entre tantes variables. A la Figura 2.2 veiem un fragment de la Democracy-Dictatorship (DD) dataset (Cheibub et al., 2010), que hem dividit en tres parts assenyalades amb quadres vermells (més informació disponible aquí). A la primera part hi figuren les variables relacionades amb la unitat d’anàlisi i totes les seves codificacions. A la segona part hi observem les variables substantives de la base de dades. En aquest cas, els autors tenien per objectiu desenvolupar una classificació binària de democràcia (democracy) a partir de característiques com la selecció de l’executiu (exselec) o del legislatiu (legselec), entre d’altres. I al final del marc de dades hi figuren altres variables, que no són centrals, però poden ajudar a donar context a les altres variables.

Figura 2.2: DD dataset (Cheibub et al., 2010).

El llibre de codis és una eina de navegació imprescindible per navegar per un marc de dades. Aquest document acostuma a acompanyar el marc de dades i en descriu el contingut, estructura i variables. Sense ell no podem entendre el significat i la codificació de moltes variables. Com a mínim, el llibre de codis està format per una introducció i un apartat de descripció de les variables:

  • En la introducció es presenta la base de dades i el motiu que ha impulsat la seva construcció. En aquest apartat normalment es comenten algunes consideracions prèvies a tenir en compte a l’hora de llegir les dades, així com les definicions més importants.
  • En la descripció de les variables, normalment es presenta una taula amb el codi de la variable en el marc de dades i una descripció del seu significat. La Taula 2.2 simula la descripció d’algunes de les variables de la DD dataset. Així, veiem per exemple que ccow és el codi numèric de país que fa servir el projecte COW, que amb el codi numèric de la variable “exselec” podem conèixer el sistema d’elecció de l’executiu o que amb “agedem” podem saber els anys consecutius que porta el país sent una democràcia en un any determinat. Els llibres de codis poden incloure també una descripció de les unitats amb què les variables estan mesurades i la font d’informació de procedència.
Taula 2.2: Llibre de codis
Variable Descripció
ctryname Nom del país
year Any
ccow Codi d’identificació del país numèric de Correlates of War
...
exselec Tipus de selecció de l’executiu: 1 (Elecció Directa); 2 (Elecció Indirecta); 3 (No escollit).
legselec Tipus de selecció del legislatiu: 0 (No hi ha legislatiu); 1 (No Escollit); 2 (Escollit).
democracy Variable binària que indica si el país és una democràcia.
...
regime Tipus de règim: 0 (Democràcia parlamentària); 1 (Democràcia semi-presidencial); 2 (Democràcia presidencial); 3 (Dictadura civil); 4 (Dictadura militar); 5 (Dictadura reial).
agedem Anys consecutius que el règim classifica com a democràcia.

Els llibres de codis no són sempre fàcils de trobar. Alguns vindran adjunts en el mateix arxiu comprimit on es troba la base de dades que ens interessa. D’altres els haurem de buscar per la pàgina web de l’organització que allotja les dades. També ens podem trobar que alguns marcs de dades es poden carregar directament a programes estadístics com R. En aquests casos, és molt possible que els llibres de codis vinguin inclosos amb la documentació de les dades.