2 L’anàlisi quantitativa
Quan parlem de l’anàlisi quantitativa, ens referim a les tècniques que tenen per objectiu sistematitzar i representar una realitat determinada en valors normalment numèrics mitjançant models matemàtics i estadístics. Per entendre què fa l’anàlisi quantitativa, fixem-nos com a punt de partida en Figura 2.1. A dins el planeta Terra hi ha milers de fenòmens que poden ser sistematitzats i representats mitjançant l’anàlisi quantitativa. Per sistematitzar, entenem el procés de convertir la informació en una forma estructurada i manejable (en un sistema). Fa centenars d’anys que les ciències naturals van començar a sistematitzar el món natural. Els científics classificaven elements com les espècies, les plantes o els núvols. N’establien categories i quantificaven les seves propietats com la longitud de les tiges de les plantes, anys de vida d’un animal, el pes dels elements com l’aigua, etc. Pensaven que aquesta sistematització dels fenòmens del medi natural ajudaria a trobar regularitats generalitzables mitjançant experiments científics.

En ciències socials el procés ha estat molt semblant, amb la diferència que la realitat que volem observar i sistematitzar és la realitat social. Així doncs, els científics socials també han identificat i delimitat “objectes” del món social com els estats, els partits polítics o els conflictes i n’han establert propietats quantificables com la població o el règim polític d’un estat, el nombre de vots o la ubicació ideològica d’un partit polític i el nombre de morts o la durada d’un conflicte. De la mateixa manera que ha passat en el món natural, una branca de la ciència ha cregut que la sistematització i la quantificació del món social era un pas imprescindible per avançar en el coneixement. La creació d’“objectes socials” quantificables permetria aplicar-hi tècniques estadístiques i analitzar-los per determinar regularitats en el seu comportament.
Per tant, un requisit indispensable de l’anàlisi quantitativa per generar coneixement és passar del món abstracte i desconegut de la Figura 2.1 a una estructura definida i d’aparença certa que emmagatzemarem en una base de dades, com la que veiem a continuació. La Taula 2.1 mostra un fragment de la Global Terrorism Database (taula a)(START, 2022), una base de dades que recopila informació sobre els atacs terroristes que s’han produït al món des de 1970. Hi ha comptabilitzades més de 200.000 observacions. La part dreta (taula b) mostra un fragment de la Militarized Interstate Dispute (MID) Dyadic dataset (Maoz et al., 2018), una base de dades de més de 10.000 observacions que registra les disputes militaritzades entre estats des de 1816.
| iyear | country_txt | city | latitude | longitude | attacktype1_txt | targtype1_txt |
|---|---|---|---|---|---|---|
| 1970 | Dominican Republic | Santo Domingo | 18.45679 | -69.95116 | Assassination | Private Citizens & Property |
| 1970 | Mexico | Mexico city | 19.37189 | -99.08662 | Hostage Taking (Kidnapping) | Government (Diplomatic) |
| 1970 | Philippines | Unknown | 15.47860 | 120.59974 | Assassination | Journalists & Media |
| 1970 | Greece | Athens | 37.99749 | 23.76273 | Bombing/Explosion | Government (Diplomatic) |
| 1970 | Japan | Fukouka | 33.58041 | 130.39636 | Facility/Infrastructure Attack | Government (Diplomatic) |
| 1970 | United States | Cairo | 37.00511 | -89.17627 | Armed Assault | Police |
| 1970 | Uruguay | Montevideo | -34.89115 | -56.18721 | Assassination | Police |
| 1970 | United States | Oakland | 37.79193 | -122.22591 | Bombing/Explosion | Utilities |
| namea | nameb | strtyr | outcome | settlmnt | fatlev | highact | hihost | duration | revstatb | severity |
|---|---|---|---|---|---|---|---|---|---|---|
| USA | UKG | 1902 | 0 | 0 | 0 | 7 | 3 | 184 | 1 | 49 |
| USA | UKG | 1902 | 6 | 1 | 0 | 7 | 3 | 25 | 1 | 49 |
| UKG | USA | 1902 | 0 | 0 | 0 | 7 | 3 | 184 | 1 | 49 |
| UKG | USA | 1902 | 6 | 1 | 0 | 7 | 3 | 25 | 1 | 49 |
| AUH | YUG | 1913 | 4 | 3 | 0 | 10 | 3 | 177 | 0 | 20 |
| YUG | AUH | 1913 | 3 | 3 | 0 | 10 | 3 | 177 | 1 | 20 |
| UKG | ALB | 1946 | 5 | 3 | 2 | 19 | 4 | 183 | 0 | 65 |
| ALB | UKG | 1946 | 5 | 3 | 2 | 19 | 4 | 183 | 0 | 65 |
Taula 2.1: Quantificació del món social.
Bases de dades com les que acabem de veure seran les formes habituals que adoptarà el món social quan vulguem estudiar l’àmbit internacional a través de l’anàlisi quantitativa. Com que “base de dades” és un terme molt ampli (inclou qualsevol manera d’emmagatzemar dades), precisarem que la forma més habitual amb què treballarem són els conjunts de dades, un format de base de dades en dues dimensions que acostuma a tenir les següents característiques (Wickham, 2014):
Cada casella del marc de dades ens indica un valor. Com podem veure, els valors poden ser nombres (com 1970, 177, 183) o bé caràcters (com “YUG”, “UKG” o “Fukuoka”). Cada valor pertany a una observació i variable determinada.
Les observacions estan representades a les files. Cada observació conté tots els valors que mesuren la mateixa unitat a través de tots els seus atributs. Per exemple, a la taula b la primera observació mesura les disputes militaritzades entre els Estats Units (USA) i el Regne Unit (UKG) que es van iniciar el 1902. Aquesta observació té diverses característiques o atributs, com el resultat final (outcome) o els dies de durada (duration).
Les variables estan representades a les columnes. Cada variable conté tots els valors que mesuren el mateix atribut en totes les unitats. Per exemple, la variable attacktype1 de la taula 1 adopta un valor diferent segons l’observació que estigui mesurant.
Cada marc de dades té una sola unitat d’observació. Per la unitat d’observació entenem el significat de cada una de les observacions d’un conjunt de dades. Poden ser països, persones, organitzacions internacionals, partits polítics, etc. i també poden mesurar un interval de temps determinat. En la taula de l’esquerra cada observació és un atac terrorista, mentre que en la taula de la dreta cada observació és l’any de la disputa militaritzada (podem dir-ne disputa-any).
La majoria de conjunts de dades que ens trobarem són semblants a la taula de l’esquerra. D’aquests conjunts de dades en diem monàdics perquè la unitat d’anàlisi acostuma a ser un actor o fenomen internacional. Per exemple, si registrem informació de tots els països del món de 1945 fins a 2011 haurem creat un marc monàdic que tindrà com a unitat d’anàlisi el país-any. En el món de les RRII, però, també serà habitual trobar-nos marcs de dades diàdics, que tenen com a unitat d’anàlisi la relació entre dos actors. Fixem-nos que a la taula de la dreta necessitem dos actors per construir cada observació, perquè el que volem mirar són les relacions –conflictives, en aquest cas– entre ells.
