Tècniques d’anàlisi bivariada (CPS)
Després d’haver-nos familiaritzat en el mòdul anterior amb els principis bàsics d’inferència estadística, ara ja podem aplicar de forma pràctica aquests coneixements per analitzar la relació entre dues o més variables. Mitjançant les tècniques estadístiques que aprendrem en aquest mòdul podrem afirmar si, des d’un punt de vista estadístic, el comportament d’una variable està parcialment determinat pel comportament d’una altra (King et al., 1994).
Les variables que involucrem en l’anàlisi bivariada les anomenarem variable independent i variable dependent, en funció de la variable que creiem que parcialment determina el comportament de l’altra. Així, a la variable que considerem que està causant l’efecte l’anomenarem variable independent (també coneguda com a “variable explicativa” o “de tractament”) i la identificarem amb el símbol \(x\). D’altra banda, la variable que pensem que està afectada per la variable independent, la denominarem variable dependent (també coneguda com a “variable explicada” o “de resposta”) i la identificarem amb el símbol \(y\)1.
1 No sempre és fàcil determinar quina és la variable independent i quina és la dependent, però normalment quan comencem una investigació sempre partim d’una intuïció de la direcció de causalitat.
En funció de si la variable independent i la variable dependent de la relació que volem examinar són numèriques o categòriques, utilitzarem unes tècniques o unes altres. A la taula 1 en mostrem un resum.
Segueix aquest vídeo per entendre millor la diferència entre la variable independent i la variable dependent.
| Variable dependent categòrica | Variable dependent numèrica | |
|---|---|---|
| Variable independent categòrica | Taula de contingència | Diferència de mitjanes |
| Variable independent numèrica | Regressió logística | Regressió lineal |
D’aquesta manera, si tant la variable independent com la variable dependent són categòriques, utilitzarem el mètode conegut com a “taula de contingència”. Si la variable independent és categòrica i la dependent és numèrica, farem servir la diferència de mitjanes. Si, en canvi, tant la variable independent com la variable dependent són numèriques, utilitzarem la regressió i la correlació. Finalment, si la variable independent és numèrica i la variable dependent és categòrica, farem una regressió logística.
En els primers quatre capítols d’aquest mòdul veurem, per separat, cada una d’aquestes quatre tècniques. Primer examinarem les tècniques que s’utilitzen quan la variable independent de la relació bivariada és categòrica i després les que s’utilitzen quan és numèrica. El tercer capítol el deixarem per a l’anàlisi multivariada i en el darrer capítol veurem una implementació pràctica.