Un sistema utilizzato spesso nel valutare l’efficacia di un trattamento medico o di un programma social in base a quanta popolazione beneficia di questi, tuttavia possiamo andare incontro a dei problemi. Immaginate che si stia valutando un trattamento di una malattia che affligge sia uomini che gatti. Vengono trattati 1 gatto e 4 persone, dei quali il gatto ed 1 persona guariscono, le altre 3 persone muoiono e osservando il gruppo di controllo, costituito da 4 gatti ed 1 persona, 3 gatti guariscono mentre 1 gatto e la persona muoiono. Nella realtà questi numeri sarebbero verosimilmente moltiplicati per cento, in questa spiegazione li manterremo piccoli per semplicità. Facendo quindi un riassunto della nostra situazione, 100% dei gatti trattati sopravvive, mentre solo il 75% dei gatti non trattai sopravvive, 25% delle persone trattate sopravvive, mentre lo 0% di quelle non trattate sopravvive. Leggendo in questo modo i dati sembrerebbe che il trattamento sia in grado di migliorare le possibilità di guarigione, se però osserviamo gli stessi dati, mettendo assieme quanto succede tra uomini e gatti, solo il 40% dei soggetti trattati sopravvive, mentre il 60% dei soggetti non trattati sopravvive, così facendo sembrerebbe quindi che il trattamento riduca le possibilità di guarigione. Quale delle due interpretazioni è corretta?
Quest’esempio, illustrato in questo video di MinutePhysics, è una semplice illustrazione del Paradosso di Simpson, secondo il quale è possibile trarre due conclusioni opposte analizzando gli stessi dati in base a come vengono suddivisi. In questi casi la sola statistica non aiuta a risolvere il dilemma, in questi casi è necessario comprendere la causalità implicata nella situazione utilizzata. Ad esempio, sapendo che per le persone la stessa malattia è più grave e quindi è più frequente che vengano prescritti trattamenti per la stessa, diventa più sensato che meno persone ai quali questo trattamento viene prescritto sopravvivono, anche se questo migliora le possibilità di guarigione, dal momento che le persone trattate avevano più possibilità di morire.
D’altra parte se fossimo in una situazione in cui le persone, indipendentemente da quanto sono malate, sono più frequentemente trattate rispetto ai gatti, dal momento che poche persone vogliono pagare per la cura dei loro felini, allora il fatto che 4 persone su 5 muoiono mentre solo 1 gatto su 5 muore suggerisce che effettivamente il trattamento in questione potrebbe non essere una buona scelta. Nel preparare un esperimento controllato bisogna essere sicuri che nulla che possa essere causalmente collegato all’esperimenta possa influenzare il risultato del trattamento utilizzato, nel caso di un esperimento non controllato bisogna poter rimuovere tali elementi nell’analizzare i risultati.
Utilizzando dati di un esperimento reale, lo stato del Winsconsin ha ripetutamente ottenuto risultati migliore nei test scolastici delle scuole medie rispetto al Texas. Questi risultati potrebbero far pensare che il Winsconsin stia facendo un lavoro migliore, tuttavia se si suddividono i risultati tenendo conto dell’etnia degli studenti, direttamente collegata alla situazione socioeconomica delle famiglie e pertanto un importante fattore che influenza l’educazione e quindi i risultati ai test scolastici, gli studenti del Texas hanno ottenuto risultati migliori rispetto al Winsconsin, gli studenti afro-americani del Texas hanno avuto risultati migliori dei corrispondenti studenti nel Winsconsin e lo stesso è avvenuto per gli studenti latino-americani e caucasici. Le differenze osservate nel totale dei risultati sono dovute al fatto che in proporzione nel Winsconsin ci sono meno studenti afro e latino-americani e più studenti caucasici, generalmente di famiglie più benestanti. Pertanto il messaggio di questi risultati non può essere quello che nel Winsconsin il sistema scolastico è migliore che nel Texas, ma solamente che ha in proporzione più persone in situazioni socioeconomiche avvantaggiate.
Semplicemente comprendendo il contesto dei dati statistici osservati e come questo li possa influenzare si possono comprendere molte cose. In alcune situazioni il paradosso di Simpson può essere meglio compreso in un grafico: immaginate due trend separati ma che tendono nella stessa direzione in modo parallelo. In questo caso i singoli trend delle due popolazioni tendono verso una direzione, ma osservando il trend tra entrambe le popolazioni, la direzione è opposta. Rendendo concreto quest’esempio immaginate che l’asse orizzontale sia la quantità di soldi e che l’asse verticale sia la felicità: questo trend indicherebbe che la quantità di soldi è inversamente proporzionale alla felicità, lo stesso vale anche per i gatti, ma mettendo persone e gatti nello stesso grafico, se i gatti fossero sia più ricchi che più felici delle persone il trend delle due popolazioni indicherebbe in modo incorretto che più soldi rendono persone e gatti più felici.
In questo caso essere un gatto rende più felici e casualmente correla anche con l’avere più soldi. Un altro modo di interpretare in modo sbagliato questo grafico è pensare che con più soldi si diventi un gatto. Si tratta di un esempio semplice per comprendere come sia possibile mentire o quanto meno trarre conclusioni sbagliate utilizzato la statistica ciecamente e senza contesto.
Questo non significa tuttavia che la statistica sia sempre paradossale e confusionale, anzi la maggior parte delle volte accade che i dati statistici siano corretti fin dall’inizio, se ad esempio fossimo nel caso in cui sia le persone che i gatti diventano più tristi quando hanno più soldi ed allo stesso tempo i gatti fossero più poveri e felici delle persone anche il trend generale non è più paradossale: più soldi=più tristezza. Tuttavia è importante sapere che paradossi come quello di Simpson sono possibili è che possa essere necessario avere più contesto sui dati per capire il significato delle nostre analisi statistiche.
Be the first to comment on "Il paradosso di Simpson"