"Negli studi medici, i ricercatori sono solitamente interessati a determinare la dimensione della differenza di un risultato misurato tra i gruppi, piuttosto che una semplice indicazione del fatto che sia statisticamente significativo o meno".
Gardner MJ, Altman DG. Intervalli di confidenza piuttosto che valori p: stima piuttosto che verifica di ipotesi. BMJ 1986;292(6522):746-50.
Per riassumere rispetto al mese scorso, i valori p ci dicono se abbiamo risultati statisticamente significativi. Allora perché non è abbastanza? Significato statistico e importanza clinica sono 2 giudizi separati. Uno studio di grandi dimensioni può essere in grado di rilevare una differenza statisticamente significativa che è piccola e clinicamente irrilevante; al contrario, un piccolo studio potrebbe non essere in grado di rilevare una piccola differenza clinicamente importante. In breve, la visione a tunnel sul valore p non è molto utile e incoraggia il pensiero pigro!
Un intervallo di confidenza (CI) fornisce un intervallo per la nostra migliore ipotesi della dimensione del vero effetto del trattamento che è plausibile data la dimensione della differenza effettivamente osservata. Se i CI dovessero essere costruiti da 100 campioni della stessa dimensione della stessa popolazione, 95 di essi conterranno il vero effetto del trattamento, 5 no. Saremmo fiduciosi al 95% che se il vero effetto del trattamento fosse noto, l'IC lo conterrebbe. Poiché la fiducia è legata all'intervallo e non al vero effetto, non è corretto dire che "c'è una probabilità del 95% che il vero effetto sia all'interno dell'IC". Questo perché il vero effetto (che non ci è noto ed è il motivo per cui stiamo facendo lo studio in primo luogo) o cade in un intervallo particolare oppure no. Cioè, la sua probabilità di essere nell'IC è del 100% o dello 0%; non è il 95%. Infine, si noti che gli IC possono essere costruiti per qualsiasi numero di probabilità, sebbene la maggior parte dei ricercatori riporti gli IC del 90%, 95% e 99%.
Il mese prossimo, continueremo la nostra discussione sull'intervallo di confidenza.