Aogoi
Notiziario
ARCHIVIO NEWS
Studi clinici. Ecco come interpretarli senza prendere abbagli

Studi clinici. Ecco come interpretarli senza prendere abbagli

21 settembre 2016 - Dal New England Journal of Medicine arrivano le istruzioni per l’uso su come interpretare i risultati di un trial. Un piccolo utilissimo prontuario per non cadere nelle trappole della statistica e nelle forzature di interpretazione, che insegna a leggere i risultati tra le righe, senza arenarsi sull’endpoint primario, che preso da solo può essere fuorviante

I risultati di uno studio clinico vengono in genere interpretati andando subito a vedere se l’endpoint primario è stato raggiunto o meno, cioè se il valore della ‘P’ è inferiore a 0,05, il minimo sindacale per decretare l’esistenza di una differenza tra due trattamenti. Ma per capire se questi risultati rappresentino un reale progresso nella pratica clinica o richiedano invece una conferma da successivi studi clinici è necessario andare oltre la ‘P’ dell’endpoint primario e scavare un po’ più in profondità.

Se i risultati di efficacia e sicurezza del trial sono convincenti, il passo successivo consiste nel valutarne la qualità e la validità. Poi bisognerà capire se quei risultati ottenuti sui pazienti ‘ideali’ (e dunque inesistenti) di un trial clinico siano applicabili anche ai pazienti in carne ed ossa che si incontrano nella pratica clinica quotidiana. Last but not least, ormai nessun trattamento arriva alla pratica clinica se prima non passa le forche caudine della costo-efficacia. Insomma che per ogni nuovo farmaco il percorso dalle pagine di una rivista specializzata, alla realtà clinica quotidiana può essere realmente molto lungo o addirittura del tutto virtuale.

A spiegare come leggere uno studio clinico e a dare una serie di istruzioni per l’uso sull’interpretazione dei suoi risultati provvedono con un articolo sul New England Journal of Medicine Stuart Pocock del Dipartimento di Statistica Medica della London School of Hygiene and Tropical Medicine e Gregg Stone del Columbia University Medical Center, New York Presbyterian Hospital e Cardiovascular Research Foundation di New York.
Ecco in sintesi, le istruzioni per l’uso degli autori che consigliano ai lettori quali domande porsi di fronte ad uno studio con risultati ‘positivi’.

Tanto per cominciare, la premessa è che il raggiungimento di un outcome primario positivo non è necessariamente una rondine che fa primavera. Non basta cioè accontentarsi di questo risultato per far adottaretout court un nuovo farmaco o per modificare la pratica clinica. Un dato studio, magari insieme ad altri, verrà passato al vaglio da schiere di esperti, redattori di linee guida, payer, autorità regolatorie, medici, società scientifiche e associazioni di pazienti prima di decidere se un nuovo trattamento verrà approvato o meno. Ma intanto, per capire se i risultati di un certo studio sono così interessanti da preludere a probabili ricadute sulla pratica clinica, è bene andare a leggere in maniera più approfondita i risultati. Ponendosi una serie di domande ‘tecniche’.

Un valore della P inferiore a 0,05 è abbastanza buono?
Una P inferiore a 0,05 significa che c’è una probabilità del 5% di un risultato falso positivo (ovvero di una non differenza di risultati tra i due bracci di trattamento). Dunque – ammoniscono gli autori – se si vuole avere un risultato al di là di ogni ragionevole dubbio è bene puntare ad una P molto inferiore (ad esempio < 0,001).
Sono in linea con questo criterio i risultati dello studio PARADIGM-HF, nel quale l’associazione sacubitril-valsartan confrontata con l’enalapril ha raggiunto l’endpoint primario (un composito di mortalità cardiovascolare e ricoveri per scompenso cardiaco) con una P <0,00001 e questo ha portato all’approvazione del sacubritril-valsartan da parte delle autorità regolatorie.

Qual è l’ordine di grandezza del beneficio derivante da un determinato trattamento?
Al di là della significatività statistica, un’altra fondamentale questione da porsi è la rilevanza clinica dei risultati dello studio; per questo è necessario calcolare gli effetti del trattamento in scala relativa (relative risko hazard ratio) e assoluta (calcolando ad esempio le differenze nel tasso di eventi che si verificano nel follow-up e il number needed to treat).

L’endpoint primario è rilevante dal punto di vista clinico?
Endpointsurrogati. Sebbene gli studi di fase 3 abbiano in genere una potenza sufficiente a raggiungere dei risultati di rilevanza clinica, per alcune patologie ci si accontenta dei cosiddetti endpoint ‘surrogati’ (es. riduzione dell’emoglobina glicata come misura surrogata dell’effetto anti-glicemico nei soggetti con diabete). Ma i risultati di alcuni granditrial hanno messo in seria discussione l’affidabilità di questi endpointsurrogati. Restando nel campo del diabete, gli autori citano il caso dello studio ACCORD, dove il braccio trattato in maniera più intensiva, rispetto a quello terapia ‘standard’, otteneva una maggiore riduzione dell’emoglobina glicata. Peccato però che era anche gravato da una maggior mortalità.
Endpoint compositi.Di fronte ad un endpoint composito, gli autori raccomandano una lettura separata delle sua diverse componenti, per capire qual è quella che ha maggiormente generato il risultato. Nel trial RITA-3, che ha valutato gli effetti del trattamento interventista rispetto ad uno conservativo in una popolazione di pazienti con sindrome coronarica acuta, un numero inferiore di pazienti del gruppo ‘trattamento interventista’ ha presentato l’endpoint primario, un composito di mortalità, infarto del miocardio, angina refrattaria a 4 mesi. Un risultato tuttavia ‘trascinato’ dal dimezzamento dei casi di angina refrattaria, mentre nessuna differenza era stata rilevata nei tassi di infarto o di mortalità. Sulla base di questo studio non era dunque possibile concludere che la strategia interventista fosse un intervento ‘salva-vita’. Ma in seguito uno studio con un follow–up di 5 anni ha evidenziato una riduzione del 22% nel tasso di infarti e mortalità tra i pazienti del gruppo di intervento, dato confermato anche da successive metanalisi. Tutto ciò ha dunque portato ad adottare la rivascolarizzazione coronarica precoce nei soggetti con sindromi coronarie acute per migliorarne la prognosi.

Gli outcome secondari sono d’aiuto?
L’impressione che i risultati di uno studio siano ‘positivi’ viene rinforzata dalla presenza dioutcome secondari prespecificati che mostrino anch’essi un beneficio del trattamento in esame. Al contrario se glioutcome secondari risultano negativi, nel lettore si insinua il dubbio della validità dell’intero studio.
L’esempio questa volta viene dal trial EMPA-REG OUTCOME (empagliflozin versus placebo nel diabete di tipo 2). Il beneficio di empagliflozin rispetto all’endpoint primario composito (mortalità cardiovascolare infarto, stroke) presentava un hazard ratio (HR) di 0.86 (95% CI, 0.74 to 0.99; P=0.04). Un risultato molto solido tuttavia in quanto generato da una riduzione della mortalità cardiovascolare (HR 0.62; 95% CI, 0.49 to 0.77; P<0.001) e rinforzato da un risultato simile per la mortalità per tutte le cause (P<0.001) e per i ricoveri per scompenso cardiaco (P=0.002). In altre parole i risultati maggiormente significativi dal punto di vista statistico empagliflozin li ha ottenuti negli endpoint secondari, ma i risultati positivi dell’endpoint primario avevano dato un imprinting di credibilità a tutto lo studio.

I risultati dello studio sono confermati per tutti i sottogruppi importanti?
Gli effetti di un farmaco possono essere diversi a seconda delle caratteristiche dei pazienti, oppure essere più evidenti in alcuni sottogruppi ad alto rischio, come nel caso delle statine nei soggetti con diversi fattori di rischio cardiovascolari. E’ questo il motivo per cui le statine in prevenzione primaria vengono riservate ai pazienti ad alto rischio.
Più complesso è il caso di un trial ‘positivo’ a favore di un farmaco, nell’ambito del quale però l’analisi per sottogruppi non evidenzia un beneficio dall’assunzione di questa terapia. La prudenza è d’obbligo – ammoniscono gli autori – nell’interpretare i risultati delle analisi per sottogruppi. E’ anche ragionevole però ‘risparmiare’ ad alcuni pazienti un trattamento probabilmente per loro inefficace o potenzialmente dannoso. E’ il caso dello studio PLATO su pazienti con sindrome coronarica acuta, trattati con ticagrelor o con clopidrogrel; il trial ha prodotto un endpoint primario composito (mortalità cardiovascolare, infarto e stroke) inferiore del 16% con il ticagrelor. Tra i pazienti in terapia con aspirina ad alte dosi tuttavia il rischio è risultato maggiore del 45% nel gruppo ticagrelor, rispetto a quello clopidogrel, mentre nei soggetti in terapia con aspirina a dosaggio standard, il rischio è stato del 21% inferiore per il ticagrelor. Sebbene ancora si discuta sulla validità di questi risultati, l’FDA ha emesso un warning sul fatto che un dosaggio di aspirina superiore a 100 mg riduca l’efficacia del ticagrelor e vada pertanto evitato in questi pazienti.

Il trial è sufficientemente grande da essere convincente?
Quando a raggiungere la significatività statistica per l’endpoint primario è un trial di piccole dimensioni, la prudenza nell’interpretazione del risultato è d’obbligo. Un buon esempio viene da uno studio con N-acetilcisteina nella prevenzione della nefropatia da mezzo di contrasto. In questo trial il danno renale si è verificato in un paziente sui 41nel gruppo in trattamento con N-acetilcisteina e in 9 pazienti sui 42 del gruppo di controllo. In questo caso, dire che l’N-acetilcisteina è un farmaco efficace nel prevenire la nefropatia da mezzo di contrasto è un’affermazione esagerata che andrebbe mitigata in un ‘potrebbe essere efficace’. Idealmente questo dato andrebbe confermato da uno studio più ampio, che non è mai stato realizzato. Per contro, una metanalisi di 10 trial randomizzati (su 1.916 pazienti) ha stabilito che le evidenze a favore dell’N-acetilcisteina sono troppo deboli per supportarne l’uso per questa indicazione.

Il trial è stato interrotto troppo presto?
Capita a volte che uno studio venga interrotto precocemente perché l’analisi ad interim evidenzia una forte superiorità di un trattamento rispetto ad un altro. Purtroppo questa pratica – ammettono gli autori – porta spesso a sopravvalutare l’efficacia di un trattamento, oltre a rischiare di far perdere dati preziosi sugli endpoint secondari e di safety.

Le preoccupazioni relative alla safety controbilanciano i risultati positivi sull’efficacia?
Di fronte ad un farmaco nuovo con un’efficacia maggiore dei precedenti, bisogna immediatamente andare a vedere i risultati di safety. Benefici e rischi assoluti vanno presentati in termini di differenze percentuali. Di utilità sarebbe anche avere a disposizione il NNT (number needed to treat) e il NNH (number needed to harm).

Il bilancio efficacia-sicurezza è paziente-specifico?
Il bilancio clinico netto di un nuovo trattamento potrebbe risultare declinato in maniera diversa a seconda delle categorie di pazienti (cioè vantaggioso per alcuni, ma deleterio per i pazienti ad aumentato rischio di eventi avversi). Fare un bilancio rischi-benefici individualizzato per il singolo paziente però non è facilissimo, anche se di certo rappresenterebbe un importante passo verso una terapia realmente su misura.

Ci sono errori nel disegno o nell’esecuzione del trial?
Un risultato altamente significativo nell’endpoint primario già rassicura molto sul fatto che quel risultato non può dipendere dal caso. Tuttavia bisogna anche andare a vedere che non vi siano bias di disegno o di conduzione dello studio, prima di accettare che il trattamento testato apporti un reale beneficio.
Un esempio di questo viene dal SYMPLICITY HTN-2, il primo trial randomizzato sulla denervazione renale nell’ipertensione resistente. Lo studio ha dimostrato che a 6 mesi, la sistolica risultava nettamente inferiore nel gruppo sottoposto a denervazione, rispetto al gruppo di controllo (differenza media 31 mm Hg; P<0.0001). Ma non era un trial in cieco e questo ha comportato una serie di problemi. Così quando si è andati ad effettuare un successivo studio controllato, il SYMPLICITY-HTN-3, la denervazione renale è risultata del tutto inefficace. Di qui il monito di Pocock e Stone di diffidare dei trial non controllati.

Un altro punto molto importante da tener presente è il grado di aderenza al trattamento dei soggetti arruolati nello studio oltre al tasso dei drop-out che può andare ad inficiare la validità dello studio. Problemi questi che sono costati al rivaroxaban l’ indicazione per le sindromi coronariche acute da parte dell’FDA, visto che nello studio ATLAS ACS 2–TIMI 51 il 27,6% dei pazienti aveva interrotto precocemente il trattamento e che mancavano una serie di dati importanti per il 7,2% dei pazienti.

I risultati di questo studio sono applicabili ai miei pazienti?
I risultati di qualsiasi trial, a voler essere rigorosi, sono applicabili solo alla tipologia di pazienti arruolata per quel determinato studio. La questione se sia possibile estrapolare questi risultati ad altri pazienti non è banale. Nel caso dello studio SPRINT (che ha valutato i risultati di un trattamento antipertensivo intensivo versus quello standard relativamente ad un endpoint primario composito comprendente infarto, sindromi coronariche acute, ictus, scompenso cardiaco e mortalità cardiovascolare) ad esempio erano stato esclusi tutti i pazienti sotto i 50 anni d’età e quelli con diabete o con una storia di ictus. Dunque, a voler essere precisi, i risultati di questo studio riguardano solo il 20% dei pazienti ipertesi.

Altra considerazione importante da fare è la ‘geografia’ dello studio, cioè le popolazioni studiate. Nel caso dei trial internazionali comprendenti diversi paesi nei vari continenti, questo è un punto a favore della generalizzabilità dei risultati. Per ragioni opposte, vanno presi con grande attenzione i risultati di studi monocentrici, che raramente possono avere un impatto sulle linee guida. A meno che non fungano da studio pilota con risultati confermati da successivi studi con arruolamento multicentrico.

Maria Rita Montebelli

Associazione dei Ginecologi Italiani:
ospedalieri, del territorio e liberi professionisti

Studi clinici. Ecco come interpretarli senza prendere abbagli

Gyneco AOGOI

Ginecologia pratica e medicina perinatale

Benessere Donna

Associazione dei Ginecologi Italiani:ospedalieri, del territorio e liberi professionisti

Studi clinici. Ecco come interpretarli senza prendere abbagli

Gyneco AOGOI

Ginecologia pratica e medicina perinatale

Benessere Donna

Associazione dei Ginecologi Italiani:
ospedalieri, del territorio e liberi professionisti