2. Metodi


Costruzione DataBase

Struttura dei dati

L’applicazione del Sistema ACG presuppone la disponibilità delle seguenti tipologie di dati di base:
1. Anagrafe – identificazione della popolazione in analisi.
2. Diagnosi – problemi di salute dei soggetti in anagrafe (codici diagnosi ICD, ICPC).
3. Farmaci - Prescrizioni farmaceutiche dei soggetti in anagrafe (codice ATC).
4. Costi – stima dei costi dell’assistenza ai soggetti in anagrafe distinti in costi totali e costi per farmaci.
 
Nella logica del sistema ACG questi dati vengono organizzati in tre file distinti:
 
“Patient File” - un record per soggetto. 
Contiene i dati anagrafici e i dati di costo/tariffa riferita alla popolazione in analisi. Oltre a queste informazioni di base, nel Patient File è possibile inserire dati utili alla stratificazione delle analisi (ad esempio il MMG/PLS di ogni soggetto, il distretto sanitario di residenza, l’appartenenza a definite sub-popolazioni) e dati utili per la costruzione di modelli predittivi del consumo di risorse (ad esempio numero di ospedalizzazioni, numero di visite ambulatoriali, trattamenti chemioterapici). 

“Medical Services File” - più record per soggetto.
Contiene i dati sulle diagnosi effettuate nel corso di eventi  sanitari, come ricoveri, accessi al pronto soccorso, certificazioni per esenzioni, ecc. Le diagnosi sono codificate con i codici ICD9, ICD10 e ICPC.
 
          
 
“Pharmacy File” - più record per soggetto. 
Contiene i dati sulle prescrizioni farmaceutiche e sul consumo di farmaci.
 
             
 
Il Database è stato costruito con passaggi successivi, a partire dalle specifiche che man mano sono state condivise con il gruppo di lavoro. 
Sono state utilizzate le fonti dati presenti sia a livello di flussi istituzionali (regionali o ministeriali), ma anche direttamente nei gestionali delle singole aziende. Sono stati considerati i flussi riguardanti: 
a) Ricoveri (produzione + mobilità passiva)
b) Specialistica ambulatoriale (produzione + mobilità passiva)
c) Farmaceutica (produzione + mobilità passiva, compresa la distribuzione diretta)
d) Pronto soccorso
e) Assistenza domiciliare integrata ed attività di Unità di Valutazione Multidimensionale
f) Psichiatria
g) Registro di patologie croniche dalle esenzioni ticket (anagrafe) 
h) Registro delle malattie rare (registro del Veneto)
Grazie a questi dati è stato possibile assemblare i tre files da cui ACG importa i dati per produrre il Database, in riferimento alla base anagrafica fornita dalla Regione.
Nei primi tre mesi di attività è stato prodotto un primo dataset, parzialmente completo, dal quale sono stati estrapolati i dati della popolazione assistita da un medico di base individuato per ciascuna Azienda per procedere con l’audit di quanto rilevato. Successivamente è stato costruito un database intermedio, completo in tutto eccettuati flussi di ADI e psichiatria.
Infine, al termine del primo semestre di attività è stato completato il database definitivo.
La descrizione analitica dei criteri adottati per la costruzione dei dataset per ACG e per la valorizzazione dei campi e riportata nell’appendice I.4.

 

Le fonti informative

Le fonti informative utilizzate per la costruzione dei dataset ACG delle ULSS di Padova e di Verona sono in gran parte quelle correntemente utilizzate dalle Aziende per la gestione dei flussi informativi sanitari. Con riferimento alle categorie di dati di base sopra elencate, sono stati elaborati i seguenti archivi :

1. Anagrafe sanitaria: persone residenti nella ULSS al 31/12/2011
 
2. Diagnosi
a. Archivio Schede di Dimissione Ospedaliera (flusso SDO) dell’anno 2011 – codici diagnosi ICD9-CM. Oltre alle SDO del 2011 sono state estratte anche le SDO degli anni 2006-2010 limitatamente ai ricoveri con diagnosi di patologia cronica al fine di assicurare una maggior copertura della rilevazione delle diagnosi croniche.
b. Archivio Accessi in Pronto Soccorso (flusso PS) dell’anno 2011 - codici diagnosi ICD9-CM.
c. Archivio Pazienti in Assistenza Domiciliare Integrata (flusso ADI) nell’anno 2011 - codici diagnosi ICPC.
d. Archivio valutazioni UVMD – codici diagnosi ICPC.
e. Archivio Persone con esenzione ticket attiva nel 2011 – codici diagnosi ICD9. Per i soggetti con codice esenzione generico (senza indicazione del codice ICD9 della patologia) sono state adottate le seguenti assunzioni:
esenti per tumore (cod. esenzione 048): ICD9 “199-Tumori maligni senza indicazione della sede”. Solo per esenzioni attive dal 2007.
esenti per ipertensione (cod. esenzione A31): ICD9 “4019-Ipertensione essenziale non specificata”.
Esenti per glaucoma (cod.esenzione 019): ICD9 “3659- Glaucoma non specificato”
f. Archivio Pazienti in Assistenza psichiatrica territoriale (flusso APS) nel 2011 - Diagnosi ICD10
g. Archivio pazienti presenti nel registro Malattie Rare del Veneto dal 2002 al 2011
 
3. Farmaci
a. Archivio Farmaceutica territoriale
b. Archivio distribuzione diretta farmaci e distribuzione per conto 
 
4. Costi
a. Assistenza ospedaliera: Archivio SDO – tariffe regionali
b. Assistenza ambulatoriale: Archivio prestazioni specialistiche ambulatoriali (flusso SPS) – tariffe nomenclatore tariffario regionale
c. Costo degli accessi domiciliari dei medici in assistenza programmata e ADIMED 
d. Costo degli accessi domiciliari di infermieri e terapisti – risultati indagine ad hoc  4 ULSS del Veneto
e. Costo dei farmaci acquistati nelle farmacie (compresa mobilità passiva)
f. Costo dei farmaci a distribuzione diretta e per conto (compresa mobilità passiva)

Per i flussi informativi SDO, specialistica ambulatoriale e farmaceutica sono state considerate anche le prestazioni, e i relativi costi, in mobilità passiva.

Validazione statistica

 Una delle fasi del processo di introduzione del sistema ACG nei diversi Paesi è la valutazione del grado di predittività dei costi (o delle risorse assistenziali impiegate) da parte del sistema attraverso l’applicazione di modelli di regressione ed il calcolo della quota di varianza spiegata (R quadrato).Sulla scorta delle esperienze documentate in letteratura, è stata condotta una analisi di regressione lineare finalizzata a valutare la relazione tra la stima dei costi ottenuta applicando i criteri descritti in Tabella 1 e le variabili potenzialmente esplicative dei costi, e cioè: età e sesso, patologie rilevate/case-mix e farmaci utilizzati.
Come si può osservare dalla Figura 1, la distribuzione del costo totale nella popolazione è fortemente asimmetrica, con una quota rilevante di soggetti con costo pari a zero e una lunga coda a destra, determinata da relativamente pochi soggetti che presentano però costi molto elevati (non rappresentati in Figura). Per questo motivo si è scelto di escludere dall’analisi i soggetti classificati nell’ACG “5200-Non utilizzatori” –per i quali non sono stati riscontrati né diagnosi né costi – e i soggetti con costi superiori al 97,5-mo percentile (“outliers”), in quanto necessitano di valutazioni specifiche.

 

               Figura 1. Distribuzione della popolazione per costo totale. Archivio integrato.

               Anno 2011 –  Distribuzione troncata al 95-mo percentile .

  

In definitiva, sulla casistica rimanente (circa l’80% del totale per entrambe le Aziende ULSS) sono stati costruiti quattro modelli di regressione lineare in step successivi, considerando come Variabile dipendente il costo totale e di volta in volta diverse variabili esplicative:
Modello 1: età in anni e sesso [costo=a+b1(eta)+b2(sesso)+]
Modello 2: età in anni, sesso, RUB (Resource Utilization Band – aggregazioni di ACG) [costo=a+b1(eta)+b2(sesso)+ b3(RUB)+]
Modello 3: età in anni, sesso, ACG [costo=a+b1(eta)+b2(sesso)+ b3(RUB)+]
Modello 4: età in anni, sesso, ACG, Rx-MG (Pharmacy Morbidity Groups – Gruppi diagnostici farmaco-correlati) [costo=a+b1(eta)+b2(sesso)+ b3(ACG)+ b4(Rx-MG)+]
La predittività dei costi da parte dei diversi modelli è stata valutata con l’indice R quadrato, che esprime la quota di varianza dei costi spiegata dal modello di regressione. In termini percentuali, più l’indice si avvicina a 100, più il modello è in grado di descrivere l’andamento dei costi osservati.
I risultati ottenuti, presentati in Tabella C.1, sono stati molto simili in entrambe le Aziende ULSS e nell’archivio intergrato, in particolare:
  1. le variabili demografiche (età e sesso) spiegano una quota molto ridotta della variabilità dei costi (inferiore al 10%);
  2. l’aggiunta di variabili esplicative che tengono conto delle patologie, aggregate secondo la logica del case-mix del sistema ACG, aumentano la quota di varianza spiegata di almeno il 26%;
  3. l’aggiunta dei gruppi diagnostici farmaco-correlati migliora la performance del modello di un ulteriore 10%.   

 

                                                                     Tabella 1. Risultati della Regressione lineare sui costi totali

  

 

 

Variabili esplicative

R quadrato

(costo < 97.5°pctl, ACG ≠ 5200)

ULSS 16
Padova

ULSS 20
Verona

Archivio integrato

Età, Sesso

10%

9%

9%

Età, Sesso, RUB

32%

31%

31%

Età, Sesso, Codici ACG

36%

37%

36%

Età, Sesso, Codici ACG, Rx_mg

48%

47%

47%

 
Le considerazioni che si possono trarre dall’analisi condotta sono di due tipi. La prima è che esiste una relazione tra il case-mix descritto dal sistema ACG e il consumo di risorse sanitarie e che quindi anche nella realtà veneta il sistema ACG è in grado di fornire, almeno in parte, una chiave di interpretazione dei costi. La seconda è che le diagnosi ricavate dai farmaci spiegano una quota rilevante della variabilità dei costi, molto superiore a quella riscontrata in esperienze condotte in altri Paesi (10% contro il 3-4 %). Il motivo è che in Veneto, come d’altronde nel resto d’Italia, il sistema informativo sanitario è in grado di intercettare solo una parte delle patologie della popolazione, cioè in buona sostanza solo quelle che richiedono il ricovero ospedaliero o l’esenzione dalla partecipazione alla spesa. Non vengono invece ancora rilevate e codificate all’interno del sistema informativo sanitario tutte quelle patologie che vengono trattate in ambito ambulatoriale o presso il medico di famiglia o con farmaci in automedicazione.