Politica

Regioni appese a un algoritmo che nessuno ha visto

Non basta riferirsi a un lista di indicatori generici, bisogna capire anche il peso di questi indicatori. Ad oggi, non è ancora chiaro come lavorino gli "algoritmi" che il Ministero avrebbe messo all'opera per decretare se una Regione è in zona gialla, arancione o rossa. Aprire la scatola nera e capire come - e se - funzionano questi algoritmi è cruciale: per la trasparenza e per evitare incomprensioni e polemiche

di Marcello Esposito e Marco Dotti

Da oggi, ci sono i colori: regioni chiuse, regioni aperte. Regioni mezze chiuse e mezze aperte. Inevitabili polemiche. Inevitabili, soprattutto dove la chiarezza latita. Quali parametri hanno escluso la Campania dal lockdown più stretto? Quali hanno incluso Lombardia e Piemonte?

Il nuovo DPCM del Governo Conte sembra chiaro: la suddivisione avviene in base a 21 indicatori messi a punto dall'Istituto superiore di Sanità-Comitato tecnico scientifico nell'aprile scorso.

L'applicazione degli indicatori è poi affidata – si legge sulla stampa – a due algoritmi. E qui, a nostro avviso, le cose si complicano.

Black box

Gli algoritmi dovrebbero elaborare una matrice del rischio. Ma qualche incongruenza comincia a emergere, anche se spesso affoga nei toni meramente polemici che condizionano il dibattito pubblico.

«Una volta accertata la qualità del dato – si legge nel decreto firmato dal Ministro Roberto Speranza il 30 aprile scorso – si procederà ad una valutazione del rischio, definito come la combinazione della probabilità e dell’impatto di una minaccia sanitaria. È possibile analizzare separatamente queste due condizioni per poi valutare il rischio complessivamente. In questo contesto specifico, la minaccia sanitaria è costituita dalla trasmissione non controllata e non gestibile di SARS-CoV-2, e si valuterà quindi il rischio legato alla probabilità di infezione/trasmissione in Italia e all’impatto, ovvero la gravità della patologia con particolare attenzione a quella osservata in soggetti con età superiore a 50 anni».

Tutto chiaro? A noi pare di no. Resta infatti da capire la black box degli algoritmi. Ovvero: tutto.

Per costruire un indice, di qualunque natura esso sia, è necessario elaborare una funzione (o algoritmo) che metta in relazione le variabili indipendenti (dette anche le “x”) con l’indice (detto anche la “y”). In base ai valori che assumono le “x” per i diversi soggetti che compongono l’universo di osservazione, l’algoritmo produce un valore per la “y”. In base ai valori della “y”, si stila la classifica dei soggetti rispetto ai quali le rilevazioni delle “x” sono state effettuate.

Gli algoritmi, questi sconosciuti

In termini formali e facendo riferimento all’indice di rischiosità in base al quale le regioni italiane sono state “colorate”, questi concetti si esprimono molto semplicemente così:

Y(i) = f ( X1(i), X2(i), …. , X21(i) )

dove Y(i) è l’indice di rischiosità della Regione i-esima, mentre X1(i), ….. X21(i) sono i valori dei 21 indicatori (posti letto occupati, R0, …..) sempre per la Regione i-esima.

Nelle forme più semplici, la funzione f () è lineare e quindi l’indicatore si ottiene attribuendo un peso alle 21 variabili:

Y(i) = a*X1(i) + b* X2(1) + …. + z* X21(i)

Dove a, b, …. z sono appunto i pesi.

Se si hanno a disposizione solo le definizioni delle “X”, ma non si conoscono né i valori né la forma funzionale di f(), è impossibile comprendere il motivo per cui alcune Regioni sono in zona rossa e altre in zona gialla.

Trasparenza: un dovere civico

A noi non risulta che lo schema di funzionamento di questi algoritmi sia disponibile. Ovviamente, se qualcuno l'ha visto si faccia avanti. In caso contrario, in base all’Open Data Act e in base alla promessa di trasparenza solennemente pronunciata in Parlamento dal Presidente del Consiglio, Professor Giuseppe Conte, sarebbe opportuno avere questi dati per comprendere natura e funzioni degli algoritmi utilizzati per includere o escludere le regioni da una delle tre zone (gialla, arancione, rossa) indicate dal DPCM.

Per un semplice, ma fondamentale dovere di trasparenza. Per una chiarezza civica e diradare ogni ombra e farla finita, una volta per tutte, con il rimpallo di responsabilità.

17 centesimi al giorno sono troppi?

Poco più di un euro a settimana, un caffè al bar o forse meno. 60 euro l’anno per tutti i contenuti di VITA, gli articoli online senza pubblicità, i magazine, le newsletter, i podcast, le infografiche e i libri digitali. Ma soprattutto per aiutarci a raccontare il sociale con sempre maggiore forza e incisività.