Roberto Vacca

Sanno copiare bene il mondo
ma spesso i modelli sbagliano

Gli strumenti con i quali cerchiamo di comprendere il mondo e di prevedere eventi futuri sono i modelli che la nostra mente è capace di costruire. Possono essere ingenui e intuitivi o sofisticati ed espressi in forma matematica. La loro applicazione ci ha fatto conseguire grandi successi conoscitivi, ma c'è sempre il rischio che ci inducano a credere in spiegazioni della realtà del tutto illusorie.

Conosciamo la realtà per esperienza o attraverso descrizioni di altre persone: poi la capiamo costruendone modelli. Questi possono essere qualitativi e basati sull'intuizione (dai livelli più bassi dei proverbi a quelli più alti prodotti dai saggisti). Costruiamo modelli quantitativi usando tabelle, formule o rappresentazioni geometriche. Ancora più elaborati sono i modelli costituiti da strutture meccaniche o elettromeccaniche o da programmi di computer, che obbediscono (o speriamo obbediscano) alle stesse leggi che governano un processo o un fenomeno reale. Con questi strumenti cerchiamo di capire il mondo e di prevedere eventi futuri. In che misura ci riusciamo?
Provo nelle pagine che seguono a illustrare i notevoli successi conseguiti con l'uso di modelli e a cautelare contro i rischi di utilizzare male i modelli e di credere a spiegazioni della realtà del tutto illusorie. E' illusorio il fine di creare modelli identici all'originale: Suarez Miranda (Viajes de varones prudentes, citato da Borges) racconta di geografi che costruirono la mappa di un impero così grande che coincideva puntualmente con l'impero stesso. Poi videro che la mappa era inutile e l'abbandonarono alle inclemenze del tempo (nei deserti se ne trovavano rimasugli abitati da animali e da mendicanti).

1.
Il cervello umano produce al suo interno immagini del mondo, ne nota regolarità, ne prevede sviluppi e, quindi, ne modifica alcune parti copiando in esse strutture organizzative che ha elaborato. Non sappiamo ancora bene come funziona questo processo in cui i sensi producono input e il cervello elabora. Talora interpreta bene la realtà - talora la distorce. «Tra le sicure maniere per conseguire la verità è l'anteporre le esperienze a qualsivoglia discorso, non essendo noi sicuri che in esso, almanco copertamente non sia contenuta la fallacia e non essendo probabile che una sensata esperienza sia contraria al vero». [G. Galilei, lettera a F. Liceti del 15 settembre 1640].
Newton scrisse che «dagli esperimenti e dalle osservazioni cercava di trarre conclusioni generali per induzione». Il metodo classico della scienza si può definire ipotetico-deduttivo. Dalle conclusioni generali si formulano ipotesi, da cui si deducono previsioni che vengono controllate con nuovi esperimenti e osservazioni. Le teorie vengono formalizzate in modelli semplificati (ad esempio quelli che considerano come punti materiali anche corpi di grandi dimensioni), la teoria dei quali permette di fare previsioni di eventi futuri. Secondo la nota formulazione di Karl Popper (si veda almeno il suo celebre Logica della scoperta scientifica), le teorie vengono confrontate con ulteriori esperimenti e tenute per buone finché non sono falsificate da nuove resultanze.

Le cose che ho scritto sopra sono note. Taluno combatte sia l'induttivismo sia il fallibilismo alla Popper, sostenendo che le leggi di natura che crediamo di scoprire sono soltanto convenzioni sull'uso delle parole, modi più o meno utili di parlare del mondo. Altri sottolineano che gli stessi fenomeni possono essere spiegati da teorie (e formule matematiche) molto diverse le une dalle altre. E' vero ma, in ogni caso, le teorie che continuiamo a usare devono permettere di prevedere i risultati di esperimenti od osservazioni future, almeno in certi intervalli di validità dei valori delle variabili. Un buon criterio induce a preferire teorie semplici ad altre più complicate. Se una variabile y ha valore zero, quando l'altra variabile x assume i valori 1, 2, 3, 4, 5, 6, è ragionevole pensare che, in quell'intervallo, y non dipenda da x (cioè che la relazione fra x e y sia rappresentata dall'asse delle x - la retta orizzontale per cui y=0). Meno probabile che valga la relazione y = xalla6 - 21xalla5 + 175xalla4 - 735xalla3 + 1624xalla2 -1764x + 720 che pure è perfettamente soddisfatta dalle coppie citate di valori di y e x. Per decidere misureremo quanto valga y per altri valori di x. E ricordiamo che perfino i migliori modelli e le più accreditate teorie fisiche rappresentano solo approssimazioni della realtà più o meno rozze.

2.
Quanto rozze? Molte misure di grandezze fisiche raggiungono precisioni notevoli (10alla-9). In molte applicazioni tecniche consideriamo buone le approssimazioni dell'1 per mille. Invece in campo socio-economico le fonti sono disparate e affette da rumore ed errori notevoli - e i modelli sono molto più rozzi. Qualunque sia il settore che ci interessa, è vitale la qualità dei dati misurati o ricostruiti. Se è alta potremo formulare teorie e previsioni accurate. Se è bassa potremo essere tratti in inganno notevole. Non basta usare formule matematiche per pretendere di avere eseguito analisi scientifiche - o vagamente credibili. La matematica si può usare per dimostrare che sono veri asserti e valutazioni del tutto false.

Si presta a usi perversi anche la matematica facile. Se un sistema di equazioni lineari algebriche è mal condizionato (se un vettore dei coefficienti di un'equazione è quasi combinazione lineare dei coefficienti di un'altra equazione) se ne trarranno soluzioni diversissime e illusorie1. Se il sistema modella le sollecitazioni in un telaio in cemento armato, il progetto ne risulta insensato. Anche la matematica più complessa presenta tranelli. Se certe equazioni contengono termini esponenziali, cresce il rischio di trovare soluzioni illusorie. Ad esempio, si fanno talora previsioni accurate con equazioni di Volterra-Verhulst del tipo: dx/dt = k (N - x) x, la cui soluzione x = N/[1 + e alla(Bt+C)] modella crescita e declino di popolazioni biologiche, di parchi di manufatti o di epidemie, molto accuratamente [errori standard (scarti quadratici) di 0,001]. Però non basta che l'errore standard sia basso, infatti equazioni che mirano ad asintoti diversi di più ordini di grandezza possono ben avere tutte errori standard piccoli. Occorre eseguire controlli più sofisticati per riuscire a determinare se l'equazione trovata abbia certe caratteristiche di unicità. Anche quando questo accade, talora un processo segue una legge per un certo intervallo di tempo e poi se ne discosta cominciando a seguire una equazione dello stesso tipo ma con decorso del tutto difforme.

La serie storica del parco auto italiano fino al 1977 mirava a un asintoto di 20 M. L'anno seguente ha cominciato a seguire una crescita più lenta che mira ora a 40 M (non molto credibile). Analogamente il numero di morti per cancro in Italia dal 1926 al 1944 seguiva una legge di crescita rapida che mirava a 50.000. Nel 1944 è cambiato e ha cominciato a crescere più lentamente mirando a 225.000.
Come dice Cesare Marchetti, i tipi di descrizioni (soluzioni) matematiche da impiegare devono avere un buon pedigree, cioè devono essere state usate con successo in migliaia di casi. Nel caso delle equazioni di Volterra è da tenere presente che talora permettono di prevedere l'avvenire con anni di anticipo (e dunque calcoliamole), ma non possiamo sapere a priori se funzioneranno o no sul medio e sul lungo termine.

3.
Particolarmente perversi sono i trasferimenti interdisciplinari indebiti. Secondo J. Bricmont (Science of chaos or chaos in science? ottenibile da bricmont@fyma.ucl.ac.be) la teoria del caos è applicata male da Prigogine. Citano a sproposito i processi caotici anche alcuni studiosi di dinamica dei sistemi come George Backus del Policy Assessment Corporation di Denver, Colorado: «Se un modello basato sulla dinamica dei sistemi fornisce soluzioni disperse e irregolari, questo è uno dei risultati più ricchi di informazione che possiamo ottenere, in quanto può anche indicarci se siano presenti fenomeni caotici e quale influenza abbiano sul comportamento del sistema» (Comunicazione su Bbs Systemdynamics 1996). Il concetto è errato: per riconoscere il caos dal rumore in fenomeni fisici, occorrono centinaia di migliaia di valori misurati - non una serie storica qualunque, magari di poche centinaia di valori osservati.

Negli anni '60 il professor Jay Forrester del Mit introdusse i modelli basati sulla dinamica dei sistemi e li applicò alla gestione di aziende e di città. L'applicazione al mondo intero costituì lo studio sui Limiti dello Sviluppo presentato al Club di Roma, che tentava di calcolare l'avvenire della situazione socio-economica del mondo usando poche variabili: popolazione, terreni coltivabili, risorse naturali, investimenti, produzione industriale e agricola, inquinamento, qualità della vita. Questi modelli contengono variabili che sono livelli (ad esempio investimenti nell'industria) e altre costituite da flussi (ad esempio produzione industriale). Ogni flusso è influenzato da vari livelli e ogni livello da vari flussi. Le equazioni che governano le variabili si arguiscono analizzandone le variazioni in funzione di altre variabili. Si determinano, così, in modo empirico i coefficienti di equazioni alle differenze finite che costituiscono il modello. Lo studio concludeva che entro pochi decenni si sarebbe verificata una grave crisi per l'esaurimento delle risorse naturali o per mancanza di alimenti dovuta alla sovrapopolazione o per l'accorciamento della vita umana causato dall'inquinamento. I fatti non confermarono quelle previsioni.

Queste procedure empiriche, infatti, possono condurre a previsioni divergenti anche se le equazioni si adattano bene ai dati storici. Il modello, inadeguato a formulare previsioni credibili, conteneva 150 equazioni. Pochi anni dopo, Mesarovic e Pestel costruirono un altro modello del mondo disaggregato in dieci regioni e sette settori di attività. Le equazioni usate erano migliaia; i coefficienti erano empirici e l'affidabilità delle previsioni era, di nuovo, scarsa. Il modello era tanto complesso che ebbe echi (e critiche) assai più scarsi. Infatti, se i modelli sono troppo complicati, accade spesso che teorie avanzate per descrivere i meccanismi, concetti modellistici, diagrammi di flusso, software e interpretazione dei risultati siano documentati in modo così ingombrante da impedire controlli e peers' review. Senza controllo, la credibilità è scarsa o nulla.

Dunque non si possono considerare affidabili le previsioni concernenti sistemi socio-economici complessi basate su modelli incrementali che usano equazioni banali del tipo f(t+ t) = f(t) + f(t) con parametri che determinano il f(t), modificati gradatamente finché non permettono un adeguato backcasting (consistente nello scegliere coefficienti basati, ad esempio, su dati fino al 1980, tali che il modello preveda, poi, accuratamente i valori delle variabili dal 1980 al momento presente). Le equazioni di Forrester-Meadows, poi, sono almeno basate su lunghe serie storiche. Le cose vanno peggio quando si tenta di calibrare i coefficienti delle equazioni su dati scarsi (magari riferiti a una sola ascissa temporale) - come tentano di fare anche studiosi con buone referenze accademiche.

4.
Un errore ripetuto spesso da studiosi della dinamica dei sistemi è quello di dar peso maggiore a variabili soft (intuitive) che a quelle hard (quantitative e misurate). Nel Maggio 1996 Jim Hines (del Mit) scriveva (comunicazione su Bbs Systemsdynamics) di preferire «i modelli che spiegano come le cose interagiscano a quelli che predicono punti futuri». Poi asseriva che «l'informazione sulle strutture risiede per la massima parte nelle teste dei manager, in misura minore nei loro scritti, in misura straordinariamente piccola in basi dati numeriche e in misura incredibilmente piccola nelle serie storiche.»! Il padre della dinamica dei sistemi, Jay W. Forrester, scriveva il 15 giugno 1997: «abbiamo nelle nostre teste tutta l'informazione necessaria per capire la natura dei sistemi sociali». L'opinione mi sembra avventata e di derivazione hegeliana. (Nel 1800 Hegel vantò di aver dimostrato logicamente che devono esistere 7 e solo 7 pianeti nel sistema solare, ma il 1 gennaio 1801 Piazzi scoprì Cerere. Poi se ne trovarono altri).

5.
Molti fra i non esperti sono pronti a credere ciecamente ai printout di un computer specie se usato in una università. Invece i computer sono macchine adattissime a produrre risultati apparentemente plausibili e tutti errati - per mala sorte (faciloneria, incompetenza, dati di partenza affetti da forte rumore) o per mala fede. Ripetiamo spesso che non bisogna confondere i modelli con la realtà che rappresentano. Però è arduo rispettare questo caveat perché i modelli (buoni o cattivi) costituiscono proprio il modo avanzato in cui la nostra mente comprende la realtà.


Nota

1 Ad esempio, il sistema
x=1 + [1 + 10alla-6] y
x=y
ha soluzione
x = y = -10alla6
ma se il coefficiente di y diventa [1- 10-6], cioè viene variato soltanto di 2 milionesimi, allora la soluzione diventa
x = y = + 10alla6
cioè cambia
da - 1.000.000 a + 1.000.000.