„Unter einer „Menge” verstehen wir jede Zusammenfassung M von bestimmten wohlunterschiedenen Objekten m unserer Anschauung oder unseres Denkens (welche die „Elemente” von M genannt werden) zu einem Ganzen.“
Georg Cantor
Frequently the messages have meaning; that is they refer to or are correlated according to some system with certain physical or conceptual entities. These semantic aspects of communication are irrelevant to the engineering problem. The significant aspect is that the actual message is one selected from a set of possible messages.
Concetto: «s. m. [dal lat. conceptus -us, der. di concipĕre «concepire»]. – 1. Pensiero, in quanto concepito dalla mente; più in particolare, anche dal punto di vista filosofico, la nozione che la mente si è formata dell’intima essenza di una data realtà (materiale o astratta), afferrando insieme i varî aspetti e i caratteri essenziali e costanti di questa realtà». Dizionario Treccani online.
Ricordo bene il mio stupore. Eravamo ancora nel vecchio, più piccolo, ma da me adorato, appartamento di via S., quando mio figlio, due, al massimo tre anni, nel vedere un oggetto diverso da quelli dello stesso genere visti prima, lo chiamò correttamente “sedia”. Come riuscì a riconoscerlo? Perché nella sua mente si era già formato il concetto di “sedia”.
Scrive Gerd Gigerenzer a pagina 102 del suo libro “Perché l’intelligenza umana batte ancora gli algoritmi” – Milano 2023, Raffaello Cortina Editore: «Gli umani hanno un concetto mentale di autobus. I bambini riescono a riconoscere un autobus dopo averne visto solo uno o pochi. Un autobus ha quattro pneumatici, fanali e un parabrezza, e la sua funzione è quella di trasportare molte persone. Una rete neurale profonda non ha un simile concetto di autobus e non conosce la sua funzione. Non sa neppure dove sia l’autobus nell’immagine. La sua intelligenza consiste nel trovare associazioni statistiche tra i pixel e nell’assegnare ai pixel delle probabilità. Maggiore è l’associazione, maggiore è la sicurezza della rete. Se gli elementi tipici degli oggetti si ripetono nell’immagine, la rete sarà più fiduciosa che l’oggetto esista nell’immagine. L’eclatante colore giallo inframezzato da righe nere diventa l’elemento tipico che ha rilevato. Questi colori vengono amplificati dalle strisce orizzontali.»
Per comprendere il significato di questa frase, ho immaginato di porre la stessa domanda a mio figlio e ad alla rete neurale: “perché affermi che si tratta di una sedia?”. Immagino che il primo avrebbe risposto: “Perché ha quattro gambe, una seduta, uno schienale ed è costruita da un uomo per far sedere un suo simile.” La rete neurale (meglio, il suo programmatore) avrebbe risposto: “Presa la sequenza di 0 e di 1 che costituisce la versione digitalizzata dell’immagine della sedia, misurata con un artificio matematico la distanza tra questa e una sequenza standard che mi sono costruito esaminando milioni di foto di oggetti che mi hanno detto essere “sedie”, trovo che la distanza è inferiore al valore prefissato per rispondere che quella nell’immagine è un esemplare di “sedia”. Se mi confermi che ho indovinato, posso aggiornare i miei parametri di valutazione e, in questo senso, affermare che io imparo.” A tutti gli effetti, le due risposte sarebbero molto diverse.
IL CONCETTO DI “CONCETTO”
Cosa intendiamo per “concetto”? La definizione riportata nell’incipit tratta dal vocabolario Treccani online non è di molto aiuto; sono convinto che se dovessimo precisare tutti i termini che in essa compaiono finiremmo nella circolarità. La questione è vecchia come l’Intelligenza Artificiale (come mostra la citazione nell'incipit, è persino antecedente: l'aveva già compresa Claude Shannon nel suo celebre articolo sulla teoria dell'informazione; concetti e significato vanno a braccetto). Anzi, possiamo dire che i pionieri di questa disciplina lavorarono sodo per realizzare software che riproducessero il modo di pensare degli esseri umani, e i loro sforzi non sono stati vani. Secondo il modello entità – relazioni, i “concetti” sono elenchi di attributi (i cosiddetti “campi”) atti a descriverli. Merito di Edgar F. Codd è stato quello di eliminare il “solipsismo” delle entità, che sembravano vivere ciascuna di vita propria, introducendo le relazioni tra esse, che permettono di generare rappresentazioni sistemiche del mondo. Lo sviluppo successivo è la OOP (Programmazione Orientata agli Oggetti) di cui ho già parlato altrove.
Per quanto io ne so, ma potrei sbagliarmi, non esiste ancora un software in grado di generare, dalla mera osservazione della realtà, un proprio modello entità-relazioni. Voglio dire, possiamo immaginare una tabella o una classe che contenga tutte gli attributi necessari ad identificare al meglio una sedia (numero di gambe, colore, materiali, ecc.), tuttavia se vogliamo estendere questo software per ricomprendere anche gli sgabelli, è necessario l’intervento del programmatore. A mio figlio, al contrario, sarebbe stato sufficiente mostrargli un esemplare di sgabello, spiegargli che questo nuovo oggetto è simile ad una sedia, ma non è una sedia, e si chiama “sgabello”. Come afferma Gigerenzer, non serve che gli mostri un milione di sgabelli: visti due di essi, nella sua mente si forma già il concetto di “sgabello”. [1] [2]
DOVE RISIEDONO I CONCETTI?
Dove risiedono i concetti? Anche ipotizzando che la mente possieda un’intrinseca capacità di generare, classificare e ordinare i concetti, rimane il fatto che il cervello, a livello materiale, è costituito da neuroni tra loro connessi tramite assoni, ecc. sui cui corrono segnali di natura elettrica. La rappresentazione in termini di potenziale e corrente elettrica del concetto di sedia è, evidentemente, completamente diversa dall’immagine di sedia che ciascuno di noi possiede nella propria testa. È questa domanda che ispirò John Von Neumann alla scrittura del libro “Computer e cervello” (https://www.ilsaggiatore.com/libro/computer-e-cervello-2) già nel 1958. Ed è da questo libro che prende il via lo sviluppo delle reti, guarda caso, dette “neurali”, tentativo di riprodurre, ad un livello elementare, la funzionalità del cervello, non della mente. Non sappiamo come effettivamente il cervello riconosca una sedia e, a priori, per quanto, a me, questo possa sembrare improbabile, non possiamo escludere che utilizzi un qualche metodo “statistico”.
Per risolvere questi problemi, mi permetto di esporre una teoria alternativa che si basa sulla “teoria delle idee” di Platone.
PLATONE 4.0 E L’IPER-WEB
Di Platone e della sua teoria delle idee ho già parlato altrove; per quanto assurda, è indubbio che la teoria elimina qualsiasi perplessità inerente la conoscenza, aprendo tuttavia nuove difficoltà concernenti il rapporto tra anima e corpo e la collocazione dell’Iperuranio. Per questo ho riesaminato e aggiornato la teoria.
Tutto comincia con un’esperienza personale. È normale oggi che nelle aziende la gestione dei computer sia centralizzata: tutti ricevono modelli simili e, soprattutto, a meno di dettagli ininfluenti, con la stessa configurazione iniziale. Durante il loro uso, capita che i PC manifestino comportamenti strani, che talvolta rasentano il paranormale: il mouse che non funziona come ti attendi, programmi che non rispondono ai comandi, connessioni che si interrompono senza motivo, ecc. fino al blocco totale della macchina. Contrariamente alle aspettative, questi fenomeni si manifestano sempre alle stesse persone, di solito quando sono molto concentrate sull’attività che svolgono al terminale. Ipotizzo allora che il cervello sia in grado di emettere onde cerebrali che interferiscono con l’elettronica del computer e che tali fenomeni siano la manifestazione di queste onde, evidentemente prodotte in maniera più intensa proprio dai cervelli di quelle persone. Tale ipotesi è sufficiente per una moderna teoria platonica della conoscenza.
L’anima non è più necessaria. L’iperuranio non è trascendente, ma immanente ed accessibile ai cervelli umani tramite le onde cerebrali; in pratica, come in un WI-FI universale, ciascun cervello si connette all’iperuranio, che potremmo chiamare ora Iper-WEB, ed opera il download della conoscenza. Non escludo che i sogni siano spiegabili in termini di connessione che rimane attiva durante il sonno (chi si disconnette, non sogna).
Come in ogni rete che si rispetti, ogni cervello ha la propria chiave di accesso, il che giustifica la mancanza di interferenza tra cervelli, che tuttavia – per l’ineliminabile presenza del rumore – talvolta si manifesta (telepatia). L’unica difficoltà è dimostrare sperimentalmente l’esistenza delle onde cerebrali, il cui sottofondo deve essere elettromagnetico, altrimenti non potrebbero interferire con le apparecchiature elettroniche. Ci sto lavorando; accetto suggerimenti. [3]
Ciò detto, il titolo del libro di Gigerenzer tradisce le aspettative. Salvo affermare che gli algoritmi non saranno mai in grado di affrontare l’imprevisto – argomento che richiede una riflessione dedicata – lo psicologo tedesco non ha altri argomenti per dimostrare che gli algoritmi non potranno, un giorno, replicare il funzionamento della mente umana. Mostra, invero, che le reti neurali funzionano in maniera significativamente diversa dal cervello umano e che - malauguratamente - gli uomini fanno un cattivo uso degli algoritmi, spesso travalicando le intrinseche limitazioni che questi hanno, ma questo è un tema completamente diverso.
Mi rimane una domanda: le numerose e sparse sculture di sedie giganti (vedi foto sopra), come le classificherebbe la rete neurale? E mio figlio? E voi? [4]
NOTE
1 Teoria delle Categorie
Definire i concetti attraverso elenchi di attributi sposta solo il problema dalla definizione di “oggetto” a quella di “attributo”. A questo problema cercò di rispondere, secondo me, Aristotele con la sua teoria delle categorie. Secondo Wikipedia https://it.wikipedia.org/wiki/Categoria_(filosofia) : «Per Aristotele le categorie sono i gruppi o i generi sommi che raccolgono tutte le proprietà che si possono predicare dell'essere. Sono i predicamenti dell'essere, che si riferiscono a qualità primarie (l'essenza immutabile degli oggetti), o secondarie (gli accidenti che possono cambiare). Le categorie sono in tutto dieci: la sostanza, la qualità, la quantità, la relazione, il dove, il quando, lo stare, l'avere, l'agire, il subire. Ogni elemento della realtà può essere fatto rientrare in una di queste categorie.).». Gli attributi, dunque, non sono infiniti, ma possono ricondursi alle dieci categorie fondamentali. Come è noto, il concetto viene ripreso e migliorato da Kant; a tale proposito è interessante quanto riportato nella medesima pagina: «A differenza dunque di Aristotele, per il quale le categorie appartenevano alla realtà ontologica dell'essere, le categorie kantiane appartengono all'intelletto; diventano cioè delle funzioni a priori, dei modi di funzionare del nostro pensiero che inquadrano la realtà secondo i propri schemi precostituiti. Non si applicano alla realtà in sé, ma solo al fenomeno.». In sintesi, il filosofo tedesco (anticipando Gigerenzer 😊) aveva già compreso che il nostro cervello possiede la straordinaria e curiosa capacità di organizzare i dati sensibili in una struttura di database relazionale. Facoltà posta alla base della sua teoria degli insiemi da Georg Cantor (vedi citazione nell'incipit).
A mio avviso, questa capacità non è esclusiva della specie umana, ma almeno di tutti i mammiferi; non capirei, altrimenti, come potrebbe sopravvivere un gatto se il suo cervello ne fosse privo. Una conseguenza importante di questa affermazione è che la capacità di formare i concetti deve essere antecedente alla creazione del linguaggio e, in tal senso, “primordiale”.
2 Elementi di Euclide
Gli elementi di Euclide possono essere visti come un tentativo di ricondurre un mondo molto semplificato, quello della geometria piana, a pochi concetti essenziali. Come è noto, il matematico di Alessandria dovette comunque fermarsi ad alcuni “concetti primitivi”, identificati in “punto”, “retta” e “piano”. Alla fine dell’Ottocento, il matematico tedesco David Hilbert chiarì tuttavia che quei concetti non hanno nulla a che vedere con la rappresentazione elementare che lo studente si fa (il “puntino” o la “linea diritta” tracciata con la matita sul foglio), quanto con le relazioni tra quelli esistenti. Tutto ciò che conta è che:
per due punti passa una sola retta;
due rette si incontrano in un solo punto, fatto salvo il caso in cui siano parallele.
Questa particolarità la si ritrova anche nei modelli di dati: le gerarchie o i modelli a stella, ad esempio, possiedono tutti la stessa struttura (sono tra loro isomorfi), il che sembrerebbe suggerire che siano più importanti le relazioni che le entità stesse.
3 Tesi di Church-Turing e computer analogici
Facezie a parte, la questione non è quella posta da Gigerenzer, ma quella posta da Douglas S. Hofstadter nei capitoli XXVII e seguenti del suo classico “Gödel, Escher e Bach”, Adelphi 1979.
Che le reti neurali non riproducano il funzionamento della mente o che Deep Blue non giochi a scacchi come Kasparov significa solo che, almeno fino ad oggi, non disponiamo di algoritmi in grado di riprodurre quei comportamenti. Il fine di creare una macchina imbattibile nel gioco degli scacchi da un umano è già stato raggiunto. Per il riconoscimento facciale, ci siamo molto vicini (o, forse, lo abbiamo raggiunto, non sono aggiornato sul tema). Che questi non siano risultati raggiunti in maniera analoga a come opera il cervello umano potrebbe anche non essere considerato un limite (che il pilota automatico di un aereo non funzioni come il cervello del pilota non impedisce l’utilizzo del pilota automatico). Il problema è la veridicità della tesi di Church-Turing, vale a dire che tutti i processi mentali umani possono (se preferite: potranno un giorno) essere riprodotti tramite la manipolazione di simboli.
Negare la tesi comporta contestualmente proporre un modello computazionale alternativo e, per quanto ne so, l’unica possibilità è costituita dal computer analogico. La questione è intrigante: in tutti i casi il discreto può riprodurre con la precisione voluta il continuo? Nel suo famoso articolo "On Computable Numbers, with an Application to the Entscheidungsproblem", Alain Turing dimostra l’esatto contrario: esistono numeri reali che non sono calcolabili (da una macchina di Turing, ma neppure da un processo mentale umano!). Anzi, questi costituiscono la normalità e quelli calcolabili (come pi-geco) l’eccezione! Si potrebbe tuttavia sostenere che questa sia una “patologia matematica” di nessuna applicazione ai casi concreti.
Un computer analogico non soffre, per definizione, di questa limitazione ed è in grado di “calcolare” qualsiasi numero reale, sebbene non sia in grado di rappresentarlo come sequenza infinita di cifre. In effetti non mi è chiaro perché i computer analogici siano stati esclusi come modello alternativo a quelli digitali, tuttavia qualcuno ci sta ancora lavorando! https://www.elettronicanews.it/dal-computer-tradizionale-al-computer-neurale/ e https://it.wikipedia.org/wiki/Memristore
4 La sedia rotta
Tra le molte sculture di sedie giganti, la mia preferita è la Broken Chair - Wikipedia. Nonostante l’assenza di una gamba, noi riconosciamo benissimo che si tratta di una sedia. Quante gambe si devono togliere perché quello che vediamo cessi di essere una sedia?
Comments