Aprire il Cofano
Il motore dell'Intelligenza Artificiale Predittiva e Generativa
Il motore dell'Intelligenza Artificiale Predittiva e Generativa
Questo percorso si imbocca partendo dalla presentazione 'Chiromanti, gatti e parole', che riporta tra le altre cose una sintesi dei risultati sperimentali ottenuti in Coding the Blues, dimostrando che come quelli che pensavamo fossero sentimenti tipici dell'uomo siano invece codificabili come numeri, e quindi potenziale oggetto di elaborazione da parte della IA (a sostegno della teoria della Chiromante Stocastica). Questa presentazione è seguita da un dialogo dello stesso tipo che la illustra vocalmente. Segue ancora il documento, sempre con il titolo 'Chiromanti, gatti e parole' che esplicita sotto forma di testo gli stessi concetti, accompagnato anch'esso da una sua sintesi vocale. Il pulsante Gioca al polo al Polo indossando una polo fa vedere come si modifica il vettore di embedding duranta una modifica semantica dovuta al contesto. Si continua poi offrendo approfondimenti specifici, dal 'Il viaggio di una barca' che usa una metafora marina per spiegare i fondamentali delle operazioni di algebra lineare e delle reti neurali. Concetti che vengono ripresi in 'Come vedono le macchine' sulla computer vision, nell'articolo 'Come pensa GPT', nella 'Rotta delle parole' e nel 'Viaggio delle parole' che ci fanno passare dalla IA predittiva a quella generativa, agganciando il concetto di significato. Il dialogo 'La metafora delle onde del mare' introduce alla spiegazione del componente chiave della generativa, il transformer, ed è introduzione al 'Il Mare, il Vento, la Boa', che utilizza questa metafora per spiegare come il transformer calcola il significato di un testo. Si continua con 'La baia protetta di NotebooKLM', su come funziona l'approccio RAG (Retrieval Augmented Generation), e in particolare NotebookLM e i vantaggi che l'uso di questa applicazione comporta. Affrontando il tema del training, 'Come impara una macchina' illustra l'addestramento delle reti neurali sulla base del documento prodotto da Gemini 'Il training di una rete neurale', mentre 'Il doppio volto dell'addestramento' illustra a grandi tratti le tecniche di addestramento dei modelli linguistici. Il documento 'La geometria delle reti neurali e del transformer' usa la metafora del paesaggio montano ('rugged landscape') per illustrare il funzionamento del training e dell'inferenza e spiegare fenomeni come la allucinazioni, usando concetti derivati da considerazioni termodinamiche e delle teorie dell'informazione e dei sistemi complessi, ma cercando di usare un linguaggio accessibile. Per facilitare le cose, segue una presentazione e un dialogo vocale.
Questa sezione contiene una presentazione di dettaglio di questa tecnologia e dei suoi principali impatti sociali e politici, denominata Manuale Popolare di Intellligenza Artificiale. Si tratta un 50-ina di slide compilate dopo una serie di esperimenti svolti su un modello linguistico scaricato in locale. Ogni slide è stata successivamente verificata nella sua fattualità, grazie a un lungo dialogo con Gemini. Delle note di approfondimento e un dialogo vocale ne facilitano la comprensione, mentre un glossario ne definisce i principali termini. Un'analisi molto interessante illustra un parallelo tra le classificazioni oggetto della Computer Vision e quelle dei modelli linguistici come BERT: 'Parallelo tra classificazioni fatte da modelli predittivi o modelli linguistici come BERT'. Il documento fondamentale 'Il training degli LLM e l'Autoattenzione' è nvece un dialogo con Gemini in cui si discute dei meccanismi di base di training di un LLM e del meccanismo di autoattenzione, come funzioni principali e centrali dei modelli linguistici. Lo stesso documento è discusso nel successivo omonimo podcast che assume un particolare valore didattico dal punto di vista della comprensione del funzionamento di un LLM. Un punto vista peculiare sull'Intelligenza Artificiale che si può riprendere anche analizzando i meccanismi entropici proposti dalla Teoria della Comunicazione di Shannon: è quanto si può leggere nel documento 'L'entropia di Claude Shannon', in cui si fa un parallelelo con il concetto di entropia di Ludwig Boltzmann, si usano metafore prelevate dai racconti di Luis Borges e si conducono analisi (a fini esplicativi) sulla lirica 'L'infinito' di Giacomo Leopardi e su altri esempi di testo.
I temi della generazione delle immagini, dei video, della IA Agentica e dei meccanismi alla base del Reasoning per la loro complessità, qui solo accennati. E poi cosa sono i Canvas. Ancora, una panoramica e una classificazione dei chatbot all'inizio del 2026 nel documento 'Guida ai Chatbot AI 2026'.