Costruire sistemi RAG su dati reali
Progetta e implementa una pipeline RAG completa: dati, embedding, retrieval, ranking e validazione su basi documentali reali.
Molti sistemi RAG funzionano in demo e falliscono quando vengono applicati a documentazione reale: retrieval poco rilevante, chunking inefficace, contesto mal costruito, risposte parziali o fuorvianti.
Questo corso è dedicato a chi vuole passare dalla teoria alla costruzione concreta di un sistema RAG. In una giornata intensiva viene affrontata l’intera pipeline: preparazione dei dati, generazione degli embedding, indicizzazione, retrieval, costruzione del prompt e valutazione delle risposte.
Il focus non è sulla definizione del pattern, ma sulle scelte tecniche che determinano la qualità finale: granularità dei chunk, strategie di ranking, gestione del contesto e misurazione delle performance.
Al termine del corso avrai un framework chiaro per progettare e migliorare un sistema RAG su dati reali, evitando gli errori più comuni.
1. Architettura di un sistema RAG
- Componenti della pipeline end-to-end
- Errori tipici nei primi prototipi
- Trade-off tra semplicità e controllo
- Quando RAG è la scelta corretta e quando no
2. Preparazione dei dati
- Strategie di chunking e segmentazione
- Granularità e sovrapposizione
- Pulizia e normalizzazione dei contenuti
- Impatto della struttura dei documenti sulla qualità del retrieval
3. Embedding e indicizzazione
- Scelta e gestione degli embedding
- Aggiornamento e versionamento
- Vector store e strategie di indicizzazione
- Performance, latenza e costi
4. Retrieval e ranking
- Similarità semantica e limiti pratici
- Filtri e query ibride
- Reranking per migliorare la rilevanza
- Riduzione del rumore nei risultati
5. Costruzione del contesto e generazione
- Costruzione del prompt con contenuti recuperati
- Gestione dei limiti di contesto
- Riduzione delle allucinazioni
- Strategie di grounding e citazione delle fonti
6. Valutazione della qualità
- Metriche di rilevanza e copertura
- Test manuali e dataset di valutazione
- Analisi degli errori
- Iterazione e miglioramento continuo
7. Portare un RAG in produzione
- Aggiornamento della knowledge base
- Monitoraggio e controllo dei costi
- Versionamento della pipeline
- Pattern architetturali per ambienti aziendali
Questo corso è tenuto da uno dei seguenti docenti:
-
Andrea Saltarello è CTO di Managed Designs e founder di Improove.
È docente della School of Management del Politecnico di Milano, occupandosi dei corsi master dedicati a Big Data ed Intelligenza Artificiale, e relatore presso eventi e conferenze internazionali quali: Codemotion, Microsoft Ignite Tour, WPC.
È autore di articoli tecnici per differenti testate editoriali e co-autore di "Microsoft .NET: Architecting Applications for the Enterprise", pubblicato da Microsoft Press.
In qualità di Microsoft Regional Director, è advisor del senior leadership team di Microsoft Corporation, offrendo ad esso feedback strategico. Per il suo impegno a supporto delle community è stato annualmente premiato quale Microsoft Most Valuable Professional dal 2003 ad oggi.
-
Gian Maria Ricci è Independent Consultant e Software Architect con decenni di esperienza nello sviluppo software, DevOps e architetture applicative. È Microsoft Most Valuable Professional (MVP) nella categoria Developer Technologies dal 2009, ruolo che riflette il suo impegno tecnico e nella community italiana di sviluppatori.
Ha iniziato a programmare in giovane età e, nel tempo, ha lavorato con un ampio spettro di tecnologie, maturando competenze consolidate nell'integrazione delle API, nei processi CI/CD, nel DevOps e nella progettazione di soluzioni moderne. Sebbene sia noto per competenze storiche in .NET e negli strumenti Microsoft, oggi concentra parte significativa del suo lavoro sull'integrazione di modelli linguistici avanzati e workflow AI-oriented nelle applicazioni enterprise.
È speaker frequentemente invitato a conferenze tech nazionali e internazionali e autore di percorsi formativi su temi come AI generativa applicata allo sviluppo, all’automazione e produttività degli sviluppatori, portando esempi concreti tratti dall’uso quotidiano degli strumenti moderni.
Requisiti
- Esperienza di sviluppo software o data engineering
- Familiarità con API e gestione di dati strutturati
- Conoscenza di base dei modelli linguistici
Non è richiesta esperienza pregressa nella costruzione di sistemi RAG.
Cosa imparerai
- Progettare una pipeline RAG completa su dati reali
- Scegliere strategie efficaci di chunking e retrieval
- Migliorare la rilevanza delle risposte generate
- Valutare e ottimizzare un sistema RAG
- Evitare gli errori più comuni nei primi prototipi
- Durata (ore)
- 8
- Max posti
- 12
- Lingua
- Italiano