Costruire sistemi RAG su dati reali

Progetta e implementa una pipeline RAG completa: dati, embedding, retrieval, ranking e validazione su basi documentali reali.

Molti sistemi RAG funzionano in demo e falliscono quando vengono applicati a documentazione reale: retrieval poco rilevante, chunking inefficace, contesto mal costruito, risposte parziali o fuorvianti.

Questo corso è dedicato a chi vuole passare dalla teoria alla costruzione concreta di un sistema RAG. In una giornata intensiva viene affrontata l’intera pipeline: preparazione dei dati, generazione degli embedding, indicizzazione, retrieval, costruzione del prompt e valutazione delle risposte.

Il focus non è sulla definizione del pattern, ma sulle scelte tecniche che determinano la qualità finale: granularità dei chunk, strategie di ranking, gestione del contesto e misurazione delle performance.

Al termine del corso avrai un framework chiaro per progettare e migliorare un sistema RAG su dati reali, evitando gli errori più comuni.

1. Architettura di un sistema RAG

Componenti della pipeline end-to-end
Errori tipici nei primi prototipi
Trade-off tra semplicità e controllo
Quando RAG è la scelta corretta e quando no

2. Preparazione dei dati

Strategie di chunking e segmentazione
Granularità e sovrapposizione
Pulizia e normalizzazione dei contenuti
Impatto della struttura dei documenti sulla qualità del retrieval

3. Embedding e indicizzazione

Scelta e gestione degli embedding
Aggiornamento e versionamento
Vector store e strategie di indicizzazione
Performance, latenza e costi

4. Retrieval e ranking

Similarità semantica e limiti pratici
Filtri e query ibride
Reranking per migliorare la rilevanza
Riduzione del rumore nei risultati

5. Costruzione del contesto e generazione

Costruzione del prompt con contenuti recuperati
Gestione dei limiti di contesto
Riduzione delle allucinazioni
Strategie di grounding e citazione delle fonti

6. Valutazione della qualità

Metriche di rilevanza e copertura
Test manuali e dataset di valutazione
Analisi degli errori
Iterazione e miglioramento continuo

7. Portare un RAG in produzione

Aggiornamento della knowledge base
Monitoraggio e controllo dei costi
Versionamento della pipeline
Pattern architetturali per ambienti aziendali

Questo corso è tenuto da uno dei seguenti docenti:

Andrea Saltarello

CEO @ Improove

Andrea Saltarello è CEO di Improove e professore di Data Science ed AI presso la Graduate School of Management del Politecnico di Milano.

È co-autore di "Microsoft .NET: Architecting Applications for the Enterprise", pubblicato da Microsoft Press, autore di articoli tecnici per differenti testate editoriali e relatore presso eventi e conferenze internazionali quali: Codemotion, Microsoft Ignite Tour, WPC.

In qualità di Microsoft Regional Director, è advisor del senior leadership team di Microsoft Corporation, offrendo ad esso feedback strategico. Per il suo impegno a supporto delle community è stato annualmente premiato quale Microsoft Most Valuable Professional dal 2003 ad oggi.
Gian Maria Ricci

Software Architect @ Freelance

Gian Maria Ricci è Independent Consultant e Software Architect con decenni di esperienza nello sviluppo software, DevOps e architetture applicative. È Microsoft Most Valuable Professional (MVP) nella categoria Developer Technologies dal 2009, ruolo che riflette il suo impegno tecnico e nella community italiana di sviluppatori.
Ha iniziato a programmare in giovane età e, nel tempo, ha lavorato con un ampio spettro di tecnologie, maturando competenze consolidate nell'integrazione delle API, nei processi CI/CD, nel DevOps e nella progettazione di soluzioni moderne. Sebbene sia noto per competenze storiche in .NET e negli strumenti Microsoft, oggi concentra parte significativa del suo lavoro sull'integrazione di modelli linguistici avanzati e workflow AI-oriented nelle applicazioni enterprise.
È speaker frequentemente invitato a conferenze tech nazionali e internazionali e autore di percorsi formativi su temi come AI generativa applicata allo sviluppo, all’automazione e produttività degli sviluppatori, portando esempi concreti tratti dall’uso quotidiano degli strumenti moderni.

Requisiti

Esperienza di sviluppo software o data engineering
Familiarità con API e gestione di dati strutturati
Conoscenza di base dei modelli linguistici

Non è richiesta esperienza pregressa nella costruzione di sistemi RAG.

Cosa imparerai

Progettare una pipeline RAG completa su dati reali
Scegliere strategie efficaci di chunking e retrieval
Migliorare la rilevanza delle risposte generate
Valutare e ottimizzare un sistema RAG
Evitare gli errori più comuni nei primi prototipi

Durata (ore): 8
Max posti: 12
Lingua: Italiano

Vuoi organizzare una edizione del corso per la tua azienda? Contattaci!

CONTATTACI