We use cookies to enhance your browsing experience, serve personalised ads or content, and analyse our traffic.
By clicking "I accept", you consent to our use of cookies.

Costruire sistemi RAG su dati reali

Progetta e implementa una pipeline RAG completa: dati, embedding, retrieval, ranking e validazione su basi documentali reali.

Molti sistemi RAG funzionano in demo e falliscono quando vengono applicati a documentazione reale: retrieval poco rilevante, chunking inefficace, contesto mal costruito, risposte parziali o fuorvianti.

Questo corso è dedicato a chi vuole passare dalla teoria alla costruzione concreta di un sistema RAG. In una giornata intensiva viene affrontata l’intera pipeline: preparazione dei dati, generazione degli embedding, indicizzazione, retrieval, costruzione del prompt e valutazione delle risposte.

Il focus non è sulla definizione del pattern, ma sulle scelte tecniche che determinano la qualità finale: granularità dei chunk, strategie di ranking, gestione del contesto e misurazione delle performance.

Al termine del corso avrai un framework chiaro per progettare e migliorare un sistema RAG su dati reali, evitando gli errori più comuni.


1. Architettura di un sistema RAG

  • Componenti della pipeline end-to-end
  • Errori tipici nei primi prototipi
  • Trade-off tra semplicità e controllo
  • Quando RAG è la scelta corretta e quando no

2. Preparazione dei dati

  • Strategie di chunking e segmentazione
  • Granularità e sovrapposizione
  • Pulizia e normalizzazione dei contenuti
  • Impatto della struttura dei documenti sulla qualità del retrieval

3. Embedding e indicizzazione

  • Scelta e gestione degli embedding
  • Aggiornamento e versionamento
  • Vector store e strategie di indicizzazione
  • Performance, latenza e costi

4. Retrieval e ranking

  • Similarità semantica e limiti pratici
  • Filtri e query ibride
  • Reranking per migliorare la rilevanza
  • Riduzione del rumore nei risultati

5. Costruzione del contesto e generazione

  • Costruzione del prompt con contenuti recuperati
  • Gestione dei limiti di contesto
  • Riduzione delle allucinazioni
  • Strategie di grounding e citazione delle fonti

6. Valutazione della qualità

  • Metriche di rilevanza e copertura
  • Test manuali e dataset di valutazione
  • Analisi degli errori
  • Iterazione e miglioramento continuo

7. Portare un RAG in produzione

  • Aggiornamento della knowledge base
  • Monitoraggio e controllo dei costi
  • Versionamento della pipeline
  • Pattern architetturali per ambienti aziendali

Questo corso è tenuto da uno dei seguenti docenti:

  • CEO @ Improove

    Andrea Saltarello è CTO di Managed Designs e founder di Improove.

    È docente della School of Management del Politecnico di Milano, occupandosi dei corsi master dedicati a Big Data ed Intelligenza Artificiale, e relatore presso eventi e conferenze internazionali quali: CodemotionMicrosoft Ignite Tour, WPC.

    È autore di articoli tecnici per differenti testate editoriali e co-autore di "Microsoft .NET: Architecting Applications for the Enterprise", pubblicato da Microsoft Press.

    In qualità di Microsoft Regional Director, è advisor del senior leadership team di Microsoft Corporation, offrendo ad esso feedback strategico. Per il suo impegno a supporto delle community è stato annualmente premiato quale Microsoft Most Valuable Professional dal 2003 ad oggi.

  • Software Architect @ Freelance

    Gian Maria Ricci è Independent Consultant e Software Architect con decenni di esperienza nello sviluppo software, DevOps e architetture applicative. È Microsoft Most Valuable Professional (MVP) nella categoria Developer Technologies dal 2009, ruolo che riflette il suo impegno tecnico e nella community italiana di sviluppatori.

    Ha iniziato a programmare in giovane età e, nel tempo, ha lavorato con un ampio spettro di tecnologie, maturando competenze consolidate nell'integrazione delle API, nei processi CI/CD, nel DevOps e nella progettazione di soluzioni moderne. Sebbene sia noto per competenze storiche in .NET e negli strumenti Microsoft, oggi concentra parte significativa del suo lavoro sull'integrazione di modelli linguistici avanzati e workflow AI-oriented nelle applicazioni enterprise.

    È speaker frequentemente invitato a conferenze tech nazionali e internazionali e autore di percorsi formativi su temi come AI generativa applicata allo sviluppo, all’automazione e produttività degli sviluppatori, portando esempi concreti tratti dall’uso quotidiano degli strumenti moderni.

Requisiti

  • Esperienza di sviluppo software o data engineering
  • Familiarità con API e gestione di dati strutturati
  • Conoscenza di base dei modelli linguistici

Non è richiesta esperienza pregressa nella costruzione di sistemi RAG.

Cosa imparerai

  • Progettare una pipeline RAG completa su dati reali
  • Scegliere strategie efficaci di chunking e retrieval
  • Migliorare la rilevanza delle risposte generate
  • Valutare e ottimizzare un sistema RAG
  • Evitare gli errori più comuni nei primi prototipi
Durata (ore)
8
Max posti
12
Lingua
Italiano

CONTATTACI