We use cookies to enhance your browsing experience, serve personalised ads or content, and analyse our traffic.
By clicking "I accept", you consent to our use of cookies.

Dal feedback umano ai dati: RAG evaluation senza sorprese

Lingua: Italiano
Evento: M12 - RAG Night
Track 1
Orario: 19:45  -  20:15

Abstract

Valutare i sistemi RAG è complesso: il feedback umano è soggettivo, lento e non standardizzato, rendendo difficile misurare l’efficacia dei sistemi in scenari diversi. Aletheia nasce per risolvere questo problema. È un pacchetto Python che rende la valutazione dei sistemi RAG semplice, veloce e riproducibile. Grazie a metriche standardizzate, fornisce misure quantitative e oggettive delle performance.

L’intervento mostrerà come Aletheia analizzi sia la qualità dei contenuti recuperati (i chunk) sia quella delle risposte generate dai LLM, offrendo una visione completa e integrata del sistema. I team potranno così diagnosticare problemi, ottimizzare flussi di retrieval e generation e prendere decisioni basate su dati concreti.

Speaker