Evaluace AI aplikací, nejen modelů.
Evals.cz je pražský meetup pro lidi, kteří staví nebo zkoumají produkty poháněné AI. Benchmarky modelů na leaderboardech jsou zajímavé, ale jak zhodnotit konkrétní RAG pipeline v produkci?
Hodnocení kvality retrievalu a celkových RAG pipeline v produkci
Jak odhalit a opravit problémy v nasazených AI systémech
Evaluační přístupy kombinující lidskou expertízu s automatizací
Integrace evaluací do vývoje a CI/CD pipeline
Nasazujete a monitorujete modely v produkci
Integrujete LLM nebo RAG do existujícího produktu
Měříte a vylepšujete výkon AI systémů
Potřebujete rozumět kvalitě AI funkcí
Studujete spolehlivost a bezpečnost AI
Praktický zájem a zvědavost jsou vítány
"Co se pokazilo v produkci a jak jsme to opravili" — žádné sales pitche