Evals.cz

Evaluace AI aplikací, nejen modelů.

Evals.cz je pražský meetup pro lidi, kteří staví nebo zkoumají produkty poháněné AI. Benchmarky modelů na leaderboardech jsou zajímavé, ale jak zhodnotit konkrétní RAG pipeline v produkci?

Co řešíme

🔍

Kvalita RAG systémů

Hodnocení kvality retrievalu a celkových RAG pipeline v produkci

⚠️

Regrese v produkci

Jak odhalit a opravit problémy v nasazených AI systémech

👥

Human-in-the-loop

Evaluační přístupy kombinující lidskou expertízu s automatizací

⚙️

Vývojový lifecycle

Integrace evaluací do vývoje a CI/CD pipeline

Pro koho je to

ML/AI inženýři

Nasazujete a monitorujete modely v produkci

Backend vývojáři

Integrujete LLM nebo RAG do existujícího produktu

Datoví vědci

Měříte a vylepšujete výkon AI systémů

Produktoví manažeři

Potřebujete rozumět kvalitě AI funkcí

Výzkumníci AI

Studujete spolehlivost a bezpečnost AI

Začátečníci vítáni

Praktický zájem a zvědavost jsou vítány

Formát meetupu

Místo Kanceláře Apify
Formát 1-3 krátké přednášky + diskuse
Jazyk Především angličtina
Atmosféra Neformální, přátelská, praktická
"Co se pokazilo v produkci a jak jsme to opravili" — žádné sales pitche

Partneři