Chat CircularsEvaluateAnalyze Obligations Admin

RAG Evaluation

Compare RAG pipeline answers against vanilla LLMs — scored by GPT-4o judge on 5 criteria.

Question

Ground Truth (optional)

Source Filter (optional)

Compare against

GPTGeminiCustom Answer

Powered by your RAG pipeline