T2-RAGBench: Text-and-Table Benchmark for Evaluating Retrieval-Augmented Generation
von Kutay Isgörür, Jan Strich, Martin Semmann, Maximilian Trescher, Chris Biemann
Jahr:
2026
Publikation:
arXiv
Abstrakt:
Since many real-world documents combine textual and tabular data, robust Retrieval Augmented Generation (RAG) systems are essential for effectively accessing and analyzing such content to support complex reasoning tasks. Therefore, this paper introduces T2-RAGBench, a benchmark comprising 23,088 question-context-answer triples, designed to evaluate RAG methods on real-world text-and-table data.
Link:
Read the paperAdditional Information
Brief introduction of the dida co-author(s) and relevance for dida's ML developments.
Kutay Isgörür
Während seines Physikstudiums an der Boğaziçi-Universität konzentrierte sich Kutay auf theoretische Physik und fand durch seine Mitarbeit in einer universitären Forschungsgruppe den Einstieg in das Gebiet des maschinellen Lernens. Er arbeitete an einer Reihe von Projekten im Bereich maschinelles Lernen, wobei er seine Fähigkeiten in den Bereichen Datenverarbeitung, Modelltraining und Analyse vertiefte. Derzeit setzt Kutay als Masterstudent an der Freien Universität Berlin seine Erkundung der Schnittstelle zwischen computergestützter Physik und maschinellem Lernen fort. Neben seinem Studium unterstützt er das Team für maschinelles Lernen bei dida.