I'm thrilled to share that our paper, KRETA: Korean Reading and rEasoning in Text-rich VQA Attuned to diverse visual contexts, has been published at the EMNLP 2025 Main Conference.
This year’s acceptance rate was highly competitive—only 22.16% of 8,174 submissions were selected as Main papers. KRETA introduces a comprehensive benchmark for evaluating Korean reading and reasoning in text-rich Visual Question Answering, spanning 15 domains and 26 image types.
Furthermore, we built a semi-automatic VQA generation pipeline optimized for text-rich environments to ensure data quality. We hope KRETA will serve as a strong foundation for advancing multilingual vision-language models and Korean NLP research.
As a co-author, I'm excited to contribute to advancing multilingual vision-language model research.

저희 논문 KRETA: Korean Reading and rEasoning in Text-rich VQA Attuned to diverse visual contexts가 EMNLP 2025 Main Conference에 출판되었습니다.
올해 Main paper 경쟁률은 매우 높았습니다. 전체 8,174편 중 22.16%만 Main paper로 선정되었습니다. KRETA는 15개 도메인과 26개 이미지 유형을 아우르며, 텍스트가 많은 이미지에서 한국어 읽기와 추론 능력을 평가하는 종합 벤치마크입니다.
또한 데이터 품질을 높이기 위해 text-rich 환경에 맞춘 반자동 VQA 생성 파이프라인을 구축했습니다. KRETA가 다국어 비전 언어 모델과 한국어 NLP 연구를 발전시키는 든든한 기반이 되기를 바랍니다.
공동저자로서 다국어 비전 언어 모델 연구에 기여할 수 있어 기쁩니다.
