SARD: Synthetic Arabic Recognition Dataset

riotu-lab 's Collections

updated May 19

A large-scale synthetic Arabic OCR dataset comprising 843,622 book-style document images across 10 fonts, designed to advance VLM for Arabic Texts