KolmOCR v251129
KolmOCR์ ๊ธฐ์กด์ olmOCR๋ฅผ ํ๊ตญ์ด ๋ฌธ์์ ํ์ตํ ๋ชจ๋ธ๋ก ์ด๋ฏธ์งยทPDF๋ฅผ ๊ตฌ์กฐํ๋ Markdown์ผ๋ก ๋ณํํฉ๋๋ค.
ํ์ต์ ํ์ฉ๋ ์ฝ๋
https://github.com/posicube-services/KolmOCR
KolmOCR Benchmark
- ํ/์ด๋ฏธ์ง/์ฝ๋/๊ทธ๋ํฝ ๋ฑ ๋ค์ํ ํ๊ตญ์ด ๋ฌธ์๋ฅผ ํฌํจํ Markdown ์์ฑ ๊ณผ์ ํ๊ฐ์ฉ ๋ฐ์ดํฐ ๋ฐ ํ๊ฐ ์คํฌ๋ฆฝํธ
- ๋ฐ์ดํฐ์
์์น:
kolmocr_benchํด๋ - ํ๊ฐ ์คํฌ๋ฆฝํธ:
olmocr/kolmocr_eval/scripts/evaluate.py
| Split | Docs | ํน์ง |
|---|---|---|
| fail document in qwen2.5 7b | 100 | Qwen2.5-7B-Instruct์ MD์์ฑ ์ฑ๋ฅ์ด ๋ฏธํกํ ๋ฌธ์์ |
| success document in qwen2.5 7b | 100 | Qwen2.5-7B-Instruct์ MD์์ฑ ์ฑ๋ฅ์ด ์ข์ ๋ฌธ์์ |
| table | 10 | ์ ๋ณํฉ/๋ฉํฐํค๋ ํฌํจ |
| graphic | 10 | ์ด๋ฏธ์ง ์บก์ ยท๋ํ |
| code_blocks | 10 | ์ฝ๋/๋ฆฌ์คํธ ํผ์ฌ |
| multicolumn | 10 | ๋ค๋จ๋ฌธ์ |
- ์๊ธฐ ๋ชจ๋ split์ ๋ํ
text_edit(Text),table_f1(Table)image_iou(Image IoU),f1_score(Heading, List) score๊ฐ ์ฌ์ฉ๋จ. Image IoU ํ์ฌ ํ๊ฐ ์ฝ๋์ ์ค๋ฅ๋ก N/A๋ก ํ์๋จ.
LeaderBoard using KolmOCR Benchmark
| Element | KolmOCR 7B v251129 (Ours) | Qwen2.5-VL-7B-Instruct | Qwen2.5-VL-32B-Instruct |
|---|---|---|---|
| Text | 0.5695 | 0.5993 | 0.5938 |
| Heading | 0.3099 | 0.3775 | 0.3197 |
| List | 0.1931 | 0.3256 | 0.2448 |
| Table | 0.5857 | 0.1333 | 0.364 |
| Image IoU | N/A | N/A | N/A |
| Code-Block | 0.0143 | 0.0321 | 0.037 |
Metrics
| ๋ฉํธ๋ฆญ | ์ค๋ช | ์ถ๋ ฅ ํ์ผ |
|---|---|---|
text_edit |
๋ณธ๋ฌธ ๊ธฐ์ค Normalized Edit Distance ๋ฐ ์ ์ฌ๋, ํค๋ฉ/๋ฆฌ์คํธ F1 ์ ์ | text_edit.csv |
table_f1 |
ํ ์ด๋ธ ๋ธ๋ก ๋งค์นญ ๊ธฐ๋ฐ precision/recall/F1 (๊ตฌ์กฐ/๋ด์ฉ ๋ชจ๋ ์ ๊ณต) | table_f1.csv |
image_iou |
์ด๋ฏธ์ง bbox ์์ ๋งค์นญ ๊ธฐ๋ฐ ํ๊ท IoU | image_iou.csv |
code_TED |
์ฝ๋ ๋ธ๋ก ์ถ์ถ ํ ์ธ์ด๋ณ ํธ๋ฆฌ ๋ณํ ๋ฐ Tree Edit Distance ์ ์ฌ๋ (์ง์: python, c, cpp, java) |
code_TED.csv |
overall |
์ฃผ์ ์งํ ํ๊ท : text_edit, reading_order, table_TEDS, table_TEDS_S, formula_cdm | overall.csv |
f1_score |
ํค๋ฉ/๋ฆฌ์คํธ ๊ตฌ์กฐ F1 ์ ์๋ง ๋ณ๋ ์ ์ฅ | f1_score.csv |
- Downloads last month
- 19