ALTO・PAGE入門 ― OCRの結果を「座標つき」で残す
OCR・HTRの結果を、ただの文字列でなく『画像のどこに何があったか』という座標つきで残す二つの標準 ALTO と PAGE を、初学者向けに概念から解説します。ページ→領域→行→単語の入れ子、座標が画像とテキストを結ぶ意味、ALTO(電子化・METS)とPAGE(解析・正解データ)の違い、IIIFやTEIへの橋渡しまでを図で見ていきます。
ALTOPAGEOCRHTRDigital Humanities
⚠ この解説は、AIによる実験的な取り組みです(構成・図・音声合成を含む)。不正確な内容を含む可能性があります。ご利用の際はご注意ください。
掛け合い解説(ずんだもん×四国めたん)
別バージョン
ナレーション解説
章立て
- 1
本編
なぜ座標つきで残すか・ページ→領域→行→単語の入れ子・ALTOとPAGEの違い・IIIF/TEIへの橋渡し
読み上げ原稿
- 0:00OCRの結果を「座標つき」で残す
- 0:34この動画について
- 1:15この回のゴール
- 1:52今日の流れ
- 2:141. なぜ「座標つき」で残すのか
- 2:25画像から文字を起こす ― その結果は?
- 2:53位置を捨てると、できなくなること
- 3:17座標が、画像とテキストを結ぶ
- 3:41ここまでの整理
- 4:082. 入れ子の構造
- 4:23紙面を、入れ子でとらえる
- 4:50領域には「種類」がある
- 5:16「読む順番」と「自信のほど」も残せる
- 5:45ここまでの整理
- 6:153. ALTO と PAGE
- 6:27ALTO ― 電子化の現場から
- 7:03ALTO は「中身」、METS は「束ね方」
- 7:28PAGE ― 研究・正解データから
- 8:02「正解データ」を作って、認識を鍛える
- 8:31二つの性格 ― どちらも「座標つきの結果」
- 9:06ここまでの整理
- 9:36座標つきだから、つながる
- 10:07ここで少し、考えてみよう
- 10:39まとめ
- 11:12出典・ライセンス
- 11:44ご清聴ありがとうございました

























