概要
Google Colabを用いたNDL"古典籍"OCRアプリを作成しました。以下のURLからお試しいただけます。
https://colab.research.google.com/github/nakamura196/ndl_ocr/blob/main/NDL古典籍OCRの実行例.ipynb
NDL古典籍OCRの説明は以下です。
GitHub - ndl-lab/ndlkotenocr_cli: NDL古典籍OCRのアプリケーション(ソースコードを含む)
NDL古典籍OCRのアプリケーション(ソースコードを含む). Contribute to ndl-lab/ndlkotenocr_cli development by creating an account on GitHub.
また、ノートブックの作成にあたっては、@blue0620さんのノートブックを参考にしています。ありがとうございます!

Toru Aoike (@blue0620) on X
とりあえずGoogle colab版のサンプルコードを置いておきます。(最後のテキストデータの可視化のセルはたまに落ちます……なぜ……)
https://t.co/7NqLGq0fj9
今回作成したノートブックでは、入力フォーマットの追加や、Googleドライブへの保存機能などを追加しています。
使い方
NDLOCRアプリの使い方とほぼ同様です。以下の動画を参考にしてください。
工夫
工夫した点として、認識結果をIIIFマニフェストの形に変換し、Miradorビューアで閲覧できるようにしました。具体的には、以下のような出力が得られます。

後者のリンクをクリックすることで、以下のようなMiradorビューアが表示され、認識結果を確認することができます。

このIIIFマニフェストファイルも、Googleドライブに格納しています。
参考
NDLOCRのチュートリアルについては、以下を参考にしてください。

Google Colabを用いたNDLOCRアプリのVersion 2を作成しました。
Google Colabを用いたNDLOCRアプリのVersion 2を作成しました。
動画版(生成AIによる自動生成): この記事の内容をずんだもん×四国めたんの掛け合いで解説しています。自動生成のため、内容に誤りがある可能性があります。正確な情報は記事本文をご参照ください。


コメント
…