📜くずし字の文字検出・古典籍OCRをPython非依存でJS/Next.jsに移植し、ONNX量子化とライブラリ化まで試したノート
くずし字・古文書の文字検出(YOLOv11)と NDL古典籍OCR-Lite(RTMDet+PARSeq)を Python なしで JS/Next.js(onnxruntime-node)に移植した記録。ONNX 変換、SAHI、行検出、int8 量子化の精度比較、Vercel で動かない理由、コアのライブラリ化までをまとめます。
くずし字・古文書の文字検出(YOLOv11)と NDL古典籍OCR-Lite(RTMDet+PARSeq)を Python なしで JS/Next.js(onnxruntime-node)に移植した記録。ONNX 変換、SAHI、行検出、int8 量子化の精度比較、Vercel で動かない理由、コアのライブラリ化までをまとめます。

YOLOv11xモデルをHugging Faceに公開する

YOLOv11xと日本古典籍くずし字データセットを用いた文字の検出モデルの構築

mdx.jpを用いてYOLOv11のクラス分類(くずし字認識)の学習を試す

Hugging Face SpacesとYOLOv5モデル(顔コレデータセットで学習済み)を使った推論アプリの構築

ModuleNotFoundError: No module named 'huggingface_hub.utils._errors'対応

YOLOv5モデル(文字領域検出)を使った推論アプリ

Hugging Face SpacesとYOLOv5モデル(NDL-DocLデータセットで学習済み)を使った推論アプリの修正

ultralyticsplus: ValueError: Invalid CUDA 'device=0' requested...への対処

ultralytics/yolov5でのAttributeErrorへの対応

Hugging Face SpacesでJSONを返却する

NDL-DocLデータセットとYOLOv5を用いたレイアウト抽出モデルを作成しました。

AWS Lambdaを用いた物体検出API(Flask + yolov5)の構築

Flaskを用いてyolo5モデルを公開するリポジトリのECRとAWS App Runnerでの使用方法