本記事はAIにより自動生成されています。内容に抜け漏れや不正確な記述が含まれる可能性があります。情報源は X投稿・GitHub更新・カレントアウェアネス・ポータルです。

デジタル人文学(DH)関連の新規ツール開発・公開情報を週次でまとめています。

みんなで翻刻くずし字OCRに認識可能文字数の拡張と高速化を実装

@yuta1984 氏により、みんなで翻刻くずし字OCRで認識可能な文字数が5,000文字から7,700文字に拡張されました。認識精度は落ちていないとのことです。

また、処理速度の大幅な高速化も実装されました。WebGPU対応環境では従来の90秒程度から10秒程度まで認識時間が短縮されたとされています。さらに、認識結果の逐次表示機能にも対応したとのことです。

みんなで翻刻くずし字OCRにLLMによる現代語訳とIIIF画像読込機能を追加

@yuta1984 氏により、みんなで翻刻くずし字OCRにLLMを用いた現代語訳機能とIIIFマニフェストからの画像読込機能が追加されました。この機能は @tpWacky 氏のアイデアによるものとのことです。

LLMは Claude、ChatGPT、Gemini のモデルから選択でき、APIキーをユーザー側で取得してアプリに設定する方式で利用できるとされています。