本記事はAIにより自動生成されています。内容に抜け漏れや不正確な記述が含まれる可能性があります。情報源は X投稿・GitHub更新・カレントアウェアネス・ポータルです。
デジタル人文学(DH)関連の新規ツール開発・公開情報を週次でまとめています。
みんなで翻刻くずし字OCRに認識可能文字数の拡張と高速化を実装
@yuta1984 氏により、みんなで翻刻くずし字OCRで認識可能な文字数が5,000文字から7,700文字に拡張されました。認識精度は落ちていないとのことです。
また、処理速度の大幅な高速化も実装されました。WebGPU対応環境では従来の90秒程度から10秒程度まで認識時間が短縮されたとされています。さらに、認識結果の逐次表示機能にも対応したとのことです。
- みんなで翻刻くずし字OCR
- 情報源:@yuta1984 の投稿
みんなで翻刻くずし字OCRにLLMによる現代語訳とIIIF画像読込機能を追加
@yuta1984 氏により、みんなで翻刻くずし字OCRにLLMを用いた現代語訳機能とIIIFマニフェストからの画像読込機能が追加されました。この機能は @tpWacky 氏のアイデアによるものとのことです。
LLMは Claude、ChatGPT、Gemini のモデルから選択でき、APIキーをユーザー側で取得してアプリに設定する方式で利用できるとされています。
- みんなで翻刻くずし字OCR
- 情報源:@yuta1984 の投稿・@tpWacky の投稿
コメント
…