View in English

TEIカスタマイズ入門 ― ODDでスキーマと出力を仕立てる

巨大なTEIを、自分の資料に合わせて「仕立てる」カスタマイズの考え方を、初学者向けに概念から解説する約15分の動画。設計図 ODD(One Document Does it all)を真ん中に置き、そこから生成される検証用スキーマ(RELAX NG/DTD、補足でSchematron)による妥当性検証と、出力を宣言する Processing Model(→HTML/PDF等)までを図で見る。TEI入門の続編。実装の細部には踏み込まない。

TEIODDRELAX NGDTDSchematronProcessing ModelXMLDigital Humanities
⚠ この解説は、AIによる実験的な取り組みです(構成・図・音声合成を含む)。不正確な内容を含む可能性があります。ご利用の際はご注意ください。

掛け合い解説(ずんだもん×四国めたん)

別バージョン

ナレーション解説

章立て

  1. 1

    本編

    TEIは巨大→カスタマイズ・設計図ODD・Romaで生成・妥当性検証・RELAX NG/DTD/Schematron・Processing Modelで出力宣言・ODD一枚から検証も出力も・解釈・始め方

    読み上げ原稿

    • 0:00ODDでスキーマと出力を仕立てる

      皆さん、こんにちは。デジタル・ヒューマニティーズ入門、技術要素シリーズを担当します、なかむらさとるです。この回のテーマは、TEIの、カスタマイズです。とても大きな、TEIを、自分の資料に合わせて、仕立てる。その中心にあるのが、オーディーディーという、設計図です。初学者向けに、図を交えながら、ゆっくり見ていきます。プログラミングの細かい話には、あまり立ち入りませんので、どうぞ気楽について来てください。

      ODDでスキーマと出力を仕立てる
    • 0:37この動画について

      はじめに、この動画について、簡単に、ご案内します。この動画は、クリエイティブ・コモンズ(CC)で、公開されている、オープンな教材を、参照しつつ、独自に、構成した、解説です。スライドと、図は、新規に作成し、ナレーションは、本人の声をもとにした、AIの、音声合成で、つくっています。あくまで、実験的な、取り組みですので、内容は、ご確認・ご注意のうえ、ご利用ください。もし、誤りに、気づかれたら、概要欄から、ご指摘いただけると、たすかります。出典と、ライセンスは、動画の最後と、概要欄に、まとめてあります。それでは、本編に、入りましょう。

      この動画について
    • 1:30この回のゴール

      まず、この回のゴールを、確認しておきましょう。目標は、大きく、四つです。一つめは、TEIは、巨大なので、使う分を、選ぶ、つまり、カスタマイズが、要る、ということを、説明できること。二つめは、オーディーディーが、スキーマと、文書を生み出す、単一の、設計図だと、説明できること。三つめは、妥当性検証の、役割と、リラクシングや、ディーティーディーの、違いの概要を、イメージできること。そして四つめは、プロセシングモデルで、出力を、オーディーディーの中に、宣言できる、という発想を、説明できることです。略語が、いくつか出てきますが、一つずつ、ほどいていきますので、ご安心ください。

      この回のゴール
    • 2:28今日の流れ

      今日の流れです。はじめに、なぜ、TEIを、仕立てる必要があるのか。つぎに、設計図、オーディーディー。それから、オーディーディーから生まれる、検証、つまり、スキーマ。そして、オーディーディーから生まれる、出力、プロセシングモデル。最後に、自分で始めるための、手がかりを、紹介します。

      今日の流れ
    • 2:57なぜ「仕立てる」のか

      それでは、はじめましょう。まずは、なぜ、TEIを、仕立てる必要があるのか。TEIの、大きさから、見ていきます。

      なぜ「仕立てる」のか
    • 3:09TEIは、とても大きい

      図を、見てください。TEIには、数百もの、要素が、用意されています。とても、大きな、規格です。けれども、ひとつの資料で、実際に、使う要素は、ふつう、ほんの一部だけです。全部を、覚えて、使う必要は、ありません。

      TEIは、とても大きい
    • 3:32自分の資料に合わせて選ぶ

      そこで、行うのが、カスタマイズです。図のように、TEIという、大きな道具箱の中から、この資料で、使う分だけを、選び取ります。使える要素を、あらかじめ、絞っておくと、書く人も、読む人も、迷いにくくなります。何を、使ってよいかが、はっきりするからです。

      自分の資料に合わせて選ぶ
    • 3:58設計図 ― ODD

      その、選んだ内容を、一枚に、まとめたものが、オーディーディーです。ワン・ドキュメント・ダズ・イット・オール、の頭文字で、ひとつの文書で、すべてをまかなう、という意味です。図のように、どの要素を使うか、どんな制約をかけるか、そして、その説明を、ひとつの設計図に、まとめます。おもしろいことに、この設計図の、中身もまた、TEIで、書かれています。プロジェクトにとっての、単一の、よりどころ、になります。

      設計図 ― ODD
    • 4:38ここまでのポイント

      ここで、いったん、整理します。TEIは、巨大で、ひとつの資料で使うのは、ふつう、一部だけでした。使う分を、選ぶのが、カスタマイズで、書く人も、読む人も、迷わなくなる。そして、その選択を、一枚にまとめた設計図が、オーディーディーで、中身も、TEIで書く、のでした。では、この設計図から、何が生まれるのでしょう。まずは、検証のための、スキーマから、見ていきます。

      ここまでのポイント
    • 5:18ODDから「検証」が生まれる

      ここからは、オーディーディーから、検証が、生まれる、というお話です。スキーマと、妥当性検証について、見ていきます。

      ODDから「検証」が生まれる
    • 5:30ODDから、まとめて生成する

      図を、見てください。設計図、オーディーディーを、ローマや、oXygen、といった、ツールに、通すと、いくつもの、スキーマが、まとめて、生成されます。リラクシング、ディーティーディー、W3C・スキーマ、それに、スキマトロン。さらに、人間が読むための、HTMLや、ピーディーエフの、ドキュメントも、いっしょに出てきます。設計図、一枚から、いろいろなものが、自動で、作られる、というわけです。

      ODDから、まとめて生成する
    • 6:08妥当性検証 ― ルールに合っているか

      では、スキーマは、何のために、あるのでしょう。図のように、スキーマは、いわば、ルールです。あなたの、TEI文書を、そのルールと、照らし合わせて、合っているか、もし違うなら、どこが違うかを、機械が、点検してくれます。これを、妥当性検証、と呼びます。人手では、見落としがちな、間違いも、機械なら、すばやく、見つけられます。

      妥当性検証 ― ルールに合っているか
    • 6:39スキーマ言語 ― RELAX NG と DTD

      検証のための、スキーマには、いくつかの、書き方があります。図で、二つを、比べてみましょう。ひとつは、ディーティーディー。古くから、使われてきた方式で、データの種類を、細かく指定するのが、苦手だったり、名前空間の、扱いが、難しかったりします。もうひとつが、リラクシング。こちらは、いまの、主流で、表現力が高く、名前空間にも対応していて、TEIでも、主に、これが、使われます。どちらも、妥当性検証の、ための、スキーマ言語です。

      スキーマ言語 ― RELAX NG と DTD
    • 7:20もうひとつ ― Schematron

      もうひとつ、紹介しておきたいのが、スキマトロンです。図のように、これは、もし、こういう要素があるなら、この属性を、必ず付けること、といった、規則の形で、縛るしくみです。たとえば、日付の要素には、機械可読な、属性を、必ず付ける、というような、約束ごとです。文法だけでは、表しきれない、こうした、取り決めを、点検できるのが、特徴です。

      もうひとつ ― Schematron
    • 7:53ここまでのポイント

      ここまでを、整理します。オーディーディーを、ローマなどに、通すと、スキーマと、説明が、まとめて、生成されました。スキーマを使えば、妥当性検証、つまり、文書がルールに、合っているかを、機械が、点検できる。ディーティーディーは、古くからの方式で、リラクシングが、いまの主流。規則で縛る、スキマトロンも、ありました。検証は、ただ、正しさを、保つだけでなく、決めたルールを、みんなで守るための、土台になります。そして、同じ設計図からは、じつは、出力も、生まれます。

      ここまでのポイント
    • 8:37ODDから「出力」が生まれる

      ここからは、オーディーディーから、出力が、生まれる、というお話です。プロセシングモデルについて、見ていきます。

      ODDから「出力」が生まれる
    • 8:47Processing Model ― 出力を宣言する

      プロセシングモデルとは、図のように、それぞれの要素を、どのように、出力するかを、オーディーディーの中で、宣言する、しくみです。たとえば、この要素は、見出しとして出す、この要素は、ひとつの、かたまりとして出す、というふうに、出し方を、書いておきます。ふつうなら、変換のための、プログラムを、手で書く必要がありますが、それを、設計図の中の、宣言で、すませられる、というわけです。

      Processing Model ― 出力を宣言する
    • 9:201つの宣言から、多くの形式へ

      この、宣言の、うれしいところは、図のように、宣言は、一か所で、よい、という点です。一度、出し方を、宣言しておけば、そこから、HTML、ピーディーエフ、ラテフ、イーパブ、といった、さまざまな形式へ、自動で、出し分けることが、できます。形式ごとに、別々の、変換を、書かなくて、よくなるのです。

      1つの宣言から、多くの形式へ
    • 9:49ODD一枚から、検証も出力も

      ここで、全体像を、もう一度、見ておきましょう。図のように、設計図、オーディーディーを、真ん中に、置きます。すると、左側には、検証のための、スキーマが、右側には、出力のための、プロセシングモデルが、生まれます。検証も、出力も、同じ、一枚の設計図から、生まれてくる。これが、TEIの、カスタマイズの、大きな、見取り図です。

      ODD一枚から、検証も出力も
    • 10:21ここまでのポイント

      ここまでを、整理します。プロセシングモデルは、それぞれの要素の、出し方を、オーディーディーの中で、宣言する、しくみでした。変換のプログラムを、手書きせずに、ひとつの宣言から、HTMLや、ピーディーエフなど、多くの形式へ、出し分けられる。そして、設計図、オーディーディー、一枚から、検証も、出力も、生まれる、のでした。仕組みが、見えてきたところで、少し、立ち止まって、考えてみましょう。

      ここまでのポイント
    • 10:59考えてみよう

      ここで、少し、考えてみましょう。あなたが、扱っている資料を、TEIで、書くとしたら、どの要素を、使うでしょうか。そして、どれを、必ず付ける、必須に、するでしょうか。人名、日付、注記。どこまで、使い、どこを、縛るか。よろしければ、ここで一度、動画を止めて、思い浮かべてみてください。

      考えてみよう
    • 11:30カスタマイズは、編集方針の表明

      いまの、問いには、大事な点が、ひそんでいます。どの要素を使い、どこを、必須にし、どこを、任意にするか。これは、機械的に、決まるものでは、ありません。それは、この資料で、何を、どこまで、記述するか、という、編集上の、判断です。縛りを、強くすれば、データは、そろいやすくなり、ゆるくすれば、柔軟になります。どちらが、よいかは、目的しだいです。オーディーディーは、そうした、方針を、明文化して、みんなで、共有するための、場でもあります。技術であると同時に、すぐれて、編集的な、営みなのです。

      カスタマイズは、編集方針の表明
    • 12:19始め方・学ぶには

      では、自分でも、始めてみたい、と思ったら、どうすれば、よいでしょう。まず、触れてみるなら、ローマという、ブラウザの上で、使える、TEI・カスタマイズの、生成ツールで、要素を選んで、スキーマを、出してみるのが、よい、入り口です。実際に、書いて、検証するなら、oXygen、などの、エディタが、よく使われます。体系的に、学ぶなら、TEI・ガイドラインの、カスタマイズの章や、ダリア・キャンパスの、TEI教材が、あります。出力まで、試したいなら、プロセシングモデルに、対応した、ツールを、使ってみましょう。まずは、小さな、オーディーディーを、一枚、作って、スキーマを、生成し、検証してみる。そこが、出発点に、なります。

      始め方・学ぶには
    • 13:13まとめ

      今日の、まとめです。巨大な、TEIは、使う分を、選んで、仕立てる。これが、カスタマイズでした。その選択を、まとめた設計図が、オーディーディーで、単一の、よりどころに、なります。オーディーディーから、スキーマ、リラクシングや、ディーティーディーが、生まれ、妥当性検証が、できる。さらに、プロセシングモデルで、出力も、宣言でき、多くの形式へ、出し分けられる。タグを、付ける、TEIの、次の一歩として、設計図を、一枚、書けば、検証も、出力も、地続きで、つながっていく。そんな、見通しを、持って、いただけたなら、うれしいです。

      まとめ
    • 13:58出典・ライセンス

      この動画は、海外で、オープンライセンスのもとに、公開されている、教材を、参照して、作成しました。主なものは、ダリア・キャンパスの、テキスト・エンコーディングと、TEIに関する、教材で、クリエイティブ・コモンズ(CC)の、表示ライセンスで、公開されています。あわせて、事実確認には、TEI・ガイドラインの、カスタマイズの章や、公式の、ローマも、参照しました。スライドと、図は、これらを、参考にしたうえで、あらためて、新規に、作成したものです。

      出典・ライセンス
    • 14:33ご清聴ありがとうございました

      以上で、TEI・カスタマイズの、入門を、終わります。大きな規格を、自分の資料に、合わせて、仕立てる。その設計図、一枚から、検証も、出力も、生まれる。その、考え方の、第一歩を、つかんでいただけたなら、と思います。ご清聴、ありがとうございました。

      ご清聴ありがとうございました