日本語で見る

Introduction to DTS (Distributed Text Services)

A beginner-friendly introduction to DTS (Distributed Text Services), a community-built specification for accessing collections of text through a standardized API. Covers the three endpoints (Collection, Navigation, Document), citation structure and references, JSON-LD and TEI/XML responses, and interoperability—framed as the text counterpart to IIIF for images. An experimental, independently-composed video referencing open CC-licensed materials.

DTSDistributed Text ServicesTEIJSON-LDFAIRDigital Humanities
⚠ This explainer is an experimental, AI-assisted production (including its structure, figures, and synthesized narration). It may contain inaccuracies—please use it with discretion.

Dialogue walkthrough (VOICEVOX)

Other versions

Narrated explanation

Chapters

  1. 1

    Main

    Narration script

    • 0:00テキストに共通の「窓口」をつくる

      皆さん、こんにちは。デジタル・ヒューマニティーズ入門、技術要素シリーズを担当します、なかむらさとるです。この回のテーマは、DTS、ディストリビューテッド・テキスト・サービシズです。少し聞き慣れない名前かもしれませんが、テキストのコレクションに、共通の作法で触れるための、いわば共通の窓口をつくる仕組みです。初学者向けに、図を交えながら、ゆっくり見ていきます。プログラミングの細かい話には、あまり立ち入りませんので、どうぞ気楽について来てください。

      テキストに共通の「窓口」をつくる
    • 0:37この動画について

      はじめに、この動画について、簡単に、ご案内します。この動画は、クリエイティブ・コモンズ(CC)で、公開されている、オープンな教材を、参照しつつ、独自に、構成した、解説です。スライドと、図は、新規に作成し、ナレーションは、本人の声をもとにした、AIの、音声合成で、つくっています。あくまで、実験的な、取り組みですので、内容は、ご確認・ご注意のうえ、ご利用ください。もし、誤りに、気づかれたら、概要欄から、ご指摘いただけると、たすかります。出典と、ライセンスは、動画の最後と、概要欄に、まとめてあります。それでは、本編に、入りましょう。

      この動画について
    • 1:25この回のゴール

      まず、この回のゴールを、確認しておきましょう。目標は、大きく、四つです。一つめは、DTSが、テキストに、共通の、エーピーアイで、触れるための、仕様だと、説明できること。二つめは、三つの、エンドポイント、コレクション、ナビゲーション、ドキュメントの、役割を、区別できること。三つめは、引用構造という、考え方と、JSON-LDや、TEI・XMLで、データが、返る流れを、イメージできること。そして四つめは、DTSに、準拠すると、相互運用に、つながる、ということを、説明できることです。略語が、いくつか、出てきますが、一つずつ、ほどいていきますので、ご安心ください。

      この回のゴール
    • 2:19今日の流れ

      今日の流れです。はじめに、なぜ、テキストに、共通の、窓口が、要るのかを、考えます。つぎに、DTSの、仕組み、三つの窓口を、順に、見ます。それから、どんなデータで、つながるのか。そして、どこを、一単位として、指すか、という、少し、考えさせられる話。最後に、自分で、始めるための、手がかりを、紹介します。

      今日の流れ
    • 2:50なぜ「窓口」が要るのか

      それでは、はじめましょう。まずは、なぜ、テキストに、共通の、窓口が、要るのか。テキストを、配るときの、困りごとから、見ていきます。

      なぜ「窓口」が要るのか
    • 3:03テキストはばらばらに公開されがち

      図を、見てください。テキストの、データは、しばしば、サイトごとに、ばらばらに、公開されています。あるところは、ホームページとして、別のところは、独自の、ダウンロード、また別のところは、独自の、取り出し方。置き場も、形式も、触り方も、まちまちだと、人が、一つずつ、見るぶんには、よくても、プログラムで、まとめて、扱おうとすると、なかなか、たいへんです。

      テキストはばらばらに公開されがち
    • 3:34共通の「窓口」があれば

      そこで、もし、図のように、どのテキストにも、共通の、窓口、つまり、標準化された、エーピーアイが、あったら、どうでしょう。置き場が、違っても、同じ、作法で、触れます。すると、データが、見つけやすく、たどり着きやすく、ほかのデータと、かみ合いやすく、再利用しやすく、なっていきます。この、四つの、頭文字を、とって、フェア、と、呼ぶことがあります。テキストを、フェアな、状態に、近づける、というわけです。

      共通の「窓口」があれば
    • 4:10DTS=テキストに触れるための共通API

      その、共通の、窓口を、定めたのが、DTS、です。図のように、利用する側が、お願い、つまり、リクエストを、送ると、DTSという、標準エーピーアイを、通して、テキストの、コレクションから、データが、返ってきます。中身の、置き方が、違っても、同じ、作法で、触れるのが、ねらいです。この仕様は、研究者たちの、コミュニティが、長い時間を、かけて、策定したもので、二〇二六年に、正式版が、公開されました。

      DTS=テキストに触れるための共通API
    • 4:47画像の「あれ」を、テキストにも

      ここで、すでに、ご存じの方も、いるかもしれない、ものと、つなげておきましょう。図を、見てください。資料の、画像については、IIIF、という、共通の、作法が、広く、使われています。DTSは、いわば、その、テキスト版、と、考えると、イメージしやすいかもしれません。画像を、共通の、ビューアで、ひらけるのと、同じように、テキストも、共通の、道具で、扱えるように、しよう、という、同じ、発想です。

      画像の「あれ」を、テキストにも
    • 5:22ここまでのポイント

      ここで、いったん、整理します。テキストは、置き場も、形式も、取り出し方も、ばらばらに、なりがちでした。そこに、共通の、窓口、標準エーピーアイが、あれば、同じ、作法で、触れて、フェアに、近づきます。それを、定めた仕様が、DTSで、画像の、IIIFと、同じ発想の、テキスト版でした。では、その、窓口は、具体的に、どんな、形を、しているのでしょう。つぎは、三つの、エンドポイントを、見ていきます。

      ここまでのポイント
    • 6:01DTSの仕組み

      ここからは、DTSの、仕組みです。三つの、窓口、エンドポイントを、順番に、見ていきましょう。

      DTSの仕組み
    • 6:10まずは入口(エントリーポイント)

      まずは、入口です。図を、見てください。DTSでは、最初に、入口、エントリーポイントを、叩きます。すると、そこから、これから、見ていく、三つの窓口、コレクション、ナビゲーション、ドキュメントの、それぞれの、場所、つまり、URLが、返ってきます。だから、利用する側は、どこに、何があるかを、いちいち、覚えていなくても、まず、入口に、たずねれば、迷わず、先へ、進めます。

      まずは入口(エントリーポイント)
    • 6:46① コレクション ― テキストの「間」

      一つめの、窓口は、コレクションです。これは、テキストの、間を、たどるための、窓口です。図のように、大きな、コレクションの中に、たとえば、叙事詩集、抒情詩集、散文集、といった、まとまりがあり、その中に、個々の、作品が、収められています。どんな作品が、あるのか、コレクションの中を、渡り歩いて、目的の、テキストを、見つける。そんな、役割です。

      ① コレクション ― テキストの「間」
    • 7:19② ナビゲーション ― テキストの「内」

      二つめの、窓口は、ナビゲーションです。こちらは、一つの、テキストの、内側を、たどります。図のように、たとえば、イリアスという、テキストが、第一巻、第二巻、と、分かれ、さらに、その中が、ぎょうに、分かれている。こうした、引用構造、いわば、目次のような、階層を、たどって、テキストの、どこに、何があるかを、知るための、窓口です。

      ② ナビゲーション ― テキストの「内」
    • 7:50引用構造 ― 「ここ」を指す住所

      この、引用構造には、大切な、役割が、あります。図のように、イリアスの、第一巻の、いちぎょうめ、というふうに、引用できる、一つの単位に、住所を、あたえるのです。この、住所のことを、レフ、と、呼びます。レフを、使えば、テキスト全体ではなく、その中の、どこを、呼び出すのかを、ぶれずに、指し示すことが、できます。本文の、ある、一か所を、正確に、引く、ための、目印、と、いえます。

      引用構造 ― 「ここ」を指す住所
    • 8:27③ ドキュメント ― 本文そのもの

      三つめの、窓口が、ドキュメントです。これは、本文、そのものを、取り出すための、窓口です。図のように、テキスト、全体を、まるごと、受け取ることも、できますし、さきほどの、住所で、指した、一部分だけを、受け取ることも、できます。この、一部分のことを、チャンク、と、呼びます。必要な、ところだけを、取り出せる、というのは、大きな、テキストを、扱ううえで、便利な、点です。

      ③ ドキュメント ― 本文そのもの
    • 9:013つの窓口、それぞれの役割

      三つの、窓口を、整理しておきましょう。図のように、コレクションは、テキストの、間を、たどって、作品を、選ぶ窓口。ナビゲーションは、テキストの、内側、引用構造を、たどる窓口。ドキュメントは、本文、そのものを、全体でも、部分でも、取り出す窓口でした。入口で、場所を、知り、間から、内へ、そして、本文へと、降りていく。これが、DTSの、基本の、流れです。

      3つの窓口、それぞれの役割
    • 9:38どんなデータでつながるのか

      ここからは、少し、視点を、変えて、どんな、データで、つながるのか。返ってくる、データの、形を、見ていきます。

      どんなデータでつながるのか
    • 9:48一覧や目次は JSON-LD で返る

      コレクションと、ナビゲーション、つまり、一覧や、目次の、応答は、JSON-LDという、形式で、返ってきます。図のように、作品や、巻、本文の、冒頭などが、タイトル、とか、次の巻、といった、関係の線で、つながっています。これは、前回、見た、リンクトデータと、同じ考え方で、機械が、意味の、つながりを、たどれる形に、なっている、ということです。

      一覧や目次は JSON-LD で返る
    • 10:21本文は TEI/XML で返る

      一方、ドキュメントが、返す、本文は、TEI・XMLという、形式です。図のように、ぎょうなどの、構造を、あらわす、タグごと、本文が、返ってきます。これは、前回の、テキスト符号化の回で、見た、人文テキストの、標準的な、書き方です。タグが、ついたまま、受け取れるので、ただの、文字の、かたまりではなく、構造を、生かしたまま、研究に、使うことが、できます。

      本文は TEI/XML で返る
    • 10:56同じ本文を、別々のたどり方で

      もう一つ、おもしろい、点を、紹介します。図のように、一つの、テキストに、引用構造を、複数、持たせることが、できます。たとえば、ページと、ぎょう、という、見た目の、単位で、たどる、たどり方と、歌と、句、という、作品の、単位で、たどる、たどり方を、両方、用意しておく。すると、同じ、本文を、目的に、応じて、別々の、たどり方で、引くことが、できるのです。

      同じ本文を、別々のたどり方で
    • 11:31一度そろえれば、道具を選べる

      こうして、作法を、そろえておくと、何が、うれしいのでしょう。図のように、DTSに、対応した、道具であれば、ビューアでも、検索ツールでも、分析プログラムでも、作り直すことなく、そのまま、ひらけます。一度、共通の、形で、公開すれば、いろいろな、道具が、そのまま、使える。これが、相互運用、と、呼ばれる、利点です。

      一度そろえれば、道具を選べる
    • 12:04ここまでのポイント

      ここまでを、整理します。一覧や、目次、つまり、コレクションと、ナビゲーションは、JSON-LDで、本文、つまり、ドキュメントは、TEI・XMLで、返るのでした。一つの、本文に、引用構造を、複数、持たせて、別々の、たどり方で、引くこともできます。そして、作法を、そろえるからこそ、いろいろな、道具で、ひらける、相互運用に、つながります。仕組みが、見えてきたところで、少し、立ち止まって、考えてみましょう。

      ここまでのポイント
    • 12:48考えてみよう

      ここで、少し、考えてみましょう。あなたが、ふだん、扱っている、テキストを、コレクション、そのなかの、テキスト、そして、テキストの、部分、というふうに、分けると、どうなるでしょうか。そして、どこを、引用できる、一単位に、するのが、よいでしょう。よろしければ、ここで一度、動画を、止めて、思い浮かべてみてください。

      考えてみよう
    • 13:20「一単位」の決め方は、解釈をともなう

      いまの、問いには、じつは、大事な、点が、ひそんでいます。どこを、引用できる、一単位と、するかは、かならずしも、機械的に、決まるとは、限りません。章で、引くのか、段落で、引くのか、ぎょうで、引くのか、あるいは、歌で、引くのか。どの単位で、引けるように、するかには、編集や、研究上の、判断が、入ります。そして、引用構造の、選び方しだいで、たどれる、見え方も、変わってきます。これは、テキストを、どう、構造化するか、という、TEIの、問いとも、地続きの、すぐれて、人文学的な、営み、ともいえます。

      「一単位」の決め方は、解釈をともなう
    • 14:13始め方・学ぶには

      では、自分でも、始めてみたい、と思ったら、どうすれば、よいでしょう。まず、触れてみるなら、公開されている、DTS対応の、ビューアで、サンプルの、コレクションを、ひらいてみるのが、よい、入り口です。慣れてきたら、応答の、JSON-LDを、眺めながら、コレクションから、ナビゲーション、ドキュメントへと、自分で、たどってみる。体系的に、学ぶなら、DTSの、公式仕様や、その、よくある質問、それに、クックブックと、呼ばれる、実例集が、あります。そして、自分で、つくるなら、まずは、静的な、ファイルからでも、始められる、レベルゼロ、という、入り口から、試すのが、よいでしょう。

      始め方・学ぶには
    • 15:09まとめ

      今日の、まとめです。DTSは、テキストの、コレクションに、共通の、作法で、触れるための、仕様でした。入口の、先に、コレクション、ナビゲーション、ドキュメントという、三つの窓口が、あります。一覧や、目次は、JSON-LD、本文は、TEI・XMLで、返り、引用構造で、ここ、と、指すことが、できる。作法を、そろえれば、相互運用に、つながる。ただし、どこを、一単位と、するかには、解釈が、入る、というお話でした。テキストに、タグを、付ける、TEI。データを、線で、つなぐ、RDF。それらを、配るのが、DTS。地続きの、考え方として、つかんで、いただけたなら、うれしいです。

      まとめ
    • 16:19出典・ライセンス

      この動画は、海外で、オープンライセンスのもとに、公開されている、文献を、参照して、作成しました。主なものは、ジャーナル・オブ・ザ・TEIに、掲載された、DTSに関する、論文で、クリエイティブ・コモンズ(CC)の、表示ライセンスで、公開されています。あわせて、事実確認には、DTSの、公式仕様も、参照しました。スライドと、図は、これらを、参考にしたうえで、あらためて、新規に、作成したものです。

      出典・ライセンス
    • 17:00ご清聴ありがとうございました

      以上で、DTSの、入門を、終わります。テキストに、共通の、窓口を、つくり、だれもが、同じ、作法で、たどれるように、する。その、考え方の、第一歩を、つかんで、いただけたなら、と思います。ご清聴、ありがとうございました。

      ご清聴ありがとうございました