日本語で見る

Introduction to RDF and Linked Data

A beginner-friendly introduction to RDF — representing data as subject–predicate–object triples — and Linked Data / LOD. An experimental, independently-composed video referencing open CC-licensed materials.

RDFLinked DataLODSPARQLDigital Humanities
⚠ This explainer is an experimental, AI-assisted production (including its structure, figures, and synthesized narration). It may contain inaccuracies—please use it with discretion.

Dialogue walkthrough (VOICEVOX)

Other versions

Narrated explanation

Chapters

  1. 1

    Main

    Narration script

    • 0:00データを線でつなぐ

      皆さん、こんにちは。デジタル・ヒューマニティーズ入門、技術要素シリーズを担当します、なかむらさとるです。この回のテーマは、RDFと、リンクトデータです。データを、ばらばらの表ではなく、線でつないで扱う考え方を、初学者向けに、図を交えながら、ゆっくり見ていきます。プログラミングの予備知識は、なくても、大丈夫です。どうぞ、気楽について来てください。

      データを線でつなぐ
    • 0:31この動画について

      はじめに、この動画について、簡単に、ご案内します。この動画は、クリエイティブ・コモンズ(CC)で、公開されている、オープンな教材を、参照しつつ、独自に、構成した、解説です。スライドと、図は、新規に作成し、ナレーションは、本人の声をもとにした、AIの、音声合成で、つくっています。あくまで、実験的な、取り組みですので、内容は、ご確認・ご注意のうえ、ご利用ください。もし、誤りに、気づかれたら、概要欄から、ご指摘いただけると、たすかります。出典と、ライセンスは、動画の最後と、概要欄に、まとめてあります。それでは、本編に、入りましょう。

      この動画について
    • 1:20この回のゴール

      まず、この回のゴールを、確認しておきましょう。目標は、大きく、四つです。一つめは、RDFの、三つ組、つまり、主語・述語・目的語で、データを表す考え方を、自分の言葉で、説明できること。二つめは、URIが、なぜ必要かを、説明できること。三つめは、データを、つなぐ、という、リンクトデータの発想を、説明できること。そして四つめは、SPARQLで、問い合わせる、という、流れのイメージを、持てることです。少し、略語が、多く出てきますが、一つずつ、ほどいていきますので、気楽に、聞いてください。

      この回のゴール
    • 2:10今日の流れ

      今日の流れです。はじめに、データを、つなぐ、とは、どういうことかを、三つ組の考え方から、見ます。つぎに、同じものを、指すための、URI。それから、つないで広げる、リンクトデータ。そして、問い合わせる、SPARQL。最後に、自分で始めるための、手がかりを、紹介します。

      今日の流れ
    • 2:38データを「つなぐ」とは

      それでは、はじめましょう。まずは、データを、つなぐ、とは、どういうことなのか。RDFの、三つ組という、考え方から、見ていきます。

      データを「つなぐ」とは
    • 2:52表のデータは「関係」が見えにくい

      図を、見てください。私たちが、ふだん、よく使う、表の形式は、行と列に、きちんと収まっていて、見やすいものです。ただ、よく考えると、項目と、項目が、どう関係しているか、という、つながりの情報は、表の中には、なかなか、残りにくいのです。図の、右のように、点と、線で、結んだ、グラフの形なら、何と、何が、どう関わっているのかを、そのまま、表すことが、できます。

      表のデータは「関係」が見えにくい
    • 3:25書きたいのは「関係」

      私たちが、知りたいことは、しばしば、エーと、ビーが、どう関係するか、という、関係そのものです。この人物は、この場所で、生まれた。この作品は、この人が、書いた。こうした、関係を、データとして、きちんと、書き表す方法が、要ります。それが、RDF、という、考え方なのです。

      書きたいのは「関係」
    • 3:52RDF=主語・述語・目的語の三つ組

      RDFでは、図のように、ひとつの関係を、主語、述語、目的語、という、三つの部品の、組み合わせで、書きます。これを、三つ組、英語で、トリプル、と呼びます。誰が、どうした、何を、という、ごく単純な形で、ひとつの事実を、表していく、というわけです。

      RDF=主語・述語・目的語の三つ組
    • 4:19たとえば、こう書く

      具体例で、見てみましょう。図のように、ホメロス、生まれた場所、イオニア。主語が、ホメロス。述語が、生まれた場所。目的語が、イオニア。この、三つ組、ひとつで、ホメロスは、イオニアで、生まれた、という、ひとつの、関係を、表しています。とても、シンプルですね。

      たとえば、こう書く
    • 4:47つなぐと「グラフ(網)」になる

      そして、この三つ組を、いくつも、重ねていくと、どうなるでしょう。図を、見てください。点、つまり、もの、と、線、つまり、関係が、つながって、網のような、形に、なっていきます。これを、グラフと、呼びます。ばらばらだった、事実が、線で、つながり、たどれるように、なっていく。これが、RDFの、いちばんの、特徴です。

      つなぐと「グラフ(網)」になる
    • 5:20ここまでのポイント

      ここで、いったん、整理します。データの中身は、しばしば、もの、と、ものの、関係でした。RDFは、その関係を、主語・述語・目的語の、三つ組で、書く。そして、三つ組を、重ねると、つながった、グラフに、なる。ここまでが、出発点です。でも、ホメロス、と書くだけで、世界の、誰もが、同じ人物を、思い浮かべるでしょうか。そこで、つぎは、URIの、出番です。

      ここまでのポイント
    • 5:56同じものを指す ― URI

      ここからは、同じものを、どうやって、指し示すか。URIの、話に、入ります。

      同じものを指す ― URI
    • 6:04言葉は曖昧

      言葉は、じつは、とても、曖昧です。ホメロス、と書いても、叙事詩人かもしれませんし、お店の名前かもしれません。金沢、も、地名なのか、人の姓なのか。私たち人間は、文脈で、自然に、察しますが、データを、機械的に、つなぐときには、それでは、取り違えが、起きてしまいます。だからこそ、どれを指すのかが、ぶれない、名前が、要るのです。

      言葉は曖昧
    • 6:38URI=世界共通の「名札」

      そこで、使うのが、URIです。図を、見てください。あるものに対して、世界で、ただ一つの、名札を、つけます。たとえば、このホメロスは、この、URIで、表す、と決めておけば、どの、ホメロスのことなのか、世界の、どこからでも、一意に、決めることが、できます。

      URI=世界共通の「名札」
    • 7:04三つ組を URI で書く

      では、その、URIを使って、三つ組を、書いてみましょう。図の例のように、主語、述語、目的語を、それぞれ、URIで、指し示します。中身は、ホメロス、生まれた場所、イオニア、ですが、人が読む、ただのラベルではなく、世界共通の、名札で、書いておく。こうすることで、取り違えが、起きにくく、なるのです。

      三つ組を URI で書く
    • 7:38述語も「共通の語彙」を使う

      もう一つ、大事な、工夫が、あります。述語、つまり、関係の、種類にも、共通の、語彙を、使う、ということです。図を、見てください。二つの、別々の、データセットが、どちらも、同じ、述語、たとえば、スキーマドットオルグの、バースプレイス、生まれた場所、を、使っていれば、互いに、ぴたりと、かみ合います。よく使う、述語は、スキーマドットオルグや、ダブリンコア、といった、すでに、ある、語彙を、借りるのが、ふつうです。

      述語も「共通の語彙」を使う
    • 8:17ここまでのポイント

      ここまでを、整理します。言葉の、曖昧さを、避けるために、ものに、URI、という、名札を、つける。主語・述語・目的語を、URIで、書けば、取り違えにくい。述語も、共通の、語彙を、使うと、別の、データと、かみ合う。これで、いよいよ、データを、つなぐ、準備が、整いました。

      ここまでのポイント
    • 8:46つないで広げる ― リンクトデータ

      ここからは、つないで、広げる。リンクトデータの、話です。

      つないで広げる ― リンクトデータ
    • 8:53リンクトデータ=外のデータへリンクを張る

      リンクトデータ、とは、図のように、自分の、データの、ものを、外部の、同じものへ、URIで、結びつける、ことです。たとえば、自分が、光源氏について、まとめたデータを、外部の、大きなデータの、同じ、光源氏に、これは、同じものです、と、宣言して、つなぐ。すると、自分の、データだけでは、得られなかった、情報にも、たどり着けるように、なります。

      リンクトデータ=外のデータへリンクを張る
    • 9:27LOD=開かれてつながる「雲」

      そうやって、世界中の、公開された、データが、互いに、つながっていくと、どうなるでしょう。図のように、たくさんの、データが、線で、結ばれた、大きな、雲のような、つながりが、できあがります。これを、LOD、リンクト・オープン・データ、と呼びます。開かれていて、互いに、つながっている、データの、集まりのことです。

      LOD=開かれてつながる「雲」
    • 9:58例:Wikidata という結節点

      その、結節点として、よく知られているのが、Wikidataです。Wikidataは、誰でも、編集できる、巨大な、データのハブで、多くの、データが、ここの、URIを、共通の、待ち合わせ場所として、参照しています。ウィキペディア、由来の、DBpedia、なども、大きな、結節点の、一つです。自分の、データを、こうした、ハブに、つなぐと、世界中の、データと、一気に、つながっていきます。

      例:Wikidata という結節点
    • 10:34DHでの活用

      デジタル・ヒューマニティーズでも、この、つなぐ力が、生きてきます。図のように、人物、作品、地名、といった、ものを、横断して、結び、たとえば、この人が、この作品を、著した、この作品の、舞台は、この地名、というふうに、機関を、またいで、たどれるように、することが、できます。

      DHでの活用
    • 11:02問い合わせる ― スパークル

      最後に、つないだ、データに、問いを、投げる、方法。SPARQLの、話です。

      問い合わせる ― スパークル
    • 11:10SPARQL=グラフに質問する言語

      SPARQLは、グラフに、質問する、ための、言語です。図の例を、見てください。クエスチョンマークの、ついた、パーソン、これが、探したいもの、を、表しています。そして、イオニアで、生まれた、という、条件を、書いています。つまり、これは、イオニアで、生まれた、人を、全部、あげてください、という、問い合わせ、なのです。

      SPARQL=グラフに質問する言語
    • 11:41一度に、まとめて引き出せる

      もう少し、イメージを、ふくらませましょう。三つ組の、うち、知りたい部分を、変数に、して、問い合わせると、条件に、合う、三つ組を、グラフ全体から、機械的に、集めて、返してくれます。一件ずつ、手で、探すのではなく、問いを、一度、書けば、答えが、そろう。しかも、大量の、データが、相手でも、同じ問いで、くり返し、実行できます。

      一度に、まとめて引き出せる
    • 12:14考えてみよう

      ここで、少し、立ち止まって、考えてみましょう。あなたが、ふだん、扱っている、データを、三つ組に、すると、いったい、何に、なるでしょうか。誰が、何を、どうした。よろしければ、ここで一度、動画を止めて、思い浮かべてみてください。

      考えてみよう
    • 12:35ここまでのポイント

      ここまでを、整理します。リンクトデータは、自分の、データを、外の、データへ、結ぶ、ことでした。公開された、データが、つながって、LODの、雲に、なっている。そして、SPARQLを、使えば、その網に、問いを、投げて、答えを、引き出せる。これが、データを、つなぐ、ことの、力です。

      ここまでのポイント
    • 13:10どうつなぐかにも「判断」が入る

      ただし、ここでも、大事な、点が、あります。どの、語彙を、使うか、何と、何を、同じと、みなすか、には、研究上の、判断が、入ります。つなぎ方を、変えれば、見えてくる、関係も、変わります。これは、テキストを、どう、構造化するか、という話にも、通じる、解釈の、問題です。線で、つなぐことは、機械的なようでいて、じつは、すぐれて、人文学的な、営み、なのです。

      どうつなぐかにも「判断」が入る
    • 13:53始め方・学ぶには

      では、自分でも、始めてみたい、と思ったら、どうすれば、よいでしょう。まず、触れてみるなら、Wikidataで、ものの、URIや、三つ組を、眺めてみるのが、よい、入り口です。体系的に、学ぶなら、プログラミング・ヒストリアンの、リンクト・オープン・データの、入門。デジタル・ヒューマニティーズ向けには、アールト大学、セコ・グループの、教材も、あります。そして、公開されている、SPARQLの、窓口に、簡単な、問いを、投げてみるのも、よい、経験に、なります。

      始め方・学ぶには
    • 14:39まとめ

      今日の、まとめです。RDFは、データを、主語・述語・目的語の、三つ組で、表すのでした。そして、URIと、共通の、語彙で、取り違えず、かみ合う形に、する。リンクで、結べば、LODの、雲に、なり、SPARQLで、引き出せる。さらに、どう、つなぐかにも、判断が、入る、解釈を、ともなう、営みでも、ありました。データを、ばらばらに、持つのではなく、線で、つないで、捉えなおす。そんな、視点を、ひとつ、手に入れた、と、いえるのでは、ないでしょうか。

      まとめ
    • 15:34出典・ライセンス

      この動画は、海外で、オープンライセンスのもとに、公開されている、教材を、参照して、作成しました。主なものは、プログラミング・ヒストリアンの、リンクト・オープン・データの、入門、そして、アールト大学、セコ・グループの、文化遺産と、デジタル・ヒューマニティーズのための、リンクトデータ教材です。いずれも、クリエイティブ・コモンズ(CC)の、表示ライセンスで、公開されています。スライドと、図は、これらを、参考にしたうえで、あらためて、作成したものです。

      出典・ライセンス
    • 16:15ご清聴ありがとうございました

      以上で、RDFと、リンクトデータの、入門を、終わります。データを、線で、つないで、捉えなおす。その第一歩を、つかんで、いただけたなら、と思います。ご清聴、ありがとうございました。

      ご清聴ありがとうございました