View in English

ResourceSync入門 ― リソースを最新に保ち合う

サーバ間でウェブ上のリソースを同期し続けるための枠組み ResourceSync を、初学者向けに概念から解説する約20分の動画。全体をそろえる baseline 同期(Resource List / Resource Dump)と、変更を追う差分同期(Change List / Change Dump)、能力の知らせ方(Capability List / Source Description)、Sitemaps を土台にした仕組み、そして OAI-PMH(メタデータ収集)との違いまで概観する。

ResourceSyncOAI-PMHSitemapsSynchronizationInteroperabilityDigital Humanities
⚠ この解説は、AIによる実験的な取り組みです(構成・図・音声合成を含む)。不正確な内容を含む可能性があります。ご利用の際はご注意ください。

掛け合い解説(ずんだもん×四国めたん)

別バージョン

ナレーション解説

章立て

  1. 1

    本編

    同期の課題・ResourceSyncとは・baseline(Resource List/Dump)・差分(Change List/Dump)・能力の発見(Source Description/Capability List)・Sitemap土台・OAI-PMHとの関係・始め方

    読み上げ原稿

    • 0:00リソースを最新に保ち合う

      皆さん、こんにちは。デジタル・ヒューマニティーズ入門、技術要素シリーズを担当します、なかむらさとるです。この回のテーマは、ResourceSyncです。あるサーバが、公開している、データを、別のサーバや、サービスが、つねに、最新の状態に、保ち続ける。そのための、ウェブの、しくみを、初学者向けに、図を交えて、ゆっくり、見ていきます。プログラミングの予備知識は、なくても、大丈夫です。

      リソースを最新に保ち合う
    • 0:32この動画について

      はじめに、この動画について、簡単に、ご案内します。この動画は、公開されている、標準の、仕様を、参照しつつ、独自に、構成した、解説です。特定の、教材を、翻案した、ものでは、ありません。スライドと、図は、新規に作成し、ナレーションは、本人の声をもとにした、AIの、音声合成で、つくっています。あくまで、実験的な、取り組みですので、内容は、ご確認・ご注意のうえ、ご利用ください。誤りに、気づかれたら、概要欄から、ご指摘いただけると、たすかります。出典は、動画の最後と、概要欄に、まとめてあります。それでは、本編に、入りましょう。

      この動画について
    • 1:22この回のゴール

      まず、この回のゴールを、確認しておきましょう。目標は、大きく、四つです。一つめは、ResourceSyncが、リソースそのものを、同期し続けるための、枠組みだ、ということを、説明できること。二つめは、まず全体を、そろえる、ベースラインの同期と、変更だけを、追う、差分の同期、その違いを、説明できること。三つめは、みなもとが、自分の能力を、知らせ、受け手が、それを、見つける、しくみを、説明できること。そして四つめは、メタデータを、集める、OAI-PMHと、ResourceSyncとの、関係の、見当が、つくことです。

      この回のゴール
    • 2:10今日の流れ

      今日の流れです。はじめに、データを、最新に、保ち合う、という、課題から、見ます。つぎに、ResourceSyncとは、何か。それから、まず全体を、そろえる、ベースライン。つづいて、変化に、追従する、差分。そして、能力を、どう知らせるか、と、その土台と、仕組み。最後に、OAI-PMHとの、関係と、始め方を、紹介します。

      今日の流れ
    • 2:45データを最新に保ち合うには

      それでは、はじめましょう。まずは、データを、最新に、保ち合う、というのが、どういうことなのか。同期、という、課題から、考えていきます。

      データを最新に保ち合うには
    • 2:58源は変わり、受け手は古くなる

      図を、見てください。ある機関が、デジタルの、コレクションを、公開している、とします。資料は、新しく、増えたり、内容が、更新されたり、ときには、削除されたり、と、つねに、変化していきます。一方、その、データを、別の場所で、利用したい、受け手、たとえば、横断検索の、サービスや、ミラーの、サイトは、ほうっておくと、どんどん、古くなって、いきます。図の右のように、新しい資料が、無かったり、古い版の、ままだったり。この、ずれを、どうやって、なくすか、が、問題です。

      源は変わり、受け手は古くなる
    • 3:41同期には2つの必要

      受け手が、みなもとに、追いつくには、やり方が、二通り、あります。一つは、全部、そろえる、やり方。まず、丸ごと、コピーして、土台を、そろえます。これを、ベースラインの、同期、と呼びます。もう一つは、変更だけを、追う、やり方。あとは、増えた、変わった、消えた、その分だけを、反映します。これを、差分の同期、と呼びます。毎回、ぜんぶ、取り直すのは、重いので、差分が、要るわけです。ResourceSyncは、この、そろえる、と、追う、の、両方を、共通の、やり方で、扱います。

      同期には2つの必要
    • 4:33ResourceSync とは

      では、その、ResourceSyncとは、どんな、ものなのか。もう少し、くわしく、見ていきましょう。

      ResourceSync とは
    • 4:41リソースを同期する共通の枠組み

      図を、見てください。ResourceSyncは、データの、みなもとと、受け手の、あいだに、立って、リソースを、同期するための、共通の、枠組みです。これは、NISOと、OAI、という、団体が、定めた、標準で、ゼットサーティナイン・ドット・ナインティナイン、という、番号が、つけられています。大きな、特徴は、まったく、新しい、仕組みを、作るのではなく、検索エンジンが、使う、Sitemap、という、おなじみの、しくみの、上に、作られている、ことです。

      リソースを同期する共通の枠組み
    • 5:20ここまで

      ここで、いったん、整理します。公開された、データは、変わり続け、受け手は、ほうっておくと、ずれていく。追いつくには、全部、そろえる、ことと、変更だけ、追う、ことの、二つが、要る。そして、ResourceSyncは、それを、共通の、やり方で、扱う、ウェブの、同期の、枠組みでした。では、まず、全体を、そろえる、やり方から、見ていきましょう。

      ここまで
    • 5:54まず全体をそろえる ― baseline

      ここからは、まず、全体を、そろえる、ベースラインの、話です。いま、ある、全部を、一覧に、するところから、始まります。

      まず全体をそろえる ― baseline
    • 6:06Resource List = 全リソースの一覧

      図を、見てください。Resource Listとは、みなもとが、いま、公開している、リソースを、すべて、並べた、一覧です。それぞれの、行には、その、リソースの、場所、つまり、URLと、最後に、更新された、日時、そして、チェックサム、という、内容の、指紋が、書かれています。受け手は、この、一覧を、たどって、すべてを、取りに行き、まず、丸ごと、そろえます。これが、ベースラインの、同期の、出発点です。

      Resource List = 全リソースの一覧
    • 6:53Resource Dump = まとめて転送

      ただ、リソースの、数が、とても、多いときは、一つずつ、取りに行くのは、たいへんです。そこで、Resource Dump、という、形が、あります。これは、リソースの、中身を、ジップなどに、まとめた、いわば、荷物です。一覧を、たどって、個別に、取る、かわりに、一括で、ダウンロードできます。荷物の、中には、何が、入っているか、を示す、目録も、同梱されます。大量・大容量の、ベースラインを、効率よく、運ぶための、形です。

      Resource Dump = まとめて転送
    • 7:40変化に追従する ― 差分

      全体が、そろったら、つぎは、その後の、変化に、どう、ついていくか。差分の、話に、入ります。

      変化に追従する ― 差分
    • 7:50Change List = 変更の一覧

      図を、見てください。Change Listとは、ある、期間に、起きた、変更だけを、並べた、一覧です。それぞれの、変更には、種類が、書かれています。作成、created、更新、updated、削除、deleted。つまり、何が、新しく、できて、何が、変わり、何が、消えたのか。これを、伝えるわけです。受け手は、全部を、取り直す、かわりに、この、変更分だけを、反映すれば、最新に、追いつけます。

      Change List = 変更の一覧
    • 8:39Change Dump = 変更分をまとめて

      変更が、多いときには、差分も、荷物に、まとめられます。それが、Change Dumpです。これは、ある、期間の、変更分だけを、ジップなどに、まとめた、荷物です。Resource Dumpの、変更版、と、思ってください。変わった、ものだけが、入っているので、受け手は、これを、取り込めば、一気に、追いつけます。これで、全体を、そろえる、ことも、変化を、追う、ことも、一覧で、たどっても、荷物で、まとめても、どちらでも、選べる、ようになりました。

      Change Dump = 変更分をまとめて
    • 9:28ここまで

      ここまでを、整理します。Resource Listや、Resource Dumpで、まず、全体を、そろえる、ベースライン。Change Listや、Change Dumpで、変更だけを、追う、差分。一覧で、たどっても、荷物で、まとめても、よい。では、みなもとは、自分には、どんな、能力が、あるのか、を、どうやって、受け手に、知らせるのでしょう。

      ここまで
    • 10:04能力をどう知らせる

      ここからは、能力を、どう、知らせるか、という、話です。みなもとが、知らせ、受け手が、見つける、しくみです。

      能力をどう知らせる
    • 10:17Source Description と Capability List

      図を、見てください。みなもとには、入り口と、なる、Source Description、という、文書が、あります。受け手は、まず、ここを、見ます。そこから、Capability List、という、文書に、たどり着きます。これは、この、みなもとが、どんな、能力を、提供しているか、たとえば、Resource Listや、Change Listを、出せるか、を、並べた、一覧です。みなもとは、自分の、能力を、こうして、知らせ、受け手は、そこから、必要な、ものを、発見して、使う、というわけです。

      Source Description と Capability List
    • 11:09土台と仕組み

      では、これらの、文書は、いったい、どんな、形で、書かれているのでしょう。その、土台と、仕組みを、見ていきます。

      土台と仕組み
    • 11:22Sitemap を再利用して拡張する

      図を、見てください。ResourceSyncは、まったく、新しい、形式を、作るのではなく、検索エンジン向けの、Sitemap、という、既存の、形式を、そのまま、再利用します。図の、黒い、部分が、ふつうの、Sitemapです。そこに、橙色で、示した、アールエス・エムディーや、アールエス・エルエヌ、という、ResourceSync独自の、拡張を、足します。これによって、同期に、必要な、情報を、Sitemapの、上に、のせる、わけです。

      Sitemap を再利用して拡張する
    • 12:11チェックサムとリンク

      その、拡張された、情報が、同期を、確実に、します。一つめは、チェックサム。取り込んだ、ものが、途中で、化けて、いないか、を、確認できます。二つめは、変更の、種類。作成・更新・削除の、どれか。三つめは、リンク。その、リソースの、版や、ミラー、関連先などを、指し示します。さらに、変更を、すぐに、知らせる、通知の、しくみも、別途、用意されています。何が、どう、変わり、それが、本物か、を、ふつうの、ウェブの、部品で、伝えられる、わけです。

      チェックサムとリンク
    • 13:10OAI-PMH との関係

      ここで、よく、一緒に、語られる、OAI-PMH、との、関係を、整理して、おきましょう。

      OAI-PMH との関係
    • 13:19OAI-PMH × ResourceSync

      図を、見てください。じつは、ResourceSyncも、OAI-PMHも、どちらも、OAI、という、同じ、出自を、持っています。ちがいは、役割と、世代です。OAI-PMHは、メタデータ、つまり、資料の、記述レコードを、集めるための、しくみでした。これに対して、ResourceSyncは、メタデータだけでなく、リソースそのものを、最新に、同期します。しかも、専用の、しくみではなく、Sitemapや、HTTP、といった、ふつうの、ウェブの、技術の、上に、作られています。いわば、OAI-PMHの、発想を、現代の、ウェブに、広げた、もの、と、いえます。

      OAI-PMH × ResourceSync
    • 14:18DH・デジタルアーカイブでの活用

      この、最新を、保ち合う、という、しくみは、デジタル・ヒューマニティーズや、デジタルアーカイブの、いろいろな、場面で、生きてきます。たとえば、横断検索や、ポータルが、各館の、最新の、データを、いつでも、取り込めるように、なります。データの、鮮度が、保てる、わけです。また、別の、場所に、ミラーを、作って、万一の、消失に、備える、こともできます。そして、チェックサムによって、配った、先でも、データが、健全か、どうかを、確かめられます。

      DH・デジタルアーカイブでの活用
    • 14:59ここまで

      ここまでを、整理します。Source Descriptionと、Capability Listで、みなもとが、能力を、知らせ、受け手が、発見する。土台は、Sitemapで、アールエス・エムディーや、アールエス・エルエヌで、チェックサム、変更の種類、リンクを、足す。そして、これは、OAI-PMHの、メタデータ収集の、発想を、リソース同期へ、広げた、ものでした。

      ここまで
    • 15:32考えてみよう

      ここで、少し、立ち止まって、考えて、みましょう。あなたが、公開している、あるいは、これから、公開したい、データは、どうでしょうか。もし、誰かが、それを、最新に、保ちたい、と思ったとき、どうやって、追従できる、でしょうか。そして、更新や、削除を、相手に、どう、伝えますか。よろしければ、ここで一度、動画を、止めて、考えて、みてください。

      考えてみよう
    • 16:08始め方

      では、もっと、知りたい、と思ったら、どうすれば、よいでしょう。まず、OAIや、NISOが、公開している、ResourceSyncの、仕様を、読んで、概観を、つかむのが、出発点です。つぎに、仕様に、対応した、実装の、ツールを、使うと、Resource Listや、Change Listが、実際に、生成され、同期が、どう、動くのかを、試せます。そして、すでに、ResourceSyncを、採用している、サイトの、Capability Listを、覗いて、みるのも、よい、勉強に、なります。

      始め方
    • 16:51まとめ

      今日の、まとめです。ResourceSyncは、ウェブで、リソースそのものを、同期し続けるための、枠組みでした。Resource Listや、Resource Dumpで、全体を、そろえ、Change Listや、Change Dumpで、変更を、追う。Source Descriptionと、Capability Listで、能力を、知らせ、発見する。土台は、Sitemapで、OAI-PMHの、メタデータ収集を、リソース同期へ、広げた、現代版です。記述や、保存の、その先で、データを、配って、最新に、保ち合う。そのための、共通の、作法、と、いえるでしょう。

      まとめ
    • 17:40出典・ライセンス

      この動画は、公開されている、標準の、仕様を、参照して、独自に、作成しました。主なものは、OAIと、NISOによる、ResourceSync・フレームワーク・スペシフィケーション、バージョン、いってんいち、および、それに、対応する、NISOの、標準です。これらは、事実確認に、用いた、もので、特定の、教材を、翻案した、ものでは、ありません。スライドと、図は、すべて、新規に、作成して、います。

      出典・ライセンス
    • 18:17ご清聴ありがとうございました

      以上で、ResourceSyncの、入門を、終わります。データを、ただ、公開する、だけでなく、みんなで、最新に、保ち合い、つないでいく。その、ための、第一歩を、つかんで、いただけたなら、と思います。ご清聴、ありがとうございました。

      ご清聴ありがとうございました