View in English

OAIS入門 ― デジタル長期保存の参照モデル

デジタル情報の長期保存のための参照モデル OAIS(開放型アーカイブ情報システム/ISO 14721)を、初学者向けに概念から解説します。なぜ長期保存が難しいか、登場人物(生産者・消費者・管理)と指定コミュニティ、情報パッケージ SIP・AIP・DIP、AIP=Content Information+PDI(来歴・参照・固定値・文脈)、6つの機能(取り込み・保管・データ管理・管理・保存計画・アクセス)まで。PREMIS・METS・BagIt との関係も整理します。仕様で事実確認し独自に構成した実験的な動画です。

OAISISO 14721Digital PreservationAIPPREMISMETSDigital Humanities
⚠ この解説は、AIによる実験的な取り組みです(構成・図・音声合成を含む)。不正確な内容を含む可能性があります。ご利用の際はご注意ください。

掛け合い解説(ずんだもん×四国めたん)

別バージョン

ナレーション解説

章立て

  1. 1

    本編

    読み上げ原稿

    • 皆さん、こんにちは。デジタル・ヒューマニティーズ入門、技術要素シリーズです。この回のテーマは、OAISです。デジタルの情報を、長い年月にわたって保存し、未来の利用者へ、引き継いでいく。そのための、共通の、参照モデル、いわば、長期保存の、全体地図を、初学者向けに、図を交えて、ゆっくり、見ていきます。専門知識は、なくても、大丈夫です。

    • はじめに、この動画について、簡単に、ご案内します。この動画は、公開されている、標準の、仕様を、参照しつつ、独自に、構成した、解説です。特定の、教材を、翻案した、ものでは、ありません。スライドと、図は、新規に作成し、ナレーションは、AIによる、音声合成です。あくまで、実験的な、取り組みですので、内容は、ご確認・ご注意のうえ、ご利用ください。誤りに、気づかれたら、概要欄から、ご指摘いただけると、たすかります。出典は、動画の最後と、概要欄に、まとめてあります。それでは、本編に、入りましょう。

    • まず、この回のゴールです。目標は、大きく、四つ。一つめは、OAISが、デジタル長期保存の、共通の、参照モデルだ、と説明できること。二つめは、生産者、消費者、管理、という、登場人物と、指定コミュニティ、つまり、誰に分かる形で、残すか、を説明できること。三つめは、情報パッケージの、SIP、AIP、DIP、と、AIPの、中身を、説明できること。そして四つめは、取り込みから、アクセスまでの、六つの、機能の、役割の、見当が、つくことです。

    • 今日の流れです。まず、なぜ、長期保存は、難しいのか。つぎに、OAISとは、何か。それから、登場人物と、環境。情報パッケージの、SIP、AIP、DIP。六つの、機能。最後に、これまでの回、METSや、PREMISとの、関係と、始め方を、お話しします。

    • それでは、はじめましょう。まずは、そもそも、なぜ、デジタルの、長期保存が、難しいのか。そこから、考えていきます。

    • 図を、見てください。デジタルの、資料は、ただ、置いておく、だけでは、いずれ、失われて、しまいます。理由は、大きく、三つ。一つめは、媒体の、劣化。記録した、ディスクや、テープが、傷んで、読めなくなる。二つめは、形式の、陳腐化。ファイルの、形式が、古くなり、対応する、ソフトが、なくなる。三つめは、文脈の、喪失。これが、何の、資料で、どういう、いきさつの、ものか、という、背景が、忘れられて、しまう。置き場所を、確保する、だけでは、足りないのです。

    • では、どうすれば、よいのでしょう。長期保存は、機関ごとの、場当たりの、工夫だけでは、なかなか、続きません。何を、誰のために、どう、保つのかを、共通の、言葉で、語りたい。機関を、またいで、比べたり、点検したり、できる、土台が、ほしい。そこで、使われるのが、参照モデル、という、地図です。その、代表が、OAIS。METSや、PREMISといった、具体的な、道具も、この、同じ地図の、上に、置くことが、できます。

    • では、その、OAISとは、どんな、ものなのか。もう少し、くわしく、見ていきましょう。

    • 図を、見てください。OAISは、開放型、アーカイブ、情報システム、と訳される、長期保存の、参照モデルです。ISO、いちまんよんせんななひゃくにじゅういち、という、国際規格に、なっていて、もとは、宇宙データの、ための、CCSDS、という、団体の、無償の、文書です。いま、生産者が、預けた、資料を、未来の、利用者が、使える、形で、保ち続ける。その、仕組み全体を、表す、地図、それが、OAISです。

    • ここで、いったん、整理します。デジタルは、媒体、形式、文脈、の問題で、置くだけでは、失われる。だから、場当たりでなく、共通の、参照モデル、地図が、要る。その、代表が、OAISで、未来の、利用者へ、引き継ぐための、枠組みでした。では、その、地図に、出てくる、登場人物から、見ていきましょう。

    • ここからは、OAISの、登場人物と、環境の、話です。誰から、預かり、誰へ、渡すのか、を、見ていきます。

    • 図を、見てください。中心に、あるのが、アーカイブ。これを、取り巻くのが、三つの、役割です。一つめは、生産者。資料を、預ける、人や、組織。二つめは、消費者。保存された、資料を、使う人。三つめは、管理。保存の、方針を、決める、立場です。そして、もう一つ、とても、大事な、考え方が、消費者の、先に、ある、指定コミュニティ、です。これは、この資料を、理解して、ほしい、と、想定する、利用者の、集団の、ことです。

    • この、指定コミュニティ、という、考え方が、OAISの、核心です。保存とは、ただ、ファイルを、残すこと、ではありません。想定した、読者の、集団が、追加の、助けなしに、それだけで、理解できる、形で、残すこと。そのためには、専門用語や、前提、ファイル形式が、将来も、通じるように、それを、読み解く、ための、説明、表現情報、も、一緒に、保つ必要が、あります。誰に、分かれば、よいかを、決めるからこそ、何を、どこまで、残すかが、定まるのです。

    • ここからは、保存される、情報の、入れ物、情報パッケージの、話です。SIP、AIP、DIP、という、三つが、出てきます。

    • 図を、見てください。同じ、資料でも、場面によって、姿を、変えます。まず、生産者から、アーカイブに、提出される、ときの、形が、SIP、提出情報パッケージ。つぎに、アーカイブの、中で、長く、保管される、形が、AIP、保存情報パッケージ。そして、消費者に、提供される、ときの、形が、DIP、配布情報パッケージです。提出、保管、提供。三つの、場面で、それぞれの、箱が、ある、というわけです。

    • この中で、いちばん、大事なのが、保管される、AIPです。図を、見てください。AIPは、大きく、二つの、部分から、できています。一つは、コンテント・インフォメーション。これは、データの、本体と、それを、読み解く、ための、表現情報です。たとえば、数字の、列が、何を、意味するのか、という、説明です。もう一つが、PDI、保存記述情報。これは、その資料を、長く、信頼して、使うための、説明です。

    • その、PDIは、四つの、要素から、できています。図を、見てください。一つめは、来歴。いつ、誰が、何を、したか、という、履歴です。二つめは、参照。その資料を、一意に、指すための、識別子です。三つめは、固定値、fixity。途中で、化けて、いないかを、確かめる、ための、情報です。四つめは、文脈。他の、情報との、関係です。なお、版に、よっては、ここに、権利の、情報も、加わります。これらが、そろって、はじめて、将来も、安心して、使える、資料に、なります。

    • ここまでを、整理します。登場人物は、生産者、消費者、管理、そして、届け先の、指定コミュニティ。情報パッケージは、SIP、AIP、DIP、の、三つ。保管する、AIPは、コンテント・インフォメーションと、PDI、つまり、来歴、参照、固定値、文脈、から、なる。では、これらを、実際に、動かす、機能を、見ていきましょう。

    • ここからは、アーカイブを、動かす、六つの、機能の、話です。それぞれが、保存の、どの、役割を、担うのかを、見ていきます。

    • 図を、見てください。六つの、機能は、こうです。まず、入口に、あたるのが、取り込み、インジェスト。提出された、ものを、受け取り、検査します。つぎに、保管、アーカイバル・ストレージ。長く、安全に、しまっておく。そして、出口に、あたるのが、アクセス。利用者に、提供します。この、入口、保管、出口、の、流れを、三つの、機能が、支えます。全体の、運営を、行う、管理。目録や、検索を、扱う、データ管理。そして、保存計画です。

    • 六つの、なかでも、保存計画は、OAIS、らしい、機能です。技術は、つねに、変わります。ファイルの、形式が、古び、ソフトや、媒体が、使えなく、なっていく。保存計画は、それを、見越して、たとえば、古い形式から、新しい形式への、移行、マイグレーション、などを、計画します。いま、読める、だけでなく、これからも、指定コミュニティが、理解できる、状態を、保ち続ける。それを、設計するのが、保存計画です。

    • さて、ここで、これまでの、回と、つなげて、おきましょう。OAISは、あくまで、地図、参照モデルです。

    • 図を、見てください。OAISの、概念は、これまで、紹介してきた、具体的な、標準と、きれいに、対応します。たとえば、PDI、来歴や、固定値、といった、保存の、説明は、PREMISが、担います。情報パッケージの、梱包は、METS。固定値、fixityは、チェックサム。転送用の、パッケージは、BagIt。つまり、OAISは、地図であって、それぞれの、標準は、その、地図の、上に、置かれた、道具に、あたるのです。

    • この、地図を、持つことには、大きな、意義が、あります。まず、機関や、分野を、越えて、保存の、話を、同じ、言葉で、できる。何が、足りていて、何が、足りないかを、点検したり、監査したり、する、土台に、なる。そして、個々の、ツール選び、METSや、PREMIS、保存ソフト、などを、全体の、なかに、位置づけられる。道具を、選ぶ前に、全体の、地図を、持つ。それが、長く、続く、保存の、出発点に、なります。

    • ここまでを、整理します。六つの、機能は、取り込み、保管、データ管理、管理、保存計画、アクセス。とくに、保存計画で、技術の、変化に、備える。そして、OAISは、地図であり、PREMISや、METS、チェックサムなどが、その、上の、道具でした。道具立ては、以上です。最後に、考える、時間と、始め方を、お話しします。

    • ここで、少し、立ち止まって、考えて、みましょう。あなたが、残したい、デジタルの、資料を、OAISの、考え方で、見ると、どうでしょうか。その、指定コミュニティは、誰でしょう。つまり、誰に、分かれば、よいのか。そして、資料の、本体と、一緒に、残すべき、説明、来歴や、文脈、形式の、情報は、何でしょうか。よろしければ、ここで一度、動画を、止めて、考えて、みてください。

    • では、もっと、学んで、みたい、と思ったら、どうすれば、よいでしょう。まず、原典は、CCSDSの、マゼンタ・ブックで、これは、無償で、公開されていて、ISOの、規格と、同じ内容です。実務的な、理解には、デジタル・プリザベーション・コアリションの、ハンドブックが、役立ちます。そして、アーカイブマティカ、のような、保存ツールを、使うと、取り込みから、保管までの、流れを、実際に、体験できます。

    • 今日の、まとめです。OAISは、デジタル長期保存の、共通の、参照モデルでした。生産者、消費者、管理、そして、届け先の、指定コミュニティに、それだけで、分かる、形で、残す。情報パッケージは、SIPから、AIP、DIPへ。保管する、AIPは、コンテント・インフォメーションと、PDI、来歴、参照、固定値、文脈、から、なる。六つの、機能が、支え、保存計画で、変化に、備える。PREMISや、METSは、この、地図の、上の、道具でした。道具を、選ぶ前に、全体の、地図を、持つ。それが、保存の、背骨に、なります。

    • この動画は、公開されている、標準の、仕様を、参照して、独自に、作成しました。主なものは、CCSDSの、マゼンタ・ブック、開放型、アーカイブ、情報システムの、参照モデルで、これは、ISO、いちまんよんせんななひゃくにじゅういち、と、同一の、内容です。これらは、事実確認に、用いた、もので、特定の、教材を、翻案した、ものでは、ありません。スライドと、図は、すべて、新規に、作成して、います。

    • 以上で、OAISの、入門を、終わります。デジタルを、ただ、保存する、だけでなく、未来の、利用者に、それだけで、分かる、形で、引き継いでいく。その、全体地図を、つかんで、いただけたなら、と思います。ご清聴、ありがとうございました。