Webアーカイブ入門 ― 消えるWebをWARCで残す
刻々と書き換わり消えていくWebページを、研究や記録のために『丸ごと』残す考え方と標準を、初学者向けに概念から解説します。リンク切れと内容の移ろい、集める・残す・再生するの三段階、WARCが通信のやりとりごと束ねて残す仕組み、WACZ、長期保存(OAIS)・改変検知(fixity)とのつながりまでを図で見ていきます。
WARCWeb ArchivingWACZDigital PreservationDigital Humanities
⚠ この解説は、AIによる実験的な取り組みです(構成・図・音声合成を含む)。不正確な内容を含む可能性があります。ご利用の際はご注意ください。
掛け合い解説(ずんだもん×四国めたん)
別バージョン
ナレーション解説
章立て
- 1
本編
なぜ消えるか(リンク切れ・内容の移ろい)・集める/残す/再生する・WARCはやりとりごと束ねる・WACZと長期保存
読み上げ原稿
- 0:00消えるWebを、WARCで残す
- 0:36この動画について
- 1:16この回のゴール
- 1:56今日の流れ
- 2:201. なぜ消えるのか
- 2:29クリックしたら、もう無い
- 2:53消えなくても、中身が変わる
- 3:22だから「その時点」を、丸ごと残す
- 3:45ここまでの整理
- 4:112. 三段階と WARC
- 4:22Webアーカイブの三段階
- 4:52集める ― クローラーがたどる
- 5:22WARC ― 通信のやりとりごと束ねる
- 5:51なぜ「やりとり」ごと残すのか
- 6:25再生する ― 当時のWebに戻る
- 6:50ここまでの整理
- 7:203. WACZ と 長期保存
- 7:30WACZ ― 持ち運びやすい器
- 8:00みんなで支える標準
- 8:28残した後も、守り続ける
- 8:58ここまでの整理
- 9:30研究資料としての Web
- 9:58ここで少し、考えてみよう
- 10:22まとめ
- 10:57出典・ライセンス
- 11:29ご清聴ありがとうございました

























