インターネットアーカイブ(Internet Archive)とは
投稿日:2017/04/19 (更新日:)
Internet Archive(インターネットアーカイブ)は、様々なデジタル情報の収集や情報のデジタル化を行い、アーカイブしている非営利団体です。
アーカイブの他にウェイバックマシンなどのツールやサービスも提供しています。
1996年に設立されてから、アーカイブや収集した情報は拡大し続けています。
インターネットアーカイブの目的とは
インターネットアーカイブのブログで目的について発言しています。
インターネットアーカイブは、研究者、歴史家、学者がデジタルで存在する歴史的コレクションに常時アクセスできるようにする目的です。
また、サイト内ではこのように述べています。
引用元:About the Internet Archive
私たちの使命は、ユニバーサルアクセスをすべての知識に提供することです。
私たちは公開された作品を収集し、デジタル形式で利用できるようにします。
私たちはインターネットにアクセスする世界中の誰にでも役立つ公共図書館を建設しています。
情報の移り変わりが早く激しいウェブの世界で過去のデータが蓄積され誰でも閲覧できることは大変便利です。
インターネットアーカイブは、変化するメディアであるインタ―ネットを一時的なメディアであると考え、情報の収集や保存を行っています。
世界トップ300に入るサイト
膨大な情報を蓄積し提供しているインターネットアーカイブは、世界のトップ300に入るサイトになっています。
多くのサービスを提供し多くの人々に利用されているサイトやサービスですが、どのようなサービスがあるのか見ていきましょう。
インターネットアーカイブが提供しているサービス
「Internet Archive Projects」内にサービスや取り組みの紹介がありますので説明します。
- Political TV Ad Archive
- 政治のTV広告やソーシャルメディアなどの広告をアーカイブしています
- Building Libraries Together
- ユーザーも情報やメディアの収集や追加をすることができます
- Open Library
- 電子書籍を無料で読むことができます
- Scanning Services
- コレクションをスキャンしデジタル化できるサービスです
- Software Archive
- あらゆる種類の合法的にダウンロード可能なソフトウェアと関連情報を保存しています
- Wayback Machine
- Webサイトのアーカイブになり、過去のサイトも閲覧が可能です
- Archive-It
- デジタルコンテンツの収集、構築、保存を支援するサービスです
- BookServer
- インターネット上で書籍を販売、貸与、配布するためのオープンアーキテクチャを提供しています
- Open Content Alliance
- 多言語のデジタルテキストとマルチメディア資料を保存するサービスです
- Education
- 米国と中国の大学から数百の無料コース、ビデオ講義、補足資料を含むライブラリです
- Bookmobile
- インターネットからパブリックドメインの書籍を衛星経由でダウンロードし、いつでもどこでも誰でも印刷できるサービスです。
- Open Community Networks
- 低所得のサンフランシスコ市民に無料の高速インターネットを提供しており、その他のコミュニティにも同様の取り組みを行っています。
- Petabox
- 1ペタバイト(100万ギガバイト)の情報を安全に保存できるストレージシステムです
- 301Works.org
- URLマッピングをアーカイブするためのサービスです
APIの提供
Internet ArchiveのウェイバックマシンはAPIのサポートをしています。
- Wayback Availability JSON API
- 指定されたURLがアーカイブされ、Wayback Machineでアクセス可能かどうかを確認できます
- Memento API
- Wayback Machineのスナップショットを照会するために用います
- Wayback CDX Server API
- キャプチャデータの複雑なクエリやフィルタリングの分析ができます
主なアーカイブの種類
インターネットアーカイブが、収集し保存する情報は様々な種類があります。
主に取り扱っているものはウェブサイト、ソフトウェア、音楽、映画、無料書籍になります。
音楽や映画などの著作権が発生するものは、著作権が切れたものをアーカイブしていってます。
また、ウェブサイトは公開されているページを収集しパスワードが必要なページなどは収集していません。
引用元:About the Internet Archive
- 279億のWebページ
- 1100万本の本とテキスト
- 400万のオーディオ録音(160,000のライブコンサートを含む)
- 300万のビデオ(100万のテレビニュース番組を含む)
- 100万枚の画像
- 100,000 ソフトウェアプログラム
上記のアーカイブデータがインターネットアーカイブの保有データに含まれています。
インターネットアーカイブにサイトを記録するには
特別なことをしなくても、クローラーが自動的にクロールしてアーカイブされている場合がほとんどでしょう。
また、インターネットアーカイブの無料アカウントを持っている方なら誰でもメディアをアップロードすることができ保存されます。
アーカイブを拒否するには
サイトのアーカイブをウェイバックマシンから除外することも可能です。
「robots.txt」を設置してアーカイブを拒否することもできますし、除外して欲しい趣旨とURLをEメールで伝えることでも対応してくれます。
インターネットアーカイブは様々な使い道がある
中古ドメインの運用履歴を確認する手段としてウェイバックマシンを主に利用しています。
中古ドメインの質を見る際には過去の運用履歴やサイトの内容を確認することが重要になるからです。
それ以外にもインターネットアーカイブは多くの使い道があります。
書籍や音楽、映画をアーカイブしてあり閲覧することができるのでメディアとして楽しむ目的で利用することもできます。
たくさんの用途やデータをアーカイブして提供してくれているインターネットアーカイブを様々な形で利用してみてください。