昭和34年(1959年)創刊の総合週刊誌「週刊文春」の紹介サイトです。最新号やバックナンバーから、いくつか記事を掲載していきます。各号の目次や定期購読のご案内も掲載しています。

山口 真弘
2017/02/24

消えてしまった過去のウェブページが見たい! そんなときどうする?

知っておいたらきっとトクする3つの方法

【質問】
 あるウェブサイトを訪れたところ、デザインががらりと変わっていて、過去に掲載されていた記事も消えてしまっていました。もう一度読みたいのですが、なんとかして見られる方法はありませんか?

【回答】
 過去の記事が完全に見られなくなっているのであれば、それは運営者側の意向だと考えられますので、むやみに探すのは望ましいことではありません。もっとも、うっかりミスによるリンク切れだったり、あるいはサーバが一時的にダウンしていて急いで確認したい情報があるなど、相応の理由があるのであれば、過去のページを見られる方法を知っておくと、なにかと重宝します。

 現在、過去のページを見るには、大きく分けて3種類の方法が考えられます。Googleのキャッシュを見る方法、Internet Archiveの「Wayback Machine」を使う方法、そして魚拓サイトのキャッシュを探す方法です。それぞれの特徴とその方法について見ていきましょう。

◆その1:Googleのキャッシュを見る方法

 検索エンジンのGoogleは、世界中のサイトを定期巡回し、それらのキャッシュを同社のサーバに保存しています。もしサーバに障害が起こってサイトが見られなくなっても、Googleの検索結果に表示される「キャッシュ」をクリックすることで、内容を参照できるというわけです。ほとんどのリンクはそのまま機能しますので、サイト内の他のページも参照できます。

 ただしこのキャッシュは前回巡回した際のデータ、つまり当日や前日のデータであることがほとんどで、はるか以前からリンクが切れている記事を探すには向きません(そのページのURLが分かっているならば別ですが)。どちらかというと、サーバ障害で一時的に見られない場合の代替としてのみ、利用価値があると考えたほうがよいでしょう。

Googleでサイトを検索したのち、その検索結果に表示されるURLの右端の三角マークをクリックします
キャッシュが表示されました。上段にはいつ取得したキャッシュデータなのかが表示されています。リンクも生きていますので、それらをたどって他のページを見ることもできます

◆その2:Internet Archiveの「Wayback Machine」を使う方法

 2番目の方法は、Internet Archiveの「Wayback Machine」を使う方法です。Internet Archiveは世界中のウェブページを収集し、アーカイブとして保存している非営利団体で、20年もの歴史があります。そんなInternet Archiveが提供しているサービスが、URLと時期を指定してウェブページのアーカイブを参照できる「Wayback Machine」です。

 使い方は簡単で、「Wayback Machine」にアクセスして、該当サイトのURLをフォームに入力して「BROWSE HISTORY」をクリックします。すると過去に取得したアーカイブが、カレンダー形式で表示されます。画面の上段で西暦を選んだのち、その下に表示される月次カレンダーで日付を選べば、指定日に取得したアーカイブが表示できます。画像、動画など一部のコンテンツを除けば、ほとんどのリンクは生きていますので、リンクをたどって他のページを参照することも可能です。

「Wayback Machine」。上部のフォームにURLを入力して「BROWSE HISTORY」をクリックします
結果が表示されました。上段の黒い棒グラフはアーカイブを取得した年月とその回数を、下段のカレンダーの日付に付けられた青い丸は取得日を表しています
青い丸をクリックすると、その日に取得したアーカイブが表示されます。必要に応じて、日付を切り替えて表示することも可能です

 ちなみにアーカイブが作成される周期は、サイトごとにバラバラです。アーカイブはクローラーが定期的に巡回することで作成されますが、毎日のようにアーカイブが作成されることもあれば、更新頻度の低いサイトだと半年以上も音沙汰がないこともざらです。サイトの更新に合わせてキャッシュが作成されるわけではないので、必ずしも目当ての内容が見つからないこともあります。

 余談ですが、この「Wayback Machine」にサイトのアーカイブを保存されたくない場合は、ウェブページ側の「robots.txt」にこの「Wayback Machine」のクローラーを除外する設定を追加すれば、以降はキャッシュは取得されなくなります。また掲載済みのキャッシュについては、サイトの運営者からメールでの申請を行うことで、取り下げを行ってくれます。

◆その3:魚拓サービスを使う方法

 最後に紹介するのは、魚拓サービスを使う方法です。これは引用を目的にウェブサイトのコピーを取得しておくサービスで、魚の姿かたちを転写して残す行為になぞらえて、この呼び名が用いられています。国内では「ウェブ魚拓」というサービスがよく知られています。

 魚拓サービスでは、ロボットが定期巡回するインターネットアーカイブと異なり、手動でページを取得しなくてはいけないため、誰かがあらかじめ魚拓をとっていることが絶対条件になりますが、話題になっているページであれば、高い確率で過去のコピーが残されています。

 参照方法は「Wayback Machine」と同様で、サイトのトップページからURLを入力して検索します。このほかキーワードでの検索にも対応しており、過去の魚拓の中から任意のトピックを探すことができるのは、前述の2つの方法にはない利点です。

「ウェブ魚拓」。上部のフォームにURLを入力して「検索と確認」をクリックします
過去に取得された魚拓の一覧が表示されました。必要な日付を確認してクリックします
過去のページが表示できました。画面上部にはいつ時点の魚拓なのかが表示されています
 

 このほか、海外で著名な魚拓サービス「archive.is」(上の画像)でも、同様にウェブページのコピーを保存したり、スクリーンショットを撮ることができます。

 冒頭にも書いたように、できれば「しまった。消えてしまったあのウェブページが見たい!」という事態に陥らないことが一番です。しかし、誰しも緊急事態はあるものです。そんなときはこの3つの方法が役立つでしょう。

はてなブックマークに追加