消えてしまった過去のウェブページが見たい！　そんなときどうする？

知っておいたらきっとトクする3つの方法

2017/02/24

【質問】
　あるウェブサイトを訪れたところ、デザインががらりと変わっていて、過去に掲載されていた記事も消えてしまっていました。もう一度読みたいのですが、なんとかして見られる方法はありませんか？

【回答】
　過去の記事が完全に見られなくなっているのであれば、それは運営者側の意向だと考えられますので、むやみに探すのは望ましいことではありません。もっとも、うっかりミスによるリンク切れだったり、あるいはサーバが一時的にダウンしていて急いで確認したい情報があるなど、相応の理由があるのであれば、過去のページを見られる方法を知っておくと、なにかと重宝します。

　現在、過去のページを見るには、大きく分けて3種類の方法が考えられます。Googleのキャッシュを見る方法、Internet Archiveの「Wayback Machine」を使う方法、そして魚拓サイトのキャッシュを探す方法です。それぞれの特徴とその方法について見ていきましょう。

◆その1：Googleのキャッシュを見る方法

　検索エンジンのGoogleは、世界中のサイトを定期巡回し、それらのキャッシュを同社のサーバに保存しています。もしサーバに障害が起こってサイトが見られなくなっても、Googleの検索結果に表示される「キャッシュ」をクリックすることで、内容を参照できるというわけです。ほとんどのリンクはそのまま機能しますので、サイト内の他のページも参照できます。

　ただしこのキャッシュは前回巡回した際のデータ、つまり当日や前日のデータであることがほとんどで、はるか以前からリンクが切れている記事を探すには向きません（そのページのURLが分かっているならば別ですが）。どちらかというと、サーバ障害で一時的に見られない場合の代替としてのみ、利用価値があると考えたほうがよいでしょう。

Googleでサイトを検索したのち、その検索結果に表示されるURLの右端の三角マークをクリックします

キャッシュが表示されました。上段にはいつ取得したキャッシュデータなのかが表示されています。リンクも生きていますので、それらをたどって他のページを見ることもできます

◆その2：Internet Archiveの「Wayback Machine」を使う方法

　2番目の方法は、Internet Archiveの「Wayback Machine」を使う方法です。Internet Archiveは世界中のウェブページを収集し、アーカイブとして保存している非営利団体で、20年もの歴史があります。そんなInternet Archiveが提供しているサービスが、URLと時期を指定してウェブページのアーカイブを参照できる「Wayback Machine」です。

　使い方は簡単で、「Wayback Machine」にアクセスして、該当サイトのURLをフォームに入力して「BROWSE HISTORY」をクリックします。すると過去に取得したアーカイブが、カレンダー形式で表示されます。画面の上段で西暦を選んだのち、その下に表示される月次カレンダーで日付を選べば、指定日に取得したアーカイブが表示できます。画像、動画など一部のコンテンツを除けば、ほとんどのリンクは生きていますので、リンクをたどって他のページを参照することも可能です。

「Wayback Machine」。上部のフォームにURLを入力して「BROWSE HISTORY」をクリックします

結果が表示されました。上段の黒い棒グラフはアーカイブを取得した年月とその回数を、下段のカレンダーの日付に付けられた青い丸は取得日を表しています

青い丸をクリックすると、その日に取得したアーカイブが表示されます。必要に応じて、日付を切り替えて表示することも可能です

　ちなみにアーカイブが作成される周期は、サイトごとにバラバラです。アーカイブはクローラーが定期的に巡回することで作成されますが、毎日のようにアーカイブが作成されることもあれば、更新頻度の低いサイトだと半年以上も音沙汰がないこともざらです。サイトの更新に合わせてキャッシュが作成されるわけではないので、必ずしも目当ての内容が見つからないこともあります。

　余談ですが、この「Wayback Machine」にサイトのアーカイブを保存されたくない場合は、ウェブページ側の「robots.txt」にこの「Wayback Machine」のクローラーを除外する設定を追加すれば、以降はキャッシュは取得されなくなります。また掲載済みのキャッシュについては、サイトの運営者からメールでの申請を行うことで、取り下げを行ってくれます。