過去のWebサイトを見る方法は?WayBack Machine(ウェイバックマシン)が代表的なツール

過去のWebサイトを見る方法は?WayBack Machine(ウェイバックマシン)が代表的なツール

Web上にあった過去のWebサイトをもう一度閲覧したいという人は、少なくありません。一方で、削除されたサイトはもう二度と見られないもの、と諦めてしまう人も多いでしょう。しかし、過去のWebサイトはツールを利用して再閲覧することができるのです。

本記事では、過去のWebサイトが閲覧できるおすすめツールや使い方、過去のWebサイトを閲覧するメリットなどを解説します。参考にして、過去のWebサイトを今に活かす手助けにしてください。

過去のWebサイトの定義

過去のWebサイトとひとくちに言いますが、実際には意味が2つに分かれます。ひとつは現在何らかの理由で削除され、閲覧不可になっているサイト。もうひとつは問題なく現存しており、単に作成されたタイミングが古いサイトを意味します。

本記事では前者で示す、現在閲覧不可となったサイトに焦点を当てて解説します。

過去のWebサイトを閲覧するメリット

過去のWebサイトを閲覧するメリットは以下の通りです。

【過去のWebサイト閲覧によるメリット】
情報源として使用できる
サイトの分析に使用できる
ユーザーに過去のWebサイトの情報を提供できる
期限切れドメインを確認できる

現在特にトラブルなどがない場合、古いサイトの閲覧がどうメリットに繋がるのか、ピンとこない人もいるでしょう。しかしいつか問題が発生した際に、「過去のWebサイトを参考にする」という手段があることを知っておいて、損はありません。

情報源として過去のWebサイトを使用する

過去のWebサイトは情報源のひとつとして活かすことができます。

自分のサイトか他人のサイトかを問わず、何らかのWebページを仕事や生活に役立てている人は多いです。しかし情報源として頼りにしていたWebサイトが、ある日突然消えてしまうということも珍しくありません。

他人のWebサイトが閲覧不可になる理由は、管理者が事業を畳んだりサーバーがサービスを停止したりなど、さまざまです。記載内容の重要性が高くとも、サイトが削除されることはあります。そのような際に、再度過去のWebサイトを閲覧できれば情報を再取得できます。

再閲覧できた場合、貴重な情報は抜き出して保存しておくのがおすすめです。いつでも閲覧できると考えていると、何らかのトラブルで叶わなくなったとき、再度同じことで困り果てることになります。

自分のサイトを誤って丸ごと削除してしまった場合にも、過去のWebサイトを閲覧することで内容の復旧に役立てられます。ただし自分のサイトであれば、できるだけバックアップを取って、情報を保存する方が良いでしょう。情報の確認だけならまだしも、サイトを一から構築し直すとなると手間がかかるためです。過去のWebサイトを閲覧することでのサイト復旧は、あくまで緊急時の手段です。

サイトの分析に使用できる

過去のWebサイト閲覧は、情報分析に役立つこともあります。

例えば、狙っているキーワードで検索結果の上位に位置していたサイトが、突然消えてしまうことがあります。そうなった場合有益な情報が消えてしまうだけでなく、なぜそのサイトが上位に位置していたのか、分析できなくなってしまうのです。そこで消えたサイトを再閲覧することで、どの情報が世間のニーズに合致していたのか、改めて分析できます。

分析は他人のサイトだけでなく、自分のサイトにも使用可能です。リニューアルして情報を更新したあとに、重要な情報を入れ忘れ、検索順位が下がってしまったというトラブルは起こり得ます。そこで以前のサイトと見比べることで、新旧両サイトの情報の差異を見比べられます。

現在のユーザーに過去のWebサイトを閲覧して欲しい

過去のWebサイトを管理者側でなく、ユーザーに確認して欲しいというケースもあります。

Webサイトの管理者側がサイトを畳んだり、まったく別のサイトを新規で作り、活動の場を移すという流れはよくあることです。しかし突然何も見られない状態にしてしまうと、ユーザーが困ってしまうケースがあります。たとえばユーザーに関わる重大な告知などは、ある程度の間閲覧できるようにしておいた方が親切です。

しかし一部のページのために、稼働が止まったサイトを維持管理し続けるのも手間がかかります。そこで、見せたいページのみ閲覧可能にし続けることで、維持管理に割くコストを削減できるのです。

期限切れドメインの選定

過去サイトを閲覧することで、期限切れドメインの選定を効率よく行えます。

ドメインとはWebサイトにおける住所のようなものです。URLにおいては「https://」以下の部分がドメインです。ドメインには有効期限があり、更新されないまま放っておかれた場合は、いずれ期限切れとなります。期限切れとなったドメインは、新たに他の人が使えるようになります。そして以前に使用者がいたドメインは、引き継ぐことで現在のWebサイトに影響を与えることがあるのです。

例えば以前のサイトが、優良で運営歴が長く、質が良かったりすると、検索エンジンに評価が残っている場合があります。優良サイトのドメインを引き継ぐことで、新しいサイトが一定の評価を受けた状態から運営することができます。

逆に以前のサイトが悪質なサイトであったり、アダルトサイトなどであった場合、ドメインを引き継ぐことで、悪評も引き継いでしまう事態になりかねません。運営スタートの時点からマイナス評価されている、などという事態を防ぐためにも、中古ドメインを使用する場合は事前の確認をしておくのがおすすめです。

過去のWebサイトを閲覧するツール

過去のWebサイトを閲覧するためには、専用のツールを使用する必要があります。さまざまな種類がありますが、本記事では一例として代表的な6つを紹介します。

なお、過去サイトを閲覧するツールとは、厳密に言うと過去サイトの記録を閲覧しているにすぎません。実際に過去のWebサイトを現在に復元しているわけではないため、その点を踏まえて扱ってください。また、どのようなサイトでも必ず閲覧できるとは限りません。訪問者が少なかったり、記録をとられる前にすぐに閉鎖したサイトなどは見つけられない場合もあります。

WayBack Machine

WayBack Machine(ウェイバックマシン)は、過去のWebサイト閲覧ツールとしてはもっともメジャーな存在といえます。運営者は、非営利団体のインターネット・アーカイブです。

過去サイトを閲覧するツールは、目的上運営期間の長さも重要になります。WayBack Machineは2001年より運営されており、これは他のツールに比べても長期間といえます。頻繁にクロール(巡回)を行うため、アーカイブの量も相当なものです。WayBack Machineのトップページに記載されていますが、現在保存されているWebページの数は7370億を超えています。

また、WayBack Machineは一部地域を除き、世界中のどのようなサイトでも記録を取っています。欧米ではないから、趣味のサイトだからといって、記録を取られていないというわけではありません。見つけにくいと思われるサイトでも、探してみる価値はあるでしょう。

URL:https://web.archive.org/

WARP

WARP(ワープ)は正確にいうとツールの名前ではなく、日本の国立国会図書館が行っているインターネット資料収集保存事業のサイト名です。サイトにアクセスすると検索フォームだけでなく、インターネット上の資料について、収集意義や収集方法についての解説が閲覧できます。

収集範囲は日本国内のWebサイトのみ。加えて、主に政治や経済、学術的な意味合いに比重をおいて記録が取られています。そのため、公共の利益に対し有益性が高いと判断された場合は、電子書籍や民間サイトなどであっても記録されていることが多いです。

一方で個人的な趣味などに関わるサイトやアダルトサイトなどは、見つからないケースがほとんどです。そういったサイトを閲覧したい場合は、他のツールの方が適しています。

URL:https://warp.ndl.go.jp/

Web魚拓

Web魚拓も過去のWebサイトを閲覧できるツールです。しかし単に閲覧目的というよりは、過去サイトを何らかの目的で引用したいという人に向けてのサービス、という側面が大きいツールです。

Web魚拓で取得されているWebページは、日時・URL・内容が後から編集できないようになっています。これにより、事実確認や時系列確認などに有効性を示すことができるのです。著作権や名誉棄損などのトラブルが生じた際、資料として引用できるとホームページに記載があります。

そのため、WebサイトというよりもWebページのアーカイブが充実しており、ネット掲示板やSNSなどの内容が多く保存されています。情報の移り変わりが激しかったり、後から容易に編集できるようなWebページを探す際におすすめのツールです。

URL:https://megalodon.jp/

 

Stanford Web Archive Portal

Stanford Web Archive Portal(スタンフォード・ウェブ・アーカイブ・ポータル)とは、スタンフォード大学が運営するツールです。独立したツールではなく、あくまでスタンフォード大学に帰属している機能であり、Stanford Libraryという資料サイトの一部になります。

WayBack Machineと比較すると、やや日本語サイトのアーカイブ量が少なめです。しかし、WayBack Machineが取得していないアーカイブも保存しています。また、WayBack Machineと使用感が似ています。そのためどちらかがスムーズに使えるのであれば、もう片方も違和感なく使用できるでしょう。

URL:https://swap.stanford.edu/was/

発見の可能性が低いケース

Webサイトの中でも、比較的アーカイブを見つけにくいサイトがあります。以下の条件のいずれか、あるいはすべてに当てはまる場合です。

【アーカイブを見つけにくいサイトの傾向】
公益性が低い
アクセス数が少ない
運営歴が短い
URLを知らない

たとえば個人の趣味に特化したサイトなどは、情報価値として小さいとプログラムに判断され、詳細が残らない傾向にあります。アクセス数が少ないサイトも、そのサイトを有用と判断している人が少ないということになるため、やはり記録されにくいです。また、質の高いサイトであってもできた直後に削除されてしまうと、記録を取られるだけの時間がないため確認できない可能性が高まります。

さらに、多くのツールではURLでアーカイブを検索します。そのため、URLがわからないサイトは発見の難易度が上がってしまうのです。サイト名や検索キーワードではなく、URLを優先的に覚えておいてください。

また、手を尽くしたとしても見つからない場合もあります。ツールを使ったからといって、必ず見つかる保証があるわけではないということは覚えておきましょう。

WayBack Machineの使用手順

過去のWebサイトを閲覧できるツールの中でも、代表的なWayBack Machineの使用手順を解説します。とはいえ、特に難しい操作が必要なわけではありません。

見たいサイトを探す

まず、目的のサイトが記録されているか探します。トップページを開いてください。

 

矢印で示した部分のどちらかに、URLか検索キーワードを入れて検索します。ツールの中にはキーワード検索ができないものもありますが、WayBack Machineはキーワード検索も可能です。

ただし膨大な数のアーカイブが出てきてしまうため、URLの方が手間がかかりません。ここではURLを入れたものとして解説を進めます。

URLを入れると、結果が表示されます。

該当URLに対し、記録を取った回数と期間を示します。

カレンダー表示は回数とタイミングを可視化したものであり、任意の年代をクリックすると、真下に表示されるカレンダーの年度を変更可能です。

ページ上部の横長の棒グラフは月別の記録回数を示しており、頻繁に記録を取られていると、比例して水色の丸が大きくなります。クリックすると何時に記録されたか一覧で表示されるため、見たい時間帯をクリックしましょう。するとWebサイトが表示されます。

同じURLであっても、記録は何度か取られることがあります。そのため、頻繁にキャプチャされていれば、同ページの移り変わりを確認することが可能です。

 

Webページの見方

上記の方法でWebページを開くと、ページ上部にツールバーが表示されます。

ツールバー左端は、該当ページが何度、どの期間で記録されたか示されています。

ツールバー中央はその頻度を棒グラフで可視化したものであり、赤くなっている線が現在閲覧中の時系列を示しています。

ツールバー右端は現在閲覧しているページの記録が取られた日付であり、矢印をクリックすると時系列を早めたり戻したりという操作ができます。

なお、ツールバーは閉じることもできます。

WayBack Machineの使用注意点

WayBack Machineを使用するにあたって、注意点もあります。大きなものは以下です。

【WayBack Machineの注意点】
ギミックが機能しない場合がある
リンクは記録に依存する
更新と記録は連動しない

ギミックが機能しないことがある

WayBack Machineで閲覧できるページでは、「キーワード検索」「並べ替え」「カテゴリ検索」などのギミックが上手く機能しないことがあります。

機能しない場合でも、見かけ上動かすことは可能です。しかし同じページが再表示されたり、数十件あったはずの該当記事が0件になってしまったりして、結局見ることはできないという結果に終わるのです。

とはいえサイトによっては機能することもあるため、必要であれば試してみる価値はあるでしょう。

リンクは記録に依存する

WayBack Machineで閲覧できるページは、すべてページごとに管理されています。そのため、記録されていないページは見ることができません。

例えばAというサイトが、Bというサイトにリンクを貼っている場合です。リンクをクリックしてサイトBに移ったとしても、Bの記録が取られていなければページはエラーとなり表示されません。

また、記録はあくまでページごとであり、サイトごとではありません。そのため同じサイトでも、トップページは見られるがコンテンツページはエラーが出るというケースもあります。過去のWebサイトを閲覧する場合は、トップページを確認して安心するのではなく、目的の情報まで見られるか確認が必要です。

更新と記録は連動しない

WayBack Machineの検索ページにも記載がありますが、WayBack Machineがデータを取るタイミングは、サイトの更新と連動していません。タイミングによっては、まったく更新されていないページが何度も記録されている。あるいは、何度も更新されているのにほとんど記録に残っていないというケースもあります。更新される度に記録が取られる、と考えるのは間違いであると知っておきましょう。

Web業界10年以上の知見を持って、無料にてご相談へ対応いたします。
情報収集目的でも歓迎です。お気軽にご連絡ください。

  • 人材育成領域

    人材育成領域

    サイト流入
    2.3倍
    (6,843セッション→16,001セッション)
    反響
    2.1倍(12→25件)
    上位表示キーワード例
    「人材育成(検索Vol.8,100)」
  • 婚活領域

    婚活領域

    サイト流入
    2.1倍
    (52,945セッション→110,164セッション)
    反響
    1.3倍(412→536件)
    上位表示キーワード例
    「婚活(検索Vol.40,500)」
  • 日常用品領域

    日常用品領域

    サイト流入
    3.3倍
    (31,874セッション→105,514セッション)
    反響
    3.4倍(84→293件)
    上位表示キーワード例
    「お水(検索Vol.4,400)」

Web集客・制作・PRのご相談はこちらよりどうぞ

以下の内容でよろしければ、送信ボタンを押して下さい。

会社名
氏名
メールアドレス必須
電話番号
お問い合わせの種類
お問い合わせ内容

個人情報保護方針に同意の上、
送信ください

この記事の監修者

株式会社ブランディングワークス編集部

株式会社ブランディングワークス編集部

SEO対策・コンテンツマーケティングの支援事業者。SEO支援を中心に、伴うWeb制作修正やコンテンツ制作まで一気通貫した支援を実施。実績のあるパートナー会社と連携してその他Webマーケティング(広告運用・SNS・メディアのマネタイズetc.)も幅広くカバーし、戦略立案から実行までを総合的に支援も可能。

LIGブログに掲載されました