能動的に公開停止された内容の救出 — Wayback Machineをフォレンジック手段として使う
#security/forensic#web-archives#evidence-preservation
ウィキ上の位置づけ
この項目はFinWiki indexの下に位置づけられる。同種の文脈としてチームの真正な身元をめぐるフォレンジック・アンカーチェーン — 多源指紋の合成、より広い証拠境界としてシステム基盤とあわせて読む。
[!info] 要約 プロジェクト側が能動的に公式サイト / docs / PDFリンクから撤回した文書は、当事者がリスクを認識していたことの強いシグナルである。Wayback Machine (web.archive.org) で救出した原文は、「現在の自主修正 / 否認」と「過去の発言」のトーン乖離を対照するうえで、単一論点の証拠源となりうる。PDFリンクの403は終点ではなくデータである。Mt.Gox 破綻処理タイムライン(2014-2026)のような取引所事件の初期開示も、こうしたアーカイブ保全に大きく依存してきた。
操作手順
- 直リンク取得 + HTTP code記録 — 現在404/403、数か月前は200という時系列自体が証拠になる
- Wayback Machineの履歴スナップショット — web.archive.org/web/*/
で全スナップショット時刻を取得 - 最古 + 直近の2スナップショットを比較 — 静かな改訂や完全撤去が入っていないかを確認
- PDFを直接ダウンロードしてメタデータを検証 — author / 作成ソフト / 作成日時
- 原文をバックストアに保存 — プロジェクト側が後日Wayback自体に撤回申請を出す可能性がある(takedown申請の仕組みが存在)
使う場面
- プロジェクト側のREADME / docs / PDFで新たに404が出現したケース
- ホワイトペーパーのページが「一時メンテナンス中」のまま1週間以上経過したケース
- 重要な主張が最新版ドキュメントから消えているが、過去版には記載があった記憶があるケース
- 「公開されているはずだが見つからない」あらゆるartifact — 国内 VASP 暗号資産流出事件史 (2014-2026)に含まれる破綻 / 免許剥奪済み取引所の初期マーケティング / リスク開示ページも該当
使わない場面
- プロジェクト自体のrobots.txtがアーカイブをブロックしているケース(Wayback側にも保存されていない)
- そもそも一度も公開されていない文書(de-publishではなくnever-publish)
- 単なるCDNの一時障害(status code + retryで除外可能)
来歴
- ケーススタディ(vaporware audit): ホワイトペーパーPDFリンクが403 、Waybackで原文を救出、唯一の証拠源としてプロジェクト側の「撤回済 / 否認」claimとのトーン乖離を対比
- チェーン調査で推定されるフォレンジック標準実務 — 商用グローバル暗号資産フォレンジックベンダー層 — Chainalysis / Elliptic / TRM / Crystal 比較はWaybackをオンチェーンclusterデータと結合し、完全なattribution packageを構築するのが定石