※本記事にはプロモーションが含まれています。
前回の記事では、WordPress公開直後にBotがアクセスしてくる様子を紹介しました。
今回はそのアクセスログを詳しく見て、Botが最初に確認しているURLを分析してみます。
WordPressサイトを公開すると、驚くほど早くBotがアクセスしてきます。
しかも、検索エンジンのクローラーだけではありません。
セキュリティスキャナーや自動巡回Botなど、さまざまなBotがサイトを確認しに来ます。
実際にサーバーログを見てみると、公開直後のBotはある特徴的なURLを最初に確認していることが分かりました。
この記事では、実際のアクセスログをもとに、
- WordPress公開直後にBotが確認するURL
- なぜそのURLが最初にアクセスされるのか
- そこから分かるBotの目的
を分かりやすく解説します。
WordPress公開直後に最初にアクセスされたURL
まずは、実際のアクセスログの一部を見てみます。
GET / HTTP/2.0
GET /favicon.ico
GET /favicon.pngこのログを見ると、Botは次の順番でアクセスしています。
- トップページ
/ - favicon
/favicon.ico - favicon
/favicon.png
つまり、Botはサイトのアイコン(favicon)をすぐに確認しているのです。
なぜBotはfaviconを確認するのか
faviconとは、ブラウザのタブなどに表示されるサイトアイコンのことです。
WordPressでは通常、次のような場所にあります。
/favicon.ico実はこのfaviconは、Botにとってサイトの種類を識別する手がかりになります。
その理由は、次の3つです。
理由① サイトの存在確認
まず、Botはサイトのトップページにアクセスして
GET /でサイトが存在するかを確認します。
そのあとに favicon を取得することで、
- 正常なサイトか
- 実際に稼働しているか
を確認します。
これはスキャナーの初期チェックとしてよく使われます。
理由② サイトの指紋(フィンガープリント)取得
faviconは、セキュリティスキャンでよく使われるフィンガープリント情報です。
faviconのハッシュ値を計算すると、
- CMSの種類
- 使用しているサービス
- 特定のアプリケーション
などを識別できることがあります。
たとえば、
- WordPress
- Jenkins
- GitLab
- 管理パネル
などは、faviconで判別されることがあります。
そのためスキャナーは、
/favicon.icoを取得してハッシュを計算し、どんなシステムが動いているかを推測します。
理由③ 脆弱性スキャンの準備
サイトの種類が分かると、Botは次のような行動を取ります。
例
/wp-login.php
/xmlrpc.php
/wp-adminなど、CMSに合わせたURLをスキャンします。
つまりfaviconは、「このサイトをどう攻撃するか」を決めるヒントになることがあります。
実際のBotの挙動|公開直後のアクセスログ
公開直後のログを整理すると、次のような流れでした。
GET /
↓
GET /favicon.ico
↓
GET /favicon.pngこれは典型的な自動スキャナーの初期動作です。
サイトの状態を軽く確認してから、CMSの判別やスキャン対象の決定を行っていると考えられます。
WordPressサイトではよくあるBotの次の行動
WordPressサイトの場合、その後に次のURLがスキャンされることがよくあります。
例
/wp-login.php
/xmlrpc.php
/wp-json/
/wp-content/plugins/
/wp-adminこれはWordPressの
- 管理画面
- API
- プラグイン
- 認証機能
などを確認するためです。
つまり、Botは
- サイト存在確認
- favicon取得
- CMS判別
- 脆弱性スキャン
という順番で動くことが多いのです。
サーバーログを見ると分かること
今回のようにアクセスログを確認すると、次のようなことが分かります。
- どんなBotが来ているか
- どのURLをスキャンしているか
- 攻撃前の挙動
これはセキュリティ対策としても非常に重要です。
ログを見ていると、「Botはこんな順番でサイトを調べているのか」という発見がたくさんあります。
まとめ|Botはfaviconでサイトを識別している
WordPress公開直後のアクセスログを見ると、Botは次の順番でサイトを確認していました。
- トップページ
/ - favicon
/favicon.ico - favicon
/favicon.png
faviconは単なるサイトアイコンですが、
- サイト識別
- CMS判別
- スキャン準備
などに使われることがあります。
普段あまり意識しないファイルですが、サーバーログを見るとBotの行動パターンがよく分かります。
WordPressサイトを運営している人は、一度アクセスログを見てみると面白い発見があるかもしれません。
