日に日に分からんことが増えていく…

プログラマー初心者としての日々を学んでいることを記録していく。

行動履歴の取得方法について

行動履歴のログ取得、つまり、アクセスの解析には以下のやり方があるらしい。

‘'アクセス解析ツールの測定方式は時代とともに変遷してきた。まず、一番古くからあるのが、Webサーバーのログを解析する「サーバーログ取得型」だ。それから、HTMLファイルにJavaScriptのタグを記述する「Webビーコン型(タグ型)」、最後の1つが「パケットキャプチャリング型」である。 ’'

この中でも、HTMLにタグ(javascript)を入れて情報を取得する「Webビーコン型」について調べた。 ‘'サイトの各ページにJavaScriptや特殊な画像イメージ(縦横1pxの透明なGIF画像など)をタグとして埋め込んでおき、貼り付けたページがブラウザで表示されるたびに、情報収集を行うサーバーにユーザーがアクセスしたページの情報を送る仕組みをWebビーコン型と呼びます。’'

外部の解析サービスに行動履歴の情報を飛ばさない場合は、自社のサーバ(Webサーバ→解析サーバ)に情報を飛ばす必要がある(proxyが必要)。 そのプロキシってリトライするのか調べていたが、情報を見つけられなかった。。

web-tan.forum.impressrd.jp

www.internet-koukoku.co.jp

プロキシのリトライについて調べていたら、以下のpythonの変な実装のページに飛んだ。

pythonのrequestsでリトライとプロキシを設定 : mwSoft blog