行動履歴の取得方法について

行動履歴のログ取得、つまり、アクセスの解析には以下のやり方があるらしい。

‘'アクセス解析ツールの測定方式は時代とともに変遷してきた。まず、一番古くからあるのが、Webサーバーのログを解析する「サーバーログ取得型」だ。それから、HTMLファイルにJavaScriptのタグを記述する「Webビーコン型(タグ型)」、最後の1つが「パケットキャプチャリング型」である。 ’'

この中でも、HTMLにタグ(javascript)を入れて情報を取得する「Webビーコン型」について調べた。 ‘'サイトの各ページにJavaScriptや特殊な画像イメージ(縦横1pxの透明なGIF画像など)をタグとして埋め込んでおき、貼り付けたページがブラウザで表示されるたびに、情報収集を行うサーバーにユーザーがアクセスしたページの情報を送る仕組みをWebビーコン型と呼びます。’'

外部の解析サービスに行動履歴の情報を飛ばさない場合は、自社のサーバ(Webサーバ→解析サーバ)に情報を飛ばす必要がある(proxyが必要)。 そのプロキシってリトライするのか調べていたが、情報を見つけられなかった。。

web-tan.forum.impressrd.jp

www.internet-koukoku.co.jp

プロキシのリトライについて調べていたら、以下のpythonの変な実装のページに飛んだ。

pythonのrequestsでリトライとプロキシを設定 : mwSoft blog

データベースのテーブル数算出とSolrグルーピングの仕様について

データベースのテーブル数算出する。

mysql> select count(*) from `information_schema`.`tables` where `table_schema` = 'database名';
+----------+
| count(*) |
+----------+
|       34 |
+----------+
1 row in set (0.00 sec)

teratail.com

また、SolrについてResultグルーピングとCollapseグルーピング。

$ curl -s "http://[domain名]:8984/solr/[core名]/select" -d "q=text:a&fl=name,height&group=true&group.field=height&wt=json&indent=on&sort=height desc"

$ curl -s "http://[domain名]:8984/solr/[core名]/select" -d "q=text:a&fl=name,height&group=true&group.field=height&wt=json&indent=on"

7zのファイルについて解凍

圧縮ファイルで「… .7z」というものがあった。 macのデフォルトのコマンドでは対応していないので、p7zipをinstallする必要がある。

# ディレクトリの圧縮
$ 7z u -r  [ディレクトリ名].7z [ディレクトリ名]

# 解凍
$ 7z x [ファイル名].7z

yuyunko.hatenablog.com

git flowでdevelopが更新されていた場合の処理

一旦featureをpushしてdevelopにマージさせる。

$ git checkout feature/[name]
$ git push
$ git checkout develop
$ git diff
$ git diff origin/develop
$ git pull
$ git merge origin/feature/[name]
$ git checkout feature/[name]

## git pullする前に処理状況を調べる
$ git status
$ git diff
$ git pull