Solr の debug を見やすくする

Solr

debug.explain.structured=true らしい。 http://example.com:8983/solr/item/select?indent=on&q=*:*&wt=json&debug=true&debug.explain.structured=true

2018-09-21

House Priceの分析6

Python3 機械学習

大まかな流れを把握 --> 提出まで読み込み #import some necessary librairies import numpy as np # linear algebra import pandas as pd # data processing, CSV file I/O (e.g. pd.read_csv) %matplotlib inline import matplotlib.pyplot as plt # Matl…

2018-09-20

wc -l のアクセス集計

Python3

wc -l のアクセス集計を pythonで集計した。 wc -l accesslog.* a = ''' 10914 accesslog.20180828010002 8636 accesslog.20180829010001 4742 accesslog.20180830010002 6399 accesslog.20180831010001 6901 accesslog.20180901010001 5503 accesslog.2018…

2018-09-18

MySQLのレプリケーションが遅延した場合

MySQL

レプリケーション遅延まずは、 show slave statusで Seconds_Behind_Master と Slave*Runningを確認する。どれくらい遅延しているか確認できる。 slave1 [localhost] {msandbox} ((none)) > show slave status\G *************************** 1. row *****…

2018-09-14

House Priceの分析5

Python3 機械学習

前処理 import pandas as pd import numpy as np import seaborn as sns import matplotlib import matplotlib.pyplot as plt from scipy.stats import skew from scipy.stats.stats import pearsonr %config InlineBackend.figure_format = 'retina' #set '…

2018-09-07

MySQL から pandas.Dataframe へ読み込む

Python3

pandasから、mysqlに読み込む方法 import pandas as pd import MySQLdb def pd_dbread(table, columns_list): """ 接続サンプル """ # 接続する con = MySQLdb.connect( user='aaa', passwd='aaa', host='127.0.0.1', db='aaa', charset='utf8' ) # カーソル…

2018-09-07

ramdom でshuffleすると、return Noneになる問題

Python3

こうすればいいらしい。 >>> import random >>> x = ['foo', 'bar', 'black', 'sheep'] # O(N) operations・・・shuffle と同じロジック >>> random.sample(x, len(x)) ['bar', 'sheep', 'black', 'foo'] # O(NlogN) operation >>> sorted(x, key=lambda k: …

2018-09-07

House Priceの分析4

Python3 機械学習

XGBRegressorっていう、回帰モデルがあるので確認。そもそも xgboost が結構界隈では有名らしい。 import pandas as pd from sklearn.model_selection import train_test_split from sklearn.preprocessing import Imputer data = pd.read_csv('kaggle/kagg…

2018-09-01

House Priceの分析3

回帰分析 ## 平均二乗誤差をルート def error(actual, predicted): actual = np.log(actual) predicted = np.log(predicted) return np.sqrt(np.sum(np.square(actual-predicted))/len(actual)) ## 対数変換 def log_transform(feature): train[feature] = n…

日に日に分からんことが増えていく…

φ(..)メモメモ

2018-09-01から1ヶ月間の記事一覧

Solr の debug を見やすくする

House Priceの分析6

wc -l のアクセス集計

MySQLのレプリケーションが遅延した場合

House Priceの分析5

MySQL から pandas.Dataframe へ読み込む

ramdom でshuffleすると、return Noneになる問題

House Priceの分析4

House Priceの分析3