日に日に分からんことが増えていく…

プログラマー初心者としての日々を学んでいることを記録していく。

BOLB/TEXTでインデックスを貼る。

SQL

最初の100文字のみインデックスとして使うみたいな指定が必要。 ERROR 1170 (42000): BLOB/TEXT column 'text_field' used in key specification without a key length create index new_index on table_name(text_field(100)); www.deftrash.com

Solrのelevate.xmlを確認する方法

elevate.xmlへの変更をtsvに出力。 import xml.etree.ElementTree as ETにて処理。 最初urllib2でとってきていたが、socketのエラーとかでデータが飛ぶので、requestsに変更。正規表現とかも意外に苦労した。 # -*- coding: utf-8 -*- # vim:tabstop=4:shift…

Excelをpythonで操作めちゃ便利(unicodeに変換してくれる)

以下のように使えて、めちゃ便利。 ただし、cell(0, 0) がexcelのA1に対応しており、そこの注意のみ必要。 import csvのようにunicode変換に悩むこともない。 import xlrd book = xlrd.open_workbook('test.xls') print book.name sheet1 = book.sheet_by_in…

MySQL5.6から5.7に変更する際に起こったエラーについて

vagrantsで今までMySQL5.6を使ってたが、速度が3倍になるということで5.7に変更。 はじめ以下の手順で確かめていた。うまくインストールできない。 # エラーの出る手順 [root # ] yum remove mariadb-libs [root # ] rm -rf /var/lib/mysql/ [root # ] yum l…

MYSQLを勉強するときに便利なサイト

SQL

www.dbonline.jp

SFTPのみ接続可。sshでのシェルは排除。

設定は以下のようにする。 # groupadd sftp_users # usermod -G sftp_users mokyu # vi /etc/ssh/sshd_config 147行目コメント化にしてその下に追記します # override default of no subsystems #Subsystem sftp /usr/libexec/openssh/sftp-server Subsystem…

vimの文字列置換

:%s/置換前文字列/置換後文字列/gc すると一つずつチェックしてくれる。 www.ksknet.net

references invalid table(s) or column(s) or function(s) or definer/invoker of view lack rights to use themが出た

SQL

このメッセージが出た場合は最初のcreatetableの際に変な設定が入っていることがある。 具体的に言うと後で全部の権限をuserに付与しても中のテーブルは特定のユーザしか見れなくなっている。 dumpしてloadした後にこのようなメッセージが出れば、以下の動作…

ミドルウェアとは何か

ミドルウェアって何って思って検索した。DBサーバとして動かすときに使うMySQLや Webサーバとして使うapacheなどらしい。 qiita.com

Apacheのアクセス制限について

そもそもアクセス制限について、Apacheの制御もしくはファイヤーウォールなどの外部機器での制御(iptable)がある。 ファイヤーウォールはインフラに含まれるんだなあと思いました。 mod_authz_core - Apache HTTP Server Version 2.4

tupleプルプル

tupleは一旦作成すると、値を変更できないけど、 "%s, %s" % tuple("hoge", "koge") のようについ変えられる。 追加で、ディレクトリを再帰的に取得するには下のようにすればいい。便利 $ grep -r 検索文字列 ディレクトリ tigawa.github.io

Mysqlのデータを変更する(MySQL-python==1.2.5)

データベースのqueryを整形する。データベースに突っ込む前に"をつけるのが必要なのとないのがあって訳わからん。 ついでにutf-8に変換しないといけないのと、conn.commit()しないとinsertが反映されないということでばりつまづいた。 # -*- coding: utf-8 -…

Webの反応を理解する(REQUEST_METHOD)。

GETやPOST以外にもHEAD、PUTなどのリスエストメソッドが存在する。 以下のstackoverflowで知った。 stackoverflow.com HTTP入門

SQLとSolrの情報を削除する方法

簡単な処理をバッチ化した。MySQLにアクセスする方法がわかったことが大きな収穫。 # -*- coding: utf-8 -*- # vim:tabstop=4:shiftwidth=4:expandtab import sys import MySQLdb import json import urllib2 import argparse from datetime import datetime…

Apacheのアクセスログはこんな感じでコマンドから調べられる。

切り取ってしまえば、調べが簡単 $ cut -d " " -f 1-8 access_log | grep "google" | grep -ve "10.0.0.1" -vEe "10\.0\.0\.(4[8-9]|5[0-9]|6[0-3])" | wc -l ossfan.net orangain.hatenablog.com ksmzn.hatenablog.com +α帯域制限をかけながらscpなどは行っ…

リストから重複した要素を削除したい

リストの中のリストの一部が重複した場合の処理 datas = [['111111', ], ['111111', ], ] seen = set() seen_add = seen.add datas = [x for x in datas if x[0] not in seen and not seen_add(x[0])] print datas # [['111111']] www.lifewithpython.com

日本語のcsvを取り扱う際便利(python2)

csvのunicode変換は手間取るけど、良さげな変換をクラスにしてまとめている人がいたので拝借した。 import csv import sys import tempfile import shutil import os calendar_dict = { "January": "1", "February": "2", "March": "3", "April": "4", "May"…

インデックスを理解する。

SQL

MySQLはインデックスを使うとうまくチューニングできるらしい。 なんかいいサイトないかと探していると発見。 qiita.com リンク先に一つずつアクセスして行って、学んでいこうとしてる。

ApacheでYou don't have permission to access / on this serverが出た。

要は権限の問題。作業ディレクトリに権限を渡してあげればいい。 akiniwa.hatenablog.jp

mysqldump: [Warning] unknown variable 'loose-local-infile=1'について

SQL

以下のERROR、、ではなくてWarningが出たので、対処した。 mysqldump: [Warning] unknown variable 'loose-local-infile=1' 以下のサイトを読むと、これは[Error] unknown variableを出さないための裏技っぽい。 んなこと知らんがな。どうなっとんじゃ。 gih…

何度かリリースを経験して

下で今のgit hashがわかるらしい。 git rev-parse HEAD 問題が起これば色々直して行く方法はある。 www.atlassian.com あと、リリース時には操作コンソール、ログ確認、topコマンドによる確認。の3つをしながら行う方がいい。

課題もらっちゃった。。

SQL

これについて解いていこうと思っている。 何か処理したレコード群を、既存のテーブルにon duplicateでinsertする課題。 1. バルクinsert 2. tsvに一旦出力して、ローカルload dataとリモートload data 3. tsvに一旦出力して、csv engineでtableに見せかけて…

Webのアクセスピーク時の負荷を測るにはSiegeってものがあるらしい。

Webの最後の負荷テストの時に色々ツールがあると便利だ思った。 他のテストもツールを組み合わせるといい感じに成形できそう。 qiita.com 以下は今のレスポンスタイムを確かめる方法。 $ curl -kL http://google.com -o /dev/null -w "%{time_total}\n" 2> /…

SQLの集約化した後の合計値

SQL

こんな感じでまとめられる。 SELECT sum(conversions.value)*count(DISTINCT conversions.id)/count(*) as conversion_value FROM links LEFT OUTER JOIN stats ON links.id = stats.parent_id LEFT OUTER JOIN conversions ON links.id = conversions.link_…

Atomのjson整形とGoogleAnalyticsについて

AtomのJsonデータをブラウザからコピーして、整形するときに使える。 loumo.jp また、ブログにはGoogleAnalyticsという便利ツールがあるらしい。 junichi-manga.com dev.classmethod.jp はじめてのアナリティクス API V4: インストール済みアプリケーション…

git pullしてCompressing objects: 100% (16/16), done.のような表示が出たら...

Git

gitを使っていて、なんかpullが重いとか思ったら巨大なファイルを圧縮してpullしているようなinfoが… 以下のサイトが役に立ちそうと思いました。 まあ、.gitignoreを再適用して別ブランチにpushしたら何事もなかったように動くんやけど、、、 Git - メインテ…

pythonのリスト内辞書のソートについて(JSON)

以下のような場合はこのようにソートできる。 >>>terms = [{'hoge':1}, {'hoge':3}, {'hoge':2}] >>>sorted(terms,key=lambda x:x['hoge'],reverse=True) [['hoge': 3}, {'hoge': 2}, {'hoge': 1}] jsonの値などをソートするときに有効。 nemupm.hatenablog.…

SolrのadminのAPIの話

Solrのadminについて、curlしてreloadすることがあると思う。 その時は $ curl "http://localhost:8983/solr/admin/cores?action=RELOAD&core=core0" とかすればいい。するともう一回、solrにデータを投入できる。 CoreAdmin API - Apache Solr Reference Gu…

Gitをpushして失敗した時と.gitignoreを後で追加した時

Git

Gitをpushして失敗した時は、以下をすると直っていく $ git log $ git revert commitnumber あと、gitしてignoreを後で追加した時 git rm -r --cached . git add . qiita.com

ファイル内の文字列探索

現在のディレクトリ以下のファイルの文字列を探索する方法。 $ find . -type f -name "*.html" | xargs grep ' 探索したい文字列' -n find コマンド | コマンドの使い方(Linux) | hydroculのメモ

Gitの取り消し作業

Git

Git でローカルの変更を元に戻すには $ git checkout ファイル名 特定のファイルではなく、全て元に戻したい場合は $ git checkout . git pull の取り消し git reset --hard HEAD^ tnakamura.hatenablog.com tm.root-n.com

入力した行の全消し(ターミナル)

Ctr+uとCtr+kで全消しができる。 あと、iterm2ではshift + Ctr + Hでクリップボードが発動。 bacchi.me

unicodeの"__mod__"について

__mod__は数値の場合、割り算のあまりとなっているが、文字列にも存在したので、調べて見た。 %は%sや%dなど、文字列のフォーマットとして使われているところからきているのか、 >>> print '%s'.__mod__('kokoko') kokoko のように使うっぽい。 qiita.com

MultiValueFieldがドキュメント見てもわからなかった。

Form fields | Django documentation | Django 上のドキュメント見てもよくわからなかったので、探しているといい感じに解説しているサイトがあった。 coderwall.com どうやら、1つのinputに対して、二つのformを取得できるようにカスタマイズできるらしい。

Solr6の使い方

以下のようにしてスタート。 $ bin/solr start -p 8984 qiita.com

バックグラウンドで動かす方法(runserver)

python runserverを開発環境のバックで回していたい時。 $ nohup python apps/manage.py runserver 0.0.0.0:8000 > /dev/null 2>&1 < /dev/null & $ jobs $ ps aux | grep runserver $ %1 $ kill %1 これでいける。disownもあるけど、こっちの方がログアウト…

curlについて

man curlでもいいが便利だったので、サイトを転載。 qiita.com

Solrのポート(8983)がない時の対処法

$ java -jar start.jar -Djetty.port=8982(8983以外) stackoverflow.com

正規表現(sub, match)

pythonの正規表現でcompileしたのちにsubすると対象正規表現を一括で置換してくれる。 以下はアルファベット大文字の後に"_“を入れる変換。「(?!^)…」は…にマッチしたときにマッチしない。ただし、先頭を除く。 import re UPPER_RE = re.compile('(?!^)([A-Z…

サイドバーの情報をターミナルに出力する

Webのサイドバーの情報をスクレイピングする必要があったので、作ってみた。 requests、beautifulsoupとStackoverflowから拝借。。 import requests from bs4 import BeautifulSoup import pprint class MyPrettyPrinter(pprint.PrettyPrinter): def format(…

django1.6でmigrateができなかったので

makemigrationsからのmigrateが1.8とかのようにできないため、python-MySQLをpipインストールしてゴニョゴニョするのが鉄板らしい。 python manage.py syncdb Django のチュートリアルをやってみるよ (1) - co3k.org

MySQLのDATETIMEにNULLが入力されない場合について

csvをインポートしてmysqlのtableに入れた際、エラーが出た。 どうもsql_mode = STRICT_ALL_TABLES,NO_ZERO_DATE,NO_ZERO_IN_DATEの設定がかかっているらしい。 テストデータの際はDATETIMEだけ適当な日付を入力すればいいのかも。 fanblogs.jp あと、新たに…

DictCursorについて(MySQL-python)

DictCursorはCursorと違って、dictをreturnするらしい。 なので、 import MySQLdb.cursors from django.db import connection conn = connection.connection cur = conn.cursor(MySQLdb.cursors.DictCursor) の場合は、DictCursorを引き継いだdjangoのcursor…

python manage.py muigrateしてもDBが変わらない。

以下のように記載されている場合migrationが反映されず、 規定のDBにてmodel.pyが管理される。 class Items(models.Model): name = models.TextField(blank=True, null=True) class Meta: managed = False db_table = 'items_catalog' atsuya046.hatenablog.…

%のエスケープとstaticmethod

%のエスケープめんどくさくなっていた。 a = 'My name is 100%% %s .' しないとダメらしい stackoverflow.com staticmethodは何かと便利らしい。 hideharaaws.hatenablog.com

djangoのローカル開発環境を作るためのsqlのDB登録方法

ただ、utf-8で行うだけ。create tableを本番と合わしたいなら確認すればいい。 mysql> show variables like "chara%"; +--------------------------+----------------------------+ | Variable_name | Value | +--------------------------+----------------…

workon(mkvirtualenv)について

qiita.com

Apacheのサーバについて

djangoにてrunserverは自動更新するが、apacheはされない。 $ ps aux | grep python $ ps aux | grep httpd $ sudo /usr/local/apache24/bin/apachectl help $ sudo /usr/local/apache24/bin/apachectl graceful すると変更が反映される。 apache勉強しない…

SQLのdump,loadの話(付録:データ型)

SQL

dumpとはメモリやDISKのデータをファイル形式に出力することらしい。 # dump $ mysqldump -u username -ppassword database_name | gzip > dumpfile.sql.gz # load $ zcat dumpfile.sql.gz | mysql -u username -ppassword database_name qiita.com あとはデ…

git-flow(homebrewにて追加)について

git flowを使い管理していく時の便利だったサイト。 $ git flow init $ git checkout -b feature/other origin/feature/other ---> remoteよりfeatureを引っ張ってくる rfs.jp qiita.com qiita.com brew.sh centOSにもmacにも入れれるHomebrewも合わせて書い…