Python

XGBClassifier + GridSearchCV (二値分類&不均衡データ) のsklearn-likeな書き方の例

以下の条件でのコードの書き方をまとめておく。 データがアヤメなので、あまりありがたみを感じないけど。 二値分類 不均衡データ Scikit-Learn like なXGBoost記法 GridSearchCV import numpy as np, pandas as pd from sklearn.datasets import load_iris …

Pythonを用いた最適化に関して

Pythonにおける最適化についてメモ。 集合(変数の添え字) 変数 ハード制約(制約式として実装) ソフト制約(目的関数に利得項として実装) 目的関数 その他(スラック変数) などを設定してソルバーで処理するのが大まかな流れ。 PuLPがよく使われると思…

word2vecというか、gensimの使い方

word2vecというか、gensimの使い方のひな形を書いておく。一つ注意。 学習のところで、windowというオプションがあるが、 これは、文の中だけが範囲であって、文を跨がない。 window (int, optional) – Maximum distance between the current and predicted …

Pythonのスライスの仕様について自分なりに考えた。

Pythonのリストや文字列にはスライスという機能が備わっているが、 基本的なところしか押さえてなかったので、もう少し踏み込んでみた。 書籍やサイトなども見てみたが、自分が納得できる説明を見かけなかったので、挙動から自分なりに仕様を考えてみた。 こ…

kaggleコンペのタイトル取得(追記:他のデータも取得するようにした。)

kaggleコンペについての参加者の取り組み(コメントとか、機械学習関係のコードとか)を調査研究しようと思い、 ひとまず、コンペのタイトルを取得するコードを書いた。 このページの下部にも記載したし、以下のGitHubにも記載している。 Python_code/code t…

os.nice(increment)

複数人でサーバーを使うときに並列処理をする場合、 他の人のことを考慮して並列数を指定するというのは当然やるのだが、 それだけでなく、 サーバーの負荷が大きくなってきたら自分が身を引くように、自分の優先度を低くしておくというのもやっておくべき。…

【PythonとStanで学ぶ】仕組みが分かるベイズ統計学入門  がいいよ、って話。

いろいろとベイズ統計学の教材(本やネットなど)を使って勉強してたけど、 以下の動画講座が個人的には一番良かった。 【PythonとStanで学ぶ】仕組みが分かるベイズ統計学入門 | Udemy これまで理解できてなくてモヤモヤしてたことがすっきりした。 しかも…

PyAutoGUIをちょっと使ってみた。

「退屈なことはPythonにやらせよう」という本を読んでいて、 PyAutoGUIの存在を知る。 いろいろ自動化して行く中で、特にマウス操作などのGUI関係は扱いに困ってしまい、自動化のネックなることが経験上よくあったのだが、このPyAutoGUIを使えば、いろいろ壁…

機械学習のパラメータチューニングなど(ポエム感強し)

機械学習のパラメータチューニングをするには、各パラメータのことを知らないといけない。そのためには、その機械学習のアルゴリズムをわかっていないといけない。 (当たり前なんだけど、パッケージに頼ると、スクラッチで書く人よりその辺りの意識が弱いと…

savファイルをRとPythonで開く。

savファイルというSPSS由来の形式のデータを (有料の)SPSSではなく、(無料の)RかPythonで開きたいなと思った。 R まずは、Rで開く方法を示す。 開く対象であるサンプルデータ(savファイル)は、以下。 NECO data このページにある、6areaeng.savを開く…

xgboost installation on mac

macosx Anaconda(Python3.6) にインストールしようとして、いろいろ苦労したので、メモ。 conda install -c conda-forge xgboost https://anaconda.org/conda-forge/xgboost

Pandas DataFrame の groupbyについて

pandas DataFrame のgroupby メソッドの理解が不十分だと感じていたのでメモすることにした。 まずは、題材となるデータフレームとその処理コードを書く。 import pandas as pd, numpy as np df = pd.DataFrame({"a":["A","A","B","B","C"],"b":[1,2,3,3,2],…

完全数と友愛数

NHKのドラマ「この声をきみに」を見た。 とある数学者が朗読と出会い、その魅力にとりつかれるドラマだ。 そのドラマを見てて、親和数(友愛数ともいう)が出てきた。 親和数とは、異なる 2 つの自然数の組で、自分自身を除いた約数の和が、互いに他方と等し…

wxpython on macosxのエラー対処法

macosx & python3で wxpythonでGUIプログラミングをしようと。 ハマったところがあったので、メモ。 (ちなみに、windowsならハマることはなかった。) pip install wxpython ここまではOK。問題は次。 import wxapplication = wx.App() 上記のコードの2行…

OpenCV on mac(Yosemite) でハマったこと & 対処法

インストールはすんなり。 pip install opencv ただ、実行時にはまった。 import cv2 と打つと、 エラーが出た。 hdf5 が古い、みたいなこと言ってる。 以下のページにあるように、 conda update hdf5 で解決した。 Hi, I had the same problem and reached …

pythonでカレンダー表示

import calendarprint(calendar.month(2017,7)) 参考サイト(python2) www.lifewithpython.com

始めます。気楽に。気負わずに。

始めます。気楽に。気負わずに。