主に自分のメモ用途。

自分のためのメモ帳です。書きなぐってたりもします。

やんないといけないな。

勉強しないといけないことを晒す。

普通は勉強したことを晒すんだろうけど、

晒してから勉強する。

 

統計学ベイズ統計学

信頼区間ベイズ信用区間

サンプルサイズの決め方

欠測データ処理

因果推論

遺伝的アルゴリズム

バンディットアルゴリズム

最適化問題(線形、非線形組み合わせ最適化、連続最適化)

 

確率分布に親しむ

カーネル密度推定、カーネル密度比推定 + 最尤推定

不均衡データ処理:ウェイトバック、 アップサンプリング、ダウンサンプリング、ブートストラップ

制約付き回帰(y = e^a * x1 + b * log(x2) )

ロバスト回帰、ロバスト相関

非線形相関MIC

非線形データ解析

主成分分析

因子分析

クラスター分析(階層、非階層)

ベイジアンネットワーク

測度論

情報幾何

 

構造方程式モデリングSEM

適合度指標、特に、情報量規準(AIC,BIC,DIC,WAIC,  etc)

時系列分析:AR, MA, ARMA, ARIMA, BoxJenkins、SARIMA, VAR、単位根検定、共和分検定、見せかけの回帰、グレンジャー因果性, 状態空間モデル、カルマンフィルタ、粒子フィルタ

【R言語】Rでの単位根検定 その1 - 暇人の研究室

マーケティングミックスモデリング(MMM)

樋口論文、樋口本、

FB_Prophet, RNN, LSTM

 

MCMC(Stan,PyMC)

 Edward

 

MLのCV、グリッドサーチ、ROC,AUC、次元削減、次元圧縮

はじパタ、PRML、 カステラ本

アンサンブル学習、強化学習、転移学習、オンライン学習

異常検知

深層学習の原理とライブラリ(TF,Theano,Keras,Chainer,Caffe,Pytorch)を使う

 

勾配ブースティング系(XGBoost, LightGBM, CatBoost)

Stacking(XGBoost+LightGBM+CatBoost) | Kaggle

 

 自然言語処理MeCab, mecab-python, janome, word2vec, gensim, ・・・)

トピックモデル、文脈解析

 

画像解析

音声認識

 

R, Python, Julia, Perl

SQL, HiveQL(HQL)

シェル、シェルスクリプト

Git( GitHub, BitBacket)

クローリング&スクレイピング

Hadoop / Spark

 

統計検定1級、準1級

データ分析コンペ(Kaggle, DeepAnalytics)

競技プログラミング

 

計量経済学

 

多様体複素関数論、微分幾何学位相幾何学