2013年12月30日月曜日

[Python] データ分析環境の準備



データ分析が周りで流行っているような気がするので乗っかってみる。
Pythonによるデータ分析入門」を買ったので、まずは環境を整えるメモ。
この本には、「Enthought Canopy」からCanopy Expressを使う方法のセットアップの説明が載っている。
だが、断る。良く分からないのはイヤなので自分でセットアップする。
きれいな環境でやりたいので、仮想マシン用意。
ubuntu 13.10(64ビット)でPython 2.7.5+

pipインストール

まずは、pipから。内部でcurl使うので入れとく。
 # apt-get install curl
 $ curl -O http://peak.telecommunity.com/dist/ez_setup.py
 # python ez_setup.py 
 # easy_install pip

ライブラリインストール

numpy

何も入れずにnumpy入れようとしたらpython-devを入れなさい言われたので入れてから。
 # apt-get install python-dev
 # pip install numpy

scipy

これも何だかんだ言われました。
 # apt-get install gfortran liblapack-dev
 # pip install scipy

pandas

これは特になし。
 # pip install pandas

iPython

これも特になし。
 # pip install ipython

matplotlib

これはけっこういろいろと。ここらへんを参考に。
 # apt-get install libfreetype6-dev libpng12-dev
 # pip install matplotlib

ひとまず「はじめに」で触れられているライブラリはインストール完了。

ipython==1.1.0
matplotlib==1.3.1
numpy==1.8.0
pandas==0.12.0
scipy==0.13.2