データ分析が周りで流行っているような気がするので乗っかってみる。
「Pythonによるデータ分析入門」を買ったので、まずは環境を整えるメモ。
この本には、「Enthought Canopy」からCanopy Expressを使う方法のセットアップの説明が載っている。
だが、断る。良く分からないのはイヤなので自分でセットアップする。
きれいな環境でやりたいので、仮想マシン用意。
ubuntu 13.10(64ビット)でPython 2.7.5+
pipインストール
まずは、pipから。内部でcurl使うので入れとく。 # apt-get install curl
$ curl -O http://peak.telecommunity.com/dist/ez_setup.py
# python ez_setup.py
# easy_install pip
ライブラリインストール
numpy
何も入れずにnumpy入れようとしたらpython-devを入れなさい言われたので入れてから。 # apt-get install python-dev
# pip install numpy
scipy
これも何だかんだ言われました。 # apt-get install gfortran liblapack-dev
# pip install scipy
pandas
これは特になし。 # pip install pandas
iPython
これも特になし。 # pip install ipython
matplotlib
これはけっこういろいろと。ここらへんを参考に。 # apt-get install libfreetype6-dev libpng12-dev
# pip install matplotlib
ひとまず「はじめに」で触れられているライブラリはインストール完了。
ipython==1.1.0
matplotlib==1.3.1
numpy==1.8.0
pandas==0.12.0
scipy==0.13.2