pythonのpandasとnotebookを使ってデータ分析(1)
エクセルで売上げデータを広げてみて、
- グラフにしたり
- 近似曲線を入れてみたり
- R-2乗値をみたり(決定係数、寄与率)
などと、やる人は多いと思いますが
自分はエクセルが苦手で、何とかならないかと普段から思っている所に
最近、会社でpythonを触る事があって、pythonについて調べたりしていると
pythonには、「pandas」とか「notebook」とか、素晴らしいものがあるという事を知った。
これでエクセルから離れる事が出来るかもしれないと思い、調べながら手順をまとめていく事にした。
まずは、分析の準備から
- Mac Book (El Capitan 10.11.2)
- Python (2.7.10)
pipインストール
easy_install pip
zeromqインストール
brew install zeromq
必要モジュールインストール
pip install pandas pip install matplotlib pip install tornado pip install jinja2 pip install ipython pip install notebook pip install pyzmq
notebook起動
任意の作業ディレクトで実行する。
ipython notebook
ブラウザが起動して(http://localhost:8888)、下記のような画面が表示されたら完了です。
ここからもう分析が、すぐに始められそうです。
こんなに簡単に、便利なものが出来るなんて
pythonステキ過ぎる・・・
それでは、続きはまた次回に
こちらのサイトを参考にさせて頂きました。
http://yymm.bitbucket.org/blog/html/2013/10/03/ipython_entrance.html