pythonのpandasとnotebookを使ってデータ分析(2)
pythonのnotebookが起動したら、これだけでもう何でも出来る気になる・・・
エクセルの分析の代わりにと思って色々調べていたら、このサイトが見つかった。
http://daisukekobayashi.com/blog/python-least-square-method-exponential-approximation/
こちらを参考にさせて頂いて、まずは簡単に「matplotlib」でグラフでも表示してみる。
jupyterの画面の右上の「new」から「Python2」を選択する。
参考サイトからデータも拝借させて頂く
jupyterのセルに、一つ一つ入力していく。
※「Shift + Enter」で、選択中のセルが実行されるので便利。
%matplotlib inline import pandas import matplotlib.pyplot as plt
df = pandas.DataFrame({ 'x': [6.559112404564946264e-01, 6.013845740818111185e-01, 4.449591514877473397e-01, 3.557250387126167923e-01, 3.798882550532960423e-01, 3.206955701106445344e-01, 2.600880460776140990e-01, 2.245379618606005157e-01], 'y': [1.397354195522357567e-01, 1.001406990711011247e-01, 5.173231204524778720e-02, 3.445520251689743879e-02, 3.801366557283047953e-02, 2.856782588754304408e-02, 2.036328213585812327e-02, 1.566228252276009869e-02]})
ここまで入力して、次に3つ目のセルで
df
とだけ、入力して「Shift + Enter」する。
データが、htmlのtableに変換されて見やすく表示された・・・
既に、これだけで便利!!
他にも
df.describe()
とすれば、
こんなものも表示出来ます。
あ、これはどちらかと言うと、「pandas」の話ですね。
「pandas」は、行列データを簡単に扱えるライブラリで、「R」のDataFrameのような事が出来ます。
強力ですね!!
先ほどの「describe()」は、「R」の「summary()」のような機能です。
あと、「notebook」については、1セルづつ実行出来るのもいいですね。
何かこれだけで満足したので、グラフは次回に・・・