IT練習ノート

IT関連で調べたこと(実際は嵌ったこと)を書いています。

Python

PandasのDataFrameの嵌りどころ

データフレームから複数条件で行を絞るとき df[df['項目1']==0 and df['項目2']==1] df[df['項目1']==0 & df['項目2']==1] df[(df['項目1']==0) and (df['項目2']==1)] 上記3つはいずれも下記のエラーが出る。 ValueError: The truth value of a Series is …

Pythonでピボットテーブル

件数を数える。 import pandas df = pandas.read_csv(CSVファイル) df[[項目1,項目2]].pivot_table(index=項目1, columns=項目2, aggfunc=len) 単に1項目のみの件数を求めるなら、groupbyを使うよりvalue_countsのほうが手軽。 import pandas df = pandas.re…

matplotlibとggplotを使ってみる

# ライブラリのインポート import pandas # データの読み込み df = pandas.read_csv('foo.csv') # 必要なデータに絞る df2 = df[['x','y']] # x軸を分類する df2['x_rank'] = df2['x'].apply(lambda x : int(x / 1000)) # matplotlibのインポート import mat…

jupyter(iPython notebook)を使ってみる

Anacondaをインストールしたら結果的に入っていた。 (root):test01 foo$ pyenv version anaconda3-2.3.0 (set by /Users/foo/.pyenv/version) (root):test01 foo$ (root):test01 fii$ ipython notebook [I 19:49:42.714 NotebookApp] Using MathJax from CDN…

線形回帰サンプルコーディング

import numpy import pandas import statsmodels.api as sm # データ読み込み df = pandas.read_csv(csvファイル); df['constant'] = 1 col = [独立変数のカラムの配列指定] # 線形回帰分析 X = df[col] y = df[説明変数のカラム名] X = sm.add_constant(X) …

Pythonの配列の計算

numpyを使う。 普通の配列の場合は直接演算はできない。 >>> a = [1,2,3] >>> b = [4,5,6] >>> a -b Traceback (most recent call last): File "<stdin>", line 1, in <module> TypeError: unsupported operand type(s) for -: 'list' and 'list' numpyを利用すると計算がで</module></stdin>…

PythonでWebアクセス

requestsというモジュールを使ってgetする。 htmlの取得 >>> import requests >>> requests.get('https://www.example.com').text '\n<html>\n<head>\n <title>Example Domain</title>\n\n <meta charset="utf-8" />\n <meta http-equiv="Content-type" content="text/html; charset=utf-8" />\n </meta></meta></head></html>

ggplotインストール

audacityのintoro data scienceを参考にする。それだけだとimportエラーになるので追加でhuslをインストールする。 https://www.udacity.com/wiki/ud359/get-started https://github.com/yhat/ggplot/issues/407 ggplotでの画像の出力はggsaveを使う http://…

ggplotインストールと動作確認

Udacityのintoro data scienceを参考にする。それだけだとimportエラーになるので追加でhuslをインストールする。 https://www.udacity.com/wiki/ud359/get-started https://github.com/yhat/ggplot/issues/407 ggplotでの画像の出力はggsaveを使う http://p…

Python環境構築

pyenvのインストール wk$ git clone git://github.com/yyuu/pyenv.git ~/.pyenv Cloning into '/Users/foo/.pyenv'... fatal: Unable to look up github.com (port 9418) (nodename nor servname provided, or not known) wk$ wk$ git clone git://github.co…