演習編#
いろんなデータセットをpd.DataFrameに直してみましょう。
import pandas as pd
import numpy as np
from sklearn import datasets
import seaborn as sns
Wine Dataset#
wine = datasets.load_wine()
演習①#
このデータセットをwine_dfというpd.DataFrameに変形して、カラム(特徴)名をデータフレームにつけてください。
また、データフレームの最後の列に、labelというカラム名の列を追加しましょう。
このlabelカラムの要素は、int型ではなく、各ラベルの名前にしてください。
演習②#
sns.pairplotを使ってデータフレーム内の全特徴を散布図で可視化しましょう。
labelでデータの色を変えるような指定をしてみてください。
演習③#
すべての特徴に対して共分散行列を出しましょう。
演習④#
すべての特徴に対して相関行列を出しましょう。
演習⑤#
統計量を出してみましょう。
MNIST digits#
digits = datasets.load_digits()
演習⑥#
このデータセットをdigit_dfというpd.DataFrameに変形してください。
また、データフレームの最後の列に、labelというカラム名の列を追加しましょう。
演習⑦#
統計量を出してみましょう。
ただしこのとき、labelについては計算しないように、データフレームをスライスしてから計算して下さい。