演習編#

いろんなデータセットをpd.DataFrameに直してみましょう。

import pandas as pd
import numpy as np
from sklearn import datasets

import seaborn as sns

Wine Dataset#

wine = datasets.load_wine()

演習①#

このデータセットをwine_dfというpd.DataFrameに変形して、カラム(特徴)名をデータフレームにつけてください。

また、データフレームの最後の列に、labelというカラム名の列を追加しましょう。

このlabelカラムの要素は、int型ではなく、各ラベルの名前にしてください。

演習②#

sns.pairplotを使ってデータフレーム内の全特徴を散布図で可視化しましょう。

labelでデータの色を変えるような指定をしてみてください。

演習③#

すべての特徴に対して共分散行列を出しましょう。

演習④#

すべての特徴に対して相関行列を出しましょう。

演習⑤#

統計量を出してみましょう。

MNIST digits#

digits = datasets.load_digits()

演習⑥#

このデータセットをdigit_dfというpd.DataFrameに変形してください。

また、データフレームの最後の列に、labelというカラム名の列を追加しましょう。

演習⑦#

統計量を出してみましょう。
ただしこのとき、labelについては計算しないように、データフレームをスライスしてから計算して下さい。