BETA

Python 相関分析を再チャレンジ!

投稿日:2019-12-18
最終更新:2019-12-18

Python 好きなピンクを相関分析してみるでピンク色をRGB値で表して好みと相関分析したのですが
わーい!って結果が出なかったので会社の人からおすすめされたHSVで相関分析を再実行!

インプットデータはこちら

色相(Hue)

色相(Hue)とLIKEの相関係数:0.339171

彩度(Saturation)

彩度(Saturation)とLIKEの相関係数:0.561567

明度(Value)

明度(Value)とLIKEの相関係数:0.453418

なかなか思うようにいかない

高い相関は出なかった。。。データ数が少ないのでデータの特徴とか見出しづらいのかな
同じデータでニューラルネットワークも試しているが、エラーが出るようになった!
(インプットデータの標準化?前処理でデータの次元が分からなくなりました)
次はビッグデータを取ってきてきちんと前処理して分析するのが課題

import pandas as pd  
from sklearn import linear_model  
import matplotlib.pyplot as plt    
%matplotlib inline  
import seaborn as sons  

csv_data = pd.read_csv('pink_hsv.csv')  
data = pd.DataFrame(csv_data)  
pd.DataFrame(csv_data)  

# 色相とLIKEの関連  
x = data[['H']]  
y = data[['LIKE']]   

plt.scatter(x, y)    
plt.xlabel('Hue')    
plt.ylabel('LIKE')    
plt.show  
# 相関分析  
df = data[[x.columns[0], y.columns[0]]]  
corr_mat = df.corr(method='pearson')  
print(corr_mat)  

sons.heatmap(corr_mat,    
            vmin=-1.0,    
            vmax=1.0,    
            center=0,    
            annot=True,   
            fmt='.1f',    
            xticklabels=corr_mat.columns.values,    
            yticklabels=corr_mat.columns.values    
           )    
plt.show()  

# 彩度とLIKEの関連  
x = data[['S']]  
y = data[['LIKE']]  

plt.scatter(x, y)    
plt.xlabel('Saturation')    
plt.ylabel('LIKE')    
plt.show    
# 相関分析  
df = data[[x.columns[0], y.columns[0]]]  
corr_mat = df.corr(method='pearson')  
print(corr_mat)  

sons.heatmap(corr_mat,    
            vmin=-1.0,    
            vmax=1.0,    
            center=0,    
            annot=True,   
            fmt='.1f',    
            xticklabels=corr_mat.columns.values,    
            yticklabels=corr_mat.columns.values    
           )    
plt.show()  

# 明度とLIKEの関連  
x = data[['V']]  
y = data[['LIKE']]  

plt.scatter(x, y)    
plt.xlabel('Value')    
plt.ylabel('LIKE')    
plt.show    
# 相関分析  
df = data[[x.columns[0], y.columns[0]]]  
corr_mat = df.corr(method='pearson')  
print(corr_mat)  

sons.heatmap(corr_mat,    
            vmin=-1.0,    
            vmax=1.0,    
            center=0,    
            annot=True,  
            fmt='.1f',    
            xticklabels=corr_mat.columns.values,    
            yticklabels=corr_mat.columns.values    
           )    
plt.show()  
技術ブログをはじめよう Qrunch(クランチ)は、プログラマの技術アプトプットに特化したブログサービスです
駆け出しエンジニアからエキスパートまで全ての方々のアウトプットを歓迎しております!
or 外部アカウントで 登録 / ログイン する
クランチについてもっと詳しく

この記事が掲載されているブログ

だいたい急に挑戦してゴールにたどり着かずに飽きる日々です

よく一緒に読まれる記事

0件のコメント

ブログ開設 or ログイン してコメントを送ってみよう