BETA

食べログとGoogle Mapの評価を比較+色々眺める

投稿日:2019-12-17
最終更新:2019-12-18

グラフが上手く表示されてない場合こっち見てください

https://lazystudent.qrunch.io/entries/ISayy1saJEHhyRb8?ref=qrunch

はじめに

食べログ3.8問題を検証
データ解析を駆使して食べログ3.8問題が証明できなかった話

こちらの記事を読んでみて、自分も興味が湧いたのでデータを集めて眺める事にしました。

注意点

スクレイピングしたデータって公開して問題あるかよくわからないので問題あったら教えてください。
Plotlyを埋め込んだのでスマホページでは見れないかも…

データ集め

データの集め方は、食べログはkonkon3249さんのgithubを参考に各都道府県で口コミ数が100以上の物を20件×60ページ分見て、住所・評価・店名等をスクレイピングしました。
Google Mapは食べログで得られた得られた住所と店名をもとにGoogle Cloud PlatformのPlace Detailを使ってGoogleMap上の評価を得ました。

得られたデータは上記のような感じ。

データを眺める

まず食べログで得られた評価のヒストグラムを見てみます。(見えない場合はこちら)

参考にさせていただいた記事と同様のヒストグラムを得ることが出来ました。
やはり食べログの3.6が特に少ないという事は見てわかります。
Google Mapでの評価は5.0の様に小数点以下1桁までだったので、小数点以下2桁目をPythonのround関数で四捨五入した結果が以下の通りになります。(見えない場合はこちら)

こうしてみると少し正規分布っぽいかな…?

Google Mapで得られた評価は以下のようになります。(見えない場合はこちら)

うーん、Google Mapもまぁまぁ正規分布に見える。

結局のところ小数点2桁目を四捨五入してみるとそんな変な所は見られないような…(素人目線)

一応describeの結果を置いておきます。何かデータ比較のいい案とか考察してくれる人は教えてください。


分散は以下の様でした
Google Map 0.059919
食べログ 0.026813

あまりちゃんと見ていないですが、GoogleMapは外国人の方が多く含まれているのに対して食べログは日本人が多く、中央値や評価に差が生まれるのかもしれません。

また、評価数と評価をプロットしてみた奴も置いておきます。

・食べログ(見えない場合はこちら)

・Google Map(見えない場合はこちら)

最後に、実際に評価を地図にプロットした物、評価の差をプロットした物を置いておきます。
・食べログ(見えない場合はこちら)

・Googlemap(見えない場合はこちら)

・食べログとGoogleMapの差をプロット(見えない場合はこちら)

・正規化したGoogleMapと正規化した食べログの差をプロット(見えない場合はこちら)

上のグラフのヒストグラム(見えない場合はこちら)

パッと見はGoogleMapの方が評価を高くつける人が多いようです。

こうしてみると島根、鳥取、高知はそもそもレビューされている所が少ないようです。
食事の評価が好きな人は行ってみてレビューをしてみるといいかもしれません。

おわりに

著者は食べログもGoogleMapの評価も全く見ない人なので、何かわかったことがあったら教えてください…。

データに何か問題があったら教えてください。

技術ブログをはじめよう Qrunch(クランチ)は、プログラマの技術アプトプットに特化したブログサービスです
駆け出しエンジニアからエキスパートまで全ての方々のアウトプットを歓迎しております!
or 外部アカウントで 登録 / ログイン する
クランチについてもっと詳しく

この記事が掲載されているブログ

大学生の書きなぐりブログ 間違ってる事も書いてるので自己責任で勉強しましょう

よく一緒に読まれる記事

0件のコメント

ブログ開設 or ログイン してコメントを送ってみよう