BETA

Predora

@predora005

matplotlibの文字化け対策(Amazon Linux2の場合)

matplotlibの文字化け対策は多くの情報がありますが、Amazon Linux2向けの情報はありませんでした。他のOSと基本的な対策方針は同様です。...

2020-05-20

xgboostでグリッドサーチ(GridSearchCV)

scikit-learnのGridSearchCVを利用して、グリッドサーチを行いました。xgboostにはscikit-learnのWrapperが用意...

2020-04-09

xgboostでクロスバリデーション(Cross Validation)

xgboost.cv()を使用したクロスバリデーション(交差検証)の方法を簡単にまとめました。クロスバリデーションとは、学習データの一部を検証用データとし...

2020-04-06

pandasで複数行の列を持つDataFrameを作成する方法

列が複数行となっているDataFrameを作成する方法の覚書です。結論は「pd.MultiIndexを使う」です。 例えば、次のようなDataFra...

2020-04-04

xgboostの使い方:irisデータで多クラス分類

xgboostは、決定木モデルの1種であるGBDTを扱うライブラリです。インストールし使用するまでの手順をまとめました。様々な言語で使えますが、Pytho...

2020-03-29

Pythonでセルが結合されたテーブルをスクレイピングする方法

BeautifulSoupを使うと、Pythonでスクレイピングを簡単に行うことができます。しかし、セルが結合されたテーブルのスクレイピングは少々面倒です...

2020-03-26

pandasのDataFrameをconcatすると型が変わってしまう場合の対処法

pandasのDataFrameを連結する際はconcatを使用します。このとき、DataFrameにNaNが含まれていると型が変わってしまう場合がありま...

2020-03-14

Kaggle Titanic competitionのチュートリアルが終わったあとにやったこと

チュートリアルを終え、予測結果の提出方法までは分かりました。以降は、予測精度の向上を目指しました。 結果として、スコア(正解率)=0.80382まで...

2020-03-11

Kaggle Titanic competitionをチュートリアル通りに進めてみた

前回:Kaggleの始め方(Titanicコンペに参加する)の続きです。 前回は提供されたサンプルファイルを提出しただけでした。今回から予測精度の向...

2020-03-02

Kaggleの始め方(Titanicコンペに参加する)

Titanicコンペは入門用コンペ アカウント作成後にKaggleからメールが送られてきており、Titanicコンペへの参加を薦められます。Titani...

2020-02-29

Kaggleの始め方(アカウント作成)

Kaggleとは データ分析の腕をきそうコンペティションの1つです。コンペの中でもかなり有名です。Kaggleは2017年にGoogleに買収され子会社...

2020-02-27

Amazon Linux 2でJupyter Notebookを使えるようにするまで

Jupyter Notebookは機械学習を実行する環境として有名です。機械学習には触れてきましたが、Jupyter Notebookには触れてこなかった...

2020-02-26
ブログをみる

アクティビティ

Less   More

よく読まれている記事

よく使うタグ