Going Faraway

渡辺遼遠の雑記帳。技術ネタと読んだ本の紹介。

【Deep Learning with Python】Kaggleアカウント登録方法とデータのダウンロード

次の例では、Kaggleというデータ分析コンペのサイトで公開されているデータセットを使って、CNNで分類をする。

Kaggleのアカウント登録

Kaggleのサイトからアカウントを登録する。SNSのアカウントを使っても良いし、メールアドレスから登録してもOK。

f:id:liaoyuan:20180524233005p:plain

f:id:liaoyuan:20180524233015p:plain

今回はメールアドレスからアカウントを作成してみた。 Usernameはユーザ名、Display NameはKaggleのサイト上での表示名になる。なお、Display Nameは登録後にも変更できるけど、Usernameは変更できないので注意。

f:id:liaoyuan:20180524233235p:plain

送られてきたメールのリンクをクリックして、メールアドレスを確認すれば登録完了。

f:id:liaoyuan:20180524233346p:plain

ざっとコンペの内容を見てみると、コンテストという体裁を取った、企業からのデータマイニング案件の外注サイトのようにも感じる。

その他にも、データサイエンスと機械学習の学習コンテンツなどもあるようだ。

Learn | Kaggle

データのダウンロード

今回の例では、"Dogs vs. Cats"というデータセットを用いる。

Kaggle|Dogs vs. Cats

f:id:liaoyuan:20180524233954p:plain

"Download" をクリックしてデータをダウンロードする。このとき、初回ダウンロード時のみ、携帯電話のSMSを使った認証をする必要がある。 その後、"train.zip"と"test1.zip"の両方をダウンロードしておこう。(合計で800MBくらいあるので少し時間がかかる)

ダウンロードしたzipファイルを展開すると、いぬぬこ画像がたくさん展開される。

f:id:liaoyuan:20180524234415p:plain

本日はここまで。次回からはこのデータをディープラーニングを使って分類していく。