home creditのkaggle日記です
- kaggle日記をつけ始めました
- 特徴量の和訳シートを作成
- kaggle notebookでセッション切れが多発して進捗いまいちだったので、colabの準備
- k-foldが1回でbreakできるように書き換えた
- Home Credit: Baseline using Depth0 Data___ver06をsubmit→エラーで失敗
- lgbmClassで予測(0,1を予測)したため、lgbmで0~1を予測した方が良さそう
- Depth0のデータまでを使った予測
- Home Credit: Baseline using Depth0 Data___ver07で再度submit
- エラーを解消
- colabで修正したものをkaggle notebookに反映できていない部分があった
- 例えば「from sklearn.metrics import roc_auc_score」を追加し忘れた、ようなもの
- Home Credit 2024 Starter Notebookをメインで参考にした
- submitが無事にできたらclassではなくて普通のlgbmと比較したい。
- 「Home Credit: 特徴量の日本語訳」をpublicで投稿しなおした
- コンペの紐付けせずに投稿してしまっていたのを、紐づけた
- コンペのデータセットを使用していなくても、inputに追加しておくと、そのコンペのcodeに表示されるようになるよう。
- 今日からkaggleに取り組んだ時間も記録することにしました。
- codeコンペの採点方法について調べた。
- 昨日、投稿しなおしたnotebookが銅メダル!!嬉しい
- 「Simplest baseline using only depth=0 data」をpublicで投稿
- これまで簡単のために depth=0 のデータのみに絞っていたので、明日からdepth=0,1,2と1つずつ増やしていく!!
- depth=1のデータを追加
- depth=1のデータは1つのcase_idごとに複数のnum_group1が存在する。
- そのため、maxを取ったりしながら追加することになりそう
- ディスカッションを眺めていたら時間が溶けた
- 明日は、気になったものを動かしてみる
- [LB:0.565]Improved baseline Notebookを動かしてみる
- コードの解読しかできていないのでは...???
- colabで動かすときにGPUがないよ!的なエラーが発生する...
- あしたはここを解決する。
- 訓練の部分は、いまいち上手に動かないので、自分で作成したスクリプトで埋める
- 訓練部分を差し替え
- kfoldを10000にして、訓練を早くおわるようにした
- pandasの状態で特徴量エンジニアリングして、submitまで行った
- logを見るとエラーはないものの、スコアが計算されていないので、なにかしらのエラーがありそう。。。
- 「自分で書いたコードでsubmit+スコアもらえる」のを目標にしたい
- 1つエラーを修正すると、別のエラーが発生したりメモリ不足になったりと悪戦苦闘
- いろんなものをコメントアウトして最低限の状態になってしまったけれど、submitが通った。
- スコアは0.526
- エラーと戦う
- abalone(playgroundコンペ)に浮気
- submit3回
- スコア0.625
- abalone(playgroundコンペ)に浮気
- notebooks expertになれた!
- abaloneをやってみて、簡単なコンペだと手がさくさく動くのを実感
- home creditはsubmit3回