New York City Taxi Trip Durationに挑みたかった
やった問題
つくったkernel
ポイント・感想など
pd.read_csv
って、圧縮ファイルも読めるのすごい。知らなかった。- pandasのメソッドがとにかく便利、もっと知って使うべきなと思った。
- データの間引きの際、もう少し根拠を持って消して行けたらいいなと思った
- 外れ値の判断が、これまでの経験による勘になってしまっている。よくない。
- ちゃんとプロットすべきなのかな
- 楽しいけど前処理検定になってしまっている
- いろんな問題にちょっとずつじゃなくて、いろんなブログの前処理方法をしっかりまとめるべきなのでは??