しゃちの備忘録

プログラミングを中心とした技術関連の備忘録です(今のところ)

New York City Taxi Trip Durationに挑みたかった

やった問題

www.kaggle.com

つくったkernel

www.kaggle.com

ポイント・感想など

  • pd.read_csvって、圧縮ファイルも読めるのすごい。知らなかった。
  • pandasのメソッドがとにかく便利、もっと知って使うべきなと思った。
  • データの間引きの際、もう少し根拠を持って消して行けたらいいなと思った
    • 外れ値の判断が、これまでの経験による勘になってしまっている。よくない。
    • ちゃんとプロットすべきなのかな
  • 楽しいけど前処理検定になってしまっている
    • いろんな問題にちょっとずつじゃなくて、いろんなブログの前処理方法をしっかりまとめるべきなのでは??