しゃちの備忘録

プログラミングを中心とした技術関連の備忘録です(今のところ)

New York City Taxi Trip Durationに挑みたかった

やった問題

www.kaggle.com

つくったkernel

www.kaggle.com

ポイント・感想など

  • pd.read_csvって、圧縮ファイルも読めるのすごい。知らなかった。
  • pandasのメソッドがとにかく便利、もっと知って使うべきなと思った。
  • データの間引きの際、もう少し根拠を持って消して行けたらいいなと思った
    • 外れ値の判断が、これまでの経験による勘になってしまっている。よくない。
    • ちゃんとプロットすべきなのかな
  • 楽しいけど前処理検定になってしまっている
    • いろんな問題にちょっとずつじゃなくて、いろんなブログの前処理方法をしっかりまとめるべきなのでは??

Kaggleなどでcsvファイル以外の圧縮ファイルなどをcsvで読み出す方法

状況

Kaggleでは多くの場合、Dataのインプットとして様々な形式のデータが与えられます。

csvであることは多いのですが、 この問題のように、DataSourceがzipであたえらることもあります。

www.kaggle.com

csvの場合、

import pandas as pd
train = pd.read_csv(f'/kaggle/input/folder_name/train.csv')

のようにpandas.read_csvを使うことで、csvは読み込めるのですが、zipなどの場合どうすればいいのか…と悩んだのと、Kaggle以外でも使えそうだったので、その備忘録。

続きを読む

Predict Future Salesに挑みたかった

久しぶりにKaggleをしました。

といっても前はすぐに挫折したので実質初めてです。 一週間でどこまでできるかを、しばらくやり続けてみます。

続きを読む

何も知らないがmarkdownでスライドを作りたい人がreveal.jsを使えるようにする

パワーポイント以外のスライドツールに触りたくなったので、reveal.jsを触ってみました。 その導入や使い方備忘録。

本記事の目指すところ・対象層。

  • markdownでいい感じにスライドが書けると嬉しいと思っている
  • 理屈はいいので、とにかくどうすれば動く環境になるか知りたい
続きを読む

atomをフロントエンド開発用に色々パッケージを入れる

備忘録。 フロントエンドを学びたいのでその第一歩として、良い感じの開発環境を作ります。 Sublime Textとかもありますが、atomが好きなので、これで行きます。

不足だと感じたら逐一追記予定。

続きを読む