ごはんと飲み物は紙一重

あんまり更新できてないです

データ分析

fit と transform と fit_transformの違いと学習する際の注意点

当たり前だったのですが、意外に抜け落ちていたのでメモ。 こちらのサイトに丁寧に書かれていました!感謝! mathwords.net 数値計算ライブラリscikit-learnでよくある「fit」と「transform」と「fit_transform」がどういう役割をしていて、なぜ分けられてい…

俺でも沖縄県知事戦で当選確実を出したい 【沖縄 Advent Calender 2018 1日目】

ついに11月の更新は1回 12月は最低でも3つ書くから勘弁 はじめに エンジニアにはAdvent Calenderなる文化があり、Adventカレンダーのテーマに則ったブログ記事を書いて投稿していこうというやつです。ちなみに去年もやっていて、 twdlab.hatenablog.com 去年…

ちゅらデータ分析合宿に参加したお話

初のデータ分析合宿参加 つい先日の土日に、ちゅらデータ株式会社主催の分析合宿に参加してきました。バイト生の私も参加できるということで参加してたくさん勉強してきました。細かい詳細はあんまり外に出せないので、合宿を通して得た知見などをずらずら書…

データ分析と可視化をして思ったこと

技術的なところを書こうと思ったのですが、いろいろと説明するのはあれなので今日は日記カテゴリで書こうかと。 最近はバイト先や大学の講義、それ以外の多くの場所でデータ分析や可視化をすることが増えてきました。毎日毎日pythonとデータとにらめっこして…

CTRデータをヒストグラムで眺めたい

CTR(Click Through Rate)のことで、日本語ではクリック率とか言います。広告関係のやつですね。Kaggleにも似たような内容があったような。 https://www.kaggle.com/c/avazu-ctr-prediction これを各ユーザがどれだけクリックしてくれているかの分布を見てみ…