マガジンのカバー画像

データサイエンス入門講座

21
データを活用してエビデンスに基づいた経営判断を行いたいと考えるすべての人に。「データでもっと儲ける方法 ~経営とマーケティングのためのアナリティクスデザイン~(著:西内啓/発行:…
運営しているクリエイター

#データサイエンス

第21回 社内政治を乗り越えろ(2)

ボス以外のポジションの役割多くの日本企業において、もっとも人材が不足しがちなポジション…

第20回 社内政治を乗り越えろ(1)

実はここまでで、まだ道半ば ここまで、皆さんは、データを整備し、分析や予測、AIの開発とい…

第19回 ズルのできない予測精度の検証方法(2)

過学習を見抜くためのフェアな評価方法過学習がなぜ問題になるかというと、今あるデータに対…

第17回 AI開発における適切な課題設定とは(2)

総負荷量とトレードオフになる安定性と有効性このように総負荷量という考え方を持って「どれ…

第16回 AI開発における適切な課題設定とは(1)

省力化に着目したAIの課題設定 「予測精度の改善価値」にフォーカスする予測モデルについては…

第15回 何をデータで予測させるべきか(2)

前回の記事はこちら 1.05倍の予測精度の向上価値なぜ「感覚的に1.05倍」か、という点について…

第14回 何をデータで予測させるべきか(1)

何の予測モデルを作るべきか予測モデルとAIの使い分けが理解できたら、それぞれについて「何を予測させるべきか」を考えてみましょう。予測モデルの価値とは(人間以上に)予測精度の改善できることそれ自体だと述べました。とするならば、何を予測させるかを決めることというのが予測モデルについてのリサーチデザインに該当することになります。 つまり、失敗した予測モデルの多くは「予測できてもしょうがないこと」を正確に予測しようとしていると表現することもできるでしょう。その中には「正確な予測に

第13回 予測モデルとAIの使い分け

正確な予測が価値を生むときまずリサーチデザインを応用して、予測モデルやAI開発の課題設定…

第12回 洞察・予測・最適化〜AI開発で同様のところと違うところ

AI開発ではどうなのか前章ではアウトカムと解析単位というリサーチデザインの基本をもとに、…

第11回 何がその違いと関係しているのか〜基本的なデータ分析の読み方(2)

他の説明変数が絡んだ関係「p値」や「95%信頼区間」といったデータの見方を理解できれば「た…

第10回 何がその違いと関係しているのか〜基本的なデータ分析の読み方(1)

効率的な「違いの見つけ方」アウトカムと解析単位が決まり、データから考え得る限りさまざま…

第9回 解析単位を決めるための4つのルール

解析単位を選ぶコツ 前節ではアウトカムを定義するためのコツを説明しましたが、ここでは解析…

第8回 アウトカムを設定するコツ(2)

そのアウトカムでズルはできるか前回示したように、まずは利益に直結するか、ということを考…

第4回 抜け漏れ・異常値・表記の揺れにどう対処するか

数値化や再分類を阻む「データの汚れ」前節では日付やフリーワード、「あまりに細かすぎる区分をするID」などは、数値化や再分類といった加工をすれば「活用のためのデータ」に採用できることを学びました。この作業を困難にし、活用の際に意図しない誤りを生み出すのが、「データの汚れ」です。データが抜けていたり、異常値が含まれていたり、表記が揺れていたりする場合に、問題が生じます。本節でこの問題について詳しくみていきましょう。 データの抜け漏れが生みだす問題と対処方法第1回目の記事で、最終