マガジンのカバー画像

データサイエンス入門講座

21
データを活用してエビデンスに基づいた経営判断を行いたいと考えるすべての人に。「データでもっと儲ける方法 ~経営とマーケティングのためのアナリティクスデザイン~(著:西内啓/発行:…
運営しているクリエイター

#統計

第19回 ズルのできない予測精度の検証方法(2)

過学習を見抜くためのフェアな評価方法過学習がなぜ問題になるかというと、今あるデータに対…

第14回 何をデータで予測させるべきか(1)

何の予測モデルを作るべきか予測モデルとAIの使い分けが理解できたら、それぞれについて「何…

第13回 予測モデルとAIの使い分け

正確な予測が価値を生むときまずリサーチデザインを応用して、予測モデルやAI開発の課題設定…

第12回 洞察・予測・最適化〜AI開発で同様のところと違うところ

AI開発ではどうなのか前章ではアウトカムと解析単位というリサーチデザインの基本をもとに、…

第11回 何がその違いと関係しているのか〜基本的なデータ分析の読み方(2)

他の説明変数が絡んだ関係「p値」や「95%信頼区間」といったデータの見方を理解できれば「た…

第10回 何がその違いと関係しているのか〜基本的なデータ分析の読み方(1)

効率的な「違いの見つけ方」アウトカムと解析単位が決まり、データから考え得る限りさまざま…

第9回 解析単位を決めるための4つのルール

解析単位を選ぶコツ 前節ではアウトカムを定義するためのコツを説明しましたが、ここでは解析単位について考えます。第1章のデータ整備のところで「活用のためのデータを何に対して1行ずつにするか」を述べましたが、これが「解析単位は何にするか」と考えることと同じことです。 データ整備の説明の時にはどのような切り口にしたいか考えましょう、と書きましたが、実はこれにも明確なルールが存在しています。第1章で述べた特徴と重複もありますが、「解析単位」を決める時には次の4つに気をつけましょう

第8回 アウトカムを設定するコツ(2)

そのアウトカムでズルはできるか前回示したように、まずは利益に直結するか、ということを考…

第7回 アウトカムを設定するコツ(1)

よいアウトカムとは何か アウトカムと解析単位という2点が適切に定まれば、「どこから手をつ…

第6回 リサーチデザインの2つの要素

「何に活かしていいかわからない」問題前章では、業務処理のために蓄積されたデータを、活用…

第5回 継続的なデータ活用プロセスにおけるデータ整備の位置づけ

データ整備のサグラダファミリアここまで「業務のためのデータ」をどう「活用のためのデータ…

第4回 抜け漏れ・異常値・表記の揺れにどう対処するか

数値化や再分類を阻む「データの汚れ」前節では日付やフリーワード、「あまりに細かすぎる区分…

第3回 数値化と再分類でデータをもっとリッチに

活用できるデータの項目前節では「顧客ごと」「レシート1行ごと」という粒度の異なる形式のデ…

第2回 データ活用のための結合と集計

データ活用のための結合作業引き続き、スーパーマーケットのID-POSを題材にして、条件①を満たせるためにどうすればよいかを考えていきます。結合を行なう際には次のような手順で考えていくとよいでしょう。 手順① 表をまたいでデータをつなげるための「キー」を確認 手順② つなげる前に「データを含む対象」にズレがないか確認 手順③ 「最終的に何毎に一行にまとめるか」を決定 手順④ 複数行になる場合は適切に集計 では手順①について考えてみます。顧客マスターはポイントカードを作ってく