シティズンデータサイエンスラボ
データビークルの最高製品責任者であり統計家の西内啓がデータ活用で成果をあげている企業・組織のキーパーソンの方とデータサイエンスの現実について語り合う対談シリーズ。
データを活用してエビデンスに基づいた経営判断を行いたいと考えるすべての人に。「データでもっと儲ける方法 ~経営とマーケティングのためのアナリティクスデザイン~(著:西内啓/発行:翔泳社)」の全文を公開します。
「精度100%の予測」といわれたら、まず疑うべきこと適切な課題を設定できれば、予測モデルもAIも開発できるようになります。ここまでの具体化ができていれば、統計解析や機械学習の専門家でなくても、日本国内だけで100社以上あるという機械学習の開発を請け負う会社に依頼すれば、少なくとも何のアウトプットも出てこないということはありません。 最後の問題は、社内の技術者であれ社外の技術者であれ、あるいは自分自身でも、どのぐらいの精度で予測し、どの程度最適な選択肢を提示できるかを確認す
総負荷量とトレードオフになる安定性と有効性このように総負荷量という考え方を持って「どれだけの煩わしさを解決できるか」「もっと範囲を広げて考えられないか」というのはAIの課題設定を行う上で最初に検討すべき重要な視点です。しかし総負荷量が大きくなるようにとにかく範囲を広げさえすればよい、というわけでもないのが難しいところです。 なぜなら課題の範囲を広げれば広げるほど「安定性」が減少する傾向にあります。予測モデルの時にも言及しましたが、機械学習とは「このデータが得られた状態がず
省力化に着目したAIの課題設定 「予測精度の改善価値」にフォーカスする予測モデルについては「現状の1.05倍の精度で予測してどの程度のコスト削減効果があるか」と考えればよいことを学びました。また「データを収集したような状態」がどれだけ安定的に続くかというのも重要なポイントです。 では、もう一つの機械学習の使い方である、(多少人間より精度が低くてもよいので)自動化/省力化することを価値とするAIについてはどのように課題設定をしたらよいでしょうか?AIすなわち人工知能が「人間