「機械脳の時代」
本書では「データサイエンス上の計算手法そのものよりも、それをどのように使っていくか、チームの中でどのように振る舞っていくか、自分が提供する価値といった考え方やマインドセット」をメインテーマしており、機械学習の知識のみを取り扱った他の書籍と一線を画しています。既存のデータを活用して「何か気付きを与えられたら、いいね」と簡単に言ってのけてしまう組織の長に読んで欲しい内容がいっぱいです。現在の自社内での取り組みに、本書の知恵を是非活かしていきたいと思っています。
機械脳の時代―――データサイエンスは戦略・組織・仕事をどう変えるのか?
何度も読み返したい部分を本文から引用させてもらいました(以下)。
《データサイエンティスト訓》
「データサイエンスを学んでも、その知識の価値を発揮するためには、ビジネス、エンジニアリングを担うメンバーと共通言語で会話できる能力を身につける必要があります。」
「データサイエンスという武器の新しさに自分が心酔しているがゆえに、組織が一般に持ち、新しいものに対する抵抗への配慮が欠けて、プロジェクトに協力が得られぬまま頓挫することは多々あります。データサイエンスの取り組みは団体競技であって、個人技ではないという主張には、こうした理由があり、」
《A:Aim》
「現実には最初から目的が明確であることはかなり稀です。しかしそれでも、曖昧な当初の目的を、そのまま放置してプロジェクトを遂行するとその後のプロセスのどこかで破綻が起きます。」
《B:Brain》
「自分が担当したものは、どういうアプローチを採用するのか、なぜそれが適切だと考えるのか、説明する責任があります。」
「ビジネスサイドも、エンジニアリングサイドも、アルゴリズムの選定について知っていることは確実にチームの強みになります。」
「ビジネスとして結果をチームで出さなければならないことを考えれば、データサイエンティストにも手段(モデル)ではなく目的(ビジネス結果)にこそこだわる姿勢が求められます。」
「第1にB以外のA~EをはっきりさせることによってBへの要件を明示すること。第2にモデルの選定基準を可視化して、データサイエンティストに説明を求めること」
「たとえば部品の故障予測はとにかく予測精度が大事なので機械学習のモデルを使い、なぜ故障すると考えられるかの解釈・説明には統計学を使う、というコンビネーションも現実的です。」
《D:Data》
「まずA:Aim(目的)があり、そこに近づくためにどういうD:Data(データ)が必要か、」
「探索範囲の広い問いに対するアプローチの鉄則は、探索効率性を高めることです。いま手元にあるものから発想するのではなく、ゴールから逆算することでチームの知的生産性の効率が高められます。」
「しかし、成功させる手段については若干の誤解があります。「データサイエンス」のプロジェクトだからといって、成功させるためにチームが取るべき手立ては、データ分析作業に限定されるべきではありません。費用承認がおりないならば、データ投資によって可能になることのメリットを教えたり、データサイエンスについての役員のリテラシーを高める啓蒙イベントをおこなったり、短期で投資対効果がはっきりわかる小規模なパイロットを提案したりと、可能なら外部からの予算獲得なども含めて活動すればよいのです。そもそも費用対効果の説明を求められないプロジェクトのほうが奇妙でしょう。」
《E:Excecution》
「機械脳を活用した改善の目論見が初回から大当たりすることは稀ですから、パイロット実験は何度も失敗するはずです。そのたびに繰り返し粘り強い交渉や、やり方の修正が求められます。チームはまずその認識を持つべきでしょう。また、マネジメント層レベルでは、不確実性を伴うデータ活用の取り組みを組織が受け入れるための、事業責任の明確化が不可欠です。」
《データGM人材》
「データプロジェクトへの取り組みが、単なる流行語に踊らされた形だけのものかどうかを看破する嗅覚もあります。」
《データサイエンティスト人材》
「統計学の基礎となる仮設検定の考え方(帰無仮説を利用する有意検定)が、ビジネス文脈で必ず有効であるわけでもありません。検証の正確性よりも、意思決定の迅速性が大切なケースのほうが体感的には多くあります。検証が学問的にどれほど正確であるかという括りを抜け、意思決定するために必要十分な情報はどうすれば入手できるかを考えられるようなマインドセットが必要です。」
《NGフレーズ》
「どのようにすれば個人を責めなくて済むか、どうすればどのメンバーもデータ活用で課題を解決することに動機づけを持ち、足を引っ張り合うのではなく協力し合える組織にできるか、」
以下に本書のキーワードを列挙します。
【機械脳を作るためのフレームワーク】
・A:Aim(目的)
・B:Brain(機械脳の種類)
・C:Coding/Construction(プログラミング作業・実装)
・D:Data(データ選定と整備)
・E:Execution(実行)
【ゴールをメンバーで共有するポイント】
SMART:上記の設定された目的が明確であることの評価基準
・S:Specific(具体的な目的)か
・M:Measurable(測定可能な目的)か
機械脳の時代―――データサイエンスは戦略・組織・仕事をどう変えるのか?
何度も読み返したい部分を本文から引用させてもらいました(以下)。
《データサイエンティスト訓》
「データサイエンスを学んでも、その知識の価値を発揮するためには、ビジネス、エンジニアリングを担うメンバーと共通言語で会話できる能力を身につける必要があります。」
「データサイエンスという武器の新しさに自分が心酔しているがゆえに、組織が一般に持ち、新しいものに対する抵抗への配慮が欠けて、プロジェクトに協力が得られぬまま頓挫することは多々あります。データサイエンスの取り組みは団体競技であって、個人技ではないという主張には、こうした理由があり、」
《A:Aim》
「現実には最初から目的が明確であることはかなり稀です。しかしそれでも、曖昧な当初の目的を、そのまま放置してプロジェクトを遂行するとその後のプロセスのどこかで破綻が起きます。」
《B:Brain》
「自分が担当したものは、どういうアプローチを採用するのか、なぜそれが適切だと考えるのか、説明する責任があります。」
「ビジネスサイドも、エンジニアリングサイドも、アルゴリズムの選定について知っていることは確実にチームの強みになります。」
「ビジネスとして結果をチームで出さなければならないことを考えれば、データサイエンティストにも手段(モデル)ではなく目的(ビジネス結果)にこそこだわる姿勢が求められます。」
「第1にB以外のA~EをはっきりさせることによってBへの要件を明示すること。第2にモデルの選定基準を可視化して、データサイエンティストに説明を求めること」
「たとえば部品の故障予測はとにかく予測精度が大事なので機械学習のモデルを使い、なぜ故障すると考えられるかの解釈・説明には統計学を使う、というコンビネーションも現実的です。」
《D:Data》
「まずA:Aim(目的)があり、そこに近づくためにどういうD:Data(データ)が必要か、」
「探索範囲の広い問いに対するアプローチの鉄則は、探索効率性を高めることです。いま手元にあるものから発想するのではなく、ゴールから逆算することでチームの知的生産性の効率が高められます。」
「しかし、成功させる手段については若干の誤解があります。「データサイエンス」のプロジェクトだからといって、成功させるためにチームが取るべき手立ては、データ分析作業に限定されるべきではありません。費用承認がおりないならば、データ投資によって可能になることのメリットを教えたり、データサイエンスについての役員のリテラシーを高める啓蒙イベントをおこなったり、短期で投資対効果がはっきりわかる小規模なパイロットを提案したりと、可能なら外部からの予算獲得なども含めて活動すればよいのです。そもそも費用対効果の説明を求められないプロジェクトのほうが奇妙でしょう。」
《E:Excecution》
「機械脳がA:Aim(目的)を達成するには、組織の中の誰がどのように関わる必要があるのか、その人たちにとって新しい機械脳を受け入れるための理由は何なのか。誰がどのように実行状況をモニタリングしていくのか、想定されるリスクシナリオと対策はどの時点で実行するのかを決めていいきます。」
「ビジネスにおける機械脳モデルの「優秀さ」は、数学的なエレガントさでは決まりません。現実の課題解決に貢献したことをもって評価されるものです。」
「機械脳を活用した改善の目論見が初回から大当たりすることは稀ですから、パイロット実験は何度も失敗するはずです。そのたびに繰り返し粘り強い交渉や、やり方の修正が求められます。チームはまずその認識を持つべきでしょう。また、マネジメント層レベルでは、不確実性を伴うデータ活用の取り組みを組織が受け入れるための、事業責任の明確化が不可欠です。」
《データGM人材》
「データプロジェクトへの取り組みが、単なる流行語に踊らされた形だけのものかどうかを看破する嗅覚もあります。」
《データサイエンティスト人材》
「統計学の基礎となる仮設検定の考え方(帰無仮説を利用する有意検定)が、ビジネス文脈で必ず有効であるわけでもありません。検証の正確性よりも、意思決定の迅速性が大切なケースのほうが体感的には多くあります。検証が学問的にどれほど正確であるかという括りを抜け、意思決定するために必要十分な情報はどうすれば入手できるかを考えられるようなマインドセットが必要です。」
《NGフレーズ》
「どのようにすれば個人を責めなくて済むか、どうすればどのメンバーもデータ活用で課題を解決することに動機づけを持ち、足を引っ張り合うのではなく協力し合える組織にできるか、」
以下に本書のキーワードを列挙します。
【機械脳を作るためのフレームワーク】
・A:Aim(目的)
・B:Brain(機械脳の種類)
・C:Coding/Construction(プログラミング作業・実装)
・D:Data(データ選定と整備)
・E:Execution(実行)
【ゴールをメンバーで共有するポイント】
プロジェクト発足時に以下を明らかにした上で、メンバー間で共有する。
・(手段):〇〇することを通して
・(対象):〇〇が
・(数値基準):〇〇となることを
・(期日):〇〇までに達成する
・(制約条件):ただし〇〇とする
・S:Specific(具体的な目的)か
・M:Measurable(測定可能な目的)か
・A:Achievable(達成可能な目的)か
・R:Relevant(意味のある目的)か
・T:Time Bound(期限付きの目的)か
【モデル選択基準】
その時々のプロジェクト要件を踏まえ、それぞれの基準をトレードオフする。
その時々のプロジェクト要件を踏まえ、それぞれの基準をトレードオフする。
・A:Accuracy(精度)
・I:Interpretation(解釈容易性)
・C:Coding/Construction(プログラミング作業・実装)
・S:Speed(速度)
コメント