Share!

データサイエンティストに必要なスキルは何かと考えたとき、まずでてくるのが統計と数学の知識、次にハッキングスキル、そして最後がドメイン知識です。これらの三つの知識を持ち合わせたデータサイエンティストをフルスタック・データサイエンティストと呼んでいる人もいます。しかし実際には、多くのデータサイエンティストは、これらをバランスよく持っているわけではありません。とはいえ、できるデータサイエンティストであるための条件として、データ分析を行う場合は、いかに仮説を立てるかが重要になってきますし、そのためには多くの知識をフル稼働させる必要があります。
データサイエンティストの持つデータ分析の手腕は、分析モデルの手法や統計データの解析結果を見てわかりますが、データ分析の取っ掛かりは何を見て、何を問題視し、どのようなデータでそれらを可視化するのかということにあります。
実際に集められた社外データや社内データをどのように加工して、いかに使える分析結果にしていくかは、単に高度な解析手法を使うだけでは、構築することができません。まずは、どのように分析していくかのシナリオを作って仮説を立てることが大切です。仮説によってシナリオが練り込まれたものなのか表面的なものなのかが決まり、結果として最適解を出すことができます。仮説を立てるうえで必要になるのは柔軟な発想力ですが、その基本となっているのが分析対象のドメイン知識です。
ドメイン知識とは、解析しようとしている業界や事業についての知識や知見、トレンドなどの情報です。データ分析は、単に数値をグラフ化するためや、見やすくするためのものではなく、その中から次の一手となるビジネス価値や方針を導き出すための資料です。確かな数値をベースにして、仮説を立て、理論武装し、価値を生み出していきます。
また、ビジネスの価値は、一般的な情報だけでなく、その業界特有の情報を加味する必要があります。一般情報だけでは、データ分析をして新たな価値を生み出すことができず、一般論にとどまってしまいます。データを分析し、その結果見えてきたシナリオで新しいビジネスを構築することが重要です。
現在のデータは、1方向だけでなく、多方面にわたるものが多くなっています。顧客とのアクセスポイントが多ければ多いほど、多くの有益な情報と、さらに多くの無益に見える情報を得ることができます。これらの情報をどのような分析方法でアプローチするか、データ分析の結果で正しい相関関係を見いだしているかなど、実際のドメイン知識がなければ違う方向を向いてしまう可能性も少なくありません。対象のドメインに適した適切な分析手法で、ドメイン知識をベースに分析していくことが重要です。ドメイン知識で仮説を立てることができれば、結果と現実で、それほど大きな開きがでることなく、次の一手を見いだすことが容易になるでしょう。