まず初めに、DX人材がデータサイエンスを学ぶメリットを3つ紹介します。
1つ目は、グローバルで通用するポータブルスキルであることです。データサイエンスに言語の壁はなく、幅広い分野でその考え方を活かすことができます。一定量以上のデータが取得できれば、そこから予測や分類、最適化の判断材料が得られます。
2つ目は、問いに対する自身の主張に関して、データに基づいた客観的な根拠を構成し、筋道立てて論理的に説明できるようになります。単に持論を主張するたけでなく、そこにデータで客観性を与えて説明する習慣がつくようになります。また、他の人の主張に対しても、客観性があるのかを自然と判断できるようになります。それにより安易に他人の主張や情報に流されなくなります。
3つ目は、内閣府が提唱するSociety 5.0の中心分野であるデータサイエンスの知見をもつことで、人材価値が高まります。日本が目指すべき未来社会の姿として提唱されているSociety5.0は、サイバー空間(仮想空間)とフィジカル空間(現実空間)を高度に融合させたシステムにより、経済発展と社会的課題を両立する人間中心の社会を指します。データサイエンスはこのSociety 5.0の中心分野です。
データサイエンスの全体像を押さえるにあたり、参考にしたい指針にIPA(情報処理推進機構)と一般社団法人データサイエンティスト協会が協業し、策定した「データサイエンティストのためのスキルチェック/タスクリスト概説」があります。そこでは、データサイエンティストに求められるスキルセットとして「ビジネス力」「データサイエンス力」「データエンジニア力」の3つが掲げられおり、これら3つの分野にそれぞれデータサイエンスのスキルが分類されています。
・ビジネス力:課題背景を理解し、ビジネス課題を整理・解決に導く力
・データサイエンス力:情報処理・人工知能・統計学などの情報科学系の知識を理解し使う力
・データエンジニアリング力:データサイエンスを意味のある形として扱えるようにして、実装・運用する力
データのじかんでは、データサイエンティスト協会の定義するスキルセット、ビジネス課題解決力(ビジネス力)/データサイエンス力/データエンジニアリング力に加え、データを文化として捉え直すことが重要だと考えています。
データは単なる数字ではありません。データからは、人やモノやコトの行動や変化、感情や思考の動きなども見て取ることができます。データは、社会や人々の姿を映し出す、ひとつの文化なのです。より多くの人々がデータを活用する上で、データという文化の土壌を耕すこと、それが必要なのではないかと考えています。
本稿の読者の多くは、データサイエンティストを目指すというよりは、経営とデータサイエンスの橋渡し役となるビジネストランスレーターを担う人材であると思います。ビジネストランスレータがデータサイエンスにおいて押さえておきたい領域と学習方法について、筆者自身の学習経験と資格試験予備校講師としての経験を踏まえて紹介します。
文系ビジネスパーソンがデータサイエンスで最も理解に苦労するのが統計学です。しかし、基礎的な統計学は機械学習エンジニアやデータサイエンティストにとっては中心の学習分野になる一方で、ビジネストランスレーターの初期段階ではそれほど深い理解は必要ありません。
具体的に求められるレベル感としては、一般社団法人日本統計学会が実施している統計検定2級程度の理解度があれば初期段階のビジネストランスレータとしては十分です。統計検定2級は、大学基礎統計学の知識と問題解決力が問われます。統計検定2級は、理系の学部生だけでなく経済学、経営学、心理学を学ぶ大学生などを中心に文系の学部生でも取得者が増えています。
試験範囲は、統計検定2級の出題範囲を確認ください。学習方法はこれまでの学習経験によりますが、数学に自信がない初学者であれば予備校が提供する統計検定2級対応の初級統計学などの講座で最初に全体像を掴むのがよいでしょう。一方で、大学受験などで高校2年生レベルの数学を勉強した経験があれば、文系出身でも独学は可能です。その際は、統計WEBなどの統計学に関するWebサイトや、動画(Udemy、YouTubeなど)にも初級統計学のコンテンツがありますので、わからないところを参照するのがお勧めです。
データサイエンスは、高校で学ぶ微分・積分や大学基礎課程(1・2年次)で学ぶ線形代数などの数学的知識を統計学に応用しています。ですが、ビジネストランスレータを目指すのであれば、統計学に用いられている基礎数学は一旦後回しにしても構いません。
これは、業務で直接的に基礎数学の知識が必要になる場面は相対的に少ないという理由もありますが、ビジネストランスレータとしてある程度のレベルになってからでないと、基礎数学を学ぼうと思っても挫折する可能性が高いからです。
ただし、学習意欲の高い人は、高校数学の微分・積分や確率統計に関する「学び直し本(例:もう一度高校数学)」やYouTubeなどで忘れてしまった高校数学の分野をスポット的に参照するのがお勧めです。
人の頭では計算できない大量のデータを分析(機械学習)するには、プログラミング言語(PythonやRなど)、パッケージ管理システム(AnacondaやGoogle Colaboratoryなど)、BIツールを利用します。そのため、ビジネストランスレータも、データの収集・蓄積・統合、データの分析・集計、データの可視化などがどのようなプロセスを得て実行されるのかを理解しておくことは重要です。
業務で取得したデータを分析する際は、エクセルで分析を行うだけでなく、これらのデータ分析ツールを実際に使用してみると理解が深まります。RやPythonについて学んでみたければ、以下の書籍がお勧めです。
BIツールであれば、Udemyなどで人気の動画コンテンツを検索して自分のレベルにあったものを選ぶとよいでしょう。BIツールを使えば統計学の知識がなくても問題ありませんが、統計検定2級程度の基礎統計学の知識があると、どのような統計的分析手法が用いられているのか理解できるようになります。BIツールで行う分析よりも、もっと適切な分析手法がないのかを考えるには統計学の知識が役立ちます。→ここは、Udemyなどの外部情報ソースに加え、ベンダーが運営しているナレッジサイトや主催している無料セミナーやコミュニティに触れてください。
データ分析を行うためのデータを保持・管理・活用するにはデータベースの利用が不可欠です。近年ではGoogleやAmazonなどが提供するクラウド型デーベースシステムが主流ですが、データベースの種類や関連用語、データの操作や定義を行うSQL(データベース言語)の概要は理解しておく必要があります。
また、システム構成技術やソフトウェアの種類、セキュリティ対策、モデリング技法、テスト方法といった基本的な情報処理技術に関する知識もできれば押さえておきたいところです。データベースはデータエンジニアリングやシステム・ソフトウェア開発にも密接に関係するため情報処理技術全般について広く浅く学ぶ必要があります。初学者であれば、まずはIPA(情報処理推進機構)がCBT方式で随時実施しているITパスポートの取得がお勧めです。ITパスポートに関するコンテンツは、書籍やYouTube動画も豊富にあります。なかでも下記2つがお勧めです。
データサイエンスは、様々な分野の課題解決にインパクトを与える手段です。そのため、どのような課題を解決するのかを考える「課題設定能力」、どのようなデータを収集すれば真の課題に到達できるのかを考える「仮説思考力」が問われます。
そして、ビジネストランスレーターは、経営とデータサイエンスの橋渡し役であるため、経営コンサルタントに求められるソフトスキルとハードスキルの両方が必要です。
具体的に必要となるソフトスキルには、課題を深掘りするヒアリング力やデータサイエンスの知見が乏しい関係者にもわかりやすく説明するプレゼンテーション力、論理的思考力があります。
一方で、必要となるハードスキルには、外部環境や内部環境を分析するフレームワークやMBAで学ぶ戦略論、財務会計やマーケティングなどの経営学の基礎知識があります。さらに、データとして個人情報を扱う場合もあるため、個人情報保護法への理解や情報流出を防止するためのリスクマネジメントについても理解しておく必要があります。
これらの学習方法については、下の記事を参照ください。
DXやデータサイエンスのプロジェクトでは、複数のデジタル人材とエンジニアが集まりプロジェクトを組むことが一般的です。ビジネストランスレータは、経営とデータサイエンスの橋渡し役として、プロジェクトリーダと二人三脚しながら、メンバーであるデータサイエンティスト、インフラエンジニア、機械学習エンジニア、Webエンジニアなどとコミュニケーションを取りながらプロジェクトを推進していきます。
ITプロジェクトにおけるマネジメント方法のガイドラインであるPMBOKや、アジャイル開発の手法や価値観などを一通り押さえておくことで、メンバーとの共通の物差しができます。他のスキルにも当てはまることですが、特にプロジェクトマネジメントに関わるスキルは、実践で試行錯誤を重ねる中で習得が可能です。
データサイエンスは、これまで単体で成立していたスキルを複数身につける必要があります。筆者が好きな格闘技に例えるなら、柔術、キックボクシング、レスリング、ボクシングなどのスキルが求められる総合格闘技に似ています。総合格闘家は、それぞれの競技で求められるスキルを習得する一方で、各スキルを総合格闘技で使えるようにカスタマイズする必要があります。ビジネストランスレータが必要なデータサイエンスの知識やスキルも同様に、本稿で紹介したスキルを業務に合わせて総合的に学び習得することが大切です。
お話をお伺いしたDataLover:長島 三氣生(ながしま・みきお)氏
30代から50代のビジネスパーソンの能力開発を支援するパラレルキャリア研究会を主宰。 早大商卒、欧州ESADEビジネススクール経営学修士(MBA)。「デジタル戦略コンサルタント」、「講師業」、「Webアプリ開発」、「データサイエンス」を生業にするパラレルワーカー。
データサイエンスの自学自習を支援するパラレルキャリア研究会主宰
メルマガ登録をしていただくと、記事やイベントなどの最新情報をお届けいたします。
30秒で理解!インフォグラフィックや動画で解説!フォローして『1日1記事』インプットしよう!