カテゴリー
キーワード

迷えるデータサイエンス学習者の課題を解決したい! Data Learning Bibliography開発にかける想い

 

本記事では、先日クラウドファンディングのプロジェクトを達成したデータ領域特化のコンテンツデータベースである「Data Learning Bibliography」について、どういったサービスなのか、なぜそういったサービスを企画しようと考えたのかについて執筆しようと思います。

 

         

クラウドファンディングとData Learning Bibliographyの概要

まず、簡単にクラウドファンディングとData Learning Bibliographyについて、簡単にご説明したいと思います。

本クラウドファンディングは、「データサイエンス学習者と学習コンテンツのマッチングを最適化したい!」というテーマで、私の運営しているデータ領域特化のオンラインコミュニティである「データラーニングギルド」というコミュニティの中で立ち上がりました。コミュニティの中でData Learning Bibliographyの初期構想について相談したところ、かなりの好感触が得られたためプロジェクト化する形になりました。

その後、コミュニティの中で中心となるメンバーを募り、有志のメンバーと一緒にプロジェクトを進めてきました。2022年の年初頃から約半年間ほど企画を練り、2022年6月にクラウドファンディングページを公開、1ヶ月半の期間を経て100万円の支援を達成しました。

Data Learning BibliographyのBibliographyは「書誌情報」という意味を持っており、近年急激に増えてきたデータ領域のコンテンツ情報を一箇所に集約するようなサービスを目指しています。Data Learning Bibliographyを通じて、データ系のコンテンツを探す際に、適切に検索でき、書籍の評価ができる状況を実現したいと考えています。

なぜ企画を立ち上げたのか?

この企画を立ち上げた背景には、私のスクール、コミュニティ運営での教育経験を通じて感じた課題が大きく関わっていますので、まずはそちらについて説明したいと思います。

データ領域学習者の共通する課題

現在、私は以下のような事業を中心に活動しています。

  • データ領域特化のオンラインコミュニティである「データラーニングギルド」の運営
  • データサイエンス特化のスクールである「データラーニングスクール」の運営
  • データ利活用、データサイエンス領域のPM業務

このような活動を通じて、多くのデータ人材の方、データ人材を目指す方との交流を持って来ました。その活動の中で、多くの質問を頂き、答えてきました。そして、質問に多く答えていく中で、多くの方に共通するパターンも見えて来ました。

例えば、データ領域の初学者であれば、「まずはどのようなコンテンツで学習すれば良いですか?」、「今こんな学習をしているのですが、次に何を学べばいいですか?」といった質問です。ネット記事などで「これがオススメ」と言われている書籍を学習していて、その学習した結果が何につながるのがイメージできていないというケースが多く見られます。

しかし、頻出する質問であるにも関わらず、この質問に対しての回答は非常に難しいです。ある程度パターン化はできますが、現在の数学の知識、エンジニアリングの知識、職業などのバックボーン、目指しているゴールによってオススメするコンテンツが違うからです。個々人に合ったアドバイスをしているのが現状です。

コンテンツに関わる課題は、自身のデータサイエンティストとしての活動の中でも感じることがあります。データサイエンスで取り扱う範囲は非常に広いため、未経験の領域の仕事を依頼頂くことが度々あります。例えば、以下のような状況に出くわすことは珍しくないかと覆います。

  • 決定木や回帰、クラスタリングといった古典的な機械学習中心に分析を行ってきたにも関わらず、ディープラーニングの知識が必要になる。
  • テーブルデータを中心に扱っていたが、画像データ、テキストデータ、音声データなどを扱う必要が出てくる。
  • 工場設備のIoTセンサデータ中心に分析を行って来たが、プロセスデータの分析を行う必要が出てくる。
  • データ基盤を中心に活動してきたが、アプリケーションに組み込むに当たって、システム開発の知識が必要になる。

未経験の領域では、関連する領域の知識を手がかりに、手探りで進める必要があるため、多くの苦戦を強いられます。0からその領域の入門書を読み、必要な知識を部分的にピックアップして、コードを実際に動かして動作を確認し、試行錯誤しながら少しずつ理解を深めて行く必要があります。その領域の前提となる知識が足らないために、入門書の前段階の書籍を購入する必要が出てくることも珍しくありません。実践寄りの書籍が欲しいのに理論寄りの書籍だったパターン、もしくはその逆のパターンだったというシチュエーションもよく出くわします。

以上のように、データ領域の学習において、未経験の方から経験者まで「適切な学習コンテンツを選ぶ」という所に大きな課題があることが分かります。そこで、このData Learning Bibliographyでは、そのような「適切なコンテンツを選ぶ」という課題を解決したいと考えています。

良質な学習コンテンツが増えてきた

また、Data Learning Bibliographyの企画を立ち上げた理由として、良質な学習コンテンツが増えてきたという時代背景も関係しています。

私がデータ関連の業界に入った2012年頃には、まだ十分な学習コンテンツが存在せず、データサイエンスの学習をするなら大体このコンテンツというものが概ね決まっていました。そこから約10年ほど経ち、データサイエンス、データエンジニアリング、データのビジネス活用といったありとあらゆる領域のコンテンツが充実してきました。媒体としても、書籍、Webのブログ記事、動画コンテンツ、プログラミング学習サービス、PDFでのコンテンツ配布、新人研修資料の公開といった、様々な形式で良質なコンテンツが提供されています。

このような変化が起こったことで、コンテンツを探す上での課題も変わって来ました。今までは、「自分が求めているコンテンツが存在しない」という課題が中心だったのに対して「コンテンツが存在するけど見つけられない」といった課題に変わって来ました。「このクオリティの学習コンテンツが無料で公開されているのはすごい!」といった文脈のTweetや、「データサイエンティストが読むべきオススメ書籍XX選」といった記事がバズっているのを見たことがある方も多いのではないでしょうか?(ちなみに、私も書いたことがありますw)しかし、そのコンテンツは、はたして本当に必要としている方にどの程度届いているのでしょうか。きちんとコンテンツに検索用のタグ情報を付与して、検索可能にすることで、より多くの方に必要なコンテンツが届くようになるのではないでしょうか?

Data Learning Bibliographyでは、このよう近年増えて来たデータ領域のコンテンツと、データ領域の学習者をマッチングすることを目指しています。

どのような課題を解決するのか?

それでは、Data Learning Bibliographyを通じて、どのようなシチュエーションの、どのような課題を解決できるようにするのか、解説したいと思います。具体的な機能については、翌日以降の記事で紹介予定ですので、本記事では具体的な課題と解決方法、シチュエーションについて紹介したいと思います。

データサイエンス学習者と学習コンテンツのマッチングを最適化する

求められているコンテンツを適切に届けるために、どのような状況を目指すと良いのでしょうか?Data Learning Bibliographyでは、以下の3つの状況を作ることで、コンテンツを探す上での課題を解決したいと考えています。

  • コンテンツを検索可能な状況にする
  • コンテンツが自分の求めているものなのか、評価できるようにする
  • データ領域の知識体系を可視化する

「Pythonの基本」から「事業への実装」などまで知識から活用するまでの網羅的なスキル軸からコンテンツを検索できる

まず、コンテンツの検索についてですが、時系列解析、ディープラーニング、データ基盤といった「カテゴリ軸」での検索、データサイエンティスト、データエンジニア、データアナリストといった「職種軸」での検索、python、ビジネス力、高校数学といった「スキル軸」での検索が、求めているコンテンツに辿り着く可能性を高めたいと考えています。

次に、そのコンテンツページで前提とする知識、コンテンツの目次、どのようなターゲットに対して作られたコンテンツなのか、そのコンテンツで学習することでどのような知識が得られるのかといったことを一覧化することで、そのコンテンツが本当に自分の目的としているものか判断できるようにします。

最後は、データ領域の知識体系を可視化することです。その知識の前提となっている知識、前提となっている知識の前提となっている知識、その知識がどんな知識やスキルにつながるのかといったことを、可視化することで、学習の全体感を持てるようにすることを目指します。

具体的に解決したいシチュエーション

これらの課題を解決することで、初学者、経験者どちらの課題も解決できるようになると考えています。

Data Learning Bibliographyでは、さまざまな想定読者向けにおすすめの書籍はセレクトされている。

まず、初学者の、「何から初めて良いか分からない」、「本をオススメされたが、自分がその書籍を読めるレベルなのか分からない」といったシチュエーションを考えてみましょう。以下のような流れでData Learning Bibliographyを使うことを想定しています。

  • 書籍の特集ページで、初心者要コンテンツ一覧ページを見る
  • その中で、チャレンジしたい書籍を選ぶ
  • 選んだ書籍の紹介を見て、自分にできそうか判断する
  • 自分のスキルで難しそうなら、前提となっているスキルをスキルタグから確認する
  • そのスキルキーワードに書籍を再度検索する
  • 学べそうな書籍が見つかるまで、検索とコンテンツの確認を繰り返す

Data Learning Bibliographyでは、個別のコンテンツページに加えて、初学者向け、製造業向け、医療従事者向け、BIエンジニアを目指す人向けなど、トピックに合わせたコンテンツ集を作って行きたいと考えています。全く右も左も分からない人が、その領域の経験者の知見を足がかりに、自分のレベルに合わせた書籍を選べる、そのような流れで設計しています。

続いて、「新しい領域を学ぶ必要が出てきた」、「ある程度の関連知識はあるが、その領域に関する知識がない」というシチュエーションの経験者について考えてみましょう。この場合は、以下のような流れを想定しています。

  • 領域に関連するキーワードで検索を行う
  • 書籍のページを見て、内容の確認を行う
  • 書籍についているタグ情報を見て、その領域にどのような基礎知識が必要なのかを理解する
  • 関連する基礎領域のうち、自身に足りていない部分のコンテンツを検索

経験者の方が新しい領域を学習する際に苦戦するポイントとして、「その領域に関連するキーワードを探す」という悩みがあるかと思います。書籍ページの前提としているスキルタグを見ることで、どのようなキーワードが重要視されているのかを理解し、効率良くコンテンツを探すことができるような状況を作りたいと考えています。

このように、Data Learning Bibliographyでは、検索、評価、知識の体系化を行うことで、学習コンテンツと学習者のマッチングを最適化しています。

Data Learning Bibliographyのビジョン

最後に、Data Learning Bibliographyを将来的にどのようなサービスにしていきたいのかについて共有したいと思います。

データ領域のWikipediaにしたい

今、何か調べ物をしようとしときの選択肢に挙げられるサイトの一つのがWikipedia化と思います。同じ用に、データ領域の学習者が、学習コンテンツを探す際に、「とりあえずこのサイトを見ておけば間違いない」と考えるようなサイトにしていきたいと考えています。まずは書籍のみからスタートですが、動画コンテンツ、Webの記事や研修資料などのコンテンツについても増やして行く予定です。多くのコンテンツ情報を蓄積することでナレッジグラフとしても活用できるようになるので、コンテンツデータを活用したデータサイエンスの全体感が掴めるような分析も行っていきたいですね。

知の高速道路を整備したい

近年では、技術の発展、移り変わりが日々加速しています。先月新しい技術がリリースされたと思ったら、今月にはその技術を発展させた技術が出てくる。数ヶ月、数日単位で新しい技術が出てくるような状況になっているかと思います。そのような中で、適切に技術を取捨選択して学習を行うのは非常にコストがかかる活動になっているように感じます。

ただ、新しいことを学習するに当たって「ディープラーニングで画像の自動生成ができる」、「データ基盤の構築ができる」、「データマネジメントを組織に浸透させられる」といった、「目的地」はある程度定義できるはずで、そのために学習が必要なことも、概ねパターン化できるはずです。技術をパターン化し、最短経路で目的を達成できる、技術者のための知の高速道路を、Data Learning Bibliographyというサービスを通じて整備していきたいと考えています。

最後にData Learning Bibliographyをより詳しく知りたい方へ

本連載では、DataLearningBibliographyについてより詳しく知ってもらうために、以下のような話をDataLearningBibliographyに関わったメンバーの方に執筆していきます!

DataLearningBibliographyについては、以下よりアクセスできますので、是非一度自分に合った書籍がないか、検索してみてください!

書き手:村上智之(むらかみ・ともゆき)氏

株式会社ALBERTにてデータサイエンティストとしてキャリアをスタートし、機械学習やデータエンジニアリングに関する基礎を習得。株式会社イノーバでマーケティングオートメーションツールの開発やサービス企画の経験を積んだ後、澪標アナリティクス株式会社にて、大手自動車メーカーの分析チーム立ち上げに従事。2018年5月に株式会社データラーニングを設立。初学者に向けたデータ分析の教育事業とデータ分析の受託事業、データ分析人材向け有料職業紹介事業を展開。社員数数万人規模、売上数千億円以上の大規模企業からスタートアップまで、幅広い領域での分析コンサルティングを手がける。

 

 

Data Learning Bibliographyでは執筆者を募集しています!

Data Learning Bibliographyにコンテンツを充実させていくため、記事の執筆者を募集しています。執筆にささやかではありますが、謝礼として書籍の金額分のAmazonギフトカードを提供させて頂きます。データ関連の書籍であれば、どのような書籍でも大丈夫ですので、執筆にご興味がある方は代表の村上までご連絡ください。

 

 

メルマガ登録をしていただくと、記事やイベントなどの最新情報をお届けいたします。


データ活用 Data utilization テクノロジー technology 社会 society ビジネス business ライフ life 特集 Special feature

関連記事Related article

書評記事Book-review

データのじかん公式InstagramInstagram

データのじかん公式Instagram

30秒で理解!インフォグラフィックや動画で解説!フォローして『1日1記事』インプットしよう!

おすすめ記事Recommended articles

掲載特集

デジタル・DX・データにまつわる4コマ劇場『タイムくん』 データのじかんをもっと詳しく データのじかんフィーチャーズ 「47都道府県47色のDXの在り方」を訪ねる『Local DX Lab』 DXの1次情報をを世界から 『World DX Journal』 データで越境するあなたへおすすめの 『ブックレビュー』 BIツールユーザーによる、BIツールユーザーのための、BIツールのトリセツ CIOの履歴書 by 一般社団法人CIOシェアリング協議会 なぜ、日本企業のIT化が進まないのか――日本のSI構造から考える 日本ビジネスの血流である帳票のトレンドを徹底解説 データを武器にした課題解決家「柏木吉基」のあなたの組織がデータを活かせていないワケ BI(ビジネスインテリジェンス)のトリセツ 入社1年目に知っておきたい 差が付くKPIマネジメント CIOLounge矢島氏が紐解く トップランナーたちのDXの“ホンネ” データのじかん Resources 越境者のためのお役立ち資料集 AI実装の現在地点-トップITベンダーの捉え方 データでビジネス、ライフを変える、 面白くするDATA LOVERS データマネジメント・ラジオ by データ横丁 データのじかんNews データ・情報は生もの! 『DX Namamono information』 ちょびっとラビット耳よりラピッドニュース AI事務員宮西さん(データ組織立ち上げ編) 藤谷先生と一緒に学ぶ、DXリーダーのための危機管理入門 生情報取材班AI時代に逆行?ヒトが体感した「生情報」のみをお届け! データはともだち 〜怖くないよ!by UpdataTV Original データ飯店〜データに携わるモノたちの2.5thプレイス by UpdataTV〜 インサイトーク〜データで世界を覗いてみたら〜by WingArc1st + IDEATECH
モバイルバージョンを終了