データマネジメントについてイチから学びたい。データサイエンティスト・アナリストに限らず、営業、マーケターなど幅広い職種でデータの有用性を知り、そう考えている方は少なくないはずです。
そこで取り上げたいのが、2020年3月に発行された『データマネジメントが30分でわかる本』。
本記事では、「本当に30分でわかるの……?」「どんな人におすすめ?」など同書について知りたいポイントを、書評を通してご説明します!
【30秒コース】一言で!
データマネジメントの基礎を網羅的に紹介します。
【3分コース】なにそれ
データとビジネスをつなげるプランニングから運用フェーズ、ガバナンスの実行までは、11領域に分けられます。それぞれの領域について「一言でいうとどういうことか」「どういう意味か」「なぜ行うのか」「ゴール」「具体的な手法」「ケーススタディ」が最小限に圧縮してまとめられています。
【30分コース】どうして
……
『データマネジメントが30分でわかる本』は、上記の構成で11領域にそれぞれについて説明する流れで進められていきます。
さすがに「30秒コースだけ読んで満足」という方はあまりいないでしょうが、このように時間を基準にステップが示されているだけで“初学者にもとっつきやすく”の精神が徹底して意識されていることがわかります。
30分コースだけ読み進めれば30分、少なくとも1時間以内には読破できるでしょう。
とはいえ、同書はある程度データ活用の基礎的な考えを身に着けた脱初学者には進められないか、というとそんなことはありません。
【30分コース】のあとに用意されている「【3時間コース】ケーススタディ」は、むしろ業務でデータマネジメントに取り組むようになった実践者こそ重宝するでしょう。本書の主著者である@yuzutas0(ゆずたそ)氏、hase-ryo(はせりょ)氏が各領域の目的を達成するために取り組んだ事例が、実際に使われた概念図やツール名とともに紹介されているからです。
個人開発者あるいは合同会社風音屋の代表として、企業のデータコンサルや講演活動に取り組んでおり、PyCon2017ベストトークアワード優秀賞、Developer’s Summit 2018夏 アンケート満足度1位などの経歴を持つ@yuzutas0氏、株式会社メルペイデータアナリスト兼データマネジャーなどを歴任してきたhase-ryo氏の実例がkindle版であれば、500円(2021年8月23日時点)で知れるというのはうれしいポイントです。
『データマネジメントが30分でわかる本』はそもそも、データマネジメントのバイブルともいうべきDMBOK(Data Management Body of Knowledge:データマネジメントの知識体系)を“30分で読めるように独自要約する”というコンセプトで作られたそうです。
米国DAMA(Data Management Association)インターナショナルが開発したDMBOKはデータマネジメントの体系的な理解にうってつけの書籍ですが、全17章で構成されたその内容は邦訳版(データマネジメント知識体系ガイド)があるにしても初学者にとってハードルが高く、価格も13,200円(2021年8月23日時点)と手が出しづらい事情がありました。
そこで@yuzutas0氏らはデータマネジメントを「データガバナンス(Data Governance)」を中心にした以下の11領域に分ける「DAMAホイール」を章立てとして、各領域について手短にわかりやすく解説しようと考えたというわけです。
【1】データアーキテクチャ(Data Architecture)
【2】データストレージとオペレーション(Data Storage & Operations)
【3】データ統合と相互運用性(Data Integration & Interoperability)
【4】データモデリングとデザイン(Data Modeling & Design)
【5】マスターデータ管理(Reference & Master Data)
【6】ドキュメントとコンテンツ管理(Document & Content Manegement)
【7】データセキュリティ(Data Security)
【8】データ品質管理(DataQuality)
【9】データウェアハウジングとビジネスインテリジェンス(Data Warehousing & Business Intelligence)
【10】メタデータ管理(Metadata)
【11】データガバナンス(Data Governance)
筆者が同書を読んでいて、特に参考にしたいと思ったのは、第4章「データモデリングとデザイン」で@__sotaron__氏が寄稿した「モデルストーミング×スタースキーマ設計」によるデータモデル構築の流れの解説部分でした。
モデルストーミングとは、書籍『Agile Data Warehouse Design』(2011)で紹介されている、ブレインストーミング形式でモデルのアイディアを洗い出す手法の事。スタースキーマとは、星型の中心にファクト・テーブルと呼ばれる索引を、その周囲にディメンションテーブルと呼ばれる属性値を配置するデータモデルです。
マッチングアプリのデータマネジメントをケーススタディとして、ステータス情報、居住地などの属性値をどのように洗い出し、分類するのかが「7つのW」など具体的な問いとともに紹介されており、ほかにも応用できるひな形として有用に感じました。
もちろんその前にはより抽象的なレベルで、データモデルをどのように形にしていくかが「学校」と「学生」のデータの関係性を例に解説されています。
この部分を読んだだけでも、実践者にも有用で、初学者には易しいという利点が伝わったのではないでしょうか。
DMBOKの基礎が最短距離で納められる本、『データマネジメントが30分でわかる本』について書評いたしました。
“30分でわかる本”と銘打たれていますが、30分コースの概要部分だけでなく、3時間コースの「ケーススタディ」まで含めて充実した内容であることが伝わったのではないかと思います。
スキマ時間でも十分に読破できるため、お気軽に手に取ってみてはいかがでしょうか。
【参考資料】 ・ゆずたそ (著, 編集), はせりょ (著) 『データマネジメントが30分でわかる本 Kindle版』2020 ・下町柚子黄昏記 by @yuzutas0┃@yuzutas0 ・DAMA International (著), DAMA 日本支部 (翻訳), Metafind コンサルティング株式会社 (翻訳)『データマネジメント知識体系ガイド 第二版』日経BP、2018
(宮田文机)
メルマガ登録をしていただくと、記事やイベントなどの最新情報をお届けいたします。
30秒で理解!インフォグラフィックや動画で解説!フォローして『1日1記事』インプットしよう!