INDEX
宮西 京華(みやにし けいか)
保険会社で事務職をやっているデータマネジメント担当。歌い手動画を見るのが好き。
データマネジメント解説、連載の第16回が始まりました。
データマネジメントの推進計画を作るためにデータマネジメント成熟度アセスメントを行うことにした宮西さん。
まずはシステム面を調べてみることにしましたが、いざ取り掛かってみると、カタカナと英語の羅列、そして謎の略語が多く、専門用語の多さに辟易してしまいます。
・・・・・
いつものように自席に座って固まっている。
データマネジメントの成熟度アセスメントをやることになったものの、何から手をつけていいのか分からないからだ。
「……調べ方が全然分からないんですけど」
私は頭を抱えながら松田さんに相談した。すると、松田さんはおっとりと微笑みながら言った。
「まずはシステム部に聞いてみたらいいんじゃないかしら」
「システム部、ですか?」
「ええ。データがどうやって管理されているのか、システムを作った人たちなら分かるはずよ。設計書もあるし」
「なるほど……設計書をもらえば、全体像が見えてくるかもしれないですね」
「そうね。ただ、機密情報も多いから、すぐには見せてもらえないかもしれないけど」
確かに、会社のシステム情報は簡単に共有されるものではない。だが、何もしないままでは進まない。
「分かりました。まずはシステム部に問い合わせてみます!」
システム部に連絡を取って設計書をもらうことにした。返事はすぐに来たものの、「機密情報だから閲覧には制限がある」「この資料は最新版ではないかもしれない」など、やたらと慎重な対応だった。結局、ようやく送られてきた設計書を開いてみたところ——
「……これ、日本語?」
確かに、日本語の文字が並んでいる。しかし、意味がまったく分からない。カタカナと英語の羅列、そして謎の略語。まるで暗号のようだ。
例えば、「このシステムはETLプロセスを介してDWHにデータを格納し、BIツールで可視化する」と書かれている。ETL? DWH? BIツール? 一体何のことなのかさっぱり分からない。
さらに「本システムはデータ基盤としてクラウド上に構築されており、ワークフロー管理ツールを用いてデータの流れを制御している。その結果、データの処理能力を柔軟にスケールさせることが可能になっている」と続く。
ワークフロー管理ツール? スケールさせることが可能? これは本当に日本語なのだろうか。
「松田さん、これ……読めます?」
「ええ、まあ。でも最初はみんなそう思うわよ」
「これを理解しないと、アセスメントできないんですか?」
「そうね。でも、全部を理解する必要はないわ。どんなデータがどんなシステムで管理されているのか知るのが目的だから」
なるほど、すべてを完璧に理解しようとしなくていいのは少し安心した。しかし、それでもこの資料を読めるようにならないと仕事にならないのも事実だ。
私は設計書をにらみながら、とりあえず分かる単語を拾い上げてみることにした。どうやら、データは「データレイク」と呼ばれる場所に集められ、そこから分析のために「DWH」へと移されるらしい。データレイク……湖? そんなに広大なものなのか。
「松田さん、このデータレイクって具体的にどういうものなんです?」
「簡単に言うと、データをためておく大きな倉庫ね。湖のように多様なデータを貯める場所という事でデータレイクと呼ばれているのよ。生データのまま入れておいて、あとから整理する感じ」
なるほど、つまりとりあえず全部詰め込んでおいて、必要に応じて整理する場所ということか。データマネジメントの最初のステップとしては、どんなデータが、どこにあるのかを把握することが重要そうだ。
「よし、じゃあ次は……システム部の人に聞き込みして、実際のデータの流れを確認してみます!」
「頑張ってね。最初は冷たくあしらわれるかもしれないけど、めげないことが大事よ」
「えっ、それってなんでですか?」
「まあ、彼らも忙しいからね。でも、ちゃんと目的を説明すれば、協力してくれると思うわ」
松田さんはにこやかにそう言ったが、私はすでに胃が痛くなりそうだった。
データマネジメントの道は、どうやら一筋縄ではいかないらしい——
・・・・・
宮西さんが苦戦しているように、データマネジメントを進めるにはシステムの知識が不可欠です。
なぜなら、データというものはシステムで管理されるものであり、システムを正しく把握できなければ手の打ちようがないからです。
例えば、データレイクやDWHといった概念は、現代のデータ管理には欠かせないものです。
データパイプラインの中の登場人物がどのような役割を果たしているのかを理解するには、システムの構成やデータ処理の仕組みを理解する必要があります。
データマネジメントはデータがどのように流れ、どのように活用されるのかを理解し、最適な形へと導く仕事です。
そのためには、データの流れを把握するだけでなく、それを支える技術の基礎知識を持つことが求められます。
もちろん、すべてをエンジニア並みに理解する必要はありません。しかし、宮西さんのように設計書の内容がまるで暗号に見えるままでは、適切な判断を下すことは難しいです。
エンジニアと会話できる程度にはシステムに関する知識を身につけることが、データマネジメントを進める上での第一歩となるのです。
よしむら@データマネジメント担当
IT業界、金融業界、エンタメ業界でデータマネジメントを担当した経験を持ち、現在もデータマネジメント担当している。データマネジメント業界を盛り上げるために、経験を通して得た知識の発信活動を行っている。
本記事は「よしむら@データマネジメント担当」さんのデータマネジメントを学べることをコンセプトの4コマ漫画「AI事務員宮西さん–データ組織立ち上げ編」のコンテンツを許可を得て掲載しています。
保険会社で事務員として働く宮西さんは、会社がAI時代に対応するために新設したデータ部門に突然配属されました。事務員からデータマネジメントのリーダーへと成長していく宮西さんの奮闘記を描いた物語。
本シリーズ「データ組織立ち上げ編」では、宮西さんがデータ利活用組織を立ち上げるまでの挑戦を描きます。IT業界、金融業界、エンタメ業界でデータマネジメントを担当した経験を持つ著者「よしむら@データマネジメント担当」さんが豊富な経験を基に執筆しています。データ組織の一員の皆様には、ぜひご一読ください。
本特集はこちらへメルマガ登録をしていただくと、記事やイベントなどの最新情報をお届けいたします。
30秒で理解!インフォグラフィックや動画で解説!フォローして『1日1記事』インプットしよう!