Share!

Share!

「データ・プレパレーション」が注目されている背景には、企業がデータ分析をおこなうための前段階の作業であるデータ準備に追われていて、そのせいで本来の目的であるデータ分析の時間を充分にとれていないという現実があります。企業が持っているデータには、ビジネスに活かせる情報がたくさん含まれていますが、有効にデータを分析するためには、データ・フォーマットを統一し、欠損値や外れ値を確認し修正するクレンジングや、データを収集し結合するブレンディングというデータ準備作業が欠かせません。しかし企業が抱えているデータ量は膨大で、そのフォーマットは統一されておらず、データが増えていく速度にそれを処理する速度が追いついていないケースが多く見られます。現実には、データ分析にかかる時間のうち、全体の80%もの時間をデータ準備にとられているともいわれています。 そうした企業が抱えている問題の解決のために、データ・プレパレーション・プラットフォームの導入が注目を集めています。データ・プレパレーション・プラットフォームを使うことで、自社のIT部門にデータ準備やデータ分析を依頼しなくても、データ処理の専門的な知識を持たないユーザーでも、分析に使用するデータの前処理をおこなうことが可能になります。コードを使用せず直感的に操作できるデータ・プレパレーション・プラットフォームの導入は、IT部門によるデータ処理の完了を待たずに済むので、データ分析を開始するまでの時間を短縮できるというメリットがあります。 データ・プレパレーションをおこなうには、有効にデータを分析できるように、分析前にどんなデータがあるのか全体像を把握しておくことが必要です。そのためデータ・プレパレーション・プラットフォームにはデータ全体を俯瞰し、データを整備・整形・フィルタリングしやすくするデータ検証機能が搭載されています。また処理済みのデータや分析結果を、社内でシェアすることも簡単にできます。 分析をおこなうユーザー自身がデータ処理もおこなえるデータ・プレパレーション・プラットフォームやセルフサービスBIの考え方は、急速に広まりつつあります。データ・プレパレーション・プラットフォームはTalend社の「Talend Data Preparation Free Desktop」を始め、いくつものサービスの販売が国内でも開始されており、ビッグデータの活用を目指す企業がそれらを採用する流れはますます加速しそうです。