カテゴリー
キーワード

機械学習初心者はGoogleAutoML Tablesを使ってみては?メリットや使い方、使用感を知っておこう

         

Google Cloudに関する技術・事例共有イベント「Google Cloud next」。2019年の同イベントにおいて誰でも安く簡単に構造化データの機械学習モデリングができるというサービスが発表されました。それが、GoogleAutoML Tablesです。

 まだβ版ですが、すでに使ってみたという声も複数上がっている同サービス。あなたは知っていましたか?

この記事では誰でもGoogleAutoML Tablesのメリットや使い方、使用感が伝わるようわかりやすく解説いたします!

GoogleAutoML Tablesは機械学習モデルによるデータ解析を民主化する

GoogleAutoML Tablesを一言で表すと“機械学習モデルによるデータ解析をだれでも使えるようにするツール”です。

AIの民主化を掲げたクラウドサービスGoogle Cloudのうち、機械学習に特化したサービスがGoogleAutoML(Machine Learning)。これまでも画像認識を自動化するAutoML Visionや文章の構造解析を行うAutoML Natural Languageなどのサービスを提供してきました。

そんなGoogleAutoMLが満を持して表形式のデータを扱い解析・予測を自動で行えるツールとしてリリースしたのがGoogleAutoML Tablesなのです。

その精度は非常に高く、Kaggleが2019年4月に開いたハッカソンではなんと優秀なデータサイエンティスト70組以上を抑えて2位に入賞しました。これだけ高度な機械学習をプログラミングの知識がない人々でも実現可能にするGoogleAutoML Tables。例えば、以下のような用途で使えます。

  • 小売:商品に対する顧客のニーズ・最適価格・プロモーションの予測
  • 保険:保険契約者の最適なポートフォリオの策定
  • マーケティング:顧客の購入額・購入量・リードコンバージョン率・チャーンレート、ベストな接触タイミングの予測
  • IoT:アセット・デバイス・機器の故障の予測

GoogleAutoML Tablesのメリット

ここからはより詳しくGoogleAutoML Tablesのメリットを見ていきましょう

プログラミングの知識がいらない


GoogleAutoML Tablesはデータを用意し、GUI(主にマウスやタッチパネルによる画面操作で操作できる機能)で作業を進めるだけでモデルを構築してくれます。表形式のデータをインプットすると自動で種類を判別し、各数値のグラフ化まで行ってくれます。そこから必要な作業はタブをクリックしてターゲットとなる列を選んだり、予算の数値を入力するだけ。機械学習にはプログラミングの知識が不可欠だと考える人はその簡単さに思わず拍子抜けするのではないでしょうか?

かかる料金は使った分だけ


GoogleAutoML Tablesは基本無料のサービスです。料金がかかるのは以下の通り、時間・データ量ごとに規定されたコンピューティングと目盛りの使用料の分だけ。

項目

コンピューティングとメモリの使用

トレーニング

6時間の無料使用 1回(請求アカウントごと)* + $19.32/時間

(n1-standard-4 と同等のマシン 92 台を並行して使用)

バッチ予測

6時間の無料使用 1回(請求アカウントごと)* + $1.16/時間

(n1-standard-4 と同等のマシン 5.5 台を並行して使用)

オンライン予測

$0.21/時間

(n1-standard-4 と同等のマシン 1 台)

デプロイ

$0.005/GiB 時間 x マシン 9 台

(低レイテンシ サービス用にモデルを 9 台のマシンに複製)

※「AutoML Tables┃Google Cloud」より引用

とりあえず機械学習に触れてみたいという方にとって、基本無料で利用できるというのは非常に魅力的でしょう。

GoogleAutoML Tables を実際に使ってみた

最後にGoogleAutoML Tableの体験デモを機械学習初心者の筆者が実際に行ってみた手順と感想をご紹介します。

なお、デモの内容や手順は「クイックスタート」に従っています。

手順1:GoogleAutoML Tablesを有効化する


まずは、Google Cloud Platformに登録し、GoogleAutoML Tablesを有効化します。

Google Cloud Platform登録時には支払元のクレジットカードを登録する必要がありますが、料金が自動的に発生することはありません。

手順2:データをインポートする


続いて機械学習の対象となるデータをインポートします。データはGoogle BigQueryGoogle Cloud StorageといったGoogleCloud内のサービスもしくは自分のPCからアップロードすることでインポートできます。

今回はクイックスタートで用意されている「cloud-ml-tables-data/bank-marketing.csv」をCloud Storageからインポートしました。

手順3:「ターゲット列」を選択する


インポートしたデータはデータの種類ごとに分類して表示され、その名前をクリックすることで平均・標準偏差といった詳細や割合・数値などを示すグラフが表示されます。

ここから、機械学習を進めたい「ターゲット列」を選びましょう。今回は「Deposit(保証金)」を選択しました。

手順4:「トレーニング」を開始する


ターゲット列を選択したら「モデルトレーニング」を選択してモデリングを開始します。この際予算を選ぶ必要がありますが、通常は最低の1で問題なくその場合課金されないようです。その他の設定は変更せず再度「モデル トレーニング」をクリックしました。

そのあといったんブラウザを閉じて2時間後にブラウザを開くとすでにモデリングは終了していました。モデルの精度を意味するAUC(0.5を完全にランダムとし大きいほど良い)は0.614となっています。「評価」タブをクリックすれば精度や適合率、真陽性率などの指標をグラフとともに見ることができました。

さらに「テストと使用」タブをクリックすることでデプロイ(モデルを実際に使える状態にすること)操作を進め、予測を行えるようになります。

全体の感想として、データの機械学習を進めること自体はクリックと最低限の入力で済むため非常に簡単でした。ただし、構築されたモデルを活用したり分析したりするにはやはり最低限のデータサイエンスの知識は欠かせないようです。検索によりおおまかな意味はつかめるものの、完全に使いこなすにはまだまだ自分自身の知識が足りないと感じました。

実際の操作の手順やGoogleAutoML Tablesの使い方についてより詳しく知りたいという方は、以下のGoogleCloudの公式動画を参考になさってください。

終わりに

機械学習を仕事に利用してみたいけれどどこから手を付けてよいのかさえわからない……。という方は少なくないでしょう。

そんなときにまず入り口に立って、大まかな概念を把握するツールとしてGoogleAutoML Tablesは役立ちます。まずは用意されているデモデータや保有しているエクセルデータを利用して試しにモデリングを行ってみてはいかがでしょうか。

【参考資料】

「Google CloudはAIを民主化する」┃日経ビジネス もはや人の介在は不要、AIが自らAIを作り判断根拠まで説明する時代が来た┃ビジネスAI Google の AutoML が KaggleDays での表形式データのコンペで第 2 位に┃Google Developers AutoML Tables┃Google Cloud AutoML Tablesを使ってみた┃Qiita [Cloud OnAir]BigQuery ML と AutoML Tables ではじめるマーケティング分析入門[2019年5月23日放送]┃「Google Cloud Japan 」YouTubeチャンネル

宮田文机

 

メルマガ登録をしていただくと、記事やイベントなどの最新情報をお届けいたします。


データ活用 Data utilization テクノロジー technology 社会 society ビジネス business ライフ life 特集 Special feature

関連記事Related article

書評記事Book-review

データのじかん公式InstagramInstagram

データのじかん公式Instagram

30秒で理解!インフォグラフィックや動画で解説!フォローして『1日1記事』インプットしよう!

おすすめ記事Recommended articles

掲載特集

デジタル・DX・データにまつわる4コマ劇場『タイムくん』 データのじかんをもっと詳しく データのじかんフィーチャーズ 「47都道府県47色のDXの在り方」を訪ねる『Local DX Lab』 DXの1次情報をを世界から 『World DX Journal』 データで越境するあなたへおすすめの 『ブックレビュー』 BIツールユーザーによる、BIツールユーザーのための、BIツールのトリセツ CIOの履歴書 by 一般社団法人CIOシェアリング協議会 なぜ、日本企業のIT化が進まないのか――日本のSI構造から考える 日本ビジネスの血流である帳票のトレンドを徹底解説 データを武器にした課題解決家「柏木吉基」のあなたの組織がデータを活かせていないワケ BI(ビジネスインテリジェンス)のトリセツ 入社1年目に知っておきたい 差が付くKPIマネジメント CIOLounge矢島氏が紐解く トップランナーたちのDXの“ホンネ” データのじかん Resources 越境者のためのお役立ち資料集 AI実装の現在地点-トップITベンダーの捉え方 データでビジネス、ライフを変える、 面白くするDATA LOVERS データマネジメント・ラジオ by データ横丁 データのじかんNews データ・情報は生もの! 『DX Namamono information』 ちょびっとラビット耳よりラピッドニュース AI事務員宮西さん(データ組織立ち上げ編) 藤谷先生と一緒に学ぶ、DXリーダーのための危機管理入門 生情報取材班AI時代に逆行?ヒトが体感した「生情報」のみをお届け! データはともだち 〜怖くないよ!by UpdataTV Original データ飯店〜データに携わるモノたちの2.5thプレイス by UpdataTV〜 インサイトーク〜データで世界を覗いてみたら〜by WingArc1st + IDEATECH
モバイルバージョンを終了