噂のChatGPT4-o搭載「HiDock」–デジタルの世界に魅せられて–データパレード石井亮介さんが試してみた! | データで越境者に寄り添うメディア データのじかん
会員ページへmember
カテゴリー
キーワード

噂のChatGPT4-o搭載「HiDock」–デジタルの世界に魅せられて–データパレード石井亮介さんが試してみた!

ここ最近InstagramやFacebookでよく見る広告があります。オンライン会議の発言内容を録音し、文字起こしをし、要約をしてくれるというHiDockです。

今回の記事は実際にHiDockを買って、2週間ほど体験した内容を紹介するものです。広告を見て興味が沸いた人や実際にどんな機能があるか気になっている人はぜひご覧になってください。

筆者である私は新卒からデータ分析の業界に携わり、データが好きすぎて会社を独立し、起業をしました。そんなデータマニアな私の目線でHiDockを紹介して参ります。

執筆者:石井 亮介
データのじかん アンバサダーでデータ分析専門企業 ㈱データパレードの代表取締役 高田馬場の町中華屋のCDOをしながら、日々発生する業務やプライベートのデータを蓄積することを考えて生きています。またデータ飯店 店長としてデータに関わる皆さんとお酒を片手に楽しいおしゃべりをする番組に出演中
ホームページ:https://data-parade.com/
Twitter:https://twitter.com/RyosanBIMania
         

音声データを蓄積する重要性

生成AIが主流となるこれからの世界では、AIに過去のデータを読み込んでもらうことが非常に重要になります。企業であれば自社のデータ、個人であれば例えば健康のデータ。それぞれのパーソナルデータをAIが読み込むことで、精度の高い示唆を人間に享受してくれます。生成AIとデータ蓄積の関連性について、弊社のブログに詳細を書いておりますので、ぜひご参照ください。

HiDockってどんな製品なの?

AIで会議の内容を要約してくれるミドルウェアはたくさん世の中に出てきました。筆者である私もいろいろとチェックしています。Zoomなどのミドルウェアにもレコーディングや文字起こし、要約機能が徐々についてきましたね。
そのような時世の中で、なぜ私はHiDockを選択したのか、推しポイントと共に紹介をします。
またHiDockは製品購入後、無料で使うこともできますし、拡張機能を使う場合は有料のサブスクリプションがございます。私は有料版も契約しているので、無料版との機能差異についても紹介します。

スマートスピーカーに録音が機能がついている

もうこれが一番です。HiDockはスマートスピーカーなのです。私はリモートワーカーなのですが、業務中はお客様のリクエストに合わせて、Web会議ツールを変えています。Zoomの日もあればTeams、Google Meet、打ち合わせがないときはバーチャルオフィスのoviceに滞在しています。
先述の通り、ミドルウェアには要約ツールがついていますが、そのレベルはまちまちです。
まだ発展途上の領域なので、文字起こしの精度や要約に差があります。そこでスマートスピーカーに録音機能がついているHiDockに注目をしました。HiDockはスマートスピーカーの入出力を検知するので、ミドルウェアが何であっても録音することが可能となります。
またHiDockはスマートフォンともBluetooth接続ができるため、スマホにかかってきた電話も録音することができます。
HiDock1台あれば、リモートワークでの会話は全て録音できるのです。

会議の文字起こし

HiDockにはHiNoteというWebブラウザのアプリがあり、そこで諸々の操作をします。

画面の左側が文字起こしした内容と音声データの再生エリアです。
文字起こしの精度が高いです。通常の口語でのやり取りは正確に文字になります。専門的な話し合いだとところどころ間違えたりしますが、録音した音も同時に保存しているので、テキストがおかしいときは、その場で音声を再生することもできます。
この文字起こしがあるだけで、どのような打ち合わせだったかを簡単に振り返ることができます。
AIはChatGPTが搭載されています。ChatGPTが進歩すればさらに精度が増すことと思います。音声データからテキストデータを正確に生成できれば、その後の要約などの精度がさらに増すので、期待が大きいところです。

会議の要約

画面の右側で文字起こしをしたテキストをChatGPTが要約してくれます。会議のサマリとアウトライン・そしてネクストアクションを教えてくれます。
会議の内容に応じてテンプレートを切り替えることが可能なので、会議か電話か講義などを適切に選択すると、より要約の精度が高まります。

現時点でこの要約内容がすぐに業務に使えるかというと・・・70%くらい使えるといった印象です。顧客に配布する議事録とするためには会議参加者による手直しは必須です。
例えば「会議には参加しなかったけど、どのような内容だったかを把握したい」という使い方であれば、この要約で十分なレベルだと思います。

この部分もChatGPTが進歩すれば精度が高まって参ります。1年後くらいに同じテキストを要約してもらったら、さらに良い結果になると思います。

その他の機能

無料版・有料版に共通した主要機能は以上です。あとはハードウェアとして、ノイズキャンセリングやマイクがついています。そしてこのHiDock自体がドッキングステーションとして使えます。

・118W PD充電
・デュアル4K@60Hzディスプレイ対応
・2.5Gイーサネット
・SDXC 4.0カードリーダー

がついているので、デスク周りがすっきりしますね。

有料プラン(Proメンバーシップ)でできること

HiDockはイニシャルで購入してもChatGPTによる文字の書き起こしや要約は無料としていますが、Proメンバーシップというサブスクリプションプランに入ることで、さらに拡充した機能を使うことが可能です。

Proメンバーシップは月額課金ではなく、何分の会議をHiNoteにアップロードしたかで変動します。1200 Minsであれば20時間分ですね。

この機能の中で気になるものがあるので、Proメンバーシップにしてみました。気になる機能は

・話者の特定(スピーカー識別)
・別アプリへのエクスポート(GoogleドキュメントおよびNotion)

の2つです。それぞれの機能を使ってみた内容を解説します。

話者の特定(スピーカー識別)

ここはスマートスピーカータイプであるがゆえの欠点をカバーした機能です。Zoomなどのミドルウェアの文字書き起こしであれば、誰が話しているかが特定された状態で書き起こしされます。ミドルウェアであればログインしている人がわかるので、話者特定は容易です。スマートスピーカーの音声を拾うHiDockであると、誰が話しているかがわからない状態なので、HiDock側の機能で話者を特定する必要があります。
しゃべり方や音の高低で話者を分けているのだと思いますが、完璧ではないときもあります。その場合は手動で話者を結合することが出来ます。

このようにして文字の書き起こしの部分で「誰がしゃべっているのか」がわかると、AIはあらゆる分析をできるようになります。まだHiDockの機能には搭載されていませんが、特定の話者のみを抽出して、話し方のコンサルティングもできるでしょうし、誰と誰が頻繁に会話しているかを調査することもできますね。
音声データの保有にはそれだけの価値があるのです。

テキストデータのエクスポート

私がHiDockに最も注目した点がこちらです。会話の内容をTXT、CSV、SRT、Word、PDF形式にエクスポートできます。[文字起こし]と[要約]のエクスポートが可能となります。
個人的には[文字起こし]のエクスポートに価値があると思います。誰がいつ何を話したかがテキストに収められているので、このデータを非構造型データとしてデータレイクに溜めておけば、いずれそのデータをAIで読み込んで、解析をしてもらうことが可能となります。

音声データもエクスポートできれば、尚良かったのですがエクスポートできるのはテキストデータだけのようですね。

別アプリへのエクスポート(GoogleドキュメントとNotion)

他アプリに情報をエクスポートすることができます。別アプリにワンクリックでエクスポートできるとかなり便利ですよね。
試しにNotionにエクスポートをしてみました。

これは残念な結果なのですが、エクスポートできるのは要約した文章だけのようです。文字起こしデータや音声データが自動で別アプリにエクスポートできるのであれば、有料プランをもっと高くしてもいい、それくらい価値があります。
せめて文字起こしデータだけでも別アプリにエクスポートできるようになってほしいです。

HiDockはもっとこうなってほしい

まだまだ成長過程の製品だと思っています。特にミドルウェアであるHiNoteはまだまだ進化をしていくものと考えられます。
私が考えるHiDockへの要望は2点です。

話者の自動特定

現状は毎回会議が終わったら、「Speaker 1は自分、Speaker 2は⚪︎⚪︎さん」のように手動で名前をつけています。これはAIが高度化すれば話者と話し方を特定して自動で特定できるようになるのではないかと思います。
誰が話したかという情報はAIの分析をするにあたり、大変貴重なので、手動で行う工数を削減していきたいところです。
ここはZoomなどのミドルウェアなら精度100%でできているところなので、HiDockも精度の高い話者の自動特定を期待したいです。

音声データと文字起こししたテキストデータの別アプリへのエクスポート

先ほど挙げた点ですが、もう少し深掘りをします。すべての情報の基となるのは音声データ、次点で話者を特定した文字起こしテキストデータです。これらがあれば、AIを活用してさまざまなビジネスで活用することができます。情報の源泉なのですね。
例えば話者が特定された状態で音声データを取り溜めておきます。そうすると自分自身や⚪︎⚪︎さんの話し方のクセを分析することができます。しゃべるピッチや間の取り方などをAIが分析して話し方のコンサルティングをすることができるようになりますね。その他にもビジネスアイディアはたくさん出てくるでしょう。音声データや文字起こししたテキストデータにはそれだけの価値があります。

これらのデータをエクスポートできる別製品があれば喜んでそちらを購入・検証して参ります。
データマニアな私としてはこの情報の源泉となるデータが欲しいのです。

さいごに

スマートスピーカーから音声を録音して、AIで文字起こしや要約ができるHiDock、現時点で

・あらゆるウェブ会議のデータ(Bluetoothでつなげたらスマホの電話も)を音声データにできる
・音声データを文字起こしして、要約できる
・話者を識別できる

という点が大変魅力的です。このために投資をする価値があります。会議に出席せずとも状況把握ができますからね。
またHiNoteは新しい機能もどんどん出せるでしょう、音声データを持っていればできることは山ほどあります。

今後、このような製品はたくさん出てきて、やがては機能が収斂されていくものと思います。音声データのこれからに期待を持っている方は購入を検討してみてはいかがでしょうか?

豆知識|ファクトで紐解く!デジタルの世界に魅せられて

日本国内における生成AIサービスの利用者数は急速に増加!現状はAIの活用はwebサービスやソフトウェアが中心だが、HiDockのように今後はハードウェア、ガジェットに広がるのかも?

出典:ICT総研,2024年8月30日 https://ictr.co.jp/report/20240830.html/

 

特集|デジタルの世界に魅せられて

私たちの日常は、いつの間にかデジタルの魔法に包まれている。決して真面目すぎない頭・目・手で、最新テクノロジーの本質に迫ってみよう。
生成AIやスマートガジェットが身近になった2024年。しかし本当に面白いのは、その使われ方だ。データを扱うデータサイエンティスト、夜更けまでコードを磨く開発者、独自の世界観でコンテンツを生み出すクリエイター、素人の斜め上な発想で新たな使い方を見出すユーザーたち。彼らの「遊び心」が、次の革新を生み出している。
本特集では「これって本当に必要?」という素朴な問いから、「だからこそ面白い」という答えまで、デジタルの可能性に魅せられた人々の情熱と創造性に迫ります。時に無駄に見える探求が、私たちの未来を照らすはず。。。だからこれは決してムダ使いではない、人生を豊かにする(自腹の)必要経費なのだ。

詳細はこちら
×

メルマガ登録をしていただくと、記事やイベントなどの最新情報をお届けいたします。


データ活用 Data utilization テクノロジー technology 社会 society ビジネス business ライフ life 特集 Special feature

関連記事Related article

書評記事Book-review

データのじかん公式InstagramInstagram

データのじかん公式Instagram

30秒で理解!インフォグラフィックや動画で解説!フォローして『1日1記事』インプットしよう!

おすすめ記事Recommended articles

データのじかん会員なら、
全てのコンテンツが
見放題・ダウンロードし放題
 

 データのじかんメール会員でできること

  • 会員限定資料がすべてダウンロードできる
  • セミナー開催を優先告知
  • 厳選情報をメルマガで確認
 
データのじかん会員について詳しく知りたい方
close close