テクノロジー

Gemini Liveが無料になったよ。スマホと自然な会話ができておもろい

2024-10-07

著者:

2024年8月、Made by Googleイベントで、Pixel 9のラインナップとともに初めて発表された「Gemini Live」についてです。この機能は、これまで有料プランのGemini Advancedに制限されていましたが、全てのユーザーが無料で利用できるようになりました。

AIと世界の会話が広がる!

音声ボイスアシスタントが登場し、マイクロソフトのCopilotを通じてWindows 11でも同様の機能が利用可能です。この機能により、自動化や助言の分野でも進化を遂げ、映画「her/世界でひとつの彼女」のような体験もできるかもしれません。

Gemini Liveは電源ボタンを長押しすることで、右下にGemini Liveの利用を許可するポップアップが表示されます。1ページのチュートリアルに同意し、男女や英語の方言など10種類の音声から選択することによって、スマートで無意識な会話を楽しむことができるようになります。

Androidの場合、電源ボタンの長押しでGemini Liveにアクセスでき、長押しすることで通常のアシスタントアイコンではなく、青い星のアイコンが表示されます。

例えば、視聴中のYouTube動画に対して質問をすることも可能です。また、テキストアプリからAIを使って瞬時に画像を生成することもできます。

このインターフェースを通じて、スマートと「自然に」話すことができるようになります。Googleアシスタントの役割に加え、音声からの応答が必要ない会話も楽しめることでしょう。

Copilotも大幅アップデート

一方、マイクロソフトはCopilotの同様な大規模なアップグレードについても発表しました。この機能はCopilot Visionと名付けられ、最新のアプデで、画面上に表示されているテキストや画像を認識し、ユーザーがそのコンテンツに対して多くの質問をすることができます。

また、Copilot Voiceでは音声を通じてコンテンツへのアクセスも可能になり、異なる4種類の音声から選択可能です。Gemini Liveと同様の機能を持ち、ユーザーからのフィードバックが「スマート」に生かされる仕組みが整いました。

このように、現在のAI技術は急速に進化していますが、問題も抱えています。実際にこれらのAIを活用することで生じうる問題に配慮することが求められます。Gemini Liveは楽しい対話を実現しますが、引き続き安全であるかを検討する必要があります。

気になる最新機能は?

実際、このGemini Liveを運用するには、セキュリティやプライバシーの問題が求められます。Gemini Liveは、自動的にスマートなマイクがONになり、音声認識を終了するには、「ホールド」または「終了」を指示すれば大丈夫です。また、Googleのプライバシーポリシーに基づく、Geminiの処理はGemini Appsのアクティビティに保存され、それらの会話は72時間保存されます。

マイクロソフトについても、Copilot Visionはクラウドやコンピュータにデータを保存せず、「セッションを終了した瞬間にデータは永遠に破棄される」とのことです。さらに、限定されたユースケースで動作し、ダイログの背後に含まれるコンテンツでは動作しないとのこと。

「プライバシー的にどうなのか」と非難されたCopilot+のRecall機能。マイクロソフトは各的技術者(Google、Amazon、Apple、Meta)がAIモデルを開発するために、自分たちのコンテンツを無謀にして損害を被ったオンラインパートナーシップや、一部の国会議員に対処したくないのでしょう。

このGoogleとマイクロソフトについての弁明は、少なくとも今日のところは無料で使えます。Copilot Voiceは今後もユースケースを広げて行く見込みですが、Copilot Visionは限定されたCopilot Labsのベータユーザーに制限されるかもしれません。