2024年5月17日㈮の最新AIニュース、Google I/O 2024の発表内容についてです。今回の最新AIニュース、ポイントは以下の通りです。
この記事のポイントは?
- 日本標準時間(JST)2024年5月15日㈬午前2時に、Google I/O 2024にて全22項目ほどの大型発表イベントがあった。
- GPT-4oのような機能を持つAI関連の情報発表も多数発表。
- Geminiシリーズの新モデル(1.5 Pro、Advanced、1.5 Flash)が発表され、長文解析や高速応答に対応。
- クリエイティブ系のAIとしてImagen 3、Music AI Sandbox、Veoなど、テキストから画像や音楽、動画を生成する新ツールを紹介。
- 新ハードウェアとして第6世代TPU「Trillium」とTensor G3チップ搭載の「Pixel 8a」を発表。
太平洋標準時間(PST)の2024年5月13日㈫午前10時(日本標準時間(JST)2024年5月15日㈬午前2時)にGoogle社によるGoogle I/O 2024が開催されました。Google I/O(Google Input/Output)とは、Google主催の開発者向け大型会議で、技術者や開発者向けに最新の製品、技術、プラットフォームの発表やデモが行われる大型発表イベントです。初開催は2008年で、2024年の今年は14回目の開催でした。
今回(Google I/O 2024)の発表では、検索機能の強化や新しいAIモデル、開発ツールなど、全28項目ほどの最新技術が紹介されました。特に、検索関連で試験提供されていたSGE (Search Generative Experience) が「AI Overviews」として新たな名称で公式発表された点は注目が集まり、複数の視点からの検索結果を要約する機能が追加されました。また、Google Photosに「Ask Potos」という自然言語検索機能が導入され、写真ライブラリから特定の情報を簡単に検索できるようになりました。例えば、「自分のナンバープレートは?」と検索した際に、何度も登場している車のナンバープレートを検出し、その数値もテキストで表示してくれるという機能です。さらに、「Google Lens」では動画検索機能が強化され、動画を利用した物体や情報の検索が可能となっています。
And you’ll also be able to ask questions with video, right in Search. Coming soon. #GoogleIO pic.twitter.com/zFVu8yOWI1
— Google (@Google) May 14, 2024
Google公式X 「Google Lens」の使用風景
AIモデルに関しては、Geminiシリーズの新モデルが多数発表されました。それぞれ以下の通りです。
- Gemini 1.5 Pro:長文解析に対応し、初期バージョンでは1Mトークン、拡張バージョンでは2Mトークンのコンテキストウィンドウを持ち、詳細な解析が可能。
- Gemini Advanced:高機能なAI機能を提供するプレミアムサブスクリプションサービスで、Gemini 1.5 Flashは高速応答に最適化されている。
さらに、テキストから画像がつくれる画像生成モデルのImagen 3や、テキストから音楽がつくれる音楽制作ツールのMusic AI Sandbox、テキストや画像、動画から1080pの動画を生成するVeoなど、クリエイティブな分野でもAIの活用が進んでいます。
Introducing Veo: our most capable generative video model. 🎥
It can create high-quality, 1080p clips that can go beyond 60 seconds.
From photorealism to surrealism and animation, it can tackle a range of cinematic styles. 🧵 #GoogleIO pic.twitter.com/6zEuYRAHpH
— Google DeepMind (@GoogleDeepMind) May 14, 2024
GoogleディープマインドX 動画生成「Veo」で作られた動画の紹介
また、「PaliGemma」という視覚と言語の統合モデルや、27億パラメータモデル「Gemma 2」、教育に特化したAIモデルファミリー「LearnLM」も注目される発表の一つです。
さらに、「Project Astra」はマルチモーダルAIアシスタントとして様々なタスクを自動で処理し、「Gemini Live」はリアルタイムでの音声チャット機能を強化します。「Gems」はカスタムチャットボット作成ツールとして特定のタスクに最適化されています。
ジェスチャーで複雑な問題を解決する「Circle to Search」(かこって検索)、AI生成コンテンツのウォーターマーキング機能を強化する「SynthID」、JavaScript/TypeScript用のAIアプリ開発キット「Firebase Genkit」も発表されました。
ハードウェアとインフラの分野では、第6世代TPU「Trillium」が前世代より4.7倍の性能向上を果たし、新しい「Pixel 8a」もTensor G3チップを搭載して発売されます。セキュリティ面では、Androidの未来バージョンに詐欺検出機能が追加予定で、Gemini Nanoを利用してリアルタイムで詐欺の会話パターンを検出します。
最後に、DeepMindの進展紹介を行ったDemis Hassabis氏と、AI StudioとVertex AIの新機能を紹介したJosh Woodward氏の発表もあり、開発者向けの新機能が多数公開されました。
なお、詳細はGoogle I/O 2024のYoutube配信からもご覧いただけます。
出典:『Google I/O 2024 Keynote Summary』(https://blog.google/intl/ja-jp/company-news/inside-google/google-io-2024-keynote-sundar-pichai-gemini-era/)
『Google I/O 2024』(https://io.google/2024/intl/ja/)
『Google Keynote (Google I/O ‘24)』(https://www.youtube.com/live/XEzRZ35urlk?feature))
\AIの導入・開発・相談なら【クラベルAI】に相談しよう!/