GoogleのAI・LLMに関するまとめ
GoogleはAI研究開発の最前線に立ち、特に大規模言語モデル(LLM)とその応用において重要なプレイヤーです。以下に主要なサービス、テクノロジー、料金体系、そして今後の展望についてまとめます。
1. 主要な基盤モデル(LLM)
Googleの様々なAIサービスや製品の根幹をなすモデルです。
- PaLM 2 (Pathways Language Model 2):
- 詳細: Gemini登場前の主力モデル。多言語対応、推論能力、コーディング能力に優れています。様々なサイズがあり、用途に応じて使い分けられます。Bard(当時)やWorkspaceの初期AI機能などで利用されていました。Vertex AIを通じて利用可能です。
- 料金: Vertex AI経由でのAPI利用は従量課金制(後述)。
- Gemini (ジェミニ):
- 詳細: Googleの最新かつ最も高性能なマルチモーダルAIモデルファミリー。「マルチモーダル」とは、テキストだけでなく、画像、音声、動画、コードなど複数の種類の情報を同時に理解し、処理できる能力を指します。以下の3サイズがあります。
- Gemini Ultra: 最も高性能なモデル。複雑なタスク向け。Gemini Advanced(有料版)や一部のエンタープライズ向けサービスで利用。
- Gemini Pro: パフォーマンスとコスト効率のバランスが良い主力モデル。現在のGemini(無料版、旧Bard)やGoogle AI Studio、Vertex AIで利用可能。画像理解能力を持つGemini Pro Visionもあります。
- Gemini Nano: 最も軽量なモデル。スマートフォンなどのデバイス上で効率的に動作するように設計(オンデバイスAI)。Pixelスマートフォンのレコーダー要約機能などで利用。
- 料金:
- Gemini Pro/Pro Vision API: Google AI StudioやVertex AI経由で利用。無料枠があり、超過分は従量課金(後述)。
- Gemini Ultra: Gemini Advanced(Google One AI Premiumプランの一部、月額制)やVertex AI経由(従量課金)で利用。
- Gemini Nano: デバイス機能の一部として提供されるため、エンドユーザーは直接的な追加料金なし。
- 詳細: Googleの最新かつ最も高性能なマルチモーダルAIモデルファミリー。「マルチモーダル」とは、テキストだけでなく、画像、音声、動画、コードなど複数の種類の情報を同時に理解し、処理できる能力を指します。以下の3サイズがあります。
2. 主要なサービス・プラットフォーム
これらのモデルを活用した具体的なサービスや開発者向けツールです。
- Google AI Studio:
- 詳細: Webベースのプロトタイピングツール。開発者がコーディングなしで簡単にGeminiモデル(現在はGemini ProおよびPro Vision)を試したり、プロンプトを調整したりできます。APIキーを取得すれば、自身のアプリケーションにGemini APIを組み込むことが可能です。
- 料金: 無料で利用できる generous なリクエスト枠(レート制限あり)が提供されています。無料枠を超えて本格的に利用する場合は、Google Cloudプロジェクトと連携し、従量課金となります(下記参照)。
- Vertex AI:
- 詳細: Google Cloudの統合AIプラットフォーム。Googleの最新モデル(PaLM 2, Gemini, Imagen等)だけでなく、オープンソースモデルやパートナーモデルも含め、多様な基盤モデルへのアクセスを提供します。モデルのファインチューニング、デプロイ、MLOps(機械学習の運用管理)機能など、エンタープライズ向けの高度な機能が揃っています。
- 料金: 従量課金制。主に以下の要素で課金されます。
- APIリクエスト: 入力・出力のトークン数(テキストの場合)や画像数、処理時間などに基づいて課金。モデルによって単価が異なります。
- コンピューティングリソース: モデルのトレーニングやデプロイに使用する仮想マシンなどのリソース時間。
- 詳細はGoogle CloudのVertex AI料金ページで確認が必要です。
- NotebookLM (旧称 Project Tailwind):
- 詳細: Google Labsの実験的なサービス。ユーザーがアップロードしたGoogleドキュメントやPDFなどの情報ソースに基づいて、AIが質問に答えたり、要約を作成したり、アイデア出しを手伝ったりするリサーチ・ライティングアシスタントです。情報はユーザーのソースに限定され(グラウンディング)、ウェブ検索は行いません。LLMの「幻覚(Hallucination)」を抑制し、信頼性の高い情報生成を目指しています。
- 料金: 現在、実験的なサービスとして無料で提供されています(利用には制限がある場合があります)。将来的に有料化される可能性はあります。
- Gemini (旧称 Bard):
- 詳細: Googleの対話型AIアシスタント。ウェブにアクセスして最新情報に基づいた回答を生成したり、テキスト生成、翻訳、コーディング支援などを行ったりできます。Gemini Proモデルをベースとしています。拡張機能によりGoogle Workspace(Gmail, Docs等)、Google Maps、YouTubeなどと連携できます。
- 料金:
- 無料版: Gemini Proを利用。基本的な機能が無料で利用可能。
- Gemini Advanced: Gemini Ultraを利用できる有料版。より高度な推論、コーディング、クリエイティブなタスクに対応。Google One AI Premiumプラン(月額 約$19.99 ※地域により異なる)の一部として提供。
- Google Search (AI Overviews / 旧称 SGE: Search Generative Experience):
- 詳細: Google検索結果の上部に、AIが生成した要約(AI Overview)を表示する機能。複雑な質問に対して、ウェブ上の情報を統合し、簡潔な回答を提供します。現在は一部の国・言語で実験的に導入・展開が進んでいます。
- 料金: Google検索の機能の一部であり、ユーザーは無料で利用できます。
- Gemini for Google Workspace (旧称 Duet AI for Google Workspace):
- 詳細: Gmail、Googleドキュメント、スプレッドシート、スライド、MeetなどにGeminiの機能を統合。メールや文書の下書き・校正、文章の要約、スプレッドシートでのデータ分析支援、スライドの画像生成、Meetでの議事録作成支援など、生産性を向上させる機能を提供します。
- 料金: Google Workspaceの有料アドオンとして提供。個人向け(Google One AI Premiumプランに含まれる場合あり)と法人向け(ユーザーごとに月額料金)があります。法人向け料金はプランや契約によって異なります。
- Imagen 2:
- 詳細: Googleの高品質なテキストからの画像生成(Text-to-Image)モデル。Vertex AIやGoogle AI Studio(Gemini Pro Vision API経由)、Gemini Advancedなどで利用可能です。写実的な画像やクリエイティブな画像を生成できます。
- 料金: Vertex AIやAPI経由での利用は、生成する画像の数やサイズに応じて従量課金。Gemini Advanced内での利用はプラン料金に含まれます。
3. A2A (Ask-to-Answer / Article-to-Article) について
「A2A」という明確なGoogleのサービス名はありませんが、文脈から以下のいずれか、あるいはその根底にある技術を指している可能性が高いです。
- AIによる質疑応答 (Ask-to-Answer):
- これは、ユーザーの質問(Ask)に対して、LLMが関連情報(記事、ドキュメント、ウェブコンテンツなど)を理解し、回答(Answer)を生成する能力そのものを指します。
- 具体例としては、Google検索のAI Overviews や NotebookLM、Gemini (旧Bard) がこの能力を活用しています。ユーザーが質問すると、AIが学習データや指定された情報源から関連情報を探し出し、自然な文章で回答を生成します。
- 情報ソースに基づいた生成 (Article-to-Article / Grounding):
- LLMが特定の記事やドキュメント(Article)の内容に基づいて、別の形式の情報(要約、別の記事、質疑応答など)を生成するプロセスを指す可能性があります。
- NotebookLM はまさにこのコンセプトに基づいています。アップロードされた資料(Article)に基づいて、AIが応答や新しいコンテンツ(別の Article 的なもの)を生成します。
- RAG (Retrieval-Augmented Generation) という技術も関連します。これは、LLMが回答を生成する際に、外部の信頼できる情報源(記事など)を検索・参照する技術で、回答の正確性や信頼性を高めます。Google検索のAI Overviewsなどもこの技術を活用していると考えられます。
要約すると、A2Aは特定のサービス名ではなく、「LLMが情報ソースを理解し、それに基づいて質問に答えたり、新しいコンテンツを生成したりする能力やプロセス」 を指していると考えられ、Googleの多くのAIサービスでその技術が活用されています。
4. 料金体系の概要
- 無料: Gemini(基本機能)、Google検索(AI Overviews)、NotebookLM(現在)、Google AI Studio(無料枠内)、Gemini Nano(デバイス機能)。
- サブスクリプション(月額/年額): Gemini Advanced(Google One AI Premium経由)、Gemini for Workspace。
- 従量課金: Vertex AI、Google AI Studio(無料枠超過分)。主にAPIコール数、処理したトークン数、コンピューティングリソース使用量に基づいて課金されます。料金詳細はモデルや機能によって異なるため、Google Cloudの公式サイトで確認が必要です。
5. 今後の展望
- Geminiの進化と展開: Gemini Ultraのさらなる応用拡大、Gemini Pro/Nanoの機能強化や対応言語・地域の拡大が進むと考えられます。特にマルチモーダル能力(動画理解・生成など)の向上が期待されます。
- あらゆる製品へのAI統合: Google検索、Workspace、Android、Chrome、YouTube、Mapsなど、Googleのあらゆる主要製品・サービスへのAI機能の統合がさらに加速するでしょう。
- 開発者エコシステムの強化: Vertex AIやGoogle AI Studio、Firebase Genkit(生成AIアプリ開発用フレームワーク)などを通じて、開発者がGoogleのAIモデルを容易に利用・活用できる環境整備が進みます。
- 責任あるAI (Responsible AI) と安全性: AIの倫理的な問題や安全性への配慮は引き続き最重要課題であり、モデルのバイアス軽減、ハルシネーション抑制、悪用防止などの取り組みが強化されます。
- オープンソースとの連携: GoogleはGemmaのようなオープンなモデルも提供しており、プロプライエタリな高性能モデルとオープンソースコミュニティとの連携も進めていくと考えられます。
- 効率化とオンデバイスAI: Gemini Nanoのような軽量モデルの開発・応用が進み、スマートフォンやその他のデバイス上で、より多くのAI機能がネットワーク接続なしに、プライバシーに配慮した形で利用可能になるでしょう。
Googleは、基盤となる強力なLLM開発から、それを活用した多様なサービス提供、開発者向けプラットフォーム整備まで、包括的なAI戦略を推進しており、今後もAI分野におけるイノベーションを牽引していくことが予想されます。
コメントを残す