(LLM Gen) GoogleのAI・LLMに関するまとめ

GoogleのAI・LLMに関するまとめ

GoogleはAI研究開発の最前線に立ち、特に大規模言語モデル（LLM）とその応用において重要なプレイヤーです。以下に主要なサービス、テクノロジー、料金体系、そして今後の展望についてまとめます。

1. 主要な基盤モデル（LLM）

Googleの様々なAIサービスや製品の根幹をなすモデルです。

PaLM 2 (Pathways Language Model 2):
- 詳細: Gemini登場前の主力モデル。多言語対応、推論能力、コーディング能力に優れています。様々なサイズがあり、用途に応じて使い分けられます。Bard（当時）やWorkspaceの初期AI機能などで利用されていました。Vertex AIを通じて利用可能です。
- 料金: Vertex AI経由でのAPI利用は従量課金制（後述）。
Gemini (ジェミニ):
- 詳細: Googleの最新かつ最も高性能なマルチモーダルAIモデルファミリー。「マルチモーダル」とは、テキストだけでなく、画像、音声、動画、コードなど複数の種類の情報を同時に理解し、処理できる能力を指します。以下の3サイズがあります。
  - Gemini Ultra: 最も高性能なモデル。複雑なタスク向け。Gemini Advanced（有料版）や一部のエンタープライズ向けサービスで利用。
  - Gemini Pro: パフォーマンスとコスト効率のバランスが良い主力モデル。現在のGemini（無料版、旧Bard）やGoogle AI Studio、Vertex AIで利用可能。画像理解能力を持つGemini Pro Visionもあります。
  - Gemini Nano: 最も軽量なモデル。スマートフォンなどのデバイス上で効率的に動作するように設計（オンデバイスAI）。Pixelスマートフォンのレコーダー要約機能などで利用。
- 料金:
  - Gemini Pro/Pro Vision API: Google AI StudioやVertex AI経由で利用。無料枠があり、超過分は従量課金（後述）。
  - Gemini Ultra: Gemini Advanced（Google One AI Premiumプランの一部、月額制）やVertex AI経由（従量課金）で利用。
  - Gemini Nano: デバイス機能の一部として提供されるため、エンドユーザーは直接的な追加料金なし。

2. 主要なサービス・プラットフォーム

これらのモデルを活用した具体的なサービスや開発者向けツールです。

Google AI Studio:
- 詳細: Webベースのプロトタイピングツール。開発者がコーディングなしで簡単にGeminiモデル（現在はGemini ProおよびPro Vision）を試したり、プロンプトを調整したりできます。APIキーを取得すれば、自身のアプリケーションにGemini APIを組み込むことが可能です。
- 料金: 無料で利用できる generous なリクエスト枠（レート制限あり）が提供されています。無料枠を超えて本格的に利用する場合は、Google Cloudプロジェクトと連携し、従量課金となります（下記参照）。
Vertex AI:
- 詳細: Google Cloudの統合AIプラットフォーム。Googleの最新モデル（PaLM 2, Gemini, Imagen等）だけでなく、オープンソースモデルやパートナーモデルも含め、多様な基盤モデルへのアクセスを提供します。モデルのファインチューニング、デプロイ、MLOps（機械学習の運用管理）機能など、エンタープライズ向けの高度な機能が揃っています。
- 料金: 従量課金制。主に以下の要素で課金されます。
  - APIリクエスト: 入力・出力のトークン数（テキストの場合）や画像数、処理時間などに基づいて課金。モデルによって単価が異なります。
  - コンピューティングリソース: モデルのトレーニングやデプロイに使用する仮想マシンなどのリソース時間。
  - 詳細はGoogle CloudのVertex AI料金ページで確認が必要です。
NotebookLM (旧称 Project Tailwind):
- 詳細: Google Labsの実験的なサービス。ユーザーがアップロードしたGoogleドキュメントやPDFなどの情報ソースに基づいて、AIが質問に答えたり、要約を作成したり、アイデア出しを手伝ったりするリサーチ・ライティングアシスタントです。情報はユーザーのソースに限定され（グラウンディング）、ウェブ検索は行いません。LLMの「幻覚（Hallucination）」を抑制し、信頼性の高い情報生成を目指しています。
- 料金: 現在、実験的なサービスとして無料で提供されています（利用には制限がある場合があります）。将来的に有料化される可能性はあります。
Gemini (旧称 Bard):
- 詳細: Googleの対話型AIアシスタント。ウェブにアクセスして最新情報に基づいた回答を生成したり、テキスト生成、翻訳、コーディング支援などを行ったりできます。Gemini Proモデルをベースとしています。拡張機能によりGoogle Workspace（Gmail, Docs等）、Google Maps、YouTubeなどと連携できます。
- 料金:
  - 無料版: Gemini Proを利用。基本的な機能が無料で利用可能。
  - Gemini Advanced: Gemini Ultraを利用できる有料版。より高度な推論、コーディング、クリエイティブなタスクに対応。Google One AI Premiumプラン（月額約$19.99 ※地域により異なる）の一部として提供。
Google Search (AI Overviews / 旧称 SGE: Search Generative Experience):
- 詳細: Google検索結果の上部に、AIが生成した要約（AI Overview）を表示する機能。複雑な質問に対して、ウェブ上の情報を統合し、簡潔な回答を提供します。現在は一部の国・言語で実験的に導入・展開が進んでいます。
- 料金: Google検索の機能の一部であり、ユーザーは無料で利用できます。
Gemini for Google Workspace (旧称 Duet AI for Google Workspace):
- 詳細: Gmail、Googleドキュメント、スプレッドシート、スライド、MeetなどにGeminiの機能を統合。メールや文書の下書き・校正、文章の要約、スプレッドシートでのデータ分析支援、スライドの画像生成、Meetでの議事録作成支援など、生産性を向上させる機能を提供します。
- 料金: Google Workspaceの有料アドオンとして提供。個人向け（Google One AI Premiumプランに含まれる場合あり）と法人向け（ユーザーごとに月額料金）があります。法人向け料金はプランや契約によって異なります。
Imagen 2:
- 詳細: Googleの高品質なテキストからの画像生成（Text-to-Image）モデル。Vertex AIやGoogle AI Studio（Gemini Pro Vision API経由）、Gemini Advancedなどで利用可能です。写実的な画像やクリエイティブな画像を生成できます。
- 料金: Vertex AIやAPI経由での利用は、生成する画像の数やサイズに応じて従量課金。Gemini Advanced内での利用はプラン料金に含まれます。

3. A2A (Ask-to-Answer / Article-to-Article) について

「A2A」という明確なGoogleのサービス名はありませんが、文脈から以下のいずれか、あるいはその根底にある技術を指している可能性が高いです。

AIによる質疑応答 (Ask-to-Answer):
- これは、ユーザーの質問（Ask）に対して、LLMが関連情報（記事、ドキュメント、ウェブコンテンツなど）を理解し、回答（Answer）を生成する能力そのものを指します。
- 具体例としては、Google検索のAI Overviews や NotebookLM、Gemini (旧Bard) がこの能力を活用しています。ユーザーが質問すると、AIが学習データや指定された情報源から関連情報を探し出し、自然な文章で回答を生成します。
情報ソースに基づいた生成 (Article-to-Article / Grounding):
- LLMが特定の記事やドキュメント（Article）の内容に基づいて、別の形式の情報（要約、別の記事、質疑応答など）を生成するプロセスを指す可能性があります。
- NotebookLM はまさにこのコンセプトに基づいています。アップロードされた資料（Article）に基づいて、AIが応答や新しいコンテンツ（別の Article 的なもの）を生成します。
- RAG (Retrieval-Augmented Generation) という技術も関連します。これは、LLMが回答を生成する際に、外部の信頼できる情報源（記事など）を検索・参照する技術で、回答の正確性や信頼性を高めます。Google検索のAI Overviewsなどもこの技術を活用していると考えられます。

要約すると、A2Aは特定のサービス名ではなく、「LLMが情報ソースを理解し、それに基づいて質問に答えたり、新しいコンテンツを生成したりする能力やプロセス」 を指していると考えられ、Googleの多くのAIサービスでその技術が活用されています。

4. 料金体系の概要

無料: Gemini（基本機能）、Google検索（AI Overviews）、NotebookLM（現在）、Google AI Studio（無料枠内）、Gemini Nano（デバイス機能）。
サブスクリプション（月額/年額）: Gemini Advanced（Google One AI Premium経由）、Gemini for Workspace。
従量課金: Vertex AI、Google AI Studio（無料枠超過分）。主にAPIコール数、処理したトークン数、コンピューティングリソース使用量に基づいて課金されます。料金詳細はモデルや機能によって異なるため、Google Cloudの公式サイトで確認が必要です。

5. 今後の展望

Geminiの進化と展開: Gemini Ultraのさらなる応用拡大、Gemini Pro/Nanoの機能強化や対応言語・地域の拡大が進むと考えられます。特にマルチモーダル能力（動画理解・生成など）の向上が期待されます。
あらゆる製品へのAI統合: Google検索、Workspace、Android、Chrome、YouTube、Mapsなど、Googleのあらゆる主要製品・サービスへのAI機能の統合がさらに加速するでしょう。
開発者エコシステムの強化: Vertex AIやGoogle AI Studio、Firebase Genkit（生成AIアプリ開発用フレームワーク）などを通じて、開発者がGoogleのAIモデルを容易に利用・活用できる環境整備が進みます。
責任あるAI (Responsible AI) と安全性: AIの倫理的な問題や安全性への配慮は引き続き最重要課題であり、モデルのバイアス軽減、ハルシネーション抑制、悪用防止などの取り組みが強化されます。
オープンソースとの連携: GoogleはGemmaのようなオープンなモデルも提供しており、プロプライエタリな高性能モデルとオープンソースコミュニティとの連携も進めていくと考えられます。
効率化とオンデバイスAI: Gemini Nanoのような軽量モデルの開発・応用が進み、スマートフォンやその他のデバイス上で、より多くのAI機能がネットワーク接続なしに、プライバシーに配慮した形で利用可能になるでしょう。

Googleは、基盤となる強力なLLM開発から、それを活用した多様なサービス提供、開発者向けプラットフォーム整備まで、包括的なAI戦略を推進しており、今後もAI分野におけるイノベーションを牽引していくことが予想されます。