(LLM Gen)Open Agentic Web

·

https://x.com/satyanadella/status/1924535894163554561?s=46&t=Fvx4ly1dkb9h92jxqjNlqA

「Open Agentic Web」についてご説明します。

サティア・ナデラ氏がMicrosoft Build 2025の基調講演で述べたように、「Open Agentic Web」は、クラウドやモバイルに続く、新たなプラットフォームシフトとして位置づけられています [1-5]。これは、これまでの垂直統合された少数のアプリから、より多くのアプリやエージェントが相互に連携し、誰でもエージェントを構築し、展開できるオープンでスケーラブルなプラットフォームへと移行することを意味します [1, 3]。

エージェントとは [6-8]
エージェントとは、人間がタスクを委任できるものです [6, 7]。時間の経過とともに、これらのエージェントに委任できるタスクはますます複雑になっています [6, 8]。質問に答えるAIアシスタント [9, 10]、タスクを実行するエージェント [9, 10]、あるいはAIと協力してプロジェクトを完了させることも可能です [9, 10]。

「オープン」であることの重要性 [4, 11-13]
ケビン・スコット氏(Microsoft CTO)は、「オープン」であることがこのエージェント時代のウェブにとって非常に重要であると強調しています [11, 12]。シンプルで構成可能なコンポーネントとプロトコルがオープンに公開されることで、世界中の開発者の創造性によって、想像を超えるような豊かなものが生まれる可能性があります [12, 13]。もし、ウェブの初期開発において、特定のエンティティが全体を垂直統合し、独占しようとしていたら、現在の多様でダイナミックなウェブは存在しなかっただろう、というアナロジーが示されています [13]。Open Agentic Webにおいても、誰もが参加し、貢献できるオープンな環境が、その豊かさを生み出す鍵となります [4, 13]。

Agentic Webのアーキテクチャ層 [6, 8, 14-17]
ソースでは、Agentic Webはいくつかの層で構成されると考えられています [6, 8]。

  1. エージェント層 (Agent Layer): 開発者やパートナー、Microsoft自身が構築する、ますますリッチになるエージェントのエコシステムです [6, 8]。これらのエージェントの利用は過去1年で劇的に増加しており、特に新しい推論モデルの登場により、非常に複雑なタスクをこなせるようになっています [6, 8, 14]。
  2. ランタイム層 (Runtime Layer): これはエージェントの基盤となるコンポーネント群です [14, 16]。過去1年で推論能力が大幅に向上しましたが、さらに洗練されたエージェントのメモリ [14, 18] や、Retrieval Augmented Generation (RAG) アプリのための高度な検索システム [19-21] など、基本的なソフトウェアエンジニアリング要素も含まれます [14, 18]。MicrosoftはAzure AI Foundryを通じてこれらのコンポーネントを提供しています [15, 17]。
  3. プロトコル層 (Protocol Layer): エージェントがユーザーに代わってアクションを実行するためには、外部の世界と接続する必要があります [15, 17]。そのためのプロトコルがこの層を構成します [15, 17]。
    • MCP (Model Context Protocol): これはエージェント間の、またはエージェントからサービスへの通信のための標準プロトコルとして位置づけられています [15, 22-24]。HTTPに似たシンプルなプロトコルで、ペイロードに関する意見が少ないため、その上に様々なものをレイヤー化できる良い基盤となります [15, 23, 25]。GitHub CopilotやWindowsなど、様々な場所でネイティブサポートが進められています [15, 25-29]。
    • A2A (Agent to Agent): エージェント同士が連携するためのプロトコルです [17, 30]。
    • NL Web: これはMCPの上に構築されるもので、ウェブサイトやAPIを簡単にAgenticアプリケーションにするための方法を提供します [22, 31-33]。ウェブサイトやAPIにNL Webエンドポイントを追加することで、そのサービスをMCPを話すすべてのエージェントがアクセスできるようになります [22, 33]。これはAgentic Webにおける「HTMLのようなもの」と表現されています [31, 33]。あらゆるアプリやウェブサイトでインテリジェンスを作成し、同時にそのインテリジェンスの集約を民主化するものです [29]。

Microsoftの貢献 [5, 34, 35]
Microsoftは、開発者がOpen Agentic Webを構築できるよう、スタックのあらゆるレイヤーでツールとプラットフォームを提供しています [5, 34, 35]。

  • 開発者ツール: Visual Studioファミリー、GitHub、そしてGitHub Copilotは、開発体験の中心にAIを取り込み、コード補完からチャット、マルチファイル編集、そしてエージェント機能へと進化しています [9, 10]。GitHub CopilotのAgentモードや、MCPを利用してリポジトリの課題を表示したり、複雑なタスクを委任したりするデモが紹介されました [36, 37]。
  • Microsoft 365 Copilot & Copilot Studio: Microsoft 365 Copilotは、チャット、検索、ノート、作成、エージェントを統合した「AIのためのUI」であり、Webデータとワークデータを活用します [38, 39]。ResearcherエージェントやAnalystエージェントのような特殊なエージェントが専門知識を提供します [38, 40, 41]。Copilot Studioを使用すると、独自のカスタムエージェントを構築でき、LLMと確定的なワークフローを組み合わせて、マルチエージェントオーケストレーションを実現できます [42-46]。過去1年で100万個以上のエージェントがCopilotやTeamsと連携して構築されています [42, 47]。Copilot Tuningにより、企業独自のデータやスタイルでモデルをファインチューニングし、より企業に特化したエージェントを構築することも可能です [43, 47-50]。
  • Azure AI Foundry: これはAgenticアプリやエージェントを構築するための「インテリジェンスのための製造ライン」、完全なアプリプラットフォームです [51, 52]。OpenAIの最新モデルを含む1900以上のモデルをサポートし [53, 54]、モデルルーターが最適なモデルを自動選択したり [53, 55]、複数のモデル間でスループットを共有したりできます [56]。また、GrokやMistral、LlamaなどのモデルもAzureで利用可能になります [53, 56-58]。AgenticメモリのためのRetrieveal Augmented Generation (RAG) のための高度な検索システム [19-21] や、マルチエージェントオーケストレーションをサポートするAgent Service [19, 59] など、様々なコンポーネントが提供されます。Azure Cosmos DBとの統合により、エージェントは会話履歴などのデータを保存・取得できます [60, 61]。
  • Windows: WindowsはAgentic Webにとって最高の開発環境となるよう進化しており、WSLの完全オープンソース化も発表されました [29, 62, 63]。Windows AI FoundryやFoundry Localにより、デバイス上でのAI開発や推論が可能になります [64, 65]。特に、WindowsでのMCPのネイティブサポートが発表され、ファイルシステム、設定、アプリのアクション、ウィンドウ操作など、Windows自体の機能がMCPサーバーとしてエージェントに公開されます [26-29]。これにより、GitHub Copilotのようなエージェントが、ユーザーの許可を得てWindows上のタスクを実行できるようになります(例: WSLのインストール、Figmaのデザイン適用など) [26, 66-70]。
  • Microsoft Discovery: 科学分野に特化したAgenticプラットフォームです [71, 72]。Graph RAGと呼ばれるナレッジグラフベースの技術を活用し、公開情報と独自のデータから科学的な知識を推論し [71-74]、エージェントが仮説生成や実験実行のワークフローをオーケストレーションします [71, 73, 75-78]。

これらのツールとプラットフォームを通じて、Microsoftは開発者が単なるリクエスト/レスポンスAPI呼び出しではなく、ステートフルでマルチモーダル、マルチエージェントな本番環境対応のアプリケーションを構築できるよう支援することを目指しています [51, 52]。これは、これまでのウェブの歴史におけるプラットフォームシフトと同様に、開発者にとって大きな機会を創出すると考えられています [1, 3, 35]。コンテンツとインテリジェンスが、ウェブ全体でより分散され、発見可能になるビジョンが語られています [4, 29]。

提供された情報に基づくと、「Open Agentic Web」という名称の直接的な「命名由来」について具体的に述べられている箇所はありませんでした。しかし、Microsoft Build 2025の基調講演の中で、特にMicrosoftのCTOであるケビン・スコット氏が、この「Agentic Web」において「オープン」であることがなぜ極めて重要であるかを強調しており、その重要性がこの名称に反映されていると考えられます。

サティア・ナデラ氏は、「Open Agentic Web」をクラウドやモバイルに続く、新たなプラットフォームシフトとして位置づけています [1, 2]。これは、これまでの垂直統合された少数のアプリから、より多くのアプリやエージェントが相互に連携し、誰でもエージェントを構築・展開できるオープンでスケーラブルなプラットフォームへの移行を意味しています [2]。

ここで言われる「エージェント」とは、人間がタスクを委任できるものを指します [3, 4]。時間の経過とともに、これらのエージェントに委任できるタスクはますます複雑になっています [3-5]。質問に答えるAIアシスタント、タスクを実行するエージェント、AIと協力してプロジェクトを完了させることも可能です [6, 7]。

ケビン・スコット氏は、このエージェント時代のウェブにおいて、「オープン」であることが非常に重要であると繰り返し強調しています [3, 8, 9]。その理由として、以下の点を挙げています。

  • 創造性の解放: シンプルで構成可能なコンポーネントとプロトコルがオープンに公開されることで、世界中の開発者の創造性が解き放たれ、想像を超えるような豊かなものが生まれる可能性があるためです [9-11]。
  • ウェブの歴史からの学び: もしウェブの初期開発において、特定のエンティティが全体を垂直統合し、独占しようとしていたら、現在の多様でダイナミックなウェブは存在しなかっただろう、というアナロジーを用いています [9-11]。Open Agentic Webにおいても、誰もが参加し、貢献できるオープンな環境が、その豊かさを生み出す鍵となります [10, 11]。
  • プロトコルの重要性: エージェントがユーザーに代わってアクションを実行するためには、外部の世界と接続する必要があります。そのためには、MCP (Model Context Protocol) や A2A (Agent to Agent) のような、オープンで信頼性があり、相互運用可能なプロトコルが必要です [12-14]。MCPはHTTPに似たシンプルなプロトコルであり、その上に様々なものをレイヤー化できるオープンな基盤となります [12, 14, 15]。NL Webもまた、ウェブサイトやAPIを簡単にAgenticアプリケーションにするためのオープンな方法であり、「Agentic WebにおけるHTMLのようなもの」と表現されています [16-19]。

これらの説明から、「Open Agentic Web」という名称は、単に技術的な進化を示すだけでなく、開発者コミュニティ全体が参加し、共創することで、ウェブの次の時代をオープンに構築していくというMicrosoftのビジョンとコミットメントを反映していると考えられます [3, 8, 9, 11, 20]。