マルチエージェントの詳細な分析: Web3 と AI は最終的に相互に補完し合うことになるのでしょうか?

42 0 0

AIGC がコンテンツ生成のインテリジェントな時代を先導したのであれば、AI Agent には AIGC の機能を真に商業化するチャンスがあります。

AIエージェントは、より具体的で多才な従業員のようなものです。人工知能ロボットの基本的な形態として知られています。人間のように周囲の環境を観察し、判断し、自動的に行動することができます。

ビル・ゲイツはかつて、「AIエージェントをマスターすることが本当の成果です。その時までに、インターネットで自分で情報を検索する必要はもうなくなるでしょう」と述べました。AI分野の権威ある専門家も、AIエージェントの将来に大きな期待を寄せています。マイクロソフトのCEO、サティア・ナデラはかつて、AIエージェントが人間とコンピューターのインタラクションの主な手段となり、ユーザーのニーズを理解し、積極的にサービスを提供できるようになると予測しました。アンドリュー・ン教授も、将来の職場環境では、人間とAIエージェントがより密接に協力し、効率的な作業モデルを形成し、効率を向上させると予測しました。

AIエージェントはテクノロジーの産物であるだけでなく、将来の生活や仕事の方法の核心でもあります。

これは、Web3とブロックチェーンが初めて広く議論されたとき、人々はこの技術の可能性を説明するためにしばしば破壊的イノベーションという言葉を使ったことを思い出させます。過去数年間を振り返ると、Web3は初期のERC-20とゼロ知識証明から、他の分野と統合されたDeFi、DePIN、GameFiなどへと徐々に発展してきました。

人気のデジタル技術であるWeb3とAIを組み合わせると、1+1>2の効果が得られるのでしょうか？資金調達が進むWeb3 AIプロジェクトは、業界に新たなユースケースパラダイムをもたらし、新たな真のニーズを生み出すことができるのでしょうか？

AIエージェント: 人間にとって最も理想的なインテリジェントアシスタント

AI エージェントの想像力はどこにあるのか? インターネットでよく聞かれる答えは、「大規模言語モデルはヘビしかプログラムできないが、AI エージェントは栄光の王全体をプログラムできる」というものです。誇張されているように聞こえますが、誇張ではありません。

エージェントは中国語では通常、知能体と翻訳されます。この概念は、人工知能の父であるミンスキーが 1986 年に出版した著書「思想の社会」で提唱したものです。ミンスキーは、社会の一部の個人は交渉の末に問題の解決にたどり着くことができると考えており、これらの個人はエージェントです。長年にわたり、エージェントは人間とコンピューターのインタラクションの基盤となってきました。Microsoft の編集アシスタント Clippy から Google Docs の自動提案まで、これらの初期のエージェントはパーソナライズされたインタラクションの可能性を示してきましたが、より複雑なタスクを処理する能力はまだ限られています。 大規模言語モデル (LLM) が登場して初めて、エージェントの真の可能性が発揮されました。

今年5月、AI分野の権威ある学者アンドリュー・ン教授が、米国で開催されたセコイアAIイベントでAIエージェントに関する講演を行いました。その中で、教授は自身のチームが実施した一連の実験を実演しました。

AI にコードを書いて実行させ、さまざまな LLM とワークフローの結果を比較します。結果は次のとおりです。

GPT-3.5モデル: 48%精度
GPT-4モデル: 67%精度
GPT-3.5 + エージェント: GPT-4 モデルよりも高いパフォーマンス
GPT-4 + エージェント: GPT-4モデルよりもはるかに優れており、非常に優れています

マルチエージェントの詳細な分析: Web3 と AI は最終的に相互に補完し合うことになるのでしょうか?

確かにそうです。ほとんどの人は、ChatGPT などの LLM を次のように使用します。プロンプトワードを入力すると、大規模なモデルが自動的にエラーを特定して修正したり、削除したり、書き直したりすることなく、すぐに回答を生成します。

対照的に、AI エージェントのワークフローは次のようになります。

まず、LLM に記事のアウトラインを書いてもらいます。必要に応じて、インターネットでコンテンツを検索して調査と分析を行い、最初のドラフトを出力します。次に、ドラフトを読んで最適化する方法を考えます。このサイクルを何度も繰り返して、最終的に厳密なロジックと最も低いエラー率を備えた高品質の記事を出力します。

AIエージェントとLLMの違いは、LLMと人間のやりとりがプロンプトに基づいている点です。AIエージェントは目標を設定するだけで、目標に向かって自主的に考え、行動することができます。与えられたタスクに応じて計画の各ステップを詳細に分解し、外部からのフィードバックと自主的な思考に頼り、目標を達成するためのプロンプトを自ら作成します。

したがって、OpenAI は AI エージェントを次のように定義します。 LLM を脳として駆動するシステムで、知覚、計画、記憶、ツールの使用を自律的に理解し、複雑なタスクを自動的に実行できます。

AIがツールからそのツールを使える主体に変わると、AIエージェントになります。 これが、AI エージェントが人間にとって最も理想的なインテリジェントアシスタントになることができる理由です。たとえば、AI エージェントは、ユーザーの過去のオンラインインタラクションに基づいてユーザーの興味、好み、日常の習慣を理解して記憶し、ユーザーの意図を識別し、積極的に提案し、複数のアプリケーションを調整してタスクを完了することができます。

マルチエージェントの詳細な分析: Web3 と AI は最終的に相互に補完し合うことになるのでしょうか?

ゲイツ氏が思い描いた通り、将来はタスクごとに異なるアプリケーションに切り替える必要がなくなります。コンピューターや携帯電話にやりたいことを伝えるには、普通の言葉を使うだけで済みます。ユーザーが共有したいデータに基づいて、AI エージェントがパーソナライズされた応答を提供します。

一人ユニコーン企業が現実のものになりつつある

AIエージェントは、企業が人間と機械のコラボレーションを中核とする新しいインテリジェント運用モデルを構築するのにも役立ちます。ますます多くのビジネス活動がAIによって完了し、人間は企業のビジョン、戦略、主要な方向性の意思決定に集中するだけで済みます。

OpenAIのCEOサム・アルトマン氏がかつてインタビューで述べたように、AIの発展により、私たちは一人の人間によって設立され、1兆1000億の評価額を持つ企業、つまり一人の人間によるユニコーンの時代に突入しようとしています。

空想のように聞こえますが、AI エージェントの助けにより、このアイデアは現実になりつつあります。

私たちがテクノロジー系スタートアップを立ち上げると仮定しましょう。従来のアプローチでは、当然ながらソフトウェアエンジニア、プロダクトマネージャー、デザイナー、マーケティング担当者、営業担当者、財務担当者を雇用する必要があり、それぞれに独自の責任がありますが、そのすべてを私が調整する必要があります。

つまり、AI エージェントを使用すれば、従業員を雇う必要すらなくなるかもしれません。

デビン — 自動プログラミング

ソフトウェアエンジニアの代わりに、今年非常に人気が高まっている AI ソフトウェアエンジニアの Devin を採用して、フロントエンドとバックエンドの作業をすべて完了させることもできます。

DevinはCognition Labsによって開発され、世界初のAIソフトウェアエンジニアとして知られています。ソフトウェア開発作業全体を独立して完了し、問題を分析して決定を下し、コードを記述し、エラーを修正することができます。これにより、開発者の作業負荷が大幅に軽減されます。Devinはわずか半年で$196百万の資金調達を獲得し、その評価額はすぐに数十億ドルに急上昇しました。投資家には、Founders FundやKhosla Venturesなどの有名なベンチャーキャピタル企業が含まれています。

Devin はまだ一般向けバージョンをリリースしていませんが、最近人気の Web2 製品である Cursor からその可能性を垣間見ることができます。この製品は、ほとんどすべての作業を自動的に実行し、数分で簡単なアイデアを機能的なコードに変換します。指示を与えるだけで、あとは座って結果を楽しむことができます。プログラミング経験のない 8 歳の子供が Cursor を使用して実際にコード作業を完了し、Web サイトを構築したという報告もあります。

Hebbia — ファイル処理

プロダクトマネージャーや財務担当者の代わりに、すべてのドキュメントの整理と分析に役立つ Hebbia を選択するかもしれません。

企業内のドキュメント検索に重点を置く Glean とは異なり、Hebbia Matrix は、複数の AI モデルを使用してユーザーがデータとドキュメントを効率的に抽出、構造化、分析できるようにし、企業の生産性の向上を促進するエンタープライズレベルの AI エージェントプラットフォームです。驚くべきことに、Matrix は一度に数百万のドキュメントを処理できます。

ヘビアは今年7月に、a16zが主導し、Google Venturesやピーター・ティールなどの有名投資家が参加した$1億3000万ドルのシリーズBラウンドを完了した。

Jasper AI — コンテンツ生成

ソーシャルメディアの運用やデザイナーの代わりに、コンテンツの生成を支援できる Jasper AI を選択するかもしれません。

Jasper AI は、クリエイター、マーケティング担当者、企業がコンテンツ生成プロセスを効率化し、生産性とクリエイティブ効率を向上できるように設計された AI エージェントライティングアシスタントです。Jasper AI は、ブログ投稿、ソーシャルメディア投稿、広告コピー、製品説明など、ユーザーが必要とするスタイルに基づいて複数の種類のコンテンツを生成できます。また、ユーザーの説明に基づいて画像を生成し、テキストコンテンツの視覚的な補助を提供します。

Jasper AIは$1.25百万の資金を調達し、2022年に評価額$15億に達しました。統計によると、Jasper AIはユーザーが5億語以上を生成するのを支援し、最も広く使用されているAIライティングツールの1つになりました。

MultiOn — Webオートメーション

アシスタントの代わりに、MultiOn を選択して、日々のタスクの管理、スケジュールの調整、リマインダーの設定、さらには出張の計画、ホテルの自動予約、オンラインタクシーの手配などを行うこともできます。

MultiOn は、オンラインショッピングや予約などの個人的なタスクを完了して個人の効率を向上させたり、日常のタスクを簡素化して作業効率を向上させたりするなど、あらゆるデジタル環境でタスクを自律的に実行できる自動化された Web タスク AI エージェントです。

困惑 — 検索、調査

researcher の代わりに、私はおそらく、Nvidia の CEO が毎日使用している Perplexity を選択するでしょう。

Perplexity は、ユーザーの質問を理解して分解し、コンテンツを検索して統合し、レポートを生成してユーザーに明確な回答を提供する AI 検索エンジンです。

Perplexity はさまざまなユーザーグループに適しています。たとえば、学生や研究者は執筆時に情報検索プロセスを簡素化して効率を向上させることができ、マーケティング担当者はマーケティング戦略をサポートする信頼性の高いデータを取得できます。

上記の内容は単なる想像です。これらのAIエージェントの実際の能力とレベルは、さまざまな業界のエリート人材に取って代わるには不十分です。Logenic AIの共同創設者であるLi Bojie氏は次のように述べています。現在の LLM 能力は入門レベルに過ぎず、専門家レベルには程遠い。この段階では、AI エージェントは、より速く作業するがあまり信頼性が高くない従業員のようなものです。

しかし、これらの AI エージェントは、それぞれの強みを活かして、さまざまなシナリオで既存ユーザーの効率性と利便性の向上に役立っています。

テクノロジー企業だけでなく、あらゆる分野が AI エージェントの波から恩恵を受けることができます。教育分野では、AI エージェントは学生の学習の進捗状況、興味、能力に基づいてパーソナライズされた学習リソースとガイダンスを提供できます。金融分野では、AI エージェントはユーザーが個人の財務を管理したり、投資アドバイスを提供したり、株価の動向を予測したりするのに役立ちます。医療分野では、AI エージェントは医師が病気を診断し、治療計画を立てるのに役立ちます。電子商取引分野では、AI エージェントはインテリジェントなカスタマーサービスとしても機能し、自然言語処理と機械学習テクノロジーを通じてユーザーの問い合わせに自動的に回答し、注文の問題や返品要求を処理して、カスタマーサービスの効率を向上させることができます。

マルチエージェント: AI エージェントの次のステップ

前のセクションでは、一人ユニコーン企業の概念について、単一の AI エージェントでは複雑なタスクを処理する際に制限があり、実際のニーズを満たすことが難しいことを説明しました。複数の AI エージェントを使用する場合、これらの AI エージェントは異種の LLM に基づいているため、集団的な意思決定が難しく、機能も限られているため、人間がこれらの独立した AI エージェント間のディスパッチャーとして機能し、異なるアプリケーションシナリオに対応するこれらの AI エージェントの作業を調整する必要があります。これが、マルチエージェント (マルチエージェントフレームワーク) の台頭につながりました。

複雑な問題には、多くの場合、複数の知識とスキルの統合が必要ですが、単一の AI エージェントでは能力が限られており、問題に対処することができません。マルチエージェントシステムでは、異なる能力を持つ AI エージェントを有機的に組み合わせることで、AI エージェントがそれぞれの強みを発揮し、互いの強みから学び、互いの弱点を補い、複雑な問題をより効果的に解決できます。

これは、実際のワークフローや組織構造と非常によく似ています。リーダーがタスクを割り当て、異なる能力を持つ人々が異なるタスクを担当し、各プロセスの結果が次のプロセスに渡され、最終的に最終的なタスク結果が得られます。

実装プロセスでは、下位レベルの AI エージェントがそれぞれのタスクを実行し、上位レベルの AI エージェントがタスクを割り当てて完了を監督します。

マルチエージェントは、人間の意思決定プロセスをシミュレートすることもできます。問題に遭遇したときと同じように、私たちは他の人に相談します。複数の AI エージェントは、集団意思決定の行動をシミュレートし、より優れた情報サポートを提供することもできます。たとえば、Microsoft が開発した AutoGen は、この要件を満たしています。

さまざまな役割を持つ AI エージェントを作成する機能。これらの AI エージェントは基本的な会話機能を備えており、受信したメッセージに基づいて応答を生成できます。
GroupChat を使用して、複数の AI エージェントによるグループチャット環境を作成します。この GroupChat には、他の AI エージェントのチャット記録、発言順序、発言終了を管理する管理者の役割を持つ AI エージェントが存在します。

マルチエージェントの詳細な分析: Web3 と AI は最終的に相互に補完し合うことになるのでしょうか?

一人のユニコーン企業というコンセプトに当てはめると、マルチエージェントアーキテクチャを使用して、プロジェクトマネージャー、プログラマー、スーパーバイザーなど、異なる役割を持つ複数の AI エージェントを作成できます。目標を伝えて、問題を解決する方法を考えさせます。私たちは彼らの報告を聞き、意見がある場合や間違ったことをした場合は、満足するまで変更を加えさせます。

単一の AI エージェントと比較して、マルチエージェントは次のことを実現できます。

スケーラビリティ: AI エージェントの数を増やし、それぞれがタスクの一部を処理するようにすることで、需要の増加に応じてシステムを拡張できるようにし、より大きな問題を処理します。
並列処理: 当然のことながら並列処理をサポートしており、複数の AI エージェントが同時に問題の異なる部分に取り組み、問題解決をスピードアップできます。
意思決定の改善: それぞれ独自の視点と専門知識を持つ複数の AI エージェントからの洞察を集約することで、意思決定を強化します。

AI 技術が進歩するにつれて、マルチエージェントフレームワークがより多くの業界でより大きな役割を果たし、さまざまな新しい AI 駆動型ソリューションの開発を促進すると考えられます。

AIエージェントがWeb3に登場

研究室の外に出た AI エージェントとマルチエージェントには、まだ長い道のりが残っています。

マルチエージェントは別として、最も高度な単一のAIエージェントでさえ、物理レベルで必要なコンピューティングリソースとコンピューティングパワーには明確な上限があり、無限に拡張することはできません。非常に複雑で計算集約的なタスクに直面すると、AIエージェントは間違いなく コンピューティングのボトルネック パフォーマンスが大幅に低下します。

さらに、AIエージェントとマルチエージェントシステムは本質的に 集中型アーキテクチャモデル 、これは単一障害のリスクが非常に高いと判断しています。さらに重要なのは、OpenAI、Microsoft、Googleなどの企業のクローズドソースの大規模モデルに基づく独占ビジネスモデルが、独立した単一のAIエージェントスタートアップの生存環境を深刻に脅かし、AIエージェントが企業の膨大なプライベートデータをスムーズに使用して、よりスマートで効率的にすることを不可能にしています。AIエージェントは、民主的なコラボレーション環境を緊急に必要としており、 本当に価値のあるAIエージェント より幅広い層の人々にサービスを提供し、社会に大きな価値を生み出すことができます。

最後に、AI エージェントは LLM よりも業界に近いですが、その開発は LLM に基づいています。現在の大規模モデルトラックは、高い技術的障壁、高い資本投資、および未熟なビジネスモデルが特徴です。AI エージェントは通常、継続的な更新と反復のための資金を調達することが困難です。

マルチエージェントパラダイムは、Web3 が AI を支援するための優れた視点です。多くの Web3 開発チームは、すでにこれらの分野でソリューションを提供するために研究開発に投資しています。

マルチエージェントの詳細な分析: Web3 と AI は最終的に相互に補完し合うことになるのでしょうか?

AI エージェントとマルチエージェントシステムは通常、複雑な決定を下し、タスクを処理するために大量のコンピューティングリソースを必要とします。Web3 は、ブロックチェーンと分散化テクノロジを通じて分散型コンピューティングパワーマーケットを構築できるため、コンピューティングパワーリソースをグローバル規模でより公平かつ効率的に分散して利用できます。Akash、Nosana、Aethir、IO.net などの Web3 プロジェクトは、AI エージェントの意思決定と推論にコンピューティングパワーを提供できます。

従来の AI システムは集中管理されることが多く、AI エージェントは単一障害点やデータプライバシーの問題に直面します。Web3 の分散型の性質により、マルチエージェントシステムをより分散化および自律化できます。各 AI エージェントは異なるノードで独立して実行し、ユーザー要件を自律的に実行できるため、堅牢性とセキュリティが向上します。PoS や DPoS などのメカニズムを通じて誓約者と委任者に対するインセンティブと罰則のメカニズムを確立することで、単一の AI エージェントまたはマルチエージェントシステムの民主化を促進できます。

この点では、GaiaNet、Theoriq、PIN AI、HajimeAI はいずれも非常に最先端の試みを行ってきました。

Theoriq は、Web3 向けの AI を提供するプロジェクトです。Agentic Protocol を通じて AI エージェントの呼び出しと経済システムを確立し、Web3 の開発と多くの機能シナリオを普及させ、Web3 dApp に検証可能なモデル推論機能を提供することを目的としています。
GaiaNet は、集中型の OpenAI GPT ストアに対抗するために、専門家とユーザーの知的財産とデータプライバシーを保護することを目的とした、ノードベースの AI エージェント作成および展開環境です。
HajimeAI は、実際のニーズに基づいて AI エージェントワークフローを確立し、インテント自体をインテリジェントかつ自動化することで、PIN AI が言及した AI インテリジェンスのパーソナライゼーションを反映しています。
同時に、Modulus Labs と ORA Protocol はそれぞれ AI エージェントの zkML アルゴリズムと opML アルゴリズムで進歩を遂げました。

最後に、AI エージェントおよびマルチエージェントシステムの開発と反復には、多くの場合、多額の資金援助が必要になりますが、Web3 は、フロントエンドの流動性機能を通じて、潜在的な AI エージェントプロジェクトが貴重な早期支援を得られるよう支援できます。

SpectralとHajimeAIはどちらも、チェーン上でのAIエージェント資産の発行をサポートする製品アイデアを提案しています。IAO（Initial Agent Offering）を通じてトークンを発行することで、AIエージェントは投資家から直接資金を得てDAOガバナンスのメンバーになり、投資家にプロジェクト開発に参加して将来の利益を共有する機会を提供します。その中でも、HajimeAIのBenchmark DAOは、クラウドファンディングとトークンインセンティブを通じて、分散型AIエージェントスコアリングとAIエージェント資産発行を有機的に組み合わせ、Web3に基づくAIエージェントファイナンスとコールドスタートのクローズドループを作成することを望んでおり、これも比較的新しい試みです。

AIのパンドラの箱が開かれました。箱の中の誰もが興奮と混乱に陥っています。この熱狂がチャンスなのか暗礁なのかは誰にもわかりません。今日、あらゆる分野はもはやPPTファイナンスの時代ではありません。どんなに最先端の技術であっても、実装されて初めてその価値が実現されます。AIエージェントの未来は長いマラソンになる運命にあり、Web3はそれがゲームから脱落しないようにしています。

この記事はインターネットから引用したものです: マルチエージェントの詳細な分析: Web3 と AI は最終的に相互に補完し合うことになるのでしょうか?

関連：1週間の資金調達エクスプレス | 15のプロジェクトが投資を受け、公開された資金調達総額は約100万ドル

Odaily Planet Dailyの不完全な統計によると、7月29日から8月4日までに国内外で発表されたブロックチェーン資金調達イベントは15件で、前週のデータ（23件）より減少しました。公開された資金調達総額は約$1.02百万米ドルで、前週のデータ（$1.295百万米ドル）より減少しました。先週、最も多くの投資を受けたプロジェクトは、暗号資産貸付会社Morpho（$50百万米ドル）で、クロスボーダー決済インフラLayer 2 Financial（$10.7百万米ドル）がそれに続きました。具体的な資金調達イベントは次のとおりです（注：1.発表された金額で並べ替え、2.資金調達およびMAイベントを除外、3. *はブロックチェーンに関連するビジネスを行う従来の企業を示します）。暗号資産貸付会社Morphoは、Ribbit Capitalが主導する$50百万米ドルの戦略的資金調達ラウンドを完了しました。8月1日…