メインコンテンツへスキップ

【速報】Agent2Agentプロトコル(A2A)爆誕!LLM連携の新たな標準となるか?WSDLの再来との声も

·2 分
2025/04 LLM プロトコル API Google エージェント

【速報】Agent2Agentプロトコル(A2A)爆誕!LLM連携の新たな標準となるか?WSDLの再来との声も

引用元:https://news.ycombinator.com/item?id=43631381

zellyn 2025-04-09T13:19:32

A2AとかMCPのプロトコルが実際どんなんなのかマジで見えなくてイライラするわー。LLMが出力した内容でどうやって呼び出すかとか、どんなJSONがやり取りされるかの簡単な例が欲しいだけなのに…。自分でチートシート作るしかないかー。
あと、最後の推薦文でなんか余計に不安になったんだけど。

mlenhard 2025-04-09T15:22:47

マジそれな。JSONがどうやってやり取りされてるか知りたくてめっちゃ苦労した。
結局Charles使ってネットワークリクエスト全部キャプチャしたんだよね。まだブログ記事書き終わってないけど、もしJSON見たかったらここにあるよ。
https://www.catiemcp.com/blog/mcp-transport-layer/

swyx 2025-04-09T18:41:15

ブログ記事のJSON、もうちょい見やすくしてくれたら嬉しいな。
fwiw、docs見ればメッセージ構造は結構わかりやすいと思ったけど。
https://modelcontextprotocol.io/docs/concepts/architecture#m

mlenhard 2025-04-10T11:59:06

ああ、フォーマットは改善するつもりだし、もうちょい例も足すつもりだよ。タイプミスもあったし。正直、まだ公開するつもりなかったんだけど、OPの役に立つかなと思って早めに共有したんだ。
docsは結構良いと思う。でも、実際のネットワークリクエストを見るとなんか色々はっきりするんだよね。

nl 2025-04-10T05:15:26

具体的な例から学んで、そこから一般化する方が得意な人も多いんじゃない?

TeMPOraL 2025-04-10T05:22:58

それだけじゃなくて、仕様の理解があってるかとか、プロダクトがちゃんと仕様に従ってるかを確認するためにも例があると便利だよね。

zellyn 2025-04-09T17:05:19

マジ助かる。LLMからのレスポンスもキャプチャした?ツール呼び出しを開始するために、プロンプトにTOOL_CALL<mcp=github、command=list>みたいな特殊な構文が入ってる感じ?

kristopolous 2025-04-09T16:11:39

Charlesって初めて聞いた…(https://www.charlesproxy.com/)20年前に似たようなの自分で書いたんだよね(https://github.com/kristopolous/proxy)。当時はこれ無かったから…。もう古いツールは捨てないと。

stavros 2025-04-09T22:59:14

Charlesがリリースされたのほぼ20年前だから、それたぶんもう存在してたと思うよ。

kristopolous 2025-04-10T04:31:23

俺は自分が欲しいものが見つからないから作るんだよね。何かを作るってことは、それが存在しないって主張みたいなもん。例えば、ターミナル用のストリーミング・フォワード・オンリーなMarkdownレンダラーが見つからなかったから、自分でパーサーとレンダラーを作って、テストしまくってる。

mptest 2025-04-10T03:27:28

その質問への答えはめっちゃ色々あって、目的とか無駄の定義によるよね。学ぶことを価値があると思ってる人なら、時間の無駄なんてほとんどないんじゃない?でも、市場とか状況次第で、役に立つかどうかは変わってくるよね。言語学とか科学が好きな人でも、何か学ぶときに機会費用を考えるはず。俺は時間の無駄だなって思うことはあんまりないけど、もっと別のことできたかもっていつも思ってる。ただの不安症かもだけど…。

Maxious 2025-04-09T19:58:35

charlesがやってるTLSトラフィックの傍受方法ってちょっと古いよね(プロキシとか、偽のルート証明書とか)。イケてるやつらはeBPF使ってるよ。
https://mitmproxy.org/posts/local-capture/linux/

stavros 2025-04-09T23:00:44

プロキシが要らないのはわかるけど、eBPF使っても偽のルート証明書なしでTLSをバイパスできるとは思えないな。

beaugunderson 2025-04-10T06:13:32

これ見て。
https://github.com/gojue/ecapture
要するに、OpenSSLみたいなSSLライブラリ内の呼び出しをフックできるんだよ。

stavros 2025-04-10T07:39:14

それってアプリケーションによるんじゃない?静的にSSLライブラリがリンクされてたらどうするの?

jacobs123 2025-04-09T15:54:45

下のリンクに書いてあるよ。なんか、裏側は結構適当で脆いのに、50個もロゴ並べて大々的に発表してるのがすごいよね。ちょっとした言い回しとか句読点に影響されそう。bot同士が”please”とか”thank you”言い合ったら、結果が良くなるとかありそう。
https://google.github.io/A2A/#/documentation?id=multi-turn-c

behnamoh 2025-04-09T14:29:05

企業が「プロトコル」とか「標準」を導入したがるのは、それが広まればビジネスの「堀」になるからだと思うんだよね。もしA2Aがエージェント通信の事実上の標準になったら、Googleが作ったやつだから、LLMの世界全体がGoogleのサービスに開かれることになる(だからLLMが最終目標じゃない)。Microsoftとかは、自分たちの「標準」を作るか、Googleのに従うしかない。

mycall 2025-04-09T15:28:57

決定的なシステムと目標を、非決定的な計算で確実につなげるのってマジ難しいよね。結局、僕らが本当に欲しいものにはならないかも。

throwaway-blaze 2025-04-09T15:43:34

非決定的な人間に既存のコンピューターシステムの変更を手伝ってもらうみたいなもんじゃん?人間のチーム管理の問題が、そのままテクノロジーシステムにも当てはまるってことだね。

Xelynega 2025-04-09T17:39:56

当てはまるだけじゃなくて、悪化するよね。非決定的な人間が、非決定的なコンピューターシステムを変更して、それが既存のコンピューターシステムを変更するんだから。

もっとコメントを表示(1)
TeMPOraL 2025-04-10T05:41:33

それって、人を雇って管理するってことと一緒じゃん。

whalesalad 2025-04-09T14:40:11

だよねー。結局のところ、RPCの話でしょ。名前付きのメソッドと、既知の引数で、ネットワーク越しにやり取りする。簡単なHTTPリクエストが思い浮かぶけど、それじゃ簡単すぎるってこと?いや、結局全部そうじゃん。マジで終わってる。

from fastmcp import FastMCP<br><br>mcp = FastMCP(”Demo ”)<br><br>@mcp.tool()<br>def add(a: int, b: int) -> int:<br> ”””Add two numbers”””<br> return a + b

これってfastmcpの例だけど何か気づく?2、3行コードを書き換えるだけでFlaskかFastAPIのアプリケーションになるじゃん。なんでREST/HATEOASを全面採用しないんだろ?たぶん、こういう“最先端”ソリューションを設計・提唱してる人たちは、システムの通信方法とか、既存のメソッドを知らないだけか、新しい名前で既存の概念を言い換えて、ハイプに乗っかって利用したいだけなんじゃないかな。

pjerem 2025-04-09T15:18:57

皮肉なことに、公式の“github-mcp”を使ってみたんだけど、ちゃんと設定したトークンがあっても、うちの会社のレポで動かなかったんだよね。しかも、Dockerコンテナの中でフル blownのサーバーが動いてるし。
結局、LLMエージェントにgh cliを使わせることにした。
新しいプロトコルって、企業が安全対策なしに価値を搾取できるような、無料プログラムのエコシステムを作るために、車輪の再発明をしてるだけなんじゃないかな。

config_yml 2025-04-09T15:59:38

OpenAIの新しいresponses APIについても同じように感じる。DXの裏で、彼らは新しいデフォルトを売ってるんだよね。つまり、こっちのstateを保持して、それを売り返すっていう。

whalesalad 2025-04-09T17:08:56

OpenAIはマジでめんどくさい。chat apiとchat completions apiが全然違うAPIだって気づくまでに丸一日かかった。しかもresponses apiっていう三番目のやつも出てくるし。
皮肉なことに、gpt4はどれが正しいアプローチか分かってないんだよね。同じプロンプトを3回与えると、関数呼び出しとか、システムプロンプトとか、スキーマとか、全部違うやり方で解決策が出てくる。

peab 2025-04-09T15:17:15

RESTを使わない理由がマジでわからん。認証とかもう解決済みだし。LLMはAPIの呼び出し方も知ってるし!

nonethewiser 2025-04-09T15:51:08

よくわかんない。このプロトコルはHTTPを使ってて、JSONスキーマもある。でも、それ以外にもっと仕様があるんでしょ?それを新しいプロトコルなしでどうやって指定するの?それとも、そもそも指定する必要がないってこと?

Xelynega 2025-04-09T17:41:47

RESTってHTTPとJSONスキーマ使うプロトコルじゃん?どこが違うのか分かんないなー。どっちも「これがリモートで呼べる手続きで、必要なパラメータはこれだよ」って言ってるだけじゃん?

skeledrew 2025-04-09T15:37:28

HTTPとか考えなくて済むように、もう一段階抽象化してるだけじゃない?HTTPとか余計なもん持ち込みたくないし。

qwertox 2025-04-09T15:53:49

HTTPはTCPの上に、もうちょっと使いやすい層(POSTとかGETとか)を加えてるって言えるかもね。サーバーもめっちゃシンプルにできるし、全部が全部いらないってわけじゃないと思うよ。ブラウザで直接デバッグできるエンドポイント作れるし、ローカルのexeとstdioじゃなくて、hostsとportsでネットワークできるし。

skeledrew 2025-04-09T16:35:57

それだけじゃないよ。MCPはstdio、SSE(これがHTTPだね)、websocketsの3つのトランスポート方法に対応してるんだよ。クライアントとサーバーのライブラリがちゃんと実装されてれば、どれを使うか考えなくて済むのがメリット。サーバーとかツールとかリソースとか、アクセスするプロンプトを宣言するだけでいいんだ。デバッグモードもあるらしいし。

skeledrew 2025-04-09T18:03:58

結局は最初の5/6で言ってる通りなんだよね。そんなこと知らなくてもいいんだって(その抽象化レベルでは)。Pythonみたいな高レベル言語使ってるなら、アセンブリとかCみたいにレジスタがどうとか、メモリをどうとか、segfaultをどうとか考えなくていいのと同じ。

Xelynega 2025-04-10T19:19:53

でもMCPってそうじゃないっぽいよね。MCPサーバーを実装するとき、3つのトランスポート方法で違うコードが必要になるんでしょ?それって、他のプロトコルみたいに、お互いの仕組みを知らなくても上に重ねられるってわけじゃないじゃん。

zellyn 2025-04-09T17:02:17

へー、いいね。LLMがどうやってこのAPIコールをトリガーするのか、どんなプロンプトを送って指示してるのかも知りたいな。Gooseのコード読めば分かるかな…

hliyan 2025-04-09T14:50:32

これって、SOAとかWSDLの再発見ってこと?今度はwebサービスの代わりにLLMの相互運用のためってこと?間違ってるかもだけど、ソフトウェアエンジニアリングの学位に、アーキテクチャとか方法論とかパターンの盛衰の歴史みたいな科目を加えるべきか考え始めたわ。

maxwellg 2025-04-09T16:45:33

WSDLの時代にはいなかったから間違ってたらごめん🙏。WSDLの主な弱点は、アプリケーションが動的なサービスやメソッドの発見を利用できなかったことじゃない?サービスがWSDLをbroadcastできても、それを利用するものが無いと意味ないし。アプリを書くなら、未知のAPIじゃなくて、既知のAPIに対して書いた方がマシじゃん?LLMは、実行時に新しく発見されたメソッドとかAPIを利用できる、構造化されてないglueになるってことかな。

zoogeny 2025-04-09T17:48:54

SOAPとWSDLに関わって不幸だったわ😭。当時、WSDLに基づいてサービスを自動構成するっていう夢があったけど、実現しなかった。でも、API boilerplateの迅速な実装にはめっちゃ役立ったんだよね(今でも匹敵するものはないと思ってる)。サービスをWSDL endpointに向けると、どんな言語でもAPI clientをscaffoldできたんだ。JSON Schemaみたいだけど、もっと良い感じ。サービスがパラメータとかデータオブジェクトを変更したり、関数をdeprecatedしたり追加したりした場合、client実装がサービスinterfaceとどう違うかを簡単に確認できたし。簡単なversioning機能もあった気がする。runtimeの説明は、WSDLの失敗の言い訳にはならないと思う。発見っていうのは、プログラマがURLにアクセスすれば、どんなサービスがどんな関数、パラメータ、データオブジェクトを持ってるかを正確に知ることができるって意味合いが強かったからね。「runtime clientがWSDLを使って完全に未知のサービスへのサービスコールを自動構成できる」みたいな意味合いではなかった。後者はいつか実現するかもしれないけど、実際にはほとんど使われなかったんだ。

nsonha 2025-04-10T05:20:55

>take advantage of dynamic service and method discovery
今でもそんな風にシステム構築してる人いるの?動的なサービスとメソッドの発見は机上では良く聞こえるけど、実際に見たことないな。

bob1029 2025-04-09T21:18:04

XML RPCの手法で新しい製品を開発してる人もいるんだぜ😎。WSDLとかXSDがちゃんとできていれば、API specを誰かに伝えるにはマジ最高。自分は.NET使ってて、xsd.exeを呼び出して数秒でファイルからクラスを生成できるし。両側がすべてのルールに従えば、ちゃんと動くんだ。「これらのツールがなかったら、自分が扱ってるAPIは漫画みたいになっちゃうよ。生成されるソースは10MBもあるんだ。これらのtypesを生成して、intellisenseでプロパティをtunnelする方が、ベンダーのdocumentationを読むよりも100倍速いんだから。

echelon 2025-04-10T04:20:02

>WSDLs and XSDs done right are a godsend for transmitting your API spec to someone. I use .NET and can call xsd.exe to generate classes from the files in a few seconds.
それってprotobufとgRPCに似てる?近いアナロジーかな?

もっとコメントを表示(2)
bob1029 2025-04-10T09:39:34

それらに似てるけど、protobufとかgRPCがこんなに大規模なAPIに使われてるのを見たことないな。Visual Studioみたいなのを使ってるなら、これらのpath周りのtoolingも物足りない感じ。XML namespaceとかHTTP/1.1 transportと戦う方が、最近の”best practices”がもたらした惨状(特に大規模なレガシー企業における無人の複雑さ)を整理するよりマシ。オハイオの小さな銀行に、新しいprotocolに対応するためにfirewallを全部調整する必要があるって説明するのは、自分のbusinessじゃありえない。

nsonha 2025-04-10T05:17:38

後者(protobufとgRPC)はsubscriptionとstreaming、より効率的なtransportを追加するかもね。でも基本的には同じ考え方だよ。RPCの概念がXMLと同一視され、XMLが(XMLベースの)toolの実装と同一視され、XML vs JSONの議論で気が散ってたのがマジ嫌だった。yaml vs 〇〇みたいなのは今でもあるけど。

partdavid 2025-04-09T23:57:11

こういう再発見は何世代か経験済みだし、graphql typeのimportとか、protobuf stubの生成とかが同じように機能する場所で働いたこともあるよ。今日もHNの別のpostで、logicを_databaseに_入れるのがどれだけ素晴らしいかについて書かれてたけど、document DBの時代もrelational DBの時代も、少なくとも2世代は経験してるわ。developer全般について言えることが一つあるとすれば、学ぶよりも構築する方が好きなんだよね。

fedeb95 2025-04-09T15:42:44

ソフトウェアエンジニアリングって、結局いつも同じことの繰り返しだよね。

Maxious 2025-04-09T16:03:32

CORBAとかOSGiも忘れちゃだめだよ。

zubairq 2025-04-09T14:51:25

あはは、マジそれな!

phillipcarter 2025-04-09T21:17:51

MCPとA2Aの大きな違いは、実際にMCPを使ってからA2Aの資料を読むとよくわかる。MCPは今日の具体的な問題を解決しようとしてる。LLMが学習してないデータにアクセスする必要があるけど、RAGの方法が多すぎるから超難しい。だからMCPはLLMがAPIを呼び出す標準を定義してる(他にも色々)。A2AはGoogleが技術パートナーと追いかけてるマーケティングの問題を解決しようとしてる。半年後にどっちが残ってるか、言わなくてもわかるよね? contributorsが全部同じ会社のやつじゃない方だよ。

TS_Posts 2025-04-12T00:37:45

こんにちは(a2aの者です)。A2AはMCPとは違うレベルで動いてるんだ。特定の顧客の課題についてパートナーと協力してる。顧客は別々のフレームワークで個別のエージェントを構築したり、複数のベンダーからエージェントを購入したりしてる。これらのエージェントは孤立してて、ツールやメモリ、コンテキストを共有してないんだ。
例えば、ほとんどの企業は社内ディレクトリと社内プライベートAPIやツールを持ってる。社内タスクをこなすエージェントを構築できる。でも、”HR Agent”とか”Travel Assistant Agent”とか”Tax Preparation Agent”とか”Facilities Control Agent”を購入することもある。これらのエージェントはプライベートAPIやデータを共有しないんだ。それに、これらのエージェントを構造化されたツールとしてモデル化するのも難しい。”Tax Preparation Agent”は多くの異なるオプションを評価して、個々のユーザーのニーズに基づいて特定のドキュメントや情報を要求する必要があるかもしれない。これを100個のツールとしてモデル化するのは現実的じゃない。だからA2Aが役立つ。エージェントとしてエージェントと話すんだ。こうすることで、ユーザーは自分の会社のAgentにだけ話しかけて、そのAgentがHR AgentやTravel Booking Agentと連携して複雑なタスクを完了させることができる。

phillipcarter 2025-04-14T09:58:30

理論的にはこれらの問題とA2Aがそれを解決できる理由は理解できるけど、残念ながら実際に構築・展開されてるエージェントについて疑念を抱かざるを得ない。

owebmaster 2025-04-09T21:56:51

>半年後にどっちが残ってるか、言わなくてもわかるよね
LangChainはまだあるけど、だからって大した意味はない。MCPもそんなに良くないけど。

XCSme 2025-04-14T12:51:44

俺は今でもplain fetch requestsでLLMs APIsにアクセスしてるけど、めっちゃ上手くいく。10/10おすすめ。

phillipcarter 2025-04-09T22:14:30

Langchainは、LLMの呼び出しをまとめて一貫したworkflowにする問題を(上手くやってるかどうかは意見が分かれるけど)ずっと前に解決してる。しかも、first mover advantageもあった。MCPはデータとAPIの統合問題を解決してる。どちらも今日人々がする必要のある具体的なことだ。AIエージェント同士が会話することは、AIを統合する機能を構築している組織が今日抱えている具体的な問題ではない。

__loam 2025-04-09T22:44:22

Langchainは今まで見た中で一番笑えるライブラリの一つだ。多くのabstractionはclean codeを文字通りに受け取った大学生が書いたみたいに見える。多くのメソッドはすごくtrivialでshallowだから、真面目な場面で使われてるのが信じられない。

tomaskafka 2025-04-10T11:17:15

マジそれな。PagagraphLineReaderFactoryとかいうの開いたとき、パラグラフの区切りとか賢く処理してくれるのかと思ったら、しょーもない一行の正規表現がOOPのボイラープレートに包まれててマジびっくりしたわ。

XCSme 2025-04-14T12:52:50

>LLMの呼び出しをまとめてワークフローにする必要ってあるよね。
>Langchainを使う必要性を感じないんだよね。LLMの呼び出しをチェーンさせるのって、数行のコードで済むじゃん(Langchain使うより少ないくらいだと思うし)。

Flux159 2025-04-09T15:59:32

ざっくり考えたんだけど、このjsonの仕様ってmcpと似てるところがあるよね。
https://google.github.io/A2A/#/documentation?id=agent-card
全角- ウェブサイトがホストするエージェントの機能を記述するagent cardがここにある。
https://DOMAIN/.well-known/agent.json
全角- クローラーがエージェントを発見するためにスクレイピングできるらしい。
https://google.github.io/A2A/#/topics/agent_discovery
jsonrpcの呼び出しはmcpのツール呼び出しと似てるけど、入出力はLLMの入出力に近い感じ(メッセージとかアーティファクトとか)。
JSサーバーの例も面白い。
https://github.com/google/A2A/tree/main/samples/js/src/serve
全角- generatorを使ってSSEイベントを呼び出し元に送ってる。expressでSSE接続を設定した後でres.send/flushを複数回実行する方が普通だと思うんだけど、APIとして公開するのはちょっと変。

simonw 2025-04-09T13:52:09

MCPのセキュリティとプロンプトインジェクションについて書いたよ。MCP自体にはセキュリティ上の欠陥はないけど、(信頼できないソースからのテキストにさらされる可能性のある)ユーザーに代わって行動できるツールへのアクセスをLLMに提供するパターンは、プロンプトインジェクション攻撃に対して脆弱だよね:
https://simonwillison.net/2025/Apr/9/mcp-prompt-injection/

jsheard 2025-04-09T14:23:05

10年くらい経つと、インバンドシグナリングがダメだってことを忘れちゃって、同じ過ちを繰り返すよね。1960年代の電話会社は、既存のシングルチャネル回線に制御システムを後付けしなきゃいけなかったし、ポケット電卓くらいの処理能力で全部動かしてたから言い訳できたけど、今の俺たちには言い訳できないじゃん?

TeMPOraL 2025-04-09T17:42:13

>何が言い訳になるんだ?
>自然界にアウトオブバンドシグナリングなんて存在しないんだよ。予測可能性と制御のために一般性を犠牲にして、ある部分が他の部分の動作を制限するようにシステム設計に導入したものなんだ。この分離は心によって作られたものであって、宇宙の特徴ではない。
>したがって、人間もアウトオブバンドシグナリングをサポートしていない。現実の知覚、五感、内部プロセスはすべて同じバンド上にある。私たちと同じ環境で機能し、理想的には私たちのように考えることができる汎用AIシステムを構築する場合、制御とデータのようなものとの間にハードな分離を導入すると、十分な汎用性が得られない。
>私が「または何でも」と言ったのは、それが曖昧な考えだからだ。LLMの入力カテゴリ間の分離で、私たちが処理できるようにしたいタスクやシナリオのクラス全体を明らかに排除しないようなものを誰かが考え出すことを私は挑戦する。
>(また、上記のこととは全く関係なく、近い将来について考えると、人間に適用した場合、容易に永遠の奴隷、殺人、またはそれよりも悪いものに堕落しないような入力カテゴリ間の分離を誰かが考え出すことを私は挑戦する。)

TeMPOraL 2025-04-09T21:01:41

そこじゃないんだよ。重要なのは、LLMが完全に一般的なシステムとして意図的に設計されているってこと。モデルの感覚様式と行動空間の範囲内で人間のように反応できるんだ。人間(または自然界の他のもの)と同じように、LLMには別々の制御チャネルや人工的なコード対データの区別はないし、一般性を失わずにそれらを追加することはできないんだ。

もっとコメントを表示(3)
mycall 2025-04-09T15:26:42

エンタープライズデータベースは、特別な意味を持たせるために、フィールドに文字を付けたり付け加えたりするユーザーでいっぱいだよね。ファイル名でさえ、ディレクトリツリーの制限のせいでこの問題があるし。インバンドシグナルは絶対になくならないよ。

delusional 2025-04-09T15:57:41

あるレベルでは、すべてが単一のバンドに入る必要があるよね。家に別々のネットワーク接続はないし、バンドごとに別々のTCP SYNパケットを送ったりしない。ハードドライブ上のファイルごとに別々のストレージデバイスもない。どこかで多重化してるんだ。重要なのは、多重化装置がコンポーネントでなければならず、アドホックな正規表現の分散セットであってはならないってこと。

fragmede 2025-04-09T19:26:13

ある程度はそうだけど、今はもうコメントに+++ATH0とか入れられないから、接続が切れる心配はないよね。だから対策する価値はあると思うよ。

sneak 2025-04-09T20:52:42

厳密に言うと、それが有効なのは3番目の+の後に3秒の遅延がある場合だけだよ(そこで”OK”を受け取って、データモードからコマンドモードに戻る)。そしてATコマンドがコマンドとして解釈されるんだ。Hayesの仕様から外れてる。

fsndz 2025-04-09T18:08:43

また始まったよ、アーキテクチャ宇宙飛行士たち。解決策を議論する代わりに、AI業界全体が新しいアーキテクチャの話ばかりしてる。あーあ。

https://www.lycee.ai/blog/why-mcp-is-mostly-bullshit

ramesh31 2025-04-09T18:14:18

理由は簡単だよ。今のAI(本物のAI)は、もうコンピューターサイエンスの問題じゃなくて、エンジニアリングの問題なんだ。

weego 2025-04-09T19:45:03

結局、企業向けのバラバラな”標準”にしかならないと思うな。
神経科学的、アルゴリズム的、コンピューターサイエンス的、エンジニアリング的な観点から見ても、(本物のAI)が解決に近いという証拠はないよ。行き詰まる可能性の方が高い。
AI投資がダメになったら、MLみたいにリブランドされるのを待ってるよ。

fsndz 2025-04-09T19:28:31

じゃあ、hallucination(モデルレイヤーで起こるもの)はエンジニアリングの問題だって言うの? 正しいアーキテクチャを構築すれば、hallucinationはなくなるって? それは疑問だな。

ramesh31 2025-04-09T21:51:03

>あなたhallucinationがエンジニアリングの問題だって言ってるの?
そうだよ。
hallucinationはシングルショットプロンプトで大きな問題だった。でも、もう誰もそんなこと真面目にやってない。エージェントが改善して評価者がチェックするプロセスがあって、初期出力を品質チェックして、合否を返す。ツールを使ってリアルタイムデータを注入するから、LLMの上に信頼できるシステムが構築できるようになる。

yunwal 2025-04-09T22:47:29

LLMは評価なんてできないよ。影響を受けやすすぎるし、どんなにレイヤーを重ねても、適切なプロンプトを使えば必ず破綻する。

fsndz 2025-04-09T23:58:27

じゃあ、hallucinationしないLLMベースのシステムのリンクを教えてよ。

zambachi 2025-04-09T20:00:48

Specからの引用だよ~
https://modelcontextprotocol.io/specification/2025-03-26/ser
「trust & safetyとsecurityのために、ツールの実行を拒否できる人が常にいるべき」だって。
アプリは、AIモデルにどのツールが公開されてるかを示すUIを提供したり、ツールが実行されたときにわかりやすい表示を入れたり、操作の確認プロンプトをユーザーに出して、人がちゃんと確認できるようにするべきらしいよ

lennoff 2025-04-09T20:08:08

最近は”vibe coding”ってのがあって、これは人がずっと確認しなくてもいいようにするのが目標なんだよね

simonw 2025-04-09T20:55:49

同じドキュメントの中で、ここではSHOULDを使ってるのがポイントだね。他のところではMUSTを使ってるのに。参考になったよ。記事で引用させてもらうね

qwertox 2025-04-09T15:46:10

Securityってprotocolの一部に入れるべきじゃない?hostとclientがお互いにデータをsanitizeするようにしないと。そうしないと、モデルが”安全”なデータをclientに渡したり、hostが”安全”なデータをLLMに渡したりするのをどうやって信用するの?

TeMPOraL 2025-04-09T18:26:24

一般的なシステムにおいて”安全”なデータなんて存在しないんだよね。安全の度合いの問題で、システムを安全にするためにどれだけのeffort、money、犠牲を払うかって話になる。攻撃者がどれだけcompromiseにeffortをかけるかってこととの兼ね合いだね。LLMみたいなシステムは人間だと思って考えるのが良いよ。見知らぬ外国人みたいな感じで。prompt injectionはsocial engineeringと同じで、常に問題になるよ。mitigationとしては、LLMにabuseできる権限を与えないとか、exploitしようとする人をsocialやlegalなpunitive measureで防ぐとかかな。LLMを含むsecure systemの設計は、人間を含むsystemのsecurityと同じように考えるべきだね

TeMPOraL 2025-04-09T22:23:59

まさか! verboseになることはあるし、researchにLLMを使うけど、自分の考えをLLMにformulateさせるほどdesperateじゃないよ。HNにcommentを書くことで、自分のopinionやbeliefをよく考えることになるからね。めっちゃvaluableだよ。途中で自分が間違ってるって気づいて、submitせずにwindowをcloseすることもあるし

puliczek 2025-04-10T06:22:12

noteを共有してくれてありがとう!Awesome MCP Securityに追加するね!
https://github.com/Puliczek/awesome-mcp-security

latchkey 2025-04-09T14:42:28

>the patterns it encourage
まずはexampleをfixしないと…
https://github.com/modelcontextprotocol/servers/issues/866

behnamoh 2025-04-09T14:26:45

RLHFのおかげでモデルがmaliciousなrequestをrejectするのが上手くなったから、industry全体がprompt injection attackのことを忘れちゃったみたいだね。でも、prompt attackのdocumentedなcaseって何かあるのかな?

記事一覧へ

海外テックの反応まとめ
著者
海外テックの反応まとめ
暇つぶしがてらに読むだけで海外のテックニュースに詳しくなれるまとめサイトです。