OpenAI Codex CLI爆誕!ターミナルで動く軽量コーディングエージェントがClaude Codeに挑戦状!?
引用元:https://news.ycombinator.com/item?id=43708025
Codex o4-mini と Claude Code で、ミディアムサイズのコードベースのトリッキーな部分のドキュメント作成で対決してみたよ。Claude Code はすごい出来で、かなりまともなドキュメントを書いたんだ。Codex は全然ダメ。コードにないものをいっぱい捏造して、アーキテクチャを完全に誤って伝えてる。サーバーバックエンドとか REST API の話をしだしたけど、そんなものはこのアプリにはないんだよね。何がそんなにうまくいかなかったのか気になるなー。正しいコンテキストをロードして、ちゃんと理解することに問題があるのかも?そこは Claude Code がマジで最適化されてる気がする。o3 と o4-mini には期待してるから、他のテストで良い結果が出ることを願ってる!Cursor とかが o3 をどう組み込むのかも気になる。
やっぱり Claude Code の方が優れてる気がする。o4-mini は色々問題あり。o3 は良いけど、そこまで行くとお金を節約できなくなるから意味ないじゃん。みんな Claude Code を過小評価してる気がするんだよね。安くはないけど、これまでで一番良くて、一番安定した体験だよ。
Claude Code はマジで高すぎる。最近は Amazon Q Pro を CLI で使ってる。Claude Code と似たような体験ができるけど、いくつか機能が少ないかな。でも月額 20 ドルが上限だし、クレジットカードが燃え尽きる心配もない。
これってこれらのモデルのどれかを使ってるのかな?
https://openrouter.ai/models?q=amazon
Aider+Openrouter より 4 倍も高いみたい。俺はノリとか大規模なリファクタリングとかしないから、(初めてで唯一の)請求額は Gemini で 5 ドル以下。これらのモデルならさらに半額になるね。
違うよ、Amazon Q は Amazon Q を使ってるんだ。モデルは変更できないし、“Q”って名前で、上限は 20 ドルだよ(Q Developer Pro プラン)。無料プランもあるよ。
https://aws.amazon.com/q/developer/
ファイル変更、シェルコマンド実行、調査とか、何でもできる “q chat” コマンドラインコマンドがあるっていう意味で、Claude Code にかなり近い。“q chat” って言って、“このリポジトリを読んで README を作って”とか、Claude Code ができることは何でも言える。何を読むか、何を変更するかを自分で判断して、エージェントみたいに全部自分でやるんだ。(Aider とは言いたくなかった。Claude Code の魅力は、何を読むかとか変更するとか全部自分で判断して全部やってくれるところだから)
(Q って言ってるけど、俺のテストからすると、Amazon が Anthropic にめっちゃお金を注ぎ込んでることを考えると、AWS でホストされてる Claude のバリアントだってことは明らかだよね)
OpenAI の Codex のデモでは、サンドボックス化されてるって言ってたよ。実行されたディレクトリ内のファイルにしかアクセスできないし、システム上のどこにでもアクセスできるツールを呼び出したとしてもそうらしい。ネットワークもブロックされてて、curl とかも動かないみたい。昨日の Codex の短いテストでは特に感銘は受けなかったな。まともな変更ができただけでも良かったけど、コードをめちゃくちゃにしたときは、それを理解するのに時間がかかってトークンもたくさん使った。
タスクごとに特化したファインチューンモデルが必要だと思う。Java の構文エラーを修正するための専用のファインチューンとかが良い例だね。
あと、テストの作成と実行にもっと積極的に取り組む必要がある。
差分が表示されて確認できるし、コマンドを実行する前に聞いてくるし、現在のディレクトリ外のファイルにはアクセスできないよ。もう聞かないで勝手にやらせることもできるし、そうやってフル機能を作って、後でちょっと修正したりしてる。
Sonnet 3.7 を軽く使うだけでも月額 30 ドルはかかると思ってたんだけど、何か安く提供する方法を見つけたのかな?
Amazon が何をしたのかは知らないけど、俺は Aider+Openrouter で Gemini 2.5 pro を使ってて、Sonnet 3.7 の 1/6 のコストだよ。Aider のリーダーボード
https://aider.chat/docs/leaderboards/
には、最近の価格比較も含まれてる。
>Amazon Q Developer Agentでコード変換するとアプリのアップデートがめっちゃ早くなるらしいよ(月4,000行まで)。
月4,000行って少なすぎじゃない?リクエストしたらすぐ超えそう。俺が何か勘違いしてるのかな?(向こうの説明が悪いんだけど)。
いや、勘違いじゃないっぽい。これ超えると従量課金になるみたい。しかも上限20ドルじゃないんだ。
エディタのAmazon Q(例えば変換機能)とCLIのAmazon Qをごっちゃにしてるんじゃない?エディタの方は上限超えると追加料金かかるけど、CLIツール(Claude Codeみたいなやつ)は別物で、そんな制限ないよ。https://aws.amazon.com/q/developer/pricing/?p=qdev&z=subnav&… のコンソールの「チャット」を見てみて。何が「含まれてる」か、何が追加料金かかるか書いてあるよ。
俺はここ数ヶ月ほぼ毎日使ってるけど、追加料金はかかってないよ。まだ月20ドルだけ。
なるほど、ありがとう。GUIの4,000行制限はやっぱり少なすぎる気がするけど、今度CLI試してみるかも。
ぜひ試してみて!無料版はタダだし、色々いじれるよ。AWSのアカウントすら要らなくて、Q専用の新しいアカウントを作るように促されるよ。
gemini 2.5 pro expをAider[1]で使うと、Claude Sonnet 3.7より優秀だよ。しかも無料(上限は高いけど)。
[1]https://aider.chat/
clineとAiderを比べると、前回試した時(4ヶ月前)はAiderは全然ダメだった。変わったのかな?clineはSonnetに特化してるから優秀だと思ってた。Aiderは汎用的なIDEコーディングエージェントを目指してて、どのモデルでもうまく動くようにしてるけど。
gemmini 2.5 pro expをclineで使うとすごくいいんだけど、clineが提供するツールをうまく使えないことが多い。だからSonnetより安上がりだけど、Sonnetなら余裕でできる基本的なタスクをたまに失敗する。だから時間を節約するために追加料金を払ってる。
誤解しないでね。俺の意見はもう古いのかも。最近はついていくのが大変だ。
Clineを試したけど、Aiderのコマンドラインスタイルの方が早く作業できる。
/runコマンドでスクリプトを実行して、コンソールの内容をプロンプトに追加できるから、バグ修正がすごく速い。
俺としては、最新版に無制限にアクセスできるなら喜んで提供するよ。っていうか、今のコードのほとんどはgeminiが書いてるし(笑)
もしAiderにエージェントモードがあったら使うかな。率直に言って、UXが追いついてないんだよね。Claude Codeがやってることのコピーみたいなモードが欲しい。
>高価だけど、今までで最高の、一番安定した体験だったよ。
でも、やってることの割には高すぎるよね。それに、コンテキストウィンドウを使い果たすとすぐにダメになる。
コスト管理をマスターすれば、ずっと安くなるよ。コンテキストウィンドウを使い果たしてるなら、コストが高いのは当然かもね。“キャッシュ”を意識して。
特定のファイルを読み込むように指示して、絶対「/compact」を使わないこと(キャッシュが壊れるから。もし必要なら、何度もやり取りしすぎてるか、一度に使いすぎるファイルが多すぎる)。
セッション中に手動でファイルを編集しないこと(キャッシュが壊れる)。これにはLINTも含まれるよ。
明確な目標を持って、セッションのメッセージ数をできるだけ少なくする。
必要なドキュメントをmarkdownファイルでClaude.aiを使って生成して、それをリポジトリにファイルとして保存して、質問の一部としてそのファイルを読み込むように指示する。
ほとんどのタスクで、$0.5-0.75くらいかな。ヘビーユーザーじゃないけど、間違いなく助かってる(まるで、間抜けなミスをするけど、めちゃくちゃ集中できる賢いインターンがいるみたい)。
もし大量のドキュメントを読み込ませる必要があるタスクなら、数ドルになるかな。でも、Claudeが知らない(または古い)ライブラリでプロトタイプを試すときにしかやらないな。
趣味のものなら、積み重なるけどね。
会社にとっては、めちゃくちゃ価値がある。信じられないほど安い生産性向上(もし開発者が責任感を持って、怠けたり、誤用したりしなければ)。
みんなが同じようなこと言ってて、マジで驚く。 もし本気でそう思ってるなら、もう見当違いだよ。 予測不能で非決定論的なブラックボックスで、未知のトレーニングセット、重み、バイアスが、広告とは異なる動作をしてる?そりゃユーザーのせいだよね。 ジュニア開発者もスキルはあるけど、集中して軌道に乗せるにはシニアの指導が必要。ツールに知能が組み込まれてるからって、うまく伝えなければ意図を読み取れるわけじゃない。 マジな質問? コストが予測できないと、trial and errorでスキルアップするのが難しいよね?特にモデルを混ぜたり、高いモデルを使うとコストが跳ね上がるし。ベンダーがコストを重要視しないのは、価値がないか、一部の人にしか使いこなせないからかもね。 Claude Code使うときって、contextを自分でコントロールできる?contextを読み込む賢さとか、自分で管理する必要があるのか知りたいな。 わかるー、Claudeの経験、マジそれ!特に必要なcontextだけ引っ張ってくるってアドバイスが響く。時間はお金で買えるから、こういう技術はマジで助かる。scribe(作家のアシスタント)みたいなもんよね。マジ感謝! scribeのアナロジーいいね!で、scribeと同じで、Claude Codeへの不満はコストとかcontextじゃなくて、遅さなんだよねー。マジで遅い:D マジそれ。AIを使いこなすには努力が必要だよね。まるで野生の馬に乗るみたい。ベテランdevのスキルは役立つけど、Google検索みたいにうまくいくとは思わないほうがいいよ。 >It’s not going to build your entire app in a single session/context window. o3でも同じテスト試した?ミニモデルはスピード重視だよ。 OpenAIのモデルがハルシネーションして、間違いを”嘘”でごまかすって記事があったよ。原因についても考察してて面白かった。https://transluce.org/investigating-o3-truthfulness 関連デモ動画:https://x.com/OpenAIDevs/status/1912556874211422572 へーい!Claude Codeの弱点は、クローズドソースでClaudeモデルにしか対応してないことだと思うな。もしインスピレーション探してるなら、Rooが最強だよ。もっと面白い機能がたくさんある。例えば、ユーザー定義モードとか、デバッグモードとか、アーキテクチャモードとか。タスクの特定部分を要約して、新しいタスクを開始したりもできるし。それに、Claude Codeと違って、Rooはちゃんとカスタム指示に従ってくれる(マジで、Claude.mdは役に立たない!)唯一の欠点は、CLIじゃないってことかな。 gooseとか、plandexとかaiderもあるよ。あと、Rooの新しいフォークとしてkiloもあるね。 混乱したから、自分とみんなのために整理すると、Codexはオープンソースで、Claude Codeはそうじゃない。言及されてるリコンパイルのツイートはClaude Codeのことね。 最近は、リポジトリ全体(または一部)をGeminiにペーストして、このスクリプトで変更をコードに適用してるよ:https://github.com/asadm/vibemode お金を節約するとか、ミスを減らすだけじゃなくて、イテレーション速度も重要だよね。このプロセスがaiderと比べて同等だとは思えないな。 このワークフローで5個目のプロジェクトだよ。しかも色々な種類があるんだ: repomix(npm)みたいなツールを使ってみたら?エディタ(少なくともVSCode)に拡張機能があって、ソースファイルを機械可読な形式にすばやくまとめることができるよ。 CopilotでGemini Pro 2.5を選んでEditモードにすればいいんじゃない?追加料金なしでほぼ無制限に使えるよ。 Copilot(とか他のやつら)は賢すぎようとして、(自分たちの財布のために)コンテキストを削減するんだよね。添付したファイルの全部をコンテキストに入れたいんだよ。RAGされたバージョンじゃなくて。 これマジで問題だよね。Claude ProjectsとかChatGPT projects、Sourcegraph Codyのコンテキスト構築、MCPファイルシステムとか全部、コンテキストをロスがある形で圧縮してるブラックボックスって感じ。 >The best way around this I’ve found is to just own the web clients by including structured, concatenation related files directly in chat contexts。”わかるー。昔はbashスクリプトで必要なファイルを連結して、ファイル名とかパスをコメントに書いてたな。最近はClaudeの添付ファイルの数が増えたのか、必要なくなったけど。 filekittyマジでクールじゃん! ありがとう!コメントとプロジェクト見れてよかったよ。 これがagentic codingソリューションの根本的な問題だと思う。 OpenAIが500kトークンみたいな大きいコンテキストだとパフォーマンス落ちるって言ってたよ。だからコストだけじゃなくて、パフォーマンスのためにコンテキストを絞りたいよね。推論を早くするためにも。 Cursorならマジで簡単だよ。コンテキストの表面積を指定すれば、コンテキストが大きすぎなければRAGしない。 最近試してないけど、RAGしたかどうか教えてくれる?送ったコンテキスト見れる? マジでそれ。 コンテキスト削減についてだけど、疑問に思ったことがある。 だよねー。でもこれにはちゃんとした理由があって、モデルはコンテキストが小さい方が上手く動くんだって。だから俺はGeminiを使って、この怠惰で効率の悪いワークフローをやってるんだ。 Edit modeだと、開いてるウィンドウから見えるコンテキストだけじゃなくて、全部やってくれてる気がする。含めるファイルも選べるし、切り捨てられてないみたい。ちゃんとネットワーク通信を確認したわけじゃないけど、普段使ってる感じだとそうっぽい。 実際にどんなネットワークリクエストが飛んでるのか気になるなー。 もう一回試してみるけど、前にedit modeでフォルダを追加して、ファイル一覧を表示させようとしたら、全部表示されなかったんだよね。 俺は“Open Editors”を使うのが好きだな。そうすると、今作業してるコードだけがコンテキストに追加されるから、もっと自然な感じがする。 それって、それが原因で使い物にならないってこと?マジで酷すぎてビックリしてるんだよね。一度も編集に成功したことないし。コード補完は最高だけど。 多分そうかも。ほとんどのモデルは、ある程度のコンテキストサイズ(大体10-20k)を超えるとダメになるんだよね。だから俺はgemini(via aistudio)をワークフローに使ってる。 みんなこの微妙な違いを理解してないんだよね。CopilotとかCursorみたいなサブスクリプションベースのエージェントは、コスト削減のためにRAGを使ってて、RAGを使った場合、複雑なタスクでは完全なコンテキストウィンドウがある場合よりも結果が大幅に悪くなるんだ。だからChatgptとかClaudeも、ファイルアップロード機能を宣伝するときに、本当のことを言わないんだよね。 ClineはRAGを使わないから、Geminiとその大きなコンテキストで作業するのに適してるんだ。 これってhttps://aider.chat/docs/usage/copypaste.htmlと似てない? それマジそう。aiderはファイルに対してRAGしないのが良いんだよね。UIがマジで遅くて使いにくいし、gemini 2.5をAPI経由で使うのは(コンテキストウィンドウがデカいから)高いし、今はレート制限もキツいから使ってないんだよね。aistudio UI経由なら問題ないんだけど。 aiderのコピペをaistudio UIとか他のウェブチャットで使うのはアリだね。変更を適用するaiderモデルにgemini-2.0-flashを使うのも良いかも。でも最初のポイントはマジでわかる。 マジでそれな。変なワークフローが出てくるから、みんなが最適な方法に落ち着くまで、自分だけの変なツールを持ってる方が良いんだよね。 マジでデカいコードベースだと、色々見失う気がするんだよね。16x promptを使って質問に合ったファイルを選んで、プロンプトを生成させてる。 geminiのこと?マジで200kトークンまではリコールがスゲー良いと思う。それ以降はまあまあかな。 マジで上手くいくことを願う!Claude Codeはマジで優秀。 Claude Codeはクローズドなライセンスなんだよね。 プロプライエタリなコードのフォークなら、ライセンスはマジで明確で、著作権侵害になるよね。 フォークって言ってるけど、コードは共有してないよ。最初から作ったはず。 ターミナルベースでオープンソースなら、aiderが一番人気だと思う。 マジそれな!めっちゃ良い!気に入った! Aiderって、まさにそれやってくれるんじゃないの?repo map機能で。 いやいや、repo mapはコードベースの概要をLLMに伝えるだけで、Aiderが勝手にファイルを持ってくるわけじゃないよ。全部見せたいファイルは自分で指定しないと。Claude Codeとか他のツールはそこが自動だから、もっと自律的なんだよね。 Aider、こっちが指定してないファイルへのアクセス許可を普通に聞いてくるけど? 激しく同意。Claude Codeが予想以上に優秀でびっくりした。Clojureみたいなマイナー言語でもね。競争があるのは嬉しいね! Claude code毎日使ってる。ちょっと高いし、ハルシネーションも多いけど(カスタムプロンプトでほぼ抑え込んだけど)。競争が激しくなって値段下がると良いな。 高すぎ。なんでみんなClaude code使うんだろう?CursorとかWindsurfでClaude使えば良くない?もっとコメントを表示(1)
確かに、ちょこちょこ数ドルかかるかもね。でも、個人的には、そのコストに見合う以上の価値を得てるから、「高い」なんて笑っちゃうレベル。
やりたくないことを、めっちゃ効率的にやってくれるだけじゃない。やり方を知らないことも、自分のプロジェクトのコンテキスト内でやってくれて、終わったときにはやり方を理解できてる。
他の人も言ってるように、コンテキストウィンドウを使い果たしてるなら、問題はツールじゃなくて、あなた自身。
例えば、めちゃくちゃモデルが大きいプロジェクトがあるとする。Claudeにそのモデル全体を読み込ませるのは愚かだってわかるよね。そうじゃなくて、モデル内で何をしたいのか具体的に指示して、メソッド名を指定して、ファイル全体を読まずに、メソッド定義の周辺だけを読むように指示する。
もし、どうしても大きなファイルを扱う必要があるなら、そもそもファイルが大きすぎるんだから、リファクタリングして抽象化して、行数を減らすべき。あるいは、タスクに関係ないコードを一時的に削除して、読み込ませればいい。(例:ファイルをバックアップ場所にコピーして、関係ないものを削除して、作業が終わったら変更をマージして戻す)
数ドルのコストでタスクが完了するなら、「高すぎる」なんてことはないはず。そのドルで節約できる時間は、コストの何倍も価値があるし、結果に満足できなかった回数は5回以下。
同じような不満に対する返信をよく見るけど、みんな「高すぎる」「コンテキストが一杯になると役に立たない」って言ってる。それに対する返信はいつも同じ。「コンテキストを一杯にしてる時点で、もう失敗してる」(そして、それが高い理由)。
兄弟コメントに同意。プロジェクト内でドキュメントを構築させよう。タスクを小さく分けて、終わったらドキュメント化して、次のタスクに移る。(これはコンテキストに依存する。タスクを完了するためにコンテキストをロードする必要がある場合は、新しいタスク/セッションでロードし直すよりも、継続する方がお得かもしれないけど、結果は悪くなる…だから、コンテキストは最小限に抑えよう)
悪い結果になったり、堂々巡りになったり、ハルシネーションが出たりするのは、いつもコンテキストをロードしすぎたり、タスクが終わった後に新しいセッションを開始するのが面倒で、そのまま次のタスクに進んだとき。
右下のコンテキスト使用量のインジケーターを見ただけで、「オートコンパクト」される前に機能が低下してるのがわかるから、発言を信用しないように気をつける。
アプリ全体を1つのセッション/コンテキストウィンドウで構築することはできない。タスクを小さく分割して、簡潔に。
スキル不足の問題。ツールのせいじゃない。
ツールに関しては、ほとんどの場合、ユーザーのせい。使っててうまくいかないなら、ツールが悪いんじゃなくて、使い方が間違ってる可能性が高い。ほぼ間違いなく。
適材適所ってやつ。正しい仕事に、正しく使うことも重要。
Claude Codeはプロジェクト全体をリファクタリングするためのものじゃない。10万トークンの「プロジェクト全体」をロードしようとしてるなら、使い方が間違ってる。それは事実。このツールはそういう設計じゃない。確かに、「動く」かもしれないし、そう設計されてると思わせるほど近い結果が出るかもしれないけど、違う。
詳細で、具体的な作業には、めちゃくちゃ優れてるから、こんな意見があるのが信じられない。
そうは言っても、大量のコンテキストを読み込ませることもあるけど(Claude、プロジェクト全体。Claude Codeじゃないよ、そういう設計じゃないから)。そういう場合は「会話」はしない。コンテキストをロードして、質問して、タスクを与える。最初のレスポンスが全て。それで解決しないなら、どうすればいいか、より具体的にわかるはず。
ロボット手術アシスタント/ロボットの使い方を知らない外科医は、ツールの問題?それともスキルの問題?
いや、最初はそうだったんだよ。context windowを使い果たすまではね。その後は手取り足取り必要になった。そんなことするならCursor使うわ。
これが原因かもね。
これって、猛烈に開発が進んでるClaude Codeへの直接的な回答だよね:https://x.com/_catwu/status/1903130881205977320
しかもオープンソースじゃないし。非公式コメントだと、リコンパイルに対してDMCA申請してるらしいよ。https://x.com/vikhyatk/status/1899997417736724858?s=46
偶然だけど、今週Claude Codeのインタビューを公開する予定。コードエージェントCLIがSWEデザインで過小評価されてる理由とかにも触れるよ。
(要するに、linuxのユーティリティみたいに使えるってこと。@simonwのllm
みたいにね。DevinとかCopilot SaaSを買わなくても、CI/PRレビューとかいろんなとこにインテリジェンスを組み込めるんだ。)
Claude Code(と、今回のOAI Codex)のヘビーユーザーいたら、ユースケース教えてほしいなー。CFP締め切り近いから応募してね。https://sessionize.com/ai-engineer-worlds-fair-2025
aiderとかCopilotとか試したけど、どこか物足りなかったんだよね。
aiderは全部メモリにロードされるし、ターミナルでファイルの追加や削除、議論ができるし、モデルの切り替えもできる。変更は全部コミットされるし、!を付ければターミナルコマンドも実行できる。
フルコードベースは、関連ファイルよりも高くて遅い。コストを気にしないならいいけど、妥当なサイズならフルコードベースをペーストするのは現実的じゃない。
・esp32用の組み込みプロジェクト(100kトークン)
・Visual Inertial Odometryアルゴリズム(200k+トークン)
・Webアプリ(60kトークン)
・上で言及したツール自体(~30kトークン)
自分にはこれで十分うまくいってる。他の方法はダメだった。もっとコメントを表示(2)
Copilotは前は使えなかったけど、Editモードが追加されてから、ここ数ヶ月でかなり良くなった。
どこもトークン圧縮を最大限にして、そこそこの結果を出そうとしてるんだよ。
一番いいのは、構造化されたファイルを直接chat contextsに含めることだと思う。
FileKitty作ったんだけど、マジで役に立つから見てみて!
https://news.ycombinator.com/item?id=40226976
ファイルシステムのコンテキストを自分で用意して、実行結果とか問題文とか追加すれば、マジでいい結果が出ると思う。OpenAIとかAnthropicのサブスクリプションでプロンプトを調整したり、ファイルのコンテキストを更新したりするのに時間を使う価値あるよ。
最近はIDEじゃ解決できない難しい問題のために、プロンプトを複雑にするのに時間かけてる。
LLMのコードをプロジェクトに戻す時の問題、マジでわかる。
gen AIでコード書くなら、コピペとmarkdownの使い方が重要だって同僚に言ったんだよね。
プロンプトと同じくらい、コンテキスト管理も重要。
Web chatの会話をコピーするときのUIとか、マジで重要だよね。
APIに送るコンテキストを減らすために、ファンシーな関数呼び出しとかツール使ってコンテキストを絞ってる。
でも、問題を解決するために必要なコンテキストなんてわからないじゃん。
開発者が制限してるせいで、モデルの能力が低いって思われがち。
でも、context windowsが大きくなる時代になるから、コーディングのパフォーマンスはマジで上がると思うよ。
それに、そういうエージェントってブラックボックスで、.rulesとかllms.txtとかprdとかmcpとか、どう組み合わせるのがベストかわからない。
IDEも最終的なプロンプトを検査できるようなoutputがないし。MITMproxyとか使えば見れるかもだけど、ベストプラクティスを学べるツールが欲しい。
roo codeとかclineはオープンソースだから、system promptsとか見れるから試してみる。
理由はわかるけど、魔法みたいで嫌なんだよね。LLMとの間に単純なツールが欲しい。
もし自分のAPIキーを使ったら、IDEとかcopilotのプロバイダーは月額料金以外に得しないよね?
でも、サブスクリプションのトークンで提供されたモデルを使う場合、トークン数に応じて料金を請求し、それを最適化してLLMへのリクエストを小さくして、マージンを増やすインセンティブがあるんじゃない?もっとコメントを表示(3)
どういう仕組みか確認してみたけど、あなたが説明してること全部やってるみたい。違いはファイルの提供方法で、xml形式を使ってないだけ。
もしよければ「/add *」で全部のファイルを追加できるよ。
このモードから推測すると、/addでaider chatに追加したファイルは、全部チャットコンテキストに追加されるみたい。
まあ間違ってるかもしれないけど。3つのファイルで簡単なテストをしてみただけだし。
自分のワークフローに合うツールを自分で作るのも、必要なことに合わせて簡単に修正できるのも理解できる。
他のコーディングエージェントはイマイチだったから、Zedで直接プロンプトする時にしかClaudeを使ってなかったからマジで驚いたんだよね(”ここにxyzを実装して”とか、”この関数をabcで書き換えて”とか)。
だからClaude Codeを試す時は悲観的だったんだけど、今はいつも使ってる!そりゃあ、金はかかるけど、ほぼ完成したPRがめちゃくちゃ早くできるなら、1回のプロンプトで15ドル払うのは全然アリ。
つまり、競争は良いこと。Codexに期待!
https://github.com/anthropics/claude-code/blob/main/LICENSE….
Anon Kodeっていうフォークがあるけど
https://github.com/dnakov/anon-kode
こっちは他のモデルとかAnthropic以外のモデルも使えるみたい。でもライセンスが不明瞭なんだよね。
CodexがApache Licenseなのは面白いね。誰かが他のモデルでも使えるように拡張するかも。
Anthropicがライセンスを執行するかどうかは別の問題だけど、そこに投資するのは賢明じゃない気がする。
ただ、構造が分からん巨大で複雑なコードベースだとイマイチなんだよねー。ファイル自動追加とか、賢いやり方で追加してくれるAIが欲しいなー(トークン消費は増えるけど)。CodexとかClaude CodeとかAnon Kodeとか、AIエディタ系ならもっとうまくやってくれそう。それが唯一の欠点かな。