速報!ClaudeがついにWeb検索に対応!でも精度は大丈夫?気になる詳細をチェック
引用元:https://news.ycombinator.com/item?id=43425655
Web検索機能は理論上はマジでいいけど、今まで使ったやつ全部、上位X件を見て、それを正解だって決めつけてるんだよねー。人気のある話題とかよくあるエラーについてLLMに聞くと、上位に出てくるのはブログのスパム記事とか未解決のフォーラムの投稿ばっかで、結局問題解決になんないんだわ。Web検索がマジで使えないってことの表れかもね。でも、それが生成系のシステムにも影響を与えてるってのは面白い。
>top X件を見て、それを正解だと解釈する”ってことは、LLMもマジで人間みたいな行動をとるようになってきたってことじゃん?
社会人歴が長くなるほど、ほとんどの人間って仕事できねーなって思うんだよね。LLMが人間っぽくなるって、俺が求めてるのとは真逆だわ。
それって、仕事自体がマジで役に立たないからかもよ?だからって人がダメってわけじゃないし、それで得られる収入で何ができるかって話でもないけど。でも、ほとんどの仕事ってマジで意味ないように見えるよね。
もしかして、もうすでにベーシックインカムって実現してたりして?ただ、それを受け取るためには、意味のない仕事をする必要があるだけなんじゃね?
ベーシックインカムの弱点の一つは、目的意識の欠如だって言われてるよね。「解決策」は、君が言ってるように、厳密な投資対効果を求めない仕事なのかも。給料はもらえるけど、地域のために掃除したり、草木を育てたりするんだ。誰かが近所のために原価でサワードウを作ったり、誰かが高齢者のために庭の手入れをしたり。
正確にはベーシックインカムじゃないけど、スペイン南部の農村部には、似たような制度があるんだ。「Rural Employment Plan(PER)」って呼ばれてる。清掃とか塗装みたいな簡単な仕事を与えて、収入が少ない人を助けてるんだって。この制度を利用してる人たちは、10代半ばで学校を辞めたような、学歴の低い人が多いらしい。
それって最低賃金のことじゃね?
税金で支えられた労働補助金みたいなもんかな…最低賃金法も必要になるだろうけど。これってマジでいいアイデアだと思う!企業がこういう仕事で人を雇いやすくすることで、みんなの価格が下がり、サービスの利用しやすさが向上する。
仕組みが分かってないだけかもしれないけどさ。これってどうやって価格を下げるのに役立つんだ?税金は誰かが払わなきゃいけないし、結局は消費者が負担することになるんじゃないの?お金の通り道が変わるだけで、結局は誰かが払わなきゃいけない。それなら、税金で価格を補助して、プログラムの運営費も全部まかなう必要があるから、価格が上がるリスクもあるよね。
誰がどの仕事に就くかって、どうやって決めるんだろ?
やりたい人がやればいいんじゃない?でも、目的意識を持てそうなこととか、コミュニティを作れそうなことを勧めるのはありだと思うな。働く時間とか頑張る度合いは本人次第で。朝6時に近所の家の雨どいを全部掃除して、午後は自分の趣味に没頭するとかさ。怠けてるように聞こえるかもだけど、これは最低限のUBIがある前提の話ね。効率とかビジネスのあれこれに悩まされなければ、楽しい仕事って結構あると思うんだ。
金銭的なインセンティブがなかったら、誰も溝掃除なんてしないよ。やる価値のある仕事って、大抵はつまらないかキツいものなんだ。だからお金を払って人にやってもらうんでしょ!チャリティで雨どい掃除サービスなんて聞いたことないでしょ?みんな趣味とか家族や友達との時間に使いたいんだよ。
雨どい掃除とか溝掃除の会社がなくなるわけないじゃん?自分で掃除する人もいるだろうし。UBIで従来の企業がなくなるって話は聞いたことないけど、大抵は最低賃金を引き上げるって話でしょ。みんな自分の家の雨どいを掃除する時間が増えるか、お金を払って誰かに頼むようになるだけだよ。
チャリティの掃除サービスなら、YouTubeでゴミ屋敷を掃除したり、荒れた庭を無料で手入れしてる人がいるじゃん…😉
UBIの考え方って、みんながやりたい仕事をするってことだよね…
だよね!みんな趣味とか好きなこと、レジャーを追求するようになるでしょ。税金を無駄遣いして借金が増えるだけだよ。直接的な誤投資だね。
そんなことないよ。まともな仕事をしてても、生活必需品を買うお金すらない人がたくさんいるんだよ。将来とか家族のために貯金なんてできないし。問題は仕事がないことじゃなくて、最低限の収入が保証されてないことなんだ。
完全に解決できる問題じゃないよ。特にどこでも同じようにって考えるならね。
“無料のお金”みたいな政策は、良いことよりも悪いことの方が多くなるかも。
UBIは、Marxみたいな価格統制をしない限り、生活必需品を賄えない可能性が高いよ。
経済に関わる全員が毎月3000ドルもらえるようになったら、生活必需品とか全ての物の値段が同じように上がると思うよ。
UBIについて意見を言うつもりはなかったんだけど、親コメの人が思ってるのとは違うってことを説明しただけだよ。
でもいいや、ちょっとだけ。
>同じように上がる
そうなるって確信できる理由を説明してくれる?前にも考えたことがあるけど、必ずそうなるわけじゃないと思うんだ。(色々な要素によるけど)そうなる可能性もあるとは思うけどね。
資本主義って、結局のところ、自由市場が長い目で見るとうまくバランスを取ってくれるって期待に基づいているんだよね。もしお金が増えたせいで需要が上がるだけなら、物価は上がるよ。供給が増えれば、物価の変動は少しは抑えられるけど、ほとんどの製品で物価の方が供給より動きやすいから、お金が増えても、ほとんどは物価が上がる方に使われちゃうんだ。 マジでそれな。だから、Twitterのレイオフとか、今回の“DOGE”の粛清ってマジでヤバいと思うんだよね(たとえ「無駄」を省くのが正当だとしても)。「役に立たない仕事をして、週に4通メール送って、あとはTikTok見てるだけ」みたいな?だから何?人が多すぎるし、本当に経済的な価値のある仕事なんて全然足りないんだよ。みんなが尊厳を持って、家族を養って、ある程度の生活水準を保てる方がずっと大事じゃん。企業にいたことある人ならわかると思うけど、役に立ってるか怪しい人ってマジでいっぱいいるし、“tech skills”持ってる人も例外じゃないから。 今って「ブルシット・ジョブ」だけじゃなくて、「ブルシット・エコノミー」でもあるよね。広告がないと売れないようなものばっかりじゃん。例えば、車持ってるなら10年とか20年乗れるのに、広告のせいで数年ごとに新しい車が欲しくなっちゃうんだよね。それが経済を回してるんだけど。車買って、古い車を新しいのが買えない人に売って、その車はアフリカとかに送られて修理されてまた使われるみたいな。でもアフリカの人が本当に必要だっただけで、他の人は別に車なくてもよかったんだよね。車産業ってめっちゃ大きいのに、広告禁止したら1/5くらいになっちゃうんじゃない?もう根本的に生き方を変えないとヤバいけど、金持ちとか影響力のある人が困るから、先送りしてるんだよね。数十年後には子供たちがマジで困ると思う。 自由な資本主義は、どっちがどっちかを見抜くのが得意だよね。Elon Muskの考え方の根本にもそれがあると思う。できるだけ多くの仕事を作って、何か悪い影響がないか見極める、みたいな。でも、政府の立場でそれをやっちゃうと、個人の損得だけじゃ済まないから、ちょっと違うよね。 エージェントAIのせいで、ホワイトカラーの仕事がマジでヤバくなると思うんだよね。だって、多くの仕事って、別にめっちゃ優秀な人じゃなくても「OK」なレベルでできるんだもん。平均的なAIが平均的な人間より使えるようになったら、一気に状況が変わると思う。 うちのCEOと今日話してたんだけど、大学卒業したばっかりの子たちが、AIがエントリーレベルの仕事できるって状況にどう対応するんだろうねって。ちょうど息子が大学に入るところだから、マジでタイムリーな話題なんだよね。Claudeに聞いてみたら、「私と一緒に働く方法を見つけるか、私ができない分野を選べ」って言われた。マジでフレックス。 LLMのハルシネーション(幻覚)をそんなに大問題だと思ってる人がいるのが不思議。人間と会ったことないのかな? OpenAIのDeep Researchの方が優秀な気がする。StackOverflowのめっちゃマイナーな投稿とか、ポーランド旅行の時に役立つ旅行wikiサイトとか見つけてくれたし。どうやってページを見つけてるかわからないけど、ただのGoogle検索より全然良い。 GrokのDeepSearchとDeeperSearchも結構良いよね。どうやって結果にたどり着いたのかもわかるし。OpenAIのがどうなってるのか知らないけど、Grokは複数回検索して、前の結果を元にどんどん絞り込んでいくみたい。 Elon Muskがマジで嫌いだから、Grokを公平に見れないんだよね。自覚してるけど、多分そんなに損はしてないと思う。 ナチスに対しては断固として許さない姿勢が、機能する社会には不可欠だよね。 言ってくれてありがとう。バーにナチスを一人でも入れると、すぐにナチスバーになっちゃうって話を聞いたことあるよ。 みんなをナチスって呼んでたら、ナチスバーしかなくなるよ。この前Teslaに乗ってるだけでナチスって言われたし、ユダヤ系の血筋なのに。もう意味わかんない。 Grokは技術的にはかなり優秀で、AIエージェントの選択肢としてニッチを埋めてると思う。でも、ナチスの敬礼をするような人がオーナーで、アメリカ政府を解体しようとしてる人のAIを使いたくないって気持ちもめっちゃわかる。 Kagi Assistantを使うと、LLMクエリで検索できるんだよね。今のところ、信頼できる結果が得られてる気がする。例えば、おすすめの製品を聞いてみたら、良い結果が出てきたよ。プレミアムサービスだけど、価値があると思う。 Google検索ってマジでクソだよね。Hacker Newsの人たちの間ではよく言われてるけど、そんなにひどい?プログラミングで使う分には、ドキュメントとかフォーラムとかでうまくいくけど。たまに個人のブログも出てくるし。地域によって検索結果って違うのかな? Google検索はクソ?ここをクリックして10個の理由を見つけよう!と、使うべき10個の理由! 「炊飯器は何を買うべき?」で検索したら、bonappetit.comとredditが上位に出てきて、どっちもZojirushiをおすすめしてたよ。 まずZojirushiは高すぎるし、掃除が面倒。色んな種類のご飯を炊きたいとか、特別な機能が必要ならおすすめするけど。Redditもスパムの万能薬じゃないしね。bonappetit.comはアフィリエイトリンクスパムの典型例だよ。予算重視の選択肢もひどいし。 Kagiで「炊飯器は何を買うべき?」って検索したらどんな結果になるんだろう?誰かKagiユーザーいたら教えて。 Anthropicすげーじゃん!発表してすぐみんなが使えるようにするとかマジ神。 >Web検索は、アメリカの有料Claudeユーザー向けの機能プレビューで利用可能になりました。無料プランのユーザーとその他の国へのサポートは近日公開予定です。 アメリカのプライバシー法がザルだから、最初にテック機能が使えるってのもあるんだろうなー。ハハ… >OpenAIはマジでイライラする。ロールアウトの時期を言うけど、全然守られないか間違ってるし。 OpenAIの発表って、業界の動きに合わせてるように見えるんだよね。Samはニュースとか世間の話題の中心にいたいだけで、発表したものがユーザーに提供できるかとか気にしてないんじゃない? 世間の話題の中心にいることが、今のOpenAIの強みだもんね。一般の人からすると、LLM作ってる会社=OpenAIってイメージだし。Samはそれを維持しないといけないからね。 「できるまでやったるわ!」って感じだよね。Samがそうする理由はわかるけど、それで市場が安心するってのが不思議。 世界中でリリースするまで待つと時間かかるじゃん?エンジニアリングの問題じゃなくて、コンプライアンスとか法律とかの問題で。とりあえず最小限の機能でリリースして、フィードバックもらってから他の国でリリースする方が早くない?何が問題なの? 提供する機能によっては、地域ごとのCSPに機能や容量が足りない場合があるから、世界中で安定して提供できないってこともあるかもね。OpenAIみたいな大企業は例外だと思うけど。 そっかー、でも俺が言いたかったのは、外部の出来事に対応して発表することなんだよね。お互いを出し抜いて、 hypeを作ろうとしてるのが見え見えじゃん。samaだけじゃないと思うけど、特にThielの考えの人たちは。 samaって広報担当として、よく大げさなこと言うじゃん。しかも曖昧で、安全とか企業秘密とかで内容見せてくれないし。VCが中心だった頃は投資家のfomoを煽るのが目的だったから、そういう文化が広まってたんだと思う。Teslaみたいな大企業もまだやってるし、まだ存在しない製品を売ったりしてるよね。samaの発言で、buzzを呼ぶためだけのホラだって思う具体例が欲しい?すぐ見つかるよ。 彼らがそうする理由はわかるけど、あえて嘘だと解釈してる。OpenAIがニュースに合わせて発表するけど、実際にはまだ動いてないっていうのが嫌なんだよね。Advanced Voiceのデモも、Googleから注目を奪うためだけだったと思うし。あれからだいぶ経つけど、デモで言ってたほど良くないじゃん。 >Web検索は、アメリカ在住の有料Claudeユーザー向けの機能プレビューで利用可能だって。 アメリカの有料ユーザー_限定_だって。ヨーロッパの俺は使えない。 アメリカ在住の有料ユーザーって言った方がわかりやすいよね。アメリカに住んでるけど、アメリカ合衆国が考える”アメリカ”じゃないから、まだこの新機能使えないんだ。 ”USA”の略語としてAmericaを使うのは、アメリカ在住の人だけじゃないでしょ。 VPN使ってアメリカに安全に短期滞在できないかな?Anthropicがどうやってジオロックしてるか分からないけど。 どの部分のこと?「United States」の部分を見逃してたから、元のコメントは修正済み。 俺のコードをパクって金儲けしてるのに、俺にはいつ金が入るんだ?一方的すぎるだろ、この話。 検索エンジンはBraveが提供してるみたいだよ。 BraveってBasic Attention Tokenがほぼ死んでるのに生き残るんだね。すごいピボットだ。 https://en.wikipedia.org/wiki/Brave_(web_browser)#Controvers… MCPプラグインをインストールして、好きな検索エンジンを使えば? 使わなきゃいいじゃん、それか自分で作れば? テストしたら盛大にハルシネーション起こしたわ。「Arrowサポート付きのPostgresにアクセスするRust crate」って聞いたら、架空のarrow-postgres crateを作り上げて、サンプルコードまで生成してた! 本当にweb検索した?web検索機能をオンにしないとダメだし、検索中はインターフェースもちょっと違うし、結果には見つけたサイトへのリンクも表示されるはずだよ。 その通り。LLMは従来の検索エンジンじゃないから、検索エンジンのように促すべきじゃない。「Arrowサポート付きのPostgresにアクセスするRust crate」と「Arrowサポート付きのPostgresにアクセスするRust crateってどんな感じ?」の違いは、言語モデルの観点からは大差ない。ツールを使いこなせない人がいるんだよね、そういう人はツールのせいにするからすぐわかる。 LLMはそうあるべきだし、実際そうなってると思う。検索フレーズで済むなら、わざわざ質問形式にする必要なくね?丁寧な言葉遣いは人間相手だから意味がある。システムプロンプトで「検索フレーズのようなクエリには、非会話的な口調で答える」みたいに指示しようかな。 めっちゃ同意。試してみたら全然違う結果になったよ。 “プロンプティング”って正直言って迷信だよね。OPのバージョンと、ちゃんとした文章で言うのとで、どれだけ影響がある?キーワードが重要なんじゃないかな。 それ違うんじゃない?キーワードだけじゃ意味ないんだよね。Transformerモデルにとって重要なのは単語同士の関係性なんだって。モデルはプロンプトに対して、文脈に合った意味のある答えを出そうとするから、文脈をちゃんと与えてあげないとダメだよ。短い文とか、バラバラのキーワードだけじゃ、思った通りの結果にならないかもね。「I’m feeling lucky」と「Attention is all you need」は相性悪いってこと。 最初にコンテキストと詳細をしっかり伝えると、うまくいくことが多い気がする。ある程度コンテキストが分かれば、あとは短い言葉や命令で指示できるかな。 質問をそのまま答えの冒頭で繰り返すみたいな、オウム返しが多い気がするんだよね。もし注意しないと、質問の中でXを仮定してると、LLMもXが正しいと思い込んじゃうことがある。ChatGPTはウェブ検索で改善されてきてるけど。Claudeで良い結果を得るには、情報源へのリンク付きで答えを求めるのが良い。でも、ソースにないことを勝手に作り上げちゃうこともあるんだよね。 それはそうだね。ここで重要なのは、必要なコンテキストが全部与えられてることだと思う。もし既存の問題で例外的なケースを説明する必要があるなら、コンテキストウィンドウにはその例外ケースも定義する必要があるよね。 ローカルのLLMを使う上で一番の問題は、大手さんのサービスに比べてコンテキストサイズが限られてることだよね。 これって本当かな?Claudeとかが「お助けアシスタント」としてプロンプトされてるからじゃない?もし生のLLMにGoogle検索みたいに入力したら、ただの物語として続きを書くだけかもしれないよ。 プロンプトは重要だよ。プロンプトの言葉はめっちゃ大事。 面白いことに、検索エンジンに質問をフルセンテンスで入力する人も多いよね。それは年配の人とか、コンピューターに慣れてない人によくあること。俺みたいなギークは、常に必要最低限のものを理解しようとするんだよね(少なくとも仕事では。みんな楽しんでることは最適化しないといいな)。 若いとか年寄りとか関係なく、検索エンジンは純粋なキーワード検索から離れて、クエリをそのまま入力した方が良い結果が得られることが多いよ。特にGoogleはね。 それがみんなが検索結果を嫌う理由かもね。キーワード検索からフルセンテンス検索に変わったけど、多くの人がその変化についていけてないんだ。もっとコメントを表示(1)
マジでクソだよ。
NikeとかStarbucksのサイト?一位確定。
製品とかカテゴリとか、例えば「炊飯器は何を買うべき?」とか、アフィリエイトスパムだらけ。だからみんな「+reddit」って検索するんだよね。もっとコメントを表示(2)
OpenAIはマジでイライラする。ロールアウトの時期を言うけど、全然守られないか間違ってるし。
Edit:みんな=有料ユーザーね。無料ティアとか興味ないから。AnthropicとOpenAI両方の有料ユーザーからすると、ロールアウトの違いがマジで気になる。
Edit2:アメリカ目線ですまん。
エンジニアには同情するわ。営業とかマーケティングとか商品企画が勝手に突っ走って、エンジニアが間に合わない理由を説明する羽目になるんだよな。コード書いてる人が責められるとかマジ勘弁。
有料ユーザーなら誰でも使えるんだってさ。OpenAIは展開が遅いんだよね。両方課金してるけど、OpenAIの新機能は試すの忘れちゃうこと多いもん。たまに即日だけど、展開にかかる時間はバラバラ。
https://simonwillison.net/2025/Mar/21/anthropic-use-brave/
・BraveはAnthropic Trust Center portalのサブプロセッサとしてリストされてる。
・ClaudeとBraveの”interesting pelican facts”の検索結果は完全に一致。
・Claudeにweb_search toolの定義を聞くと、プロパティの一つに”BraveSearchParams”ってのがある。もっとコメントを表示(3)
不満があるなら、文句言う前にまず解決策を考えてみな。
「ベテランのソフトウェアエンジニアとして、経験の浅いエンジニアにアドバイスするつもりで答えて。Apache Arrowサポート付きのPostgreSQLにアクセスするRust crateを探してるんだけど、どうすればいい?メリットとデメリットは?」
今回のプロンプトの問題点は、文章が完全じゃないってことじゃなくて、正確じゃないってことだと思う。「rust」って言っても、プログラミング言語じゃなくて金属の腐食のことかもしれないじゃん。そこに矢印があって…。ほとんど情報がない状態で、思った通りに動かないって文句言うのは無理があるよ。