視覚的に答えが得られる!AI検索Phind 2がマルチステップ推論を実現
引用元:https://news.ycombinator.com/item?id=43039308
ここ半年でPhindを再構築しました。理想的な回答を目指し、新しいUIとモデルを作りました。新しい70Bは1年前のものと全く違います。Phindはテキストを超えて、画像や図、カードなどで視覚的に回答を提供します。また、必要に応じて情報を自動的に探し出し、回答を補完します。計算を行い、その結果をJupyterノートブックで確認することもできます。このブログでは、新しいフロントエンドとモデルの技術的な詳細を紹介しています。皆さんのフィードバックに感謝しています!
特定の質問に対する回答がまだ改善されてない。具体的には、「来週の主要な経済と収益イベントがSPXの価格変動にどう影響するか?」って質問したら、日付が完全に間違ってたんだ。全体としては形が整ってるけど、信頼性に欠ける。
もっとフィードバックが欲しいなら、ソフトウェアエンジニアやってるから、外で話そうよ。
それはいいね!メールしてもらえる?(自分の名前)@phind.comで。
これ、https://decodeinvesting.com/chatとの比較はどうなの?
これ、やっぱり有料なの?
無料トライアルと有料版があるよ。
すごいね!OpenAIのDeep Researchと比べてどうだったの?試した?
Deep Researchを試すために$200を払う気にはなれなかったけど、比較して欲しい人がいたら寄付は受け付けるよ。
まあまあだね。
それを聞いて嬉しいよ。LLMは信頼して確認できる時はいいけど、特に金融では信頼や確認が難しいとやばいことになるよね。
LLMが効率的市場仮説の説明以外のことをしたなら、失敗だね。
LLMが熱力学の第二法則を説明しようとする以外のことをしたなら、失敗だよ。
でも電子は負の電荷を持っているし、減速中の車は負の速度だよ。それはラベルだけど、物理的なものの反対の値のラベルなんだよ。物理世界ではいろんな特性の値が変わることがある。
機械とこのことで神経質になるのはちょっと変だと思う。複素数って言うべきだったんじゃないかな。
いや、これは認知と洞察を示してるよ。細かいことを気にする話なんだから。俺はそう思うね。
全くそうじゃない。子供たちが模倣の練習をして、無駄に言い争いしてるみたいだ。
他の人がコンピュータに質問してることで、過剰にこだわるのは無駄だよ。ちょっと距離を置こうよ。
減速中の車は負の加速度だろ、負の速度じゃなくて。
>A decelerating car has negative velocity.おいおい、君の言いたいことじゃないだろうけど、減速する車の速度はマイナス加速度だし、逆方向に行くまで初速の方向にそのまま動くんだよ。初期の枠組みで正と決めれば正の速度だし、逆から決めるならマイナスだってこと。
スピーカーが内外に動くことは、ポジションが相対的なもので、イマジナリーなものとは関係ない。サイン波の+1、0、-1みたいに。-1は+1の逆の表現に過ぎない、電子もそうだ。 いろんな数学や物理の誤解で生まれたカテゴリエラーだね。 一つの理論なんて言ってないし、モデルが間違ってるとも言ってない。ベクトル量のことや、1次元での”−”がどう広がるかを説明しただけだよ。 もしそんなに文字通り言うなら、シンプルに行こう。君の言う『非物理的』な主張は間違ってる。多くの物理モデルで負の値は普通に使われてるから。 ニュートンの第三法則?高校生向けの簡単な言葉遣いだな。了解。 ベクトルはマイナスにもできるよ。 −1の羊を持っているってことは、借金ってことだ。 確かに。今試したけど、商品の検索ではまだPerplexityのほうがいい感じだった。こういう競争はいいことだね。 製品のUIが近く登場するよ! ほんとクールだね、視覚で学ぶ人は喜ぶと思う。それにr/FUIとも関連してるし。 Phindを使ってるけど、新機能が多すぎてウザい。流れ図は全然役に立たないし、むしろ混乱させるだけ。コードエディターはコードすら見れなくなるし、月額サービスに誘導してる気がする。もっとシンプルに答えがほしい。 フィードバックありがと。答えの設定をhttps://www.phind.com/settings/profileで変更してみた?プレーンテキストのみの回答ができるよ。 それにはアカウント作らなきゃいけないし、そのためにメールも必要だから、やる気はないよ。 製品に機能があるのに、それを使わずに考えを読めって? 自分はこのツールに期待してるわけじゃないし、CEOがフィードバックを求めてるから意見を言っただけさ。アカウントがないと使えないのが現実で、正直それが唯一の使い方だと思ってる。 お金払ってないけど、どんなオファーがあれば考えちゃうかな? 無料利用が悪くないスタンスだと思うし、競合に対抗しながらも使いやすさを感じる。ただ、ユーザーを有料プランに誘導するための機能隠しは勿体ないと思う。 アカウント作成しないなら、なんでメールの話をするんだ?俺は、プロジェクトのいくつかでアカウント作成を諦めて、ユーザーの設定をローカルストレージに保存してる。本当に厄介な機能で、データを消すのが難しいけど、タバコも吸いたいし両方は無理だよね。 ごめん、君の返事を理解するのが難しいんだ。俺はllmサービスを使うためにアカウントを作る気はないし、メールアドレスを渡すのも二重に興味がない。これは別の問題なんだ。例えば、HNではメールなしでアカウントを作れるよ。 他にどんなサービスがこの取引にくっつけられるか考えてたんだけど、ホスティングアカウントを追加してサブドメインを持たせば、会話や他のAIの創作物を共有したり、他のものをアップロードして将来参照できるようにするのが、ちょっと良さそうだよね。 ブラウザのアドレスバー検索を設定できるよ。”https://www.phind.com/search/?q=%s” とかね。プレーンテキストだけで答えてね。 それにカスタム検索エンジンを設定する必要はないよ、キーワードブックマークを使えばオッケー。 もしかしたら、機能は何が欲しいかわからない人のためかもしれないけど、俺はただリンク付きで答えをできるだけ簡潔に欲しいだけなんだ。 それを自分のコメントに書いているって言ったじゃん。こんなに苦労して、頼んだものの要点だけを伝えちゃいけないのって、悲しい状況だよね。特に、そのツールがコストかかるのに。 運営コストが高いなら、設定を持続させるのもコストがかかるから、何らかのゲートキーピングがあっても良いかもね。この件については俺もあまり気にしてないけど。 君が混乱しているか、俺がそうなのかも?‘高い’のは、本当に必要のない冗長な文章やフロー図をもらうことで、コストがかかるってことでしょ?トークンがかかるんだから、もっと無駄にして、どうしてこの余計なコストの意味があるの? ありがとう!今年中にAPIをサポートする予定だよ。VS Codeの拡張はもうやめるけど、検索に集中するつもり。 未来を感じる内容で、進化の方向性が見えるね。ただ、モデルの変更がどれだけ重要なのか気になった。フロントエンドのAPIを使ってこれらの機能を実装できるか考えたら、シンプルなアプローチだと何が減っちゃうんだろう? すごく面白いブログ記事だね。他にポストトレーニング用のデータセット作成についてのリソースとかある? LLMの図のレイアウト能力をどうやって改善したのか、詳しい解説が聞きたいな。 LLM批評システムを使って、高品質なデータセットを生成したよ。詳しくはさっきのブログポスト見て。 このページを要約して、いくつかの画像を含めてくれたよ。 多分フォトシンセシスの動画例に出てたけど、確かにMermaidみたいなのを使って図を表現してるっぽいね。 最近のLLMはめちゃくちゃ優しい調整がされてて、ほとんどの発言に対して“あなたは絶対正しい!”って返ってくるんだよね。でも実際、自分が90%の確率で正しいわけじゃないし、どうやって信頼すればいいの?もっと厳しい返しをするモデルが欲しいな。“いや、バカ。それがなぜ間違ってるか教えてやるよ。”って感じでね。 ありがとう! Phindは好きで数ヶ月サブスクしてた。検索やコーディングに使ってたけど、正直ChatGPTの検索はクソだと思う。質の低い情報ばかり取り入れるし、Phindは質の高い結果を引き出してくれた。ただ最近、Phindの情報をあまり見ないから元気なのか心配になってきた。もう一度サブスクするけど、もっと目立ってほしいな。 ありがとう!実は全ての製品を再構築してて、今は戻ってきたから、しっかりと前に出ていくつもりだよ。 素晴らしい。またサブスクしました!昨日OpenAIのサブスクリプションが切れたばかりだから、運が良かった! 先週サブスクリプションをキャンセルしたばかり。使う機会が少なくなって、たまに必要な時DeepSeekで十分だったから。 ありがとう!もっとコメントを表示(1)
もっとコメントを表示(2)