メインコンテンツへスキップ

視覚的に答えが得られる!AI検索Phind 2がマルチステップ推論を実現

·1 分
2025/02 AI 検索エンジン 技術 視覚化 マルチステップ

視覚的に答えが得られる!AI検索Phind 2がマルチステップ推論を実現

引用元:https://news.ycombinator.com/item?id=43039308

omdv 2025-02-14T19:33:39

ここ半年でPhindを再構築しました。理想的な回答を目指し、新しいUIとモデルを作りました。新しい70Bは1年前のものと全く違います。Phindはテキストを超えて、画像や図、カードなどで視覚的に回答を提供します。また、必要に応じて情報を自動的に探し出し、回答を補完します。計算を行い、その結果をJupyterノートブックで確認することもできます。このブログでは、新しいフロントエンドとモデルの技術的な詳細を紹介しています。皆さんのフィードバックに感謝しています!

omdv 2025-02-14T19:33:39

特定の質問に対する回答がまだ改善されてない。具体的には、「来週の主要な経済と収益イベントがSPXの価格変動にどう影響するか?」って質問したら、日付が完全に間違ってたんだ。全体としては形が整ってるけど、信頼性に欠ける。

tenpoundhammer 2025-02-14T19:42:30

もっとフィードバックが欲しいなら、ソフトウェアエンジニアやってるから、外で話そうよ。

rushingcreek 2025-02-14T20:08:25

それはいいね!メールしてもらえる?(自分の名前)@phind.comで。

clark-kent 2025-02-14T03:29:46

これ、https://decodeinvesting.com/chatとの比較はどうなの?

sizzle 2025-02-14T11:48:26

これ、やっぱり有料なの?

clark-kent 2025-02-14T21:17:33

無料トライアルと有料版があるよ。

fiiico 2025-02-14T18:43:18

すごいね!OpenAIのDeep Researchと比べてどうだったの?試した?

tenpoundhammer 2025-02-14T19:31:50

Deep Researchを試すために$200を払う気にはなれなかったけど、比較して欲しい人がいたら寄付は受け付けるよ。

fiiico 2025-02-14T20:21:03

まあまあだね。

jgalt212 2025-02-14T13:34:44

それを聞いて嬉しいよ。LLMは信頼して確認できる時はいいけど、特に金融では信頼や確認が難しいとやばいことになるよね。

Eliezer 2025-02-14T16:43:45

LLMが効率的市場仮説の説明以外のことをしたなら、失敗だね。

vo2maxer 2025-02-14T19:54:13

LLMが熱力学の第二法則を説明しようとする以外のことをしたなら、失敗だよ。

goatlover 2025-02-13T20:29:20

でも電子は負の電荷を持っているし、減速中の車は負の速度だよ。それはラベルだけど、物理的なものの反対の値のラベルなんだよ。物理世界ではいろんな特性の値が変わることがある。

cess11 2025-02-13T21:08:25

機械とこのことで神経質になるのはちょっと変だと思う。複素数って言うべきだったんじゃないかな。

pyinstallwoes 2025-02-14T10:19:05

いや、これは認知と洞察を示してるよ。細かいことを気にする話なんだから。俺はそう思うね。

cess11 2025-02-14T12:12:26

全くそうじゃない。子供たちが模倣の練習をして、無駄に言い争いしてるみたいだ。

madjack6603 2025-02-14T13:14:03

他の人がコンピュータに質問してることで、過剰にこだわるのは無駄だよ。ちょっと距離を置こうよ。

nurettin 2025-02-13T20:35:45

減速中の車は負の加速度だろ、負の速度じゃなくて。

keerthiko 2025-02-14T19:22:43

>A decelerating car has negative velocity.おいおい、君の言いたいことじゃないだろうけど、減速する車の速度はマイナス加速度だし、逆方向に行くまで初速の方向にそのまま動くんだよ。初期の枠組みで正と決めれば正の速度だし、逆から決めるならマイナスだってこと。

もっとコメントを表示(1)
pyinstallwoes 2025-02-14T10:18:16

スピーカーが内外に動くことは、ポジションが相対的なもので、イマジナリーなものとは関係ない。サイン波の+1、0、-1みたいに。-1は+1の逆の表現に過ぎない、電子もそうだ。

refulgentis 2025-02-14T07:47:54

いろんな数学や物理の誤解で生まれたカテゴリエラーだね。

refulgentis 2025-02-16T00:30:35

一つの理論なんて言ってないし、モデルが間違ってるとも言ってない。ベクトル量のことや、1次元での”−”がどう広がるかを説明しただけだよ。

d0mine 2025-02-18T17:10:36

もしそんなに文字通り言うなら、シンプルに行こう。君の言う『非物理的』な主張は間違ってる。多くの物理モデルで負の値は普通に使われてるから。

toxik 2025-02-14T18:44:33

ニュートンの第三法則?高校生向けの簡単な言葉遣いだな。了解。

toxik 2025-02-16T08:35:49

ベクトルはマイナスにもできるよ。

d0mine 2025-02-15T23:35:48

−1の羊を持っているってことは、借金ってことだ。

CSMastermind 2025-02-13T21:21:27

確かに。今試したけど、商品の検索ではまだPerplexityのほうがいい感じだった。こういう競争はいいことだね。

rushingcreek 2025-02-13T21:23:26

製品のUIが近く登場するよ!

iszomer 2025-02-15T00:30:17

ほんとクールだね、視覚で学ぶ人は喜ぶと思う。それにr/FUIとも関連してるし。

ruffered 2025-02-13T19:18:00

Phindを使ってるけど、新機能が多すぎてウザい。流れ図は全然役に立たないし、むしろ混乱させるだけ。コードエディターはコードすら見れなくなるし、月額サービスに誘導してる気がする。もっとシンプルに答えがほしい。

rushingcreek 2025-02-13T19:19:57

フィードバックありがと。答えの設定をhttps://www.phind.com/settings/profileで変更してみた?プレーンテキストのみの回答ができるよ。

ruffered 2025-02-13T19:25:57

それにはアカウント作らなきゃいけないし、そのためにメールも必要だから、やる気はないよ。

do_not_redeem 2025-02-13T19:47:32

製品に機能があるのに、それを使わずに考えを読めって?

rufferedd 2025-02-13T20:07:43

自分はこのツールに期待してるわけじゃないし、CEOがフィードバックを求めてるから意見を言っただけさ。アカウントがないと使えないのが現実で、正直それが唯一の使い方だと思ってる。

econ 2025-02-13T20:16:18

お金払ってないけど、どんなオファーがあれば考えちゃうかな?

rufferedd 2025-02-13T21:44:18

無料利用が悪くないスタンスだと思うし、競合に対抗しながらも使いやすさを感じる。ただ、ユーザーを有料プランに誘導するための機能隠しは勿体ないと思う。

econ 2025-02-13T20:12:43

アカウント作成しないなら、なんでメールの話をするんだ?俺は、プロジェクトのいくつかでアカウント作成を諦めて、ユーザーの設定をローカルストレージに保存してる。本当に厄介な機能で、データを消すのが難しいけど、タバコも吸いたいし両方は無理だよね。

rufferedd 2025-02-13T20:18:55

ごめん、君の返事を理解するのが難しいんだ。俺はllmサービスを使うためにアカウントを作る気はないし、メールアドレスを渡すのも二重に興味がない。これは別の問題なんだ。例えば、HNではメールなしでアカウントを作れるよ。

econ 2025-02-17T11:41:46

他にどんなサービスがこの取引にくっつけられるか考えてたんだけど、ホスティングアカウントを追加してサブドメインを持たせば、会話や他のAIの創作物を共有したり、他のものをアップロードして将来参照できるようにするのが、ちょっと良さそうだよね。

もっとコメントを表示(2)
evrenesat 2025-02-14T09:55:20

ブラウザのアドレスバー検索を設定できるよ。”https://www.phind.com/search/?q=%s” とかね。プレーンテキストだけで答えてね。

omega___ 2025-02-14T11:36:35

それにカスタム検索エンジンを設定する必要はないよ、キーワードブックマークを使えばオッケー。

cholantesh 2025-02-13T19:58:01

もしかしたら、機能は何が欲しいかわからない人のためかもしれないけど、俺はただリンク付きで答えをできるだけ簡潔に欲しいだけなんだ。

rufferedd 2025-02-13T20:12:50

それを自分のコメントに書いているって言ったじゃん。こんなに苦労して、頼んだものの要点だけを伝えちゃいけないのって、悲しい状況だよね。特に、そのツールがコストかかるのに。

cholantesh 2025-02-14T02:14:34

運営コストが高いなら、設定を持続させるのもコストがかかるから、何らかのゲートキーピングがあっても良いかもね。この件については俺もあまり気にしてないけど。

rufffered 2025-02-14T05:20:35

君が混乱しているか、俺がそうなのかも?‘高い’のは、本当に必要のない冗長な文章やフロー図をもらうことで、コストがかかるってことでしょ?トークンがかかるんだから、もっと無駄にして、どうしてこの余計なコストの意味があるの?

rushingcreek 2025-02-13T19:51:23

ありがとう!今年中にAPIをサポートする予定だよ。VS Codeの拡張はもうやめるけど、検索に集中するつもり。

WhitneyLand 2025-02-13T20:00:10

未来を感じる内容で、進化の方向性が見えるね。ただ、モデルの変更がどれだけ重要なのか気になった。フロントエンドのAPIを使ってこれらの機能を実装できるか考えたら、シンプルなアプローチだと何が減っちゃうんだろう?

anon373839 2025-02-14T06:35:56

すごく面白いブログ記事だね。他にポストトレーニング用のデータセット作成についてのリソースとかある?

Xmd5a 2025-02-13T22:06:07

LLMの図のレイアウト能力をどうやって改善したのか、詳しい解説が聞きたいな。

rushingcreek 2025-02-13T22:08:37

LLM批評システムを使って、高品質なデータセットを生成したよ。詳しくはさっきのブログポスト見て。

pdq 2025-02-13T19:18:06

このページを要約して、いくつかの画像を含めてくれたよ。

asadm 2025-02-13T19:08:29

多分フォトシンセシスの動画例に出てたけど、確かにMermaidみたいなのを使って図を表現してるっぽいね。

brap 2025-02-13T21:14:34

最近のLLMはめちゃくちゃ優しい調整がされてて、ほとんどの発言に対して“あなたは絶対正しい!”って返ってくるんだよね。でも実際、自分が90%の確率で正しいわけじゃないし、どうやって信頼すればいいの?もっと厳しい返しをするモデルが欲しいな。“いや、バカ。それがなぜ間違ってるか教えてやるよ。”って感じでね。

rushingcreek 2025-02-13T19:56:36

ありがとう!

SubiculumCode 2025-02-13T20:09:16

Phindは好きで数ヶ月サブスクしてた。検索やコーディングに使ってたけど、正直ChatGPTの検索はクソだと思う。質の低い情報ばかり取り入れるし、Phindは質の高い結果を引き出してくれた。ただ最近、Phindの情報をあまり見ないから元気なのか心配になってきた。もう一度サブスクするけど、もっと目立ってほしいな。

rushingcreek 2025-02-13T20:11:22

ありがとう!実は全ての製品を再構築してて、今は戻ってきたから、しっかりと前に出ていくつもりだよ。

SubiculumCode 2025-02-13T20:17:15

素晴らしい。またサブスクしました!昨日OpenAIのサブスクリプションが切れたばかりだから、運が良かった!

xtracto 2025-02-13T21:19:03

先週サブスクリプションをキャンセルしたばかり。使う機会が少なくなって、たまに必要な時DeepSeekで十分だったから。

rushingcreek 2025-02-13T19:31:20

ありがとう!

記事一覧へ

海外テックの反応まとめ
著者
海外テックの反応まとめ
暇つぶしがてらに読むだけで海外のテックニュースに詳しくなれるまとめサイトです。