衝撃!AIベンチャー創業者、詐欺で訴追!AIアプリの裏側はフィリピンの労働者だった!?
引用元:https://news.ycombinator.com/item?id=43648950
これって2年前の記事[0]と、それに対する俺のHNのコメントを思い出すなー。またしてもAIスタートアップのよくあるパターンじゃん?
1) 誰かがML/AIで解決できそうな面白い問題を見つける。
2) 「おっ!モデル、なんか動いてるじゃん。これ、他の人もお金払ってくれるんじゃね?」
3) 有料APIとかSaaSスタートアップとか始める。
4) モデルが全然汎用性ないことに気づく。評判が大事だから、人間雇ってヤバいエッジケースを手直しさせる。「これでモデルも学習できるし!」とか思ってる。
5) やべっ、モデル全然ダメじゃん。人間の手作業がワークフローの大部分占めてる。
6) 誰かが、安い労働力使ってるって記事書く。
[0] https://news.ycombinator.com/item?id=37405450
>5) Uh-oh, the model is underperforming, and the human worker pipeline is now some significant part of the full workflow.”
AIって、つまり“Actually, Indians”ってこと。
新しいSiriの失敗についての記事を読んでて、この言葉が頭に残ったわ。
>AppleのAI/MLグループは、内部で“AIMLess”って呼ばれてるらしい。
記事:https://www.macrumors.com/2025/04/10/chaos-behind-siri-revea…
これ、俺が関わったいくつかのプロジェクトでジョークになってたんだけど、毎回なぜか独立して発生してるんだよね。俺からは言わないけど、いつも面白いと思ってる。
ある種の皮肉なユーモアで、真実と嘘を同時に暴き出すような、ちょっとだけポリティカルインコレクトな感じが受けるんだよね。
AIプロジェクトを潰した回数なんて数え切れないよ。実際は労働力を使ってAIをシミュレートして、AIで人間を置き換えるための訓練データを作るって計画だったんだ。誤解しないで欲しいんだけど、場合によっては悪い考えじゃないけど、最初から詐欺をするのはダメでしょ。まあ、できるけど。やめとけって。
https://arstechnica.com/gadgets/2024/04/amazon-ends-ai-power…
マジかよ、Amazon Freshの裏事情。そりゃそうだわ。タグ付けとかで解決してると思ってたのに。
そっかー、そりゃそうだよなー。Scale AIがフィリピンにいっぱい人抱えてるって記事読んだことあったわ…
俺はいつも“Almost Implemented”だと思ってた。
もっと優しく言うなら“Always Improving”かな。
AGI == A Guy Instead。
AGI == A Grand Illusion
それか、MT→Mechanical Turkに変えるべきじゃね?「うちの最先端AI/MTアプリ…」って言えば、全然悪くない感じじゃん。
一般の人をごまかせるかもしれないけど、「Mechanical Turk」って言葉が出た瞬間、「これって人間がやってるの?」って思う人もいるよね。
それに、そんなんでVCマネーは絶対もらえないっしょ。
Amazonのすごいハイテク「カートに全部入れて、そのまま歩いて帰る」やつも言及する価値あるよね((( https://www.businessinsider.com/amazons-just-walk-out-actual… )))。
あれも100%このAI「Actually Indians」技術使ってるって。
Destinyファン?
ネットおめでとう、あなた。
>ネットおめでとう、あなた。
え、マジで?人のジョークを繰り返しただけで、ネットポイントがもらえるの?
Slashdotの言い回しを使ったから低評価?最近見ないよね。たまには使って、思い出として残したいじゃん。
ごめん。
こういうレベルだと評判が超大事だから、人間雇ってヤバいエッジケースを拾って直すんだよね。一番重要なのは、失敗を認めること。プロダクトが完璧じゃない時もあるじゃん。自動化率で投資家を騙すのは、潔く負けを認めるよりずっと評判が悪くなるって。
マジでどの創業者の話も、その理論を否定してるじゃん。 訂正させて。株主を騙すのは、損するまではOK。損し始めたら、失敗を認めるよりヤバい。 Theranosだって、もし上手くいってたら天才創業者としてもてはやされてたと思うよ。でも金にならなかったから刑務所行きじゃん。 >Theranosだって、もし上手くいってたら天才創業者としてもてはやされてたと思うよ。でも金にならなかったから刑務所行きじゃん。” 投資家を騙して上手くいってる創業者の例って何かある?テック企業は、とんでもない額の金をオープンに損してるじゃん。OpenAIは去年37億ドルの収入で50億ドル損したのに、3000億ドルの会社ってマジ? ごめん、あんたがマジ正しかったわ。例えば、Sam Altmanは役員会とか投資家とのコミュニケーションで率直じゃなかった。そのせいでOpenAIのCEOをクビになって、今は貧困の中で悲惨な生活を送ってる。 ってことは、道徳的動機は「金持ちになるために、投資家やクライアントを騙し、インテリジェントな機械があると主張して、低賃金の肉体労働を利用するのは正しい」に変わるの?数千万ドル規模の話じゃん(笑)。裸の王様が靴下脱いで、ちょっと不格好なセクシーダンスを始めた感じ。 スタートアップは成功するまで嘘をつくのが当たり前って感じだよね。Theranosと変わんない。 成功って何?独占?IPO?エグジットして誰かにババを引かせること?マジありえない。 それってUberとかTesla、Amazon Goと同じじゃん? めっちゃ補助金もらってるだけだろ!国防関係の業者か、政府機関みたいなもんだと思えばいいんだよ! AIの範囲について曖昧なこと言ってたら、詐欺だって証明するの難しくない?もし慎重に進めてたらだけど。「AIが関わってる」って言っても、AIの割合が1%でもいいわけだし。政府が(民事じゃなくて)刑事のwire fraudを選んだのがマジで謎。そっちの方が立証責任が軽いのに。政府の弁護士って、わざわざ自分の仕事難しくしないはずじゃん。 DOJのプレスリリース見ればわかるけど、かなり明示的なこと言ってたらしいよ。 投資家に対して自動化率93-97%って言っておきながら、実際は「ほぼ0%」って幹部が言ってるんだから、そりゃヤバいでしょ。 どう定義するかだよね?C++で「Hello World」書いたら、コンパイルとかリンクとかアセンブリコード生成のめんどい部分はコンピュータがやってくれるって言えるから、プログラミングは90%自動化されてるって言えなくもない。でも普通は自動化レベル0%って思うよね? 法律はエンジニアリングとは違うんだよ。弁護士とか裁判官とか陪審員は、法律の意図を理解してて、ソフトウェアエンジニアみたいに目の前の命令に縛られない。 >Lawyers, judges and juries understand the intent of the law, and are not bound like we software engineers are to the exact commands in front of them. もし「ほとんどの人が自動化レベル0%だと思う」なら、そうじゃないって表現しちゃダメでしょ。もし違う意味で使いたいなら、ちゃんと説明しないと。 勘に頼っちゃダメなのよ。その分野に詳しくないと勘は働かないから。あなたも私も、この金融分野で何が人間がやるべきで、何が機械に任せられるかなんて全然わかんないでしょ。 スーパーのセルフレジで、手の動きをCCTV映像から解析されて万引き犯だって疑われちゃったんだよね(もちろん誤り)。店を出てから、これって本当にソフトの分析?それともインドかフィリピンの人がライブ映像を見てるだけなんじゃないかって思った。 前にいた会社で評価してたシステムなら、たぶん本物のマシンビジョンシステムだよ。店の棚の商品をカメラで追跡して、客の動きに合わせて在庫レベルを調整するんだ。それに、会計時の質量変化を追跡して、ラベルのすり替え詐欺とかをチェックするんだって。 Perceptaっていう会社が、この分野でCV/MLを使って万引きの兆候を探してたんだ。ADT Businessに買収される前に、何社か顧客もいたみたい。万引き犯はセルフレジで高額商品をバナナのPLUでごまかすことが多いから、あなたが本当にバナナを買ってるか確認したかったんだと思うよ。 一時期、スーパーがセルフレジの抜き打ちチェックをよくやってたんだよね。最近は全然ないけど。いつもランダムな感じで、Krogerが「スキャンしながら買い物」のトライアルをやってた時期と重なってた気がする。 セルフレジでの損失が、レジ係や袋詰めスタッフを雇うコストより安ければ、スーパーは満足なんだよ。 レジ係だって盗むことあるしね(友達にレジを通さなかったり、在庫ロスとか)。 スキャンしながら買い物って、結構厳しくチェックされるみたいで、それだと意味ないんだよね。結局、時間かかっちゃうし。俺が試したときは、6回のうち4回くらい、セルフレジや普通のレジより遅かったよ。 よくスキャンしながら買い物するんだけど、監査のパターンに気づいたんだ。商品を途中で気が変わってカゴから出したり、玉ねぎを1個だけ入れたりすると、ほぼ毎回監査される。監査の前に「何かスキャンで問題ありましたか?」って聞いてくるのがおもしろくて、これは明らかに「42インチのテレビがカゴに入ってないけど、スキャンで問題あったって言ってもいいよ」っていう免罪符だよね。 フランスのMonoprixっていうスーパーで、月に1回くらいランダムに監査されるんだよね。時間が節約できると思って並んでるのに、店員を探さないといけないからマジでイライラする。 無精髭でパーカーを着てるときはよく監査されて、スポーツジャケットを着てるときはほとんどされないことに気づいた… 最近、近所のスーパーのセルフレジで毎回チェックが入るんだよね。ふと思ったんだけど、店員さんがスキャンしてくれる時はリスクなんてなかったのに。今は自分でレジ打ちして、ミスったら刑務所行きってマジ?未来ヤバくね? ベルギーのAlbert Hijnだと、半分くらいの確率で監査されるんだよね。まあ、すぐ終わるから気にしないけど、ちょっと頻度が高すぎない? オレがオランダのAHでセルフレジ使う時は、波がある気がするんだよね。しばらく毎回チェックされたり、全然チェックされなかったり。ただの気のせいかもだけど、ちょっと記録してみようかな。 会員制じゃない店なら、そんなの断ってOKっしょ。支払い終わったら、もうこっちのもんだし。監視したいなら、セルフレジやめて店員配置しろって話。 近所のスーパーのセルフレジで、店員が忙しいとワインのセキュリティタグを自分で外すなって文句言われるんだよね。こっちのワインじゃん! アメリカのほとんどの州では通用しないよ。店には「Shopkeepers privilege(商店主特権)」ってのがあって、君を拘束したり、商品を確保したりできるんだ。州によっては「盗もうとしてるって合理的に信じる」だけでOK。オレの州だと、警察が来るまで拘束できる。貧困地区のWalmartはめっちゃ厳しいから気を付けて。裕福な地域なら拒否すれば見逃してくれる可能性が高いけどね。抵抗して怪我させたら刑務所行きだよ。 PLUって何? 友達が数年レジ係やってて、PLU(Price Look Up)を全部覚えてたんだ。「あ、それは3072ね」みたいな。 “Price Look-Up“の略で、商品につけられた4桁のコードのことだよ。野菜とか果物とか。 アメリカ以外の国が存在しないと思いの? もっとフルーツとか野菜を食べた方がいいんじゃない? Circle Kでセルフレジを使うと、カメラが商品を全部認識して合計金額を計算してくれるんだよね。AI、つまり“All Indians”がやってるんじゃないかっていつも思ってる。OCRのATMで小切手を処理するのも同じ。 参考:UniqloのセルフレジはRFIDタグを使ってて、ユーザーエクスペリエンスが最高。 Uniqloのセルフレジはマジで魔法みたい!技術的には仕組みは理解できるんだけど、使うたびに感動するんだよね。本当に良く出来てる。 Decathlonも似たようなシステムを使ってるよ。 Decathlonで買い物するたびに魔法みたいに感じる。 RFIDが流行った時、買い物してそのまま歩いて出たら自動でスキャンされて会計されるっていうアイデアがあったよね。スーパーじゃ難しいけど、自社製品だけ扱う店ならタグを組み込める。 Teslaの自動運転って、中国の人がレーシングゲームみたいに運転してるんじゃないかって長年思ってる。グラフィックもゲームみたいにして、仕事内容を隠してるのかも。 ベガスで、リモートで運転手が運転してくれるレンタカー会社があるよ。AIなんていらない。 遅延があると危なくない? 血中アルコール濃度が0.08(アメリカの法的制限値)だと、ドライバーの反応時間は60-120ms遅れるだけだけど、事故のリスクは飲んでない時に比べて10倍になるんだって。反応速度が遅くなるだけじゃない影響もあると思うな。 >遠隔のドライバーが運転してくれるってこと? へー、シェアしてくれてありがと。マジで合法だと思ってなかった。 リモートドライバーはどこにいるんだろ? Vegasにいれば遅延は少ないかもだけど、ベルリンだと… もしドライバーがローカルなら、遅延は100ms以下?結構いけるかも。システムダウンの方が心配だわ。 やっぱ危ない気がするなー。 こういうデバイスを操作する人は、そのことをちゃんと理解してるのかな。 もし手動でML用の画像セットにラベル付けしたことがあるなら、このプロセスの真実に近いってわかるはず。=3 データサイエンティストじゃないんだけど、それってホットドッグの絵文字じゃない? Amazon Goも同じことしてたのに、なんで司法省は問題にしなかったんだろ?って思ってたんだよね。もっとコメントを表示(1)
大事なのは、少なくとも信じてもらえること。Theranosの主張は、誰がどう考えても無理だって分かったよね。
例えが悪いかもしれないけど、仕事で時間かかってたクソでかいワークフローを自動化して、今じゃ人が関わってるとすら思わないレベルになってる。
陪審員を説得してみるのもアリだけど、うまくいくと思う?もしそれで有罪だって確信させちゃったら、ホワイトカラー犯罪では被告の精神状態も重要視されるから、不利になるんじゃない?
いい例がO’Connor v. Oakhurst Dairy, No. 16-1901。Maine Dairyのオックスフォードコンマ事件ね。地裁は意図に従ったけど、控訴裁は法律の文面通りに判断した。
>from the Appeals Court ruling
>”The District Court concluded that, despite the absent comma, the Maine legislature unambiguously intended for the last term in the exemption’s list of activities to identify an exempt activity in its own right. The District Court thus granted summary judgment to the dairy company, as there is no dispute that the drivers do perform that activity. But, we conclude that the exemption’s scope is actually not so clear in this regard.”もっとコメントを表示(2)
だから、店内で見た目が変わったり、商品の質量がスキャンしたラベルと一致しなかったり、カメラが在庫補充を確認できなかったりすると、疑われるみたい。経営陣がセルフレジにどれだけ力を入れてるか知ったらびっくりするかもね。個人的には、マジでつまんなかったから、もっと面白いプロジェクトを探したんだよねー=3
例えば、リンゴのPLUはこんな感じ。
>https://www.bobbywires.com/plu-1.php?S=V&L=A&V=APPLES
もっと野菜とか果物食べなよ。
ここではそういうの見たことないな。タッチスクリーンのメニューに写真が表示されるだけだよ。もっとコメントを表示(3)
https://sustainability.decathlon.com/product-traceability-an…
血中アルコール濃度が0.08(アメリカの法定上限)だと、反応時間が60~120ms遅れるだけで事故のリスクが10倍になるんだって。
奥行きの認識がないのも問題かも。
これが違法じゃないなら、ありえないんだけど。Waymoで、CS担当者が遠隔で車を運転することは許可されてないし、そもそも無理だって聞いたから。彼らはWaymo Driverに“提案”コマンドを送るだけなんだよね。遠隔の人間ドライバーは遅延が大きすぎるし、リアルタイムの情報も足りなくて、公道で車を“運転”できないと思う。
反応時間が60-100ms増えるって、酔っ払い運転と同じじゃん。
70mphで走ってたら、ブレーキがかかるまでに車一台分の距離を進んじゃうよ。
>“AI”の多くは、ランダムな人に仕事を押し付ける方法を見つけるだけ。
https://xkcd.com/1897/
(2017)
>Amazon Go:初期の頃、Amazonは“Just Walk Out”技術をテスト中だってハッキリ言ってたし、(少なくともテック業界では)ビデオフィードを通じて人間が例外的なケースを確認してるってことは知られてた。“AIの裏には人間がいる”ってジョークを言う人もいたくらい。
>彼らの主張は、最終的には技術が向上して、人間のバックアップは主にトレーニングデータと品質保証のためだってことだった。“今すぐ100% AIで人間の助けは一切なし”とは言ってなかったよね。
>Nate:完全に自動化されてるって主張してた。
>彼らのCEOは、AIがすべての作業をしていて“人間の介入なし”で、まれな例外的なケースでのみ請負業者を使用しているって明言してた。
>司法省によると、本当は人間がすべてをやってて、AIは単なるブランディングツールだったんだって。
>投資家にはソフトウェアプラットフォームだって言ってたけど、実はBPOを隠してただけだったんだね。