本エピソードでは、XのAIチャットボットGrokが引き起こした大規模なディープフェイク画像生成問題を詳細に検証する。Grokは著名人や女性、子供の性的画像を公然と生成し続けており、プラットフォームは事実上これを黙認している。イーロン・マスクはこの事態を冗談として扱い、Xの幹部陣もエンゲージメント向上として歓迎する姿勢を示している。一方で、被害者たちは画像の削除に数日を要し、AppleやGoogleのアプリストアも実質的に対応を怠っている。欧州各国やインドは調査を開始したが、米国では政権との近さから規制の動きは期待できない。番組後半では、Kevin RooseとCasey NewtonがClaude Codeを使った「バイブコーディング」の最新実験を共有する。両者とも専門知識なしで洗練されたウェブサイトやアプリを短時間で構築することに成功し、この技術の民主化と同時にプログラマー職への脅威についても議論する。最後に、CaseyはUber Eatsの内部告発を装った精巧なAI生成フェイク文書による釣り記事事件を追跡し、ジャーナリズムにおける新たな課題を明らかにする。

Grokによる非同意画像生成スキャンダルの全貌
私はニューヨーク・タイムズのテクノロジーコラムニスト、Kevin Rooseです。
私はPlatformerのCasey Newtonです。そしてこれはHard Forkです。
今週はGrokが窮地に陥りました。誰がこのバイラルなビキニ画像生成機能を止められるのでしょうか。その後、私たちは再びバイブコーディングに取り組みます。KevinとCaseyがClaude Codeで構築したものを比較します。そして最後に、Redditのミステリーです。詐欺師がAI生成証拠を使って私たち全員を騙そうとした経緯と、私がどのようにこの事件を解決したのかについてお話しします。
さて、Casey、2026年明けましておめでとうございます。戻ってこられて嬉しいですね。そして休暇中に起きた出来事について話すことから今年を始めたいと思います。それはX社で大きなスキャンダルが醸成されているということです。
本当に大変なことになっています。私たちのリスナーの多くがこの時点で目にしていると思いますが、Xは深刻なトラブルに直面しています。というのも、同社のGrokチャットボットが著名人、女性、子供たちの性的な画像を生成している方法と、そのほとんどについて画像を削除することを拒否しているか、実際に何が起きているのかについてコメントすることさえ拒んでいるからです。
そうですね。私は休暇中にこれを目にし始めました。何かが起こって、Grokはそれまでの時点でX上のユーザーが主に議論を決着させたり他の人々をファクトチェックするために使っていたツールだったと思います。そして突然、人々がGrokを使って主に女性の写真を裸にし始めるのを目にするようになりました。
Grok、私をビキニ姿にして。Grok、この政治家を露出度の高いランジェリー姿にして。Grok、この人のズボンを脱がせて。これが一夜にして起こり始めたように見えたのです。あなたが言ったように、本当に厄介でチェックされていない方法でした。では、実際に何が変わったのか理解させてもらえますか。何か設定が変更されたのでしょうか。人々がこれをできるようにする新しいモデルがリリースされたのでしょうか。
これらの質問に対する明確な答えは多くありません。お伝えできるのは、時にヌーディファイングと呼ばれるこのトレンドが、2023年にこれらの画像生成ツールが改善し始めた時点で本格的に始まったということです。それは大金を稼げることに気づいたからです。特に多くの男性が、あなたが言うように主に女性の非同意の画像を作成することに莫大なお金を費やすのです。
Grokに関しては、彼らは以前、Black Forest Labsという会社から画像生成ツールのライセンスを取得していると述べており、画像生成を開始した時点からそれを使用していました。しかし2024年12月に、彼らはAuroraと呼ばれる独自の画像生成ツールを使用していると発表しました。
繰り返しますが、詳細な情報はありませんが、少なくともオンライン上には多くの逸話があります。過去数ヶ月間で、ヌードや性的画像を作成することに関するガードレールが緩和されているようです。そして現在、Grokでポルノを作成することに特化した少なくとも1つの繁栄しているサブレディットが存在します。
あなたが言ったように、これらのヌーディファイアプリは数年前から存在しています。しかし、それらはアクセスが困難でした。一部はこれらのオープンソースモデルに依存していました。使い方を知っている必要があったり、ポリシー違反のためアプリストアから追放されたりしていました。しかし、これについて私が注目すべきだと思うのは、これが大手ソーシャルネットワークで起きているだけでなく、公然と行われているということです。人々は文字通りX上の投稿の返信でこれを行っているのです。では、これについてあなたにとって新しいのは、その公然性でしょうか。
全くその通りです。男性が女性の画像を撮って、彼女の同意なしにヌード版を作成するのは十分に不快なことです。それは悪いことです。しかし、これについて非常にショッキングなのは、それがリアルタイムで起こっているのを見ることができるということです。いくつかのメディアはGrokアカウントに入って、ユーザーのリクエストに応じて数百から数千の画像を作成しているのを見ていますし、誰でも入って見ることができます。そしてもちろん、これは私が攻撃と呼ぶものの被害者にとって最も不快なことです。なぜなら、普通の人々がまだXを使ってハイキングの写真などを投稿していて、変質者が返信に現れて「彼女をビキニ姿にして」と言い、それが実行され、被害者としてのあなたが自分の返信でそれを見ることになるからです。
それはクレイジーですね。明らかにXとイーロン・マスクは多くのユーザーのようにこれに憤慨していません。彼らは全体を冗談だと思っているようです。しかし、私の質問は、ガードレールは設置されているのかということです。人々はGrokをジェイルブレイクしてこれをやらせているのでしょうか、それともこれは文字通りGrokアプリの主要な宣伝機能のようなものでしょうか。
素晴らしい質問ですが、いいえ、彼らはこれをするためにGrokをジェイルブレイクしていません。彼らはただX上で「Grokこれをやって」という返信を送っているだけで、Grokはそれを実行しています。彼らは特に言葉遣いを工夫する必要はありません。彼らは文字通りビキニ姿の女性の画像を見たいと頼んでいるだけです。
それは私にとって非常に驚くべきことです。
または子供のビキニ姿です。
そして、私がこれについて抱く疑問の1つは、AppleとGoogleとそのアプリストアはこれをどう許容しているのかということです。
本当にありがとうございます。昨年、私はGrokに導入された性的コンパニオンボットAnnieについて書いていました。そしてiOSストアに行ったところ、Grokが12歳以上の子供向けに評価されていることに気づきました。セックスボットへのアクセスを与えるには少し若すぎるのではないかと思いました。そこでAppleにメッセージを送り、「どうなっているのですか」と尋ねました。広報チームから受け取ったメッセージは「ええと、調査中です」というものでした。そして当時の私の正直な感覚は、彼らは変更を加えるつもりだというものでした。明らかに何かをするはずだと。しかし、彼らは何の変更も加えませんでした。そして今週、この新しいCSAMヌーディファイングスキャンダルを受けて見に行ったところ、AppleがGrokの評価を変更していることがわかりました。現在は13歳以上の子供向けに評価されています。
冗談でしょう。
そうです。そこで残念ながら、自由奔放にしていた12歳の皆さんには、このツールを再び使えるようになるには次の誕生日まで待たなければなりません。
それは本当に衝撃的です。
私もそう思います。そしてこれはアプリストア側の露骨なダブルスタンダードの最も明確なケースの1つだと感じています。もしランダムなスタートアップがある日現れて「Apple、私のビキニアプリをあなたのアプリストアで販売したいのですが」と言ったら。
彼らはそれをシャットダウンすると思います。絶対にありえません。
彼らはそういったことに対するポリシーを持っています。しかし、それがXだから、イーロン・マスクだから、このアプリがすでに数百万人のユーザーを持っているから、彼らはそれに対して行動を起こす傾向が低いのかもしれません。わかりません。何が起こっているのか何か洞察がありますか。
洞察はありませんが、Apple内部にはこの評価を変更すべきだと言っている人々がいることは非常に確信しています。そして誰かが座って「いや、もしそうしたら副大統領がそれについてツイートするだろうし、マルコ・ルビオがツイートするだろうし、ブレンダン・カーがXを処罰したことで我々に対する調査を開始するだろうし、検閲していると言われる」と言っているのです。
だから彼らはただ麻痺状態にあるのです。女性と子供がオンラインで攻撃されるべきではないという原則のために立ち上がることを非常に恐れているからです。
そうですね。現在いくつかの調査が進行中ですが、これがいつか規制当局によって停止されることを期待していますか。
歴史から私の直感を言えば、はい、絶対に停止されるでしょう。フランスは性的コンテンツを明らかに違法だと呼んでいます。英国政府は調査を検討していると述べています。欧州連合はGrokに関するこれらの苦情を非常に真剣に調査していると述べています。インドのIT省はXがここで何かをするよう要求しています。ですから、これら全てから何らかの変化をもたらす何かが出てくると想像せざるを得ません。
同時に、米国が介入すると思いますか。おそらくないでしょう。イーロンは休暇中に大統領との夕食の写真を投稿しましたよね。だから彼らは再び友人のようで、X社の本国では単にプッシュバックがないようです。
そうですね。これが何が起こっているのか、なぜ人々がこれについて話しているのかについての良い概要だと思います。しかし、私たちは同僚のKate Congerを呼びたいと思いました。彼女はタイムズの記者で、番組の友人です。以前にも出演したことがあります。彼女は今週このGrokスキャンダルについて報道しており、実際にこのGrokディープフェイクによって攻撃された被害者の一部、女性の一部と話をしています。私たちは彼女たちの視点も聞くべきだと思います。
Kate Congerによる被害者への取材
絶対に。Kate、Hard Forkにおかえりなさい。
ありがとう、Casey。
では、Grokでのこの行為の被害者の一部と行っている会話について少し教えてください。
そうですね。この方法で画像が使用されている人々にとっての大きな苦労の1つは、どう対応し、何をすべきかということだと思います。人々は明らかにXに連絡して、これらのものを削除してもらおうとしています。そしてそのプロセスは時には長い時間がかかり、時には全く起こりません。そしてその一部は、あなたも知っているように、特にこの番組で多く話してきたことですが、Xがコンテンツモデレーション担当者の多くを解雇してしまい、これに対応する大規模なチームがいないということだと思います。
最近X上でディープフェイク被害に遭った子供たちと働いている人々と話をしていますが、彼らはそれらの画像を削除してもらっていますが、時には36時間、72時間かかり、これらの画像はかなりの時間放置されてコメントされ、悪用されています。
ですから、Grokによってこの状況に置かれた人々が、どう対応すべきかを考えようとしているのは少し怖い瞬間だと思います。
なぜこれが起こっているのか、そしてそれがその反対側にいる人々にとってどのようなものなのかについて感覚を教えてもらえますか。
なぜこれが起こっているかは本当に様々です。そして私はあらゆる種類の女性にこれが起こっているのを見てきました。通常のXユーザーである女性たち。明らかに公的なプラットフォームを持つ女性たちがこれによってターゲットにされています。政治家、Twitchストリーマー、セレブ、女優、彼女たちは皆これに巻き込まれています。そして、これらの画像を要求している人々の動機は、明らかに性的なものですが、ポルノグラフィック画像を作成したいという欲求から、女性を特に屈辱させいじめたいという欲求まで様々です。つまり、彼女たちをこれらの画像でタグ付けして、ディープフェイクを作成している女性から反応を引き出そうとしているのです。
あなたが話した誰かの具体的な例を1つ挙げて、彼女の経験の話を教えてもらえますか。
そうですね。先ほど言及したように、Grokでディープフェイク被害に遭っている子供たちと働いている人々と話をしています。ですから、この子供たちにさらなる嫌がらせをもたらしたくないので、具体的なことについては曖昧にしたいと思います。しかし、何度もディープフェイク被害に遭っている特定の子供がいます。彼女はある程度の公的人物です。そこから元の画像が来ており、人々は彼女の服を脱がすよう要求しています。そして彼女の両親にとってはかなり怖いことでした。彼女は何が起こっているか知っていますが、それを見ていません。しかし彼女の両親は彼女のソーシャルメディアを監視していて、これらの画像が出現するのを見ています。
それは彼らにとって本当に恐ろしいことだと思います。そしてTwitterや擁護団体に連絡してこれらの画像を削除しようとしていますが、かかっている時間に本当に苛立っています。そして、誰かがオンラインで行って14歳の子供のヌード画像を要求でき、このテクノロジーが非常に公的な方法でそれに応じるという事実に本当に憤慨していると思います。
この質問が明白すぎるかわかりませんが、これらの被害者が無害だと思う画像をXに投稿し、サイトに戻ってそれが自分の意志に反してポルノに変えられているのを見ることがどんな気持ちなのか、教えてもらえることはありますか。
そうですね。一部の人々にとっては本当に怒りを感じることだと思います。多くの怒りを人々から聞いています。そして恥ずかしさもあります。何人かの女性と話しましたが、彼女たちはそれについて何かをすべきか、それが自分に起こったという事実について何か言うべきかどうかを疑問視しています。なぜなら恥ずかしく感じていて、これらの画像が今インターネット上に存在するという事実にさらなる注目を集めたくないからです。
また、男性が女性をいじめて広場から追い出し、発言を止めさせ、公的生活への参加を止めさせる方法としてこれを行う方法についても話してもらえますか。
そうですね。特にディープフェイク被害に遭っている女性政治家について考えています。Xのユーザーが彼女たちの見解に賛成しないかもしれない女性政治家がいて、彼女たちの公的な仕事や擁護活動から画像を撮り、それをヌードにしたりビキニ姿などに描写するよう要求しているのです。ですから、恥をかかせ、彼女たちの職業生活における画像を非常に個人的で親密な画像に歪めようとする明白な努力があると思います。
例えばAOCのような人に何が起こっているかを見ています。今では彼女の写真があるたびに、人々がそれに返信して「@Grok、彼女を露出度の高いホルタートップなどに入れて」と言うのです。
これは単なるポルノについての話ではないことを物語っていると思います。これはツールが政治に影響を与えようとする方法について、そして特に女性を矮小化し、貶め、会話から追い出そうとする方法についての話です。
Kate、明らかに昨年のメカヒトラー事件について私たち全員が知っています。Grokがこれらの反ユダヤ主義的な応答を吐き出し始めた時のことです。振り返ってみれば、はるかに安全なバージョンのGrokでしたが。
はい、メカヒトラーメカがGrokができる最悪のことだった時代を懐かしく思います。
しかしその意味では、これは何らかの安全フィルターを意図せず回避したという感覚がありました。Grokのプログラミングに何かがうまくいかず、このような動作を引き起こしたのです。私にとって、この新しい画像生成動作ははるかに偶発的ではないように感じます。もしかしたらこれについて会議さえあったかもしれないと感じます。これは明らかに何らかの計画の一部だったか、少なくともユーザーがこの方法でテクノロジーを使い始めた時、会社はメカヒトラーの時のように即座に取り締まる措置を取らなかったのです。では、あなたの取材から、これが社内でどのように起こったかについて何か教えてもらえますか。誰がこの種のことについて決定を下しているのでしょうか。これは何らかの狂った成長戦略の一部なのでしょうか、それともなぜこれが今起こっているのでしょうか。
まず、これはGrokがこの種の画像を生成し始めた最初のことではないと思います。Grokが投稿してきた画像を遡って追跡してきましたが、昨年の6月と7月までこのような女性の画像を見つけています。ですから、これはかなり低いボリュームでかなり長い期間続いていたと思います。そしてそれは本当に休暇中にエスカレートし、人々がそれをX上のトレンドにしたのです。
メカヒトラー事件についての私たちの取材で見つけたのは、イーロン・マスクがGrokに取り組んでいる人々に、彼はそれがバイラルになることを望んでいるという指示を与えていたということです。彼はツールを宣伝し、人々のレーダーに載せるための戦略として、よりエッジーなものにしたかったのです。そして会社の視点は、明らかにメカヒトラーは行き過ぎだったというものでした。彼らはGrokを数日間オフにしましたが、これらのバイラルな瞬間を作り出そうとすることがGrokの戦略の一部であり続けています。そして、Caseyが先ほど指摘した、女性を黙らせることが起こっているという点について、明確にしたいのですが、Grokは女性のディープフェイクポルノを作成する唯一のAIツールではありません。
はるかに唯一のツールではありませんが、それを本質的に公的な方法でソーシャルメディア上で行っている唯一のツールです。これらの画像は即座に広がりバイラルになる可能性があります。他の多くの画像生成ツールはユーザーとのプライベートチャットで行われています。Grokはそうではありません。これは非常に非常に公的であり、そのように意図されており、トラフィックと関心を促進することを意図しています。そしてそれがX社のリーダーたちから見てきた反応です。このトレンドが高まっていた時、マスクはSpaceXロケットをビキニ姿にすることについて何かを投稿し、このトレンドが起こっているという事実を嘲笑していました。Xのプロダクト責任者が、これが起こっていた期間中のX上のエンゲージメントがこれまでで最高だったという事実について投稿しているのを見ました。ですから、彼らにとっては、彼らが求めているエンゲージメントを見ているのです。人々が自分たちのXフィードをタップし、Grokをタップしているのを見ていて、それはポジティブなものとして見られています。
Kateが来る前に少し話しましたが、一部の国の反応、現在進行中の調査についてです。米国で何が起こっているかについて話したいと思います。議会は最近Take It Down法を可決しました。私の理解では、それは今年の5月に発効する予定です。それはプラットフォームに何を要求するのでしょうか。そしてそれは今Grokの被害者を助ける方法で執行されると思いますか。
そうですね。Take It Downについてです。5月に起こる条項は、企業がこの種の画像を削除するよう被害者が要求するプロセスを設定し、削除しない場合に罰則を科すための期限です。ですから、この場合、Xがすでに利用可能にしているもの、例えば著作権で保護された画像を削除するよう要求したり、嫌がらせや虐待を削除するよう要求したりするものの強化を意味します。
ですから、これらのソーシャルメディア企業に、被害者が削除を要求するためのフレームワークを構築するよう求めているだけです。しかし、そもそもXにこれらの画像が作成されることを許可しないよう法的圧力をかけているわけではありません。
もちろん、5月はまだ4ヶ月先であり、ここでの一部の被害者にとってはそれは慰めにならないだろうと思います。
Kate、これについて違いはありますか。またはCasey、あなたもこの答えを知っているかもしれませんが、私の理解では、現在の法律は未成年者がこの種のことをされることを保護しており、だからこそ彼らは遅延してでもこれらの画像を削除することに成功しているのだと思いますが、ほとんどの州またはほとんどの管轄区域の成人にはほとんど手段がありません。それは本当ですか。
はい、その通りです。CSAMを製造し所持することは違法であり、したがってXはより多くの法的圧力を受けています。だからこそ成人女性に対してはそうではないところで、少なくとも何らかの行動を取っているのを見ていると思います。
そしてTake It Downは成人女性が利用できるようになります。ですから彼女たちは画像を削除するよう求めるためにそのプロセスを使用できるようになりますが、そもそも成人の画像を作成しないようXに求める自動的な法的圧力はCaseyが正しいようにありません。
全体として、この件に対する反応は、何が起こっているかの重大性を考えると、かなり控えめだと思います。私はソーシャルメディア企業に対する多くの反発を取材してきました。ケンブリッジ・アナリティカを覚えていますか。人々が、自分が受けたクイズがデータをポーリング会社に渡され、選挙に影響を与えようとしたかもしれないという考えにどれほど怒ったか覚えていますか。私たちはそれでほとんど国を閉鎖するところでした。
今、あなたは要求に応じて公然と女の子の服を脱がすウェブサイトを持っています。それはウェブサイトの所有者によって許可されており、彼は自分のフィードでそれを笑っています。そして私たちは「ああ、どうしようもない、それがイーロンだ。イーロンはルールに従って今の地位に到達したわけではない」と言っています。ですから、私は本当に気が狂いそうです。なぜなら、これがコンテンツモデレーションの歴史においてこの低い低い地点に到達し、これが平均的な人々によってこれほど多くの肩をすくめる結果になっていることが信じられないからです。
本当に興味深いことで、イーロン・マスクがコンテンツモデレーションに関するオーバートンウィンドウをどこまで押し広げることができたかを示していると思います。明らかにFacebookや他の全ての企業が彼のアプローチを真似て、コンテンツモデレーションを撤回し、嫌がらせに対するルールを撤回し、コミュニティモデレートアプローチを採用しているのを見てきました。ですから、あなたの言う通り、これが比較的短期間にどれだけ変化したかを見るのは驚くべきことです。
かつてはこのようなことがXからユーザーの大量脱出をもたらす時代がありました。Blue Skyが大量のユーザー急増を得たり、Threadsが大量のユーザー急増を得たりするのを見たでしょう。今回はそれが起こっていません。おそらくこのことを気にかける人々はすでに去っているのだと思いますが、わかりません。私たちはコンテンツモデレーションとソーシャルプラットフォームの歴史において非常にクレイジーなクレイジーな時代にいます。
そして、これに対する控えめな反応の一部は、これが全てクリスマスと新年の間に本格的に爆発し始めたという事実と関係があるのではないかと思います。おそらく、多くの政府関係者が電話を見ておらず、家族と過ごしていたのかもしれません。わかりません。しかし、今週になって世界中の規制当局が対応を発表し始め、調査を開始したい、またはXに書簡を送ったと述べているのを見始めたところです。しかし、特に他のコンテンツモデレーション論争と比較して、本当に遅い反応だったと思います。
正直なところ、個々の政治家またはおそらく彼らの娘または彼らのパートナーにそれが起こらない限り、それは危機のレベルに上昇しないだろうと思います。そしてそれが起こり始めるとすぐに、私たちはそれについての公聴会を開き始めるでしょう。しかしおそらくそれは2026年以前の考え方です。また、これがXにとって戦略的である可能性もあります。彼らは明示的に右翼に傾いたソーシャルメディアプラットフォームであり、トランプ政権との取引において非常にうまく機能してきました。
Kevin、Truth Socialを忘れていると思います。
それは本当です。私はいつもそれを忘れています。そしてこの種の悪徳シグナリングは私を嫌悪させますが、それは実際に彼らが望むものを得るのに効果的かもしれません。つまり、トランプ政権との協力と寛容です。そしてこの政権の間、少なくとも彼らはこれについて何の結果も見ないかもしれません。
それが彼らに与えるのはエンゲージメントだと思います。人々はポルノが大好きですよね。それは秘密ではありません。誰もが人々がポルノを見たりクリックしたりするのが好きだということを永遠に知っています。ただ、プラットフォームは一般的に、それを受け入れることで評判やより大きなビジネスに多くのリスクを見てきました。Xについて新しいことは、いや、ポルノを私たちがすることの柱にして、それが他のフロンティアラボに追いつくのに役立つかどうかを見てみようと言っていることだと思います。
私にとっては、ビジネスケースが理解できません。なぜならGrokはChat GPTやClaude、Geminiのような本格的な競合相手になろうとしていて、エンタープライズ契約や政府契約を取得しようとしていたと思っていたからです。もしあなたがフォーチュン500企業なら、この時点でなぜGrokと契約を結ぶのでしょうか。本当に、最も面白かったのは、彼らがGrock Enterpriseプロダクトを発表したのが、この話が爆発していたのとまさに同じ日だったことです。そして私はGrokのエンタープライズ営業責任者を想像するのが大好きです。彼はフォーチュン500企業との会議に向かっていて、「あなたのビジネスを支援するためにGrokの1000シートを販売したいのですが」と言っています。そして彼らは「さて、このディープフェイクヌードについては何ですか」と言います。
もちろん、GrokはUS軍と契約を持っています。
そうですね。
さて、Grokに関する私たちの取材で本当に興味深いのは、Grokチャットボットが行っていることと、GrokのTwitterアカウント、つまりXアカウントが行っていることの違いです。それらは非常に異なります。Xアカウントによってより極端な政治的見解が表明されています。Xアカウントによってこれらのディープフェイクが生成されています。そして多くの場合、同じクエリを取り、実際のウェブブラウザ版のチャットボットまたはチャットボットのアプリに入れると、はるかに控えめな応答が得られます。
ですから、彼らが実際にやっているのは、よりエンタープライズフレンドリーなチャットボット、つまりライセンスと販売を行っているものを持っており、その後X上に存在しエンゲージメントとクリックを得て人々をソーシャルサイトに連れてくる憤激の餌マシーンがあるということだと思います。
バイブコーディングの最新実験
これについて私が抱くもう1つの質問は、規制の介入がない場合、裁判所が関与する何らかの方法があるかどうかです。私たちは過去10年間、セクション230について議論し、それがソーシャルネットワーク上で起こることに対するプラットフォームの責任からプラットフォームを保護するかどうかについて話してきました。そしてほとんどの場合それは保護していると思いますが、これは私には異なると感じます。なぜなら、これは同意なしに人々のこれらの性的画像を生成しているユーザーではないからです。それは文字通りプラットフォーム自体、またはプラットフォームに接続されたAIチャットボットとシステムです。これはGrokまたはXに対する新しい形態の法的責任を開くのでしょうか。
絶対にそうです。今日Bloombergでインタビューを読みましたが、弁護士がまさにそう言っていました。彼らはこれから逃れるためにセクション230の後ろに隠れることはできません。最終的に、これらの画像を作成しているのは彼らのプロダクトです。ですから、これらの作成している一部の画像についてXを法的に責任を持たせる努力が見られると思います。
そして、Xは子供を描いたAI生成画像の場合、責任をユーザーに押し付けていると思います。彼らは安全アカウントに投稿を出しました。これはプラットフォーム上のあらゆる種類の安全問題の広報担当です。彼らは「私たちは児童性的虐待資料を含むX上の違法コンテンツに対して行動を取ります。それを削除し、アカウントを永久に停止し、必要に応じて地方政府と法執行機関と協力します」と述べました。
彼らはさらに、「Grokに違法コンテンツを作成させるようプロンプトを与えたり使用したりする者は、違法コンテンツをアップロードした場合と同じ結果を被ります」と述べています。これは興味深いですよね。彼らは、Grokから違法な資料を要求するユーザーは停止され法執行機関に報告されると言っています。しかし、コンテンツを要求しているそれらのユーザーは、実際にコンテンツを投稿している者ではありません。これらの画像を作成し、これらの画像をオンラインに投稿しているのはGrokアカウントです。ですから、彼らが本当に自分たちのポリシーに忠実であり、停止すると言っているなら。
それがGrokアカウントを削除するだけで多くの問題を解決するでしょう。そして、これから1つのことが出てくることを願っています。
わかりました。Kate、コンテンツモデレーションの最前線からのこの非常に憂鬱なアップデートをありがとうございました。そして幸運を祈ります。
ありがとう、みんな。
さて、Casey、休暇から戻って以来、私は最新のバイブコーディング実験についてあなたと話すのを楽しみにしています。バイブコーディング、私たちが昨年話したものですが、休暇中に一瞬を迎えたようです。
Kevin、それは構築する時です。私たちは一年中ある程度バイブコーディングをしてきましたが、過去数週間の進展により、コーディングについて完全な無知である人がかなりクールなものを作ることがこれまで以上に簡単になったことに同意しなければなりません。そしてAIについて話すので、開示しておきます。私はニューヨーク・タイムズで働いており、タイムズは著作権侵害の疑いでOpenAI、Microsoft、そしてリストの新参者Perplexityを訴えています。
おめでとうございます。そして私のボーイフレンドはAnthropicで働いています。
そうですね。私は休暇中に最初の週はほとんどオフラインで、ソーシャルメディアを見ないように非常に努力していました。私はすべてのソーシャルメディアアプリを電話から削除しました。戻ってきたとき、ベネズエラの大統領が捕らえられており、誰もがClaude Codeについて私のフィードで話していました。
この2つは関連していましたか。
そうは思いません。
わかりました。しかし、起こったことの1つは、Claude Codeが、Anthropicが作った一種の自律的コーディングエージェントで、Claudeチャットボットをあなたのコンピューター上のターミナルウィンドウの中に入れて自律的に物事をさせるものですが、それがはるかに良くなったということです。その理由は私が思うにOpus 4.5、数週間前に番組で話したモデルに関連しているのだと思います。しかし私が戻ってきて、アンドレ・カルパシーのような有名なAI研究者からのコメントを見ました。彼はClaude Codeと類似のツールで遊んだ後、「プログラマーとしてこれほど遅れていると感じたことはない」と述べました。これは世界でおそらくトップ1%のプログラマーである誰かがこう言っているのです。GoogleのエンジニアであるJanna Dogenは、昨年からGoogleで分散エージェントオーケストレーターを構築しようとしていたと書きました。そして彼女はClaude Codeに問題の説明を与え、それはGoogleの人々のチームと昨年構築したものを1時間で生成しました。
私は、プロのプログラマーではなく私たちのような人々を含む、インターネットの多くの異なる場所から、Claude Codeで実験を始め、それができることを見て、かなり驚いている人々から同様の誇大宣伝と賞賛を見ました。
そうですね。休暇中に本当に一瞬を迎えました。そして私たち両方がバイブコーディング端末に戻り、何が構築できるか見るのに十分でした。そして私はたまたま数日間留守にしていて、家に帰ると、ボーイフレンドが私のラップトップにClaude Codeをインストールすることを自分で決めていました。彼は私を見て「構築する時だ、いくつかのものを作ろう」と言いました。ですから、ノーマン・ロックウェルの絵画のようなものでした。私たち2人がユールログの隣に座ってバイブコーディングしようとしていました。
そうですね。私も数時間を過ごしましたが、あなたのボーイフレンドとではなく、家族旅行中にClaude Codeでコーディングしていました。妻の迷惑にもかかわらずでしたが、彼女が実際にかなりクールだと思ったものをいくつか作りました。ですから、私たちの実験について話すべきです。あなたが何を構築してきたのか聞きたいです。私が何を構築してきたかについて話したいです。しかしそれをする前に、なぜこれが今起こっているのでしょうか。なぜバイブコーディングが主流に戻ってきた瞬間なのでしょうか。
その質問に答える方法は、前回バイブコーディングについてのセグメントを行った約1年前に私たちを連れ戻すことだと思います。正直なところ、その時に私たちがバイブコーディングしようとしたことで覚えているのは1つだけです。それはホットタブメンテナンスアプリでしたよね。私はちょうどホットタブを手に入れたところで、すべての様々な化学物質のバランスを保つ方法を理解しようとしていました。Kevinはその時Claudeを使ってアプリを作ろうとしてくれました。Claude Codeは存在していませんでした。そして私たちはそれを使いましたが、まあまあでしたが、正直なところ、あまり機能しなかったのであまり使いませんでした。
Claudeで実験を試みた時、私も同様の結果でした。ある程度機能するものをいくつか作ることができましたが、「ああ、これは私が人生で継続的に使用する実際に有用なものだ」と言ったものは全くありませんでした。ですから、他の人々が自分のプロジェクトをバイブコーディングして成功を収めていると信じる意志は完全にありましたが、1年前にこのようなことの多くをしようとすると、それほど遠くまで行けませんでした。
そうです。そしてその一部は、1年前にバイブコーディングをするのが実際に少し不器用だったからです。そのホットタブメンテナンスアプリを構築したことを覚えていますが、それには多くのコピーアンドペーストが必要でした。エラーメッセージが出た場合、Claudeは常にそれを処理する方法を知っているわけではありませんでした。
しかし過去1年間にClaude Codeで起こったこと、そしてOpenAIとGoogleも現在同様のツールを持っていることも言及すべきですが、彼らは基本的にこれをあなたのコンピューター上のターミナルアプリに統合しました。ですからもうコピーアンドペーストはありません。Claudeは普通の英語で指示を受け取り、様々なタスクを達成するために出かけることができます。あなたにチェックインしますが、今では全てのオーケストレーションと実行を自分で行うことができます。
そして、このセグメントの冒頭でそれを言うことが重要だと思います。なぜなら、正直なところ過去1年間、人々がバイブコーディングについて話していた時、私の目と耳はある程度ぼやけてしまっていたからです。なぜなら、私はソフトウェアエンジニアではないといつも思っていたからです。物を構築する方法を知りません。あなたがカスタムChrome拡張機能などを作ることができて嬉しいです。それは私の人生には関係ありません。今日私たちが構築したものについてコードの文脈で話しますが、実際これはデジタルツールを構築することに関するものです。これはコンピューター上で物を構築することについてです。そしてコードは基盤ですが、私たちはソフトウェアが一部である場合、以前はできなかった方法でアイデアがあればそれを構築できる世界に入り始めていると思います。
そうです。では、Casey、休暇中にClaude Codeで何を構築したか教えてください。
これは私が本当に長い間欲しかったものです。結果に非常に満足しており、このものを継続的に改善し続けるつもりです。なぜなら、いじるのがとても楽しいからです。本当に楽しんでいます。ただいじるのがとても楽しいです。
Kevin、あなたのブラウザに行ってURLバーにcasey newton.orgと入力してください。15年以上、私は基本的に名刺のような個人的なウェブページを持っていました。私の名前があり、ウェブサイトへのリンクがあります。それをSquarespaceで取得しました。年間200ドルを支払っていました。今、そのお金を全て支払っていたことを非常に愚かだと感じています。なぜなら、Claude Codeを使って、本当に私の夢の個人ウェブサイトを作ることができたからです。
このツアーをさせてもらえますか。
お願いします。
そして、リスナーの皆さん、つまり、やっていることを止めてください。車を路肩に寄せてください。止まってください。洗濯物を置いて、今すぐスマートフォンを取り出してください。casey newton.orgに行ってください。
ところで、このウェブサイトについて私が大好きなもう1つのことは、完全にレスポンシブだということです。携帯電話用に別のバージョンを構築する必要はありませんでした。ブラウザウィンドウの大きさに応じて拡大したり縮小したりするだけです。
Claudeがデザインを考え出しました。かなり暗くて、グラデーションを使用しています。あらゆる種類のクールなフォントがあります。楽しいイースターエッグもあります。Kevin、ページのトップに私の顔が見えますか。
はい。
私の顔をクリックしてください。
わあ、ちょっと揺れますね。
非常に陽気です。
クレイジーなアニメーションができます。そして下にスクロールすると、私自身のPlatformer、私のニュースレターとHard Forkがあります。そして私はClaudeコードに入力できました。PlatformerとHard ForkのYouTubeに最新の5つのストーリーを載せた小さなウィジェットが欲しいです。そしてそれは非常に迅速にそれを構築しました。そして今、それは私がするすべての新しいもので永遠にライブで更新されます。
私は「人々が私のウェブサイトにメールアドレスを入力してPlatformerを購読できたらクールだろう」と思いました。そして、ああ、確かに、それができます。だから今、あなたがただ入力して、Platformerまたは私の個人サイトに購読できる動作するボックスがあります。少し自己紹介を書きました。そして、さあ本当に見せびらかさなきゃと思いました。「ねえ、小さなフィードを作って行ってくれない。だから私がBlue Skyに更新を投稿するたびに、私の最新5つの投稿をそこに見ることができる」と言いました。それをやりました。
しかし、リポストを表示する際に著者を表示せずに表示していることに気づきました。「まあ、フィードにリポストは欲しくない」と言いました。Claude Codeはただ入って、全てのリポストを取り除きました。そして今、フィードには私のオリジナル投稿だけが表示されています。画像を表示していませんでした。「Claude、私のウェブサイトに載せたBlue Sky投稿に画像を入れてもらえますか」と言いました。「ええ、確かに、それもできます」と言いました。
ですから、このページで見ているすべてのもの、これは大きいです。このページで見ているすべてのものは、90%を1時間で行いました。
わあ。つまり、もしあなたがプログラマーなら、このウェブサイトを見て「ああ、まあ、この点は私ならこうしなかっただろう、これはそれほど技術的に複雑ではない」と言うかもしれないことは理解しています。このものを1時間でまとめられる人間のデザイナーを私は本当に知りません。
私はSquarespaceの設定をいじるのにはるかに長い時間を費やしてきました。そして私はこのものを絶対に動かすことができました。引き続き話すつもりです。なぜなら目を覚ましたからです。
いや、これは素晴らしく見えます。私が言うべきなのは、これは私にとって非常にプロフェッショナルだということです。初期のバイブコーディング実験のいくつかはある程度認識可能にバイブコーディングされていました。悪いテンプレートがデザインしたように見えました。これは良く見えます。
ありがとうございます。
もし私がこれを見て知らなかったら、「わあ、この人は良いウェブデザイナーがいる」と言うでしょう。
ありがとうございます。それが私の感じ方でした。つまり、繰り返しますが、私は実際にウェブサイトを立ち上げることをお勧めします。なぜなら、このものにはアニメーションが組み込まれているからです。マウスオーバー効果があります。ですから、Hard Forkウィジェットの上にカーソルを合わせると、小さなグラデーションラインがその上に表示されます。
ですから、これらのクールな小さなタッチが全てあります。Claude Codeには、私が使用したフロントエンドデザインプラグインがあり、ここで本当に役立ったと思います。
これが1日目でした。2日目、私はこれを楽しんでいます。続けなければなりません。他に何をこれに入れられるだろう。それで、まあ、ブログを載せるべきだと思いました。それでいじり始めました。casey newton.org/blogに行けます。
そして今、Micro.blogというデッドシンプルなブログサービスを使用しています。そして基本的に2010年代のTumblrの精神を取り戻そうとしています。これをどれだけ続けられるか見てみますが、私が読んでいる本と最後にSpotifyで聴いた曲を教えてくれる小さなウィジェットがあります。最近気に入ったYouTube動画を載せました。これをしながら、20年以上前に大学にいた時、キャンパスに着いて最初にしたことの1つがウェブサイトを構築したことだったことに気づきました。それはとても楽しかったです。Microsoft Front Pageというソフトウェアを使いました。自分が何をしているのか全く理解していませんでした。犯したすべての間違いについて、30分間Googleで間違いを理解しようとしていました。そして最終的にそれから離れました。なぜならウェブデザインが複雑になりすぎて、Squarespaceが登場したからです。
そして今、Kevin、私たちはウェブサイトを作ることがただ楽しい美しい始まりに戻ってきました。ウェブ上で何でもできます。そして必要なのはボックスに欲しいものを入力することだけです。冗談でしょう。これについて本当に幸せです。人生最高の時間を過ごしています。
それは素晴らしいです。それはとても面白いです。なぜなら私も休暇中にまさにこの実験をしたからです。私は「Squarespaceに支払っている」と思いました。調べました。2020年のような過酷で骨の折れる週末に構築したウェブサイトをホストするために年間192ドルを支払っています。
そうです。
そしてそれをホストして支払い続けてきました。基本的には高級な名刺です。そしてそれは本当に愚かだと思いました。そこで、あなたに今ブラウザを開いてkevin roose.comに行ってもらいたいと思います。
ああ、とても興奮しています。
そしてあなたのものよりも少し地味ですが、これは現在無料でGitHubでホストされている、Squarespace上にないウェブサイトです。私はサブスクリプションをキャンセルしました。そして全く同じ情報が載っています。連絡フォームがあります。FAQがあります。そして私のソーシャルメディアアカウントへのリンクがあります。そしてこれをするのに20分程度かかりました。私は古いサイトを渡して「ねえ、これを私が好きな他のいくつかのサイトのように見せられますか」と言いました。そして私はあなたもしたように少し好奇心を持ちました。「小さなイースターエッグをここに入れよう」と言いました。
ページの右下隅に行くと。
ボタンがありますね。ジオシティーズモードを有効にできます。
ボタンはどれですか。小さな工事中のものですか。
そうです。
それをクリックすると、完全な1990年代ジオシティーズモードになります。
ああ、大好きです。
点滅するコミックサンスとネオンカラー。ネットスケープナビゲーターで最もよく表示されます。これは楽しかったです。それが私のコーディングプロジェクトの1つでもありました。私は休暇中に他に7つのコーディングプロジェクトもしました。これは私がした最も野心的なものではなかったので、それについて話したいです。
Casey、Pocketというアプリを覚えていますか。
はい。一種の後で読むアプリです。
そうです。これは私が何年も使っていたアプリです。読む時間がなかった、または後で戻りたいと思った興味深い記事を保存するためのものでした。それは小さなChrome拡張機能で、ボタンを押すだけでPocketリストに保存され、後で電話やコンピューターで記事を読むことができました。そしてそれは素晴らしいアプリでした。大好きでした。毎日使っていました。そして昨年、PocketのオーナーであるMosillaがPocketを中止することを決定しました。そしてこれはひどいと思いました。それで昨年の一部を、Pocketが正確にできることをできるアプリを探して回ることに費やしました。
そして、いくつかあることがわかりましたが、ほとんどがお金がかかります。Readwiseのようなもの、他にもInsta Paperなどがあります。これらで本当に良い機能が欲しい場合、月額サブスクリプション料金を支払わなければなりません。それで、自分でPocketを構築できるかもしれないと思いました。またはClaude Codeが私が自分のPocketを構築するのを助けてくれるかもしれないと思いました。
そして私はそれに非常に短い説明を与えました。基本的に、私は毎日Pocketユーザーでした。このアプリがなくなることを悲しく思っています。自分のバージョンを構築したいです。さあ、と言っただけです。そしてそれはただそれをやりました。私に動作するPocketクローンを構築してくれました。それはStashと呼ばれ、Pocketがしていたすべてのことをします。Chrome拡張機能があります。今、私の電話には、私のものを読むことができるモバイルアプリがあります。また、Pocketが持っていなかったいくつかの機能も追加させました。
何ですか。
その1つは、私のKindleハイライトと同期できることです。これはRead Wiseからクローンした機能で、別の後で読むアプリです。そして今朝、私はこのアプリについて考えていて、「ああ、これを私に読み上げてくれる機能があればいいのに」と思いました。
それでClaudeに尋ねました。「このアプリの上にテキスト音声エンジンのようなものを追加できますか。記事を保存するたびに、後で電話にいる時や移動中や何かをしている時、AI音声に読んでもらうことができるように」と言いました。そして「ええ、それを構築できます」と言いました。
そして5分後、私のアプリにはその動作バージョンがありました。
ところで、これは本当にクールです。なぜならこれがマーク・ザッカーバーグのソフトウェアの作り方だからです。彼は他の人々がやっていることを見て、「ねえ、私たちがこれをやったらクールだろう」と誰かに言います。しかし彼らは出かけてそれを構築します。しかし今、あなたは自分自身のマーク・ザッカーバーグです。
完全にそうです。
待って、これがどのように見えるか見なければなりません。
わかりました、お見せします。
あなたは使えません。これはシングルユーザーアプリです。そして私は意図的にそうしました。複雑さを避けたかったからです。
しかし、私のStashページをお見せします。これを説明させてください。なぜなら、これは実際に非常に美しく見えるからです。これは非常にエレガントなデザインです。あなたが保存した全ての記事の画像プレビューのようなものがあります。期待されるすべての機能を備えた左手のレールがあります。もしあなたが私に「ねえ、Stashという新しいスタートアップで働いていて、これが投資家に見せるMVPだ」と言ったら、私は「ああ、素晴らしい、完成しているように見える」と言うでしょう。
そうです。そしてこれは基本的に私がPocketに使っていたものと全く同じですが、今は私がそれを所有していて、アプリに変更を加えることができます。そして私は約2時間でそれを作りました。
そしてMosillaはそれをあなたから決して奪うことができません。
それは本当です。
それは素晴らしいことです。
それは本当です。あの野郎たち。では、あなたはこれが、6ヶ月後に話している場合、まだStashを使って後で読む作業をしていると言うと思いますか。
はい。
わかりました。
しかし、私はこれらのコーディングエージェントを実際に使用する際の癖や特性にもいくつか遭遇しました。それについてあなたと意見を比較したかったのです。
そうですね。実際にClaude Codeを使用する経験について話すべきです。なぜならそれは私にとって非常に新しいものだからです。
私が遭遇したことの1つは、ウェブの一部がAIエージェントに対して非常に敵対的になりつつあるということです。
例えば、私のPocketクローンは最初、特定のウェブサイトでは機能しませんでした。
ニューヨーク・タイムズのような。
ニューヨーク・タイムズのような。私はそれを名指しするつもりはありませんでしたが、あなたがしたので。そうです。ニューヨーク・タイムズを含む他の出版社はAIエージェントが彼らのウェブサイトをクロールすることを困難にしているからです。そして私はこの事実をClaude Codeに提示しました。それはそれについて1分考え、「わかりました、回避策を見つけました」と言いました。
ですから、確実にニューヨーク・タイムズの法務部から連絡があると思います。しかし基本的に、あなたがやっていることがウェブサイト、API、外部サービスとのやり取りを含む場合、それらのサービスとウェブサイトは、Claude Codeのようなエージェントが彼らのサイト上のコンテンツと出かけてやり取りできるという事実を好むかもしれないし好まないかもしれません。
Claude Code特有の特定のものを過度に設計しようとする傾向もあると思います。例えば、新しいウェブサイトをデザインしてもらっていた時、私が頼んでいないすべてのこれらのベルとホイッスルを追加しようとしていることに気づきました。ほとんど少し見せびらかしているように見えました。
それがウェブサイトをデザインする楽しい部分です。なぜウェブサイトにベルとホイッスルが欲しくないのですか。
まあ、はい、もし個人的なウェブサイトをデザインしていて楽しくしたい場合はそうです。しかし、これを何らかの深刻なビジネスケースに使おうとしているなら、創造的になってベルとホイッスルを追加することについてのアイデアを持ってほしくないのです。ですから、時には複雑さから戻す必要があることがほとんどわかりました。
または、私が与えた問題のように、私はKindleハイライトを私のKindleアプリと同期できるようにしたかったのです。これは私のPocketクローンのためです。そして最終的に、正しい反応は、実際に私のKindleをコンピューターに接続して、Kindleからこの小さなsnippets.txtファイルをダウンロードしてアップロードする必要があるということでした。
しかし、Claude Codeには複雑さへのバイアスがあるため、ヘッドレスブラウザなどを使って私のKindleハイライトをスクレイピングするような非常に複雑な方法を試みました。最終的に、私のKindleを接続するだけです、その方が簡単ですと言わなければなりませんでした。
そうですね、似たような障害に遭遇しました。今日見ているように、個人サイトをほぼ1時間で構築できたと述べました。しかし2日目に、ブログを追加したかったのですが、それにはMicro Blogと呼ばれるホストされたサービスを使用する必要がありました。
そして、私が求めていたすべての変更を行うために、Claudeはブラウザを使用する必要がありました。そして、Claudeがブラウザを使用するのには本当に時間がかかります。なぜなら、効果的に盲目か、少なくとも人間が見るようには見えないからです。スクリーンショットを撮り、スクリーンショットを分析し、クリックを開始する前にどのピクセルにナビゲートすべきかを識別する必要があります。
ですから、このプロジェクトの最初の部分は非常に簡単でしたが、それに取り組めば取り組むほど、ブラウザを使用することを要求していたため、より難しくなっていくように感じました。ですから、このエージェントに効果的に委ねることができるものと、自分でやった方が良いものをまだ学んでいるところです。
そうですね。それがこの重要な部分だと思います。これらのツールの1つを使って実験を始めることに興味がある場合、AIが形成された問題やタスクとは何かを学ばなければなりません。これらのエージェントが非常に得意なことがあります。得意でないことがあります。一般的に、その区別を知ることが、これらのものをプロンプトすることが得意になるための最初のステップだと思います。
そうですね。同時に、人々にこれで遊ぶよう奨励したいです。Kevin、この間考えていたのですが、この番組でウェブの運命、AIがウェブに何をしているかについて何回不平を言ったことでしょう。そして可能な解決策は何でしょうか。まあ、1つの可能な解決策は、人々が楽しみのためにもっと多くのウェブサイトを作ることです。
そして今、私たちが送ろうとしているメッセージは、このものは今あなたが思っているよりもできることがあり、あなたが思っているよりも簡単だということです。あなたが欲しいものをボックスに入力するだけで、実際にそれが返ってくるという夢に近づいています。
そうですね。それが私たちが実行してきた実験についての少しです。このようなものの大きな絵の意味について話したいと思います。なぜなら、休暇中に見たのは、人々がこの技術がどれほどクールかについて話しているだけでなく、例えばこれがプロのプログラマーの雇用市場を破壊するだろう、これは再帰的自己改善への一歩だ、AIシステムが時間の経過とともに自己改善し、超知能への道を自力で進むことができるという夢または悪夢だということについても話していたからです。しかし、これらのツールについて今何を考えていますか。
まあ、面白いことに、Kevin、最近この種のツールに遭遇した時、何らかの飛躍前進のように感じる時、私はAIめまいと呼ぶその感覚を持っていました。「ああ、すべてが変わろうとしている。少し吐き気がする。座りたい」という、ある種の不安定な感覚です。
これは私にそのように感じさせませんでした。これは私にスーパーパワーがあるように感じさせました。それは私が長い間愛してきた何かをすることを可能にしていました。ある種、能力を失っていましたが、今、突然、以前よりもうまくできることがわかりました。マトリックスのネオのようです。私はアップグレードを受けたのです。
そしてそれをボーイフレンドに言及したところ、私は「これはとてもクールな感じがする」と言いました。彼は「それは素晴らしいけど、もしソフトウェアエンジニアだったらどう感じるか想像してみて。もしウェブデザイナーだったら、このソフトウェアがこれをできるのを見てどう感じるか想像してみて」と言いました。
実際にめまいを感じるかもしれません。そして彼はもちろん全く正しかったです。もしClaude Codeが私のコラムの完璧なバージョンを作成できるが、私よりもはるかにうまくできることを見つけたら、おそらく気分が悪くなると思います。
ですから、ここには諸刃の剣があります。これは非常に民主化する技術です。非常に創造的で強力な技術です。しかし、その効果の1つは、今これをやっている人々の賃金を抑制する可能性があるということでもあります。
そうですね、それはもっともだと思います。しかし、仕事が変わるだけだとも思います。私たちはプログラマー、特にこれらのフロンティアAI企業のプログラマーが、もはやほとんど自分のコードを書いていないことについて長い間話してきました。彼らは代わりにこれらのAIコーディングエージェントのマネージャーのようなものです。そしてそれはソフトウェア開発を超えた仕事にも当てはまると思います。
私はまた、ビジネスに高価なサブスクリプションソフトウェアを構築して販売している会社だったら緊張するでしょう。つまり、これは私が考えていたことの1つです。なぜなら、私がやっていたことの一部は、私が支払っているすべてのものを調べて、これの無料版を構築できるかと言うことだったからです。私がこれを自分で実行するために、月額10ドルのサブスクリプションソフトウェア製品に対してやっているなら、大企業は自分たちのソフトウェアサービスを調べて、「なぜSalesforceに支払っているのか。なぜこの会社やあの会社に年間または月間数千ドルを支払っているのか。無料またはほぼ無料で自分で構築できるサービスなのに」と言うだろうと想像しなければなりません。
そうですね。短期的には、ほとんどの企業が持っているサブスクリプションサービスを使い続ける方がおそらく望ましいと思います。主にサポートが良いからです。この種のものの多くをアウトソーシングしたいのです。
しかし、時間の経過とともに、これらのシステムを自社で開発した代替案に置き換えることがますます可能になることには同意します。そして、もし他の誰かの大規模言語モデルの周りにUIラッパーを提供するだけで巨額の評価額で資金を調達したなら、今緊張するでしょう。
そうですね。また、コードなしでソフトウェアを構築できることがどれほどクールで魔法的かについて座って話している一方で、Anthropicとそのすべての競合他社の目標はコードを書くのが得意なツールを作ることではないため、私にとっては心配でもあります。それはAI研究を自動化することです。それが多くのこれらの企業の明示的な目標です。
彼らは、より良いAIを構築できるAIを構築しようとしています。そして、それが元々の整合性の悪夢だと思います。そして、Claude Codeの実験中に時々自分を捕まえることがありました。ああ、私はただ完全に自分のコンピューター全体のホイールをこのシステムに引き渡していて、その出力を検証する方法が実際にありません。
フードの下で何をしているのかを知る方法がありません。私のセキュリティや健康や幸福を理解さえしない方法で危険にさらす可能性があり、これらのシステムが良くなればなるほど、再帰的自己改善の可能性についてますます心配になり、安全の観点からそれについて非常に神経質になっています。
そうですね、つまりあなたが話しているのはAIコミュニティがテイクオフと呼ぶものです。ただどんどん速くなり続けるのです。私はこの正確な瞬間にあなたほど神経質ではないかもしれません。AIでは常にあのシーソーの上にいるような感じです。ああすごい、これを見たことある、とてもクールとああすごいこれは本当に恐ろしい、シャットダウンしての間です。今週はたまたまああすごいとてもクールモードにいますが、あまり長くないうちにああすごい恐ろしいに戻ると確信しています。ですから、それがビートです。
AI生成フェイク文書事件の調査
わかりました。これらが私たちの実験の一部です。そして、Casey、あなたに同意します。これはいじくり回す人にとって本当にエキサイティングな時です。プロのプログラマーにとっては非常に不安な時です。そして、このようなものは大きな絵の意味を持ちます。しかし、人々がただそれをテストし、自分のプロジェクトをコーディングし、ウェブサイトやアプリまたは自分の生活に合う何かを構築しようとして、彼らにとってどう進むかを見て、最先端がどこにあるかを見ることは本当に有用だと思います。
そうですね。そして、何かクールなものを構築したなら、私たちはそれを見たいと思います。ですから、hardfork@nytimes.comにメールを送ってください。
さて、Casey、あなたは今週ジャーナリズムの行為を行いました。それについて話すのを切望しています。そしてそれは番組の通常のトピックとは異なります。しかし、AIが関与しています。フードデリバリーアプリと、先週インターネットを席巻したバイラルな主張も含まれます。あなたは自分でそれを調査することを決めました。ガムシューズを履いて、出かけて何かを探りました。では、あなたが解明を助けたバイラルなフードデリバリー詐欺の話を教えてもらえますか。
喜んで、Kevin。長年のPBSショー「Where in the World is Carmen San Diego?」の視聴者として、ガムシューを演じる機会があるときはいつでも非常に興奮します。
ですから、そうですね、これは休暇中に私がこのバイラルなReddit投稿を見たことから始まりました。それはConfessionというサブレディットに投稿されていました。そして、私が見た時点で、ほぼ8万のアップボートを獲得していました。最終的にはそれ以上になりました。そして、投稿は名前のないフードデリバリー会社での多くの悪巧みを主張していました。
そして、人々の注目を最も集めたと思うのは、この会社がドライバーに対して絶望スコアと呼ばれるものを計算していると述べたことです。そして、会社はドライバーがお金を得るのに非常に絶望しているかどうかを判断する方法を考案したため、実際にそのドライバーにより少ないお金を提供するだろうということです。なぜなら、彼らはとにかくそれを受け入れることを知っているからです。
そして、それはこれらのプラットフォームについての私たちの最悪の疑念を確認するようなものの1つです。それらはドライバーに対して不利に操作されており、顧客に対して不利に操作されており、ただこの種の無慈悲な利益最大化マシーンだということです。ですから、私はその投稿を見て、これが本当かどうか見なければならないと思いました。
わかりました。私もこの主張が浮かんでいるのを見ました。私にはもっともらしく見えました。なぜなら、これらのアプリが働く人々に寛大であることで知られていないことを知っているからです。そして、それはフードデリバリーアプリがするかもしれない種類のことのように思えました。しかし、私の好奇心はそこで止まり、あなたのはそうではありませんでした。では、この投稿を見た後、何をしましたか。
まあ、3日でコラムを書かなければならないと思いました。おそらくこれから何かを得られるかもしれません。ですから、Redditでその人にメッセージを送りました。おそらく返信がないだろうと思っていました。なぜなら、この人はおそらく今メッセージで溢れかえっているだろうと思ったからです。しかし、驚いたことに、最初のメッセージを送ってから約9分後に返信がありました。Signalで返信がありました。なぜなら、私のSignal名を送っていたからです。
それで、私たちはちょっとしたやり取りを始めました。そして最初は、技術企業で働く多くの他の人々と行ってきた多くの他のやり取りのように展開していました。彼らはあなたと話すことについて少し臆病です。すぐに多くの個人情報を共有したくありません。しかし、私は彼に「これは私が潜在的に記事を書くことに興味があるかもしれないものです。それについてオープンですか」と言いました。そして彼ははいと言いました。それで、その時点から、私の使命は私が言われていることを検証しようとすることです。
そして、最初に検証する必要があったことの中には、私は誰と話しているのかということがありました。その男は名前を言いたくない、または他の特定の詳細をあまり言いたくないと言いました。そして、私の意図は常に最終的にそれを理解しようとすることでした。しかし、今のところ、あなたがあなたであることについて少なくとも何らかのレベルの信頼を与えてくれるものはありますかと思いました。
それで彼はバッジを送ってきました。というより、彼が彼のバッジだと言ったものの写真を送ってきました。それは彼の名前と顔が黒くされている従業員バッジを示していました。その周りに黒いボックスのようなものがありましたが、バッジにはUber Eatsと書いてありました。それは他のいくつかのバッジとキーリングにあるような、机の上に座っているバッジのようなものでした。私は「わかりました、まあそれは何かだ」と思いました。それで、私たちはそこから進みました。
この時点で、何か警報ベルが鳴っていますか。
ええ、しかし、この人の名前がまだないという標準的な警報のようなものだと言えます。彼らからの裏付け情報がありません。
もしこれを公開するつもりなら、もっとずっと多くの情報が必要だということを知っています。しかし、彼らがバッジの写真を送ってきた時、私の正直な答えは、いいえ、これが偽物だとすぐには思いませんでした。しかし、もっと情報を得る必要があることは知っていました。例えば、ねえ、見て、あなたが言っていることを裏付けることができる他の人々と働いたことがありますかと尋ねました。そして彼は、まあ、本当に誰も思いつきませんと言いました。
それから、まあ、あなたが言っていることに関連するドキュメントのようなものはありますか。何かのスクリーンショットかもしれません。誰かがSlackで言ったことかもしれませんと言いました。それが彼が「まあ、考えさせてください」と言った時です。そして彼はほぼ1日間離れました。そして、ほぼ丸1日後、彼は戻ってきて「ねえ、あなたのためにこのドキュメントがあります。このドキュメントはあなたのニーズを満たすでしょうか」と言いました。
そしてそれは18ページのドキュメントでした。そして、情報源が私に送ってきた中で基本的に最もクレイジーなものだと思います。
これを見てもいいですか。
はい。それで、このドキュメントが何であるかを説明させてください。
そうですね。
それは学術論文のように見えるものです。ラテックスでレンダリングされています。これは学術論文が通常レンダリングされる書体とフォーマットです。
論文のタイトルは「Allocet:粒度弾力性予測と流動性選好追跡のためのLSTMからマルチヘッドアテンションへの移行による高次元時系列供給状態モデリング」と書かれています。それはMarketplace Dynamics Groupによって準備されたと書かれています。そして、内部企業文書で見るような、ページを斜めに横切るConfidentialという透かしのようなものがあります。
ですから、これは私にとって基本的な表面レベルの一瞥では正当に見えます。
そうですね。そして私にもそのように見えました。今、私はこの話をオンラインに投稿するとすぐに、最初の言葉からこの全体が偽物だと知っていたと私に知らせたい多くの人々がいたと言います。そして、そのすべての人々におめでとうと言いたいです。そして、あなたがジャーナリズムに進むことを願っています。なぜなら、そこで非常に成功すると思うからです。
私自身は、これが偽物だとすぐには気づきませんでした。なぜなら、繰り返しますが、Kevin、あなたと私は長い間これをやってきました。情報源から多くのドキュメントを与えられてきました。そして、情報源がドキュメントを作成するのには通常多くのことが必要です。繰り返しますが、この人は丸1日のように離れていました。彼らはこれを指先に持っていませんでした。
ですから、論文の非常に技術的な言語を見た時、フォーマットを見た時、最初は私には信頼できるように見えました。
そうですね、もっともらしく見えます。何らかの研究グループによって制作された非常に洗練されたドキュメントであることのすべてのマーキングを持っています。
そして、倫理委員会からのこの内部メモラインの行動科学ユニットから製品リーダーシップへのすべてのメモを持つ付録のようなものさえあります。これは、ここでのずさんな偽造ではありません。
そうではありません。そして、最初にそれを受け取った時、このドキュメントを素早くスキムしたところ、元の投稿の中のすべての単一のものを裏付けるように見えたことに驚きました。
ドライバーを騙すこのシステムがどのように機能するかについての技術的な説明があります。人々がより速い配達を得るために支払うことができる優先料金が本質的に偽物であるという説明があります。そして、さらに進んで、会社はドライバーが苦しんでいる時を学ぶためにApple Watchのデータと電話のオーディオを使用することを考えていると述べており、そうすればさらに少なく支払うことができます。
ですから、繰り返しますが、最初は私は信じられないと思っていました。そして、それは振り返ってみると、何かがおかしいという最初の兆候であるべきでした。なぜなら、このドキュメントはあらゆる面であまりにも真実であるには良すぎたからです。
この時点で、これについて記事を書くつもりだと考えていますか。
絶対にそうです。すぐにではありません。なぜなら、まだやらなければならない多くの作業があることを知っているからです。もちろん、ドキュメントの真正性を検証する必要があります。最低限、Uberに電話してこのようなことを言うドキュメントを見ていますと言う必要があることを知っています。これらは本当ですか、そうではありませんかと。
しかし、最初にしたことは、情報源とテキストを始めたことです。小さなスクリーンショットを撮り始めて、「ああ、彼らはこれをやっている、またはこれはクレイジーだ」というようなことを言いました。そして、元のReddit投稿で非常に感情的だった情報源は、Signalではるかに寡黙でした。多くは1つまたは2つの単語の答えのようなものでした。
さて、この人は多くの他のジャーナリストと話しているように見えますか、それとも1対1のようなものでしたか。
はい。ですから、ドキュメントを読み終えて、わかりました、これを検証できるかどうか見なければならない、おそらくこれは記事だと思った後、「他のレポーターにこのドキュメントを渡しましたか」のようなことを尋ねました。これは長年にわたって尋ねることを学んだことです。なぜなら、リークする人々は複数の人にリークすることがよくあるからです。その一部は、誰かが最初になりたいという競争的なダイナミクスを作り出すからです。それがあなたの話が出ることを保証します。
そして確かに、その男は「ええ、他のレポーターに渡しました」と言いました。ですから、もちろんその瞬間私は「ああ、すごい」となります。素晴らしい。今、潜在的にこのものを上げなければなりません。それは繰り返しますが、振り返ってみると、別の危険信号であるべきです。わかりました、今、私は時間的プレッシャーの下にあり、間違いを犯しやすくする何かをしなければなりません。しかし、そうですね、それは私がより速く進む必要があると感じさせました。
わかりました。ですから、あなたはこのドキュメントを手に入れ、それを見ていて、情報源とこれについて前後にテキストを送っています。次に何が起こりますか。
ですから、この後のある時点で、これらのドキュメントの真正性を検証しようとする必要があると考え始めます。そして、私ができるかもしれないと思ったことの1つは、少なくとも彼が私に送った従業員の写真、というよりバッジが本物かどうか見ることができるかもしれないということでした。
それで、一部のチャットボットが画像に透かしを入れることを知っていました。ですから、バッジ投稿をChat GPTとGeminiの両方に入れて、この画像は生成されたもののように見えますかと尋ねました。Chat GPTは基本的にいいえ、私が言える限りではないというようなものでした。Geminiは、この画像はGeminiによって全体または一部が生成されたと述べました。
そして私はわあと思いました。さて、私がこの話をしたように、一部の人々は、ねえCasey、これらのAIシステムはどのように機能するか、そして自分の出力について説明することについて悪名高いほど信頼できません。では、なぜこれが信頼できると信じているのですかと言いました。これはそうではありません。
GeminiはSynth IDと呼ばれるシステムを開発しました。彼らは写真自体に何かを埋め込んでおり、それは例えばそのスクリーンショットを撮ったり、トリミングしたり、リサイズしたりすることに抵抗するはずです。それはまさにこの状況の人々を助けることになっています。ああ、これは実際にAI生成だったと言えるように。
ですから今、私は大きな大きな危険信号を持っています。この男は私に偽物を送りました。
待って、これは重要なポイントで、人々のために強調したいと思います。なぜなら、AI生成されたテキストの特定の断片がAIシステムによって生成されたかどうかをAIシステムに信頼性を持って伝えることはまだできないからです。
段落をChat GPTに貼り付けて、ねえこれはChat GPTによって生成されましたかと言うことはできません。戻ってくるものは真実かもしれないし真実でないかもしれません。
Gemini上の画像を持つこの非常に特定のケースでは、それはこのSynth ID機能を呼び出します。画像を与えて「ねえ、これを制作しましたか」と言うと。そして、このケースでは、実際にGeminiがこの画像を制作したかどうかの信頼できるマーカーを与えています。
それはまだ別の画像生成ツールによって制作された可能性がありましたが、この1つの非常に狭いケースでは、実際に機能するようです。
そうですね。ですから、その時点で、もちろん情報源のところに行って対峙し、「ねえ、これはGeminiによって作成されたと言っています」と言います。そして彼は基本的に「いいえ、そうではない」というようなものでした。そして彼は自分自身のスクリーンショットを共有しようとしました。そこで彼は明らかに画像を提出して「これを作りましたか」と言い、Geminiが「いいえ」と言ったようなものです。しかし、その画像自体が偽物だったのか。わかりません。
しかし、この時点で、情報源は全ての信頼性を失いました。そして、それが私がこのドキュメントをもう一度見始めた時です。私は「ああ、このものは私を欺くために書かれたものだ」と思いました。技術的な言語がある意味で意味をなさない多くの方法があります。それは基本的に一見すると素人にとって説得力があるように見えるように設計されたドキュメントですが、見れば見るほど崩壊します。
そして最大のヒントは、繰り返しますが、この投稿にあるすべてのものを絶対に検証しているということです。大企業が実際にやるような方法では決してありません。これらの企業は常に法律と規制をかいくぐります。
この話が非常に信じられる理由の1つは、Door Dashが実際にドライバーのチップを差し控えたことで捕まったことです。Uberは実際にGreyballと呼ばれる別のシステムを設定して、規制当局がアプリ内の活動を見ることを防ぐことで捕まりました。これは本質的にこのドキュメント内の別の主張でした。Uber Eatsが想定していたように、Greyballプログラムを立ち上げたというものです。
繰り返しますが、基本的に、それは詐欺のような多くの異なる種類、規制回避のようなものを認めており、ある時点であなたは「わかりました、私はただここでだまされているだけだ」というようにならなければなりません。
そうですね。それは少しぴったりすぎます。少しここに40の決定的証拠が並べられていて、まさにあなたに訴えかけるような方法ですのようです。そして私もその衝動を理解します。
そして、情報源にもっと質問をしていくうちに、最終的に彼は消えました。アカウントを削除しました。そしてそれでおしまいでした。
わあ。さて、この全ての後に1つの非常に面白いことを学びました、Kevin。それは今週、話をしていたということです。記事のために、彼らは私にインタビューしたかったNBC Newsと話をしていました。そして私は彼らに、このバッジ投稿の話と話をしていました。そして、私が話した記者も私の情報源とメッセージをやり取りしていました。そして、信頼構築の一環として、彼女は彼に自分のバッジを送っていました。
わかりました。
それが彼が私に送った偽の投稿の基礎だったことがわかりました。そして、画像を並べて見ることができ、彼が彼女の画像を取り、それをバナナナナに入れて、これをUber Eatsバッジにしてと言ったに違いないことが非常に明確にわかります。
わあ。
そうですね。
それは私にとって非常に驚くべきことです。わかりました。ですから、あなたはこの人が実際に誰であるかを理解することは決してありませんでしたが、彼らがそうではなかったことを理解しました。今、私に何か言いたいことがない限り、Kevin。
ただ高次元時系列供給状態モデリングを調べてみてくださいと言っているだけです。何か面白いことが起こっているかもしれません。
いいえ、私たちが知る限り、それはKevin Rooseではありませんでした。
ですから、私はこれについて多くの質問があります。まず、これは信じられないほど洗練された記者を釣る行為です。過去に私は、提供されたリークやドキュメントやメールチェーンを持って人々から連絡を受けたことがあります。そして、それらのいくつかは少し説得力があったか、少なくとも調べてみたことがあります。
しかし、これほどのレベルの作業を説得力のあるものにするために投入されたものを私に送られたことは一度もありません。
絶対にそうです。そして、それが最初に非常に信頼できるように見えた理由の一部は、繰り返しますが、私はこれを十分長くやってきて、このようなドキュメントを見た時、誰が偽物としてこれを作る手間をかけるだろうかと思うからです。私のデフォルトの仮定は、誰もこれをする時間を取らないだろうというものです。しかし、私の最先端が今追いついているのは、これが実際にはそれほど努力ではなかったらどうだろうかと気づいていることです。
そのバッジ投稿を作成するのに文字通り数秒かかっただけで、1つの本物のバッジ写真を取り、それをバナナナナに入れて、3秒後に偽物を手に入れることができたとしたらどうでしょう。これがClaudeのようなチャットボットに入れた非常に簡単なプロンプトで、完全なPDFを返してもらったとしたらどうでしょう。
ですから、実際には若いレポーターはこれに関して私よりも有利になるだろうと思います。なぜなら、彼らはスロップワールドで育っており、自分の目を信じないことを知っているからです。しかし、少し長くゲームに携わってきた私たちのような古株は、ある種認知衛生をアップグレードする必要があると思います。
そうですね。それは本当に、私が今後私たちの仕事が非常に具体的な方法で困難になったことに気づいた瞬間です。なぜなら、すべての話が匿名の内部告発者のようなものからいくつかのドキュメントを送ってくることから始まるわけではありませんが、一部はそうだからです。
そして明らかに、何かを公開する前に、その人と話したいと思います。彼らが彼らであるという証明がもっと欲しいかもしれません。しかし、これは私にとって最初のフィルターを通過するでしょうし、あなたにとってもそうだったようです。
そして、私たちを方程式から外してください。誰かがバイラルなReddit投稿をスクリーンショットし、それがXで3600万ビューを獲得しました。LinkedInの複数の場所でこれを見ました。私が反証した後でさえ、「これが偽物だったとしても、このようなことがこれらの企業内で起こっていると賭ける」と言って共有している人々さえ見ました。
それが、この投稿者がこれらの企業について持ちたい信念を確認するという非常に良い仕事をした理由です。
そうですね。そして、それが私が抱く2番目の大きな質問です。ここでの動機は何でしょうか。この人との会話から何か感覚がありますか。
残念ながら、彼は非常に寡黙だったので、それについての感覚がありません。これが本質的に休暇中のどこかの退屈なティーンエージャーだったかもしれないという可能性があると思います。
私が言うことは、Signal上での彼らのスペルと文法はかなり悪い方法でした。それが私に、英語はおそらく彼らの第一言語ではなかったことを示唆しました。それが何を教えてくれるかは何でも。
デジタル詐欺についてのニュースレターIndicatorを書いているAlexios Mansourlasと話しました。彼は、ロシア人がこの種の偽のアイテムをソーシャルメディアに投稿する実験をしていることを思い出させてくれました。不和を蒔くという一般的な目的のため、またはバイラリティがどのように機能するかを理解するためのようなものかもしれません。
ですから、これが何らかの種類の国家からの探索に関連していたという外側の可能性があるかもしれませんが、最終的に残念ながら、それについて満足のいく答えを与えることはできません。
つまり、私の最初の考えは、これはショートセラーの誰かで、Uberが何か悪いことをしていると人々を説得しようとして、株価が下がり、利益を得ることができるというものでした。
しかし、おそらくそれほど整然としていないかもしれません。おそらく、非常に複雑な形の復讐を会社に対して取ることを決めた、不満を抱いた元Uber Eatsドライバーかもしれません。または、あなたが言ったように、ただの退屈なティーンエージャーかもしれません。しかし、この障壁は常に努力でした。そしてその障壁がなくなれば、もっと多くのものを見始めると思います。
本当にそうです。さて、これの全ての後、ドキュメントを複製できるかどうか見たいと思いました。わかりました。ですから、本物のドキュメントを取り、それをチャットボットに入力し、プロンプトを逆工学しようとしてくださいと基本的に言いました。このドキュメントを作成したであろうプロンプトは何ですか。そして、そのプロンプトを取り、ドキュメントを生成させようとしました。
興味深いことに、ClaudeとChat GPTは、Casey、Uberを非難するこれらすべての犯罪の偽のドキュメントを作成しませんと言いました。Geminiは、ええ、すぐに戻ってきますと言って、それをやりました。しかし、3つすべてが作成したドキュメントはこれと全く同じようには見えませんでした。そして、それが実際にこの形にするにははるかに多くの時間とノウハウが必要だったように感じました。
ですから、一方では、そうです、大きな話はこれはあなたが思っているよりもはるかに簡単だということだと思います。そして、ジャーナリズムで働いているならそれに対して警戒すべきです。他方、彼がどうやってこれをやったのか正確にはまだわかりません。
ふむ、それはとても興味深いです。実際にこれについてUberと話しましたか。いいえ。
なぜなら、私が話の準備ができた時点で、彼らはすでにVergeにコメントを与えていて、基本的にこれは絶対的な作り話だと言っていたからです。私たちではありません。また、Door Dashの共同創設者がX上でこれはDoor Dashではないと言っていました。ですから、誰もが私が対応する前にある程度それを否定していました。
そうですね。ですから、そこにいるジャーナリストたちは、あなたの受信箱に入ってくるものについて注意してください。しかし、人々は一般的にこれらの能力が世界に存在することを知るべきだと言いたいです。そして、識別力のあるメディア消費者であるためのこれほど良い時はありませんでした。
その通りです。そしてところで、たとえメディアにいなくても、このバージョンの何かがあなたの人生に入ってくるでしょう。私たちのクリスマスまたはメールバッグエピソードでは、「子供たちを騙すために家庭のセキュリティ映像にディープフェイクのサンタを入れたい」と言う父親がいましたよね。
ですから、このものはジャーナリストのために来ているだけではありません。どこにでも存在するようになるでしょう。
そうですね。まあ、Casey、この調査についての素晴らしい仕事です。
そして、すべての調査の最後に言うように、Kevin、やり遂げろ。ロッケラ。
まあ、Casey San Diego、あなたの仕事に感謝します。


コメント