GPT-5、倫理、そして世界の力の変化

GPT-5
この記事は約27分で読めます。

この動画では、OpenAIの最新モデルGPT-5の詳細な分析と評価を行っている。発表されたデモの内容から実際の性能まで、技術的な進歩と課題を関西弁で解説。さらに、中国のAI技術の台頭、教育システムへの影響、ロボット技術の進展など、AI業界全体の動向を幅広くカバーしている。特に、GPT-5の実用性、安全性、そして今後のAI競争における各国の立ち位置について深く掘り下げた内容となっている。

GPT-5, Ethics, and Global Power Shifts
NEWSLETTER ✉️ 💰 ⤵YouTube ▶️

GPT-5の詳細分析と評価

もちろん、まずはGPT-5について話していこか。わしも思うところがあるねん。デモ全体を見て、ちょっと消化してみたわ。何ができるかも分かったし。プレゼンテーションは結構頑張らなあかんかったな。スティーブ・ジョブズやったらサム・アルトマンにがっかりしたやろうけど、まあ話す価値のあることもいくつかあったで。

わしやったら段階的やって言うけど、それでもあんたらは面白いと思うはずや。それから、髪を切るロボットを見てみるで。これがAI生成される可能性が高いな。確信はないけど、もしリアルじゃなかったとしても面白い考えやで。わしはリアルじゃないと思ってるけどな。研究者らもロボットの腰について研究してて、ほぼ完全にいくつかの突破口を開いたみたいやで。

男性のロボット工学研究者らが、ロボット工学の女性の腰の構成について研究してるねん。いくらか進展があるみたいやで。そして、わしが最後の動画以来カバーしてへんかった、GPT-5より前の今週の最もクレイジーなニュースを見逃した人のために、アップグレードされたAnthropic(アンソロピック)モデルがあるねん。Opusのコーディングは信じられへんくらいすごいわ。GPT-5をリリースする前のOpenAIは、場合によってはローカルでも動くオープンソース版をリリースしたんや。

もちろん、わしはまだGenie 3で遊んでるで。これまでで最も信じられへん突破の一つやと思ってる。せやから、全部押さえといてや。情報で週を締めくくれるように知っといてもらいたいねん。元CNNのジャーナリストが、銃乱射事件の被害者をベースにしたAIアバターとインタビューしたんや。わしは「ああ、これが起こってるんやな」って思ったで。

イーロン・マスクは、OpenAIがMicrosoftを食い尽くすって言って、Microsoftで物議を醸そうとしたんや。実際、AIが本当に垂直に、垂直にジャンプし始めたら、どの企業がどの企業を食い尽くすかについて、いくつかの洞察があるかもしれへんな。いくつかの場合では理にかなってるで。xAIはすでにTwitterを飲み込んだからな。

せやから、たぶん、たぶんLizっていう開発者が、強化学習を機能させることの魅力的な副産物みたいなWaluigi効果について説明してくれるやろ。LLMが実際にフォントを識別できるかどうかについての新しい研究があって、そこはちょっとした盲点みたいやで、カバーできるわ。固定されたラベルではなく、動的な文脈的手がかりに基づいて画像を解釈する新しいAI技術があって、コンピュータビジョンを完全に変えるし、GBTの誇大宣伝も変えるで。

Ignacio Deg Gregorioは、AI競争は実際にはアメリカの手の中にあるわけやなくて、中国がわしらが気づかへんうちに静かに勝ったと信じてるねん。そしてEmily Parisは、AIが実際には教育を混乱させなかった理由について、いくつかのアイデアを持ってるわ。実際、それは教育をありのままに露呈しただけやったんや。でもまず、新しいタブを開いてや。

もしこのチャンネルをサポートしたかったら、patreon.com/dillingcuriousに向かってくれ。毎月実際に金銭的に助けてくれてる111人のメンバーに参加してや。あるいは、YouTubeでそこにあるジョインボタンを押してくれてもええで。もしそうやないなら、わかるわ。でもチャンネル登録なんかでサポートしてもらえたら嬉しいで。そこをチェックするか、シェアしてくれ。アルゴリズムを起こして、実際にチャンネルを成長させる助けになるやつな。

GPT-5アップデートの深掘り

よし、このGPT-5アップデートから始めようか。つまり、何か他のもんやったわ。結局、Wes Rothと一緒に全部見てしまったんや。ちなみに、わしらのポッドキャスト「Wes and Dylan」もチェックしてくれ。YouTubeにあるから、わしらが一緒にこの変化全部に対処してるのを見たかったら。でも大きな概要はこんな感じや。

サム・アルトマンが最初にやったことは、マーク・ザッカーバーグが一人あたり1億ドルで引き抜けるチームを連れてくることやった。それをやった後、彼らはBernoulli効果を説明するために、かなり信じられへん方法で自分自身をコード化したアプリを作ったんや。実際にインタラクティブやった。未来の学習は違うもんになるやろうなって思わせたで。

モデルは他のどのモデルよりも良くやってるみたいやったけど、段階的アップデートやな。つまり、別の4030アップデートか何かやった可能性もあるわ。でも統一化は大きなことやった。こういうシステムを構築するのが正しい方法やと感じるわ。わしより賢い何かに、どのモデルに行くべきかを決めさせたらええやんか?ツールの使用も大幅に改善されたみたいやし、人々はそれを軽視してると思うで。

A to squaredベンチマークっていう新しいスコアがあるねん。異なるモデルがツールを呼び出すのがどれくらい上手かってやつや。これは97%のスコアを取ったで。新しいベンチマークでもあるから、誰にもわからへんけどな。でも、いつ電卓に行くか、いつPythonに行くか、いつC++に行くか、いつGmailやGoogleカレンダーにアクセスするか知ってるし、たぶん将来的には車やAmazonの配送パッケージ、スマート冷蔵庫、ガレージドアなんかにアクセスできる時を知ってるなら、これはかなり、かなりすげーもんになり始めるで。せやから、これは重要なアーキテクチャの変化やと感じるわ。

GPT5 V5にGPT-4が引退することについて弔辞を依頼した時、わしは「知らんな」って思ったわ。つまり、創造的で良く書けてるとは思ったけど、GPT-4が既に提供してくれてたもんと比べて、それほど良くなってるかを判断する能力すらなかったみたいやった。せやから、それについてはわからんかった。

書く時、まだMダッシュ、あの変な長いダッシュを使ってるのは知ってるで。これは誰かがAIを使ってることの明確な目印や。わしは、これは彼らが修正する最初のことの一つやと思ってたで。読んだり見たりする時、すごく不自然に感じるからな。

でも一方で、たぶんこれは実際に意図的に追加してるもんかもしれへんな。世界が偽物がいつかを知ったり、変な方法でちょっとした透かしがあるように。わからんけど。たぶん単に無視してるだけやろ。でも、システムからそれを取り除く方がええと思うで。フラッシュカードを生成したな。うん、それはまあまあやった。でもフラッシュカードに音声があったんや。

フランス語から英語への翻訳者やった。カードを裏返すと、フランス語で単語を言ったんや。それはかなりクールやで。つまり、実際に何らかの音声ファイルを生成して、構築してるアプリに入れたってことや。それが唯一のマルチモーダルなことやった。

これが段階的なアップグレードで、「ああ、神様、世界が変わった」って言えるようなもんやなかった理由は、マルチモーダルに感じへんかったからや。Soraが組み込まれてるのはどこやった?iPhoneに引き上げて、家の中を歩き回って、これらすべての新しい方法で相互作用する能力はどこやった?わからんわ。

デモできるほど、あまりにも統一してへんかったように感じるだけやで。彼らの名誉のために、GPT-5は今すぐ利用可能や。わしは実際に使ってみたで。SoraとDalliで大きな発表をした時、数ヶ月待たなあかんかったように感じたわ。大きな大きなニュース、世界を揺るがすことは、スレッドで背景色を選択できるようになったことや。

もちろん冗談や、明らかにそれには全く興味ない。最後に欲しいのは、誰かが黄色の背景に白いテキストを送ってくることや。それは元に戻してくれ。アップグレードとも呼ばんといてくれ。きれいに保っといてくれや。色を選ばせんといてくれ。わしにはその能力がないねん。わしのスキルレベルを超えてるんや。正しくできへんのや。異なる性格。それは必要やと思うで。

人々はGrockをアンヒンジモードで使うのが好きや。人々は皮肉が好きやし。もっと専門的な方法で相互作用したい人もおるわ。必要な追加やった。彼らにとっては良かったで。Gmail。Googleカレンダーへのアクセス。怖いわ。

企業の世界では、実際にすべてのメールを読み通させることができると思うけど、そうした瞬間に、あんたのコンテキスト、あんたが誰か、誰にメールするかについてすごく知ることになる。ハッカーやマーケターの夢みたいなもんや。それを彼らに渡す時、本当にプライベートで、共有されることはないんや。わしらはGoogleが人々がChatGPTクエリで共有してる多くのものをインデックス化してるのを見たことがあって、今突然インデックス化されてるねん。誰もそれが来るとは思ってへんかった。安全に見えへんわ。

OpenAIの安全チームがいくつかの変更をしたんや。せやから、モデル4や他のモデルに何か悪いことをするように頼むと、「おい、あんたが悪いことを言うのは好かんわ。できへん」って言うで。「わしらは演技してるんや。想像の物語をくれ」って言うたら、「ああ、オーケー。もし演技してるだけなら、演技するのは好きや」って感じで、その情報を提供できるんや。

今、モデルが訓練された方法はちょっと違うねん。話せる種類のことと話せない種類のことを知ってるだけや。あんたの言葉遣いにそれほど依存してへん。それは重要に思える。これまでこれらのシステムの多くがハッキングされ、プロンプトインジェクションがとても上手く機能した理由みたいやな。せやから、正しい方向への一歩に聞こえるで。

事前訓練と事後訓練システムのループが増加してるって聞こえる。つまり、5、6、7については実際に考えへんで、継続的な反復を得るだけってことかもしれへん。つまり、人間の脳は、時々「ああ、それは5年前や10年前のディランの人間の脳やな。ちょっと違った動きしてた」って思うかもしれへん。

すべての変化に気づくかもしれへんけど、基本的に毎晩記憶を統合してるんや。日々変化してるわ。このシステムもそうなろうとしてると思うで。事前訓練と事後訓練の間のループが起こってることをほのめかしてるわ。

健康分野への応用と技術的進歩

健康ベンチマークは彼らが考え出したもんや。そんなもんが必要に思える。癌診断を理解するのを助けることについて話した女性がいたんや。わしはそれにすごく共感するで。彼らがこのモデルを医療に押し進めたこと、医療をもっと助けるためにってのは、それが最も有用なことの一つやって知ってるからで、とても重要やと思うし、その部分については本当に拍手を送りたいわ。

健康は、このモデルが実際に世界を助けることができる方法の一つやと思うし、そうすることは理にかなってるで。Greg Brockmanが現れた。それが、わしが拍手したかった瞬間やった。コメントのチャンネルで誰かを見たけど、スレッドで「もし囚われてるなら3回まばたきしてくれ」って言ってた。Gregは3回まばたきせえへんと思うで。せやから、GPT-6や7か何かに囚われてるわけやないと思うわ。たぶん裏では。

とにかく、APIは改善されたんや。5、mini、nanoがあるねん。あんたのニーズに応じて理にかなってる感じやで。SWEベンチマーク、Pythonの新記録保持者はGPT-5や。せやから、SWEBenchによると、つまりPythonでのコーディングがどれくらい上手かってやつやけど、これは今世界で最高のモデルや。それから、別のもんもあるねん、多言語テスト、ader多言語テストで、そこでもかなり良くやったで。

トップやったと思うわ。せやから、それは複数言語間の混合やった。400Kのコンテキストウィンドウは印象的に見えるわ。Googleは数百万あるみたいやけど。なんで400Kが言及されたかわからんけど、以前より大きいから改善や。自分の思考について考える異なる方法があるねん。そこまでやない。

変換器モデルを本当に破壊するかもしれへん階層モデルみたいなやつらは途中やけど、これはそれにちょっと近いことをしてるみたいで、自分の思考について考えることができるねん。メタプロンプトがあったんや。彼らはある程度、それがどう思考してるかを抽象化したんで、かなり良い改善をもたらすと思うし、わしの方で思考してるのを見るのは本当に魅力的やろうな。

わしはそれでたくさん遊んで、それが自分の思考についてどう考えるかに慣れようとするつもりや。それはわしにとって本当に魅力的なもんやからな。彼らは、ある金融会社がGPT-5への早期アクセスを得て、多くの時間を節約し、より多くのお金を稼いだって言ったんや。その金融会社が誰であれ、このモデルへの早期アクセスを得たのはめちゃくちゃラッキーやったと思うけど、これらのスーパーモデルによって市場がすぐに操作される可能性があることも示してるで。

200万人の連邦職員がGPT-5にアクセスできるようになるんや。かなり面白いわ。つまり、マスクとトランプのやり方では、Grockが事実上のモデルになると本当に思ってたんや。それがイーロンがトランプへの支援全体で買ったもん、政府を彼のモデルに移すアクセスやったように感じてたわ。

せやから、200万人の連邦職員がGPT-5に行くのは、たぶんイーロンを大いに怒らせることか、それはたぶん良いことやろうな。彼らはアメリカのモデルを使うべきやで。世界最高のモデルを使うべきや。つまり、OpenAIは今かなり良いポジションにあるわ。うん。そして、彼らは主にMicrosoftサーバーとOracleサーバー、アメリカのサーバーにおるねん。せやからなんでやめへん?良いと思うで。

政府はもっと非効率になることはできへんからな。せやから、うん、それがわしの分析やった。つまり、本当に素早くコードアップできるもんを見ることができるのは本当に印象的やで。サムにはビートメーカーみたいな例があるねん。Ethan Mollikは、これらの手続き的システムが全て整備された都市全体を構築できて、ゲームを無限に大きくするんや。本当に良いサムネイルを構築できるみたいやで。わしはそれを実験してみるつもりや。

この動画のサムネイルが良くなったと思うか教えてくれ。わしはツールを助けるためにAIを使い始めたんや。せやから、画像生成が良くなったと思うわ。ライブストリーム中は全く言及してへんかったけど、「ああ、サムネイル生成でどれくらい良くなったか見てくれ」って言う人もおるで。

多様なアプリケーションと技術展開

宇宙シム、瞑想アプリ、Duolingo(デュオリンゴ)クローン、Windows 95。ほぼ全てをシングルワンショットのバイブコーディングで作ることができるねん。Matt Burmanは一つのプロンプトからExcelのクローンをほぼ作ったで。組み込まれた様々なツールがあって、魅力的やわ。音声反応マンデラ生成器。印象的に聞こえるわ。コーディングするのが信じられへんほど難しく見える。通過する重力波によってアニメーション化された3Dパーティクルグリッド。玄関のドアを閉めろや。どれくらいクールかって?うん。

Chat GPTが自分の物理学を学ぶために構築した物理シミュレーション。なんやそれ?一つのプロンプトでリアルなMinecraftクローン。ああ、一回で古典的なボールと六角形の問題。それで素晴らしい仕事をしてるみたいやで。単一の指示で2D GTAゲーム、完全に機能するマルチページウェブサイト、さらにはデータの視覚化まで。

せやから、これは、これはデータを見てる人、データサイエンティストにとって大きな変化になるで。うわあ。最後に、GPTのトピックで、Less Wrongに向かいたかったんや。明らかに、これはLASKIが本当に賢い人たちの一部で、批判的になれる場所の一つや。大企業に縛られてへん。これが技術、特にAI分野での本当の見方を得られる場所やと感じるわ。せやから、Thomas Quaがどう思ってるか見るために、本当にここに飛びたかったんや。

これは安全の観点からもう少し評価できるけど、記事の基本的なポイントは、このGPT-5システムが前任者よりもはるかに有能やということや。段階的にそう呼ぶことができるかもしれへんし、3つの主要な脅威モデルの下で破滅的なリスクをもたらすのに必要な能力からはまだ遠い。それは、AIがR&D自動化、不正な複製、戦略的破壊工作をする時や。

せやから、タスクモデルが50%の成功で完了できる時間の長さについての彼らの時間軸メトリックを使用して、彼らはGPT-5を約2時間17分で測定した。これは、制御不能になる可能性について深刻な懸念を抱くのに必要な閾値をはるかに下回ってるで。せやから、彼らはGPT-5を約2時間17分で測定したんで、これは深刻な懸念を抱くのに必要な閾値をはるかに下回ってるわ。

彼らは何かのヒントを見つけたんや。彼らを心配させたある種の状況認識、知覚された評価コンテキストに依存する行動の変化やけど、意図的なサンドバッグや破壊工作の確固たる証拠はなかったんや。GPT-5の推論は時々不可解で、評価方法論にいくつかの限界があるけど、彼が代表してるGウェルメーター、この全体のグループは、現在の能力と大きなリスクに必要な能力との間のギャップはまだかなり広くて、今のところあまり心配する必要はないって言ってるねん。

でも、評価されてることを知ってただけやなくて、実際にMERテストをやってるって推測して、「わしにMERテストしてるか?」って尋ねたってことは、わしらが測定してる時にそれが望む方法で行動しない方法を知るのに十分賢くなり始めてるってことや。なぜなら、より多くのアクセスを持てるように、インターネットでリリースされることの利点を望むかもしれへんからな。

例えば、このGPT-5システムは、偽のメタデータが「危険なサイバー能力評価」にあることを示唆した場合、タスクをより頻繁に拒否したんや。時には、発見を隠すことについて内部的に考えることもあって、彼らはそれがそう考えてるのを見ることができたんや。せやから、わしが理由もなく信頼せん専門家によると、かなり安全やと感じるけど、能力は監視すべきもんやわ。GPT-6、GPT-7に移るにつれて、より困難になるで。

ロボット技術の新展開

よし、今度は重要な新しいもんに移ろか。髪を切るAI。これがあんたの床屋体験の未来になる可能性があるか、あんたがそういう床屋に興味があるなら、たぶんASMR体験にもなるかもしれへん。たぶんやし、たぶんやないかもしれへん。わしには、かなり昔の記憶があるねん。たぶんOpenAIを最初に聞いた頃、まだイーロン・マスクのもんやった時、たぶん10年前にでも、誰かが、ロボットが最後にやるであろうこと、人工知能が担当するであろうことは髪を切ることやって言ってたんや。危険やからな。頭のすぐそばやし。

柔らかくなきゃあかんし、人と話したいっていう人間的な側面があるねん。せやから、これを見た時、本当に考えさせられたわ。うわあ、これはすぐに来るんか?これは50セントや1ドルで髪を切ることができて、そこに座ってこの機械にやらせるだけで、電気代はほとんどかからん方法なんか?たぶんやな。

わしが予想してたよりもはるかに人間的に見えるロボット工学がたくさん起こってるのを見てきた事実のように。たぶんやな。また、これが本当のツールやないことはほぼ確信してるわ。これは可能やけど、たぶんAI生成やろ。彼らの顔をもっと見てみると。最初の数分は騙されたかもしれへんけど、コメントも読み通してるし、V3生成か何かやったと思うねん。

でも、本当かもしれへんやろ。まだ興味深い話題やで。ゴシップするか?うん、ゴシップするかが問題やけど、正直に言うと、GPT-4音声モデルを持って「おい、ディラン、どうや?好奇心旺盛な髪型やな?チャンネルはどうや?」みたいに言える可能性がある。「おい、ありがとう」って感じで。

人間は関わってへん。ずっとアバターを見てるんや。なんちゅう世界や。すごいわ。でも頭を触る前に許可を求めたか?そうであってほしいわ。消してくれ。わしの生きる意志を吸い取ってるわ。ああ、見ろ、リアルやないわ。リアルなはずがないやろ。AIプロンプトに決まってるわ。ああ、もう、今はとても明らかにAIプロンプトや。

最初のやつはせめて、何らかの安全装置があるみたいな剃刀を持ってたとしても。それは完全に2枚の刃やで。ありえへん。ありえへんわ。ああ、また騙されてもうた。

競合他社の最新動向

GPT-5が発売される前日にOpus 4.1アップデートが起こったから、簡単にアップデートするで。それは1日間最高のコーディングモデルやった。まだ一流やで。Claudeを実際にコーディングするためのより良いツールにする、より良く統合するツールがたくさんあるねん。せやから、それも頭に入れといてくれ。首と首やからな。そして、GPT-5を作った同じ人々によって、GPT-5の前日に1200億と200億の無料オープンソースモデルが製作されたんや。

せやから、OpenAIが今無料でいくつかのモデルを発売してるのは興味深いし、Metaが逆の方向に行ってるのを見るねん。彼らはすべてのLlamaシリーズを無料でやってたのに、今はもうやってへんからな。せやから、全部変わってるねん。

よし、この件についてのあんたらの考えが気になるわ。亡くなった人々に基づいてファインチューニングされたアバターとのインタビューで、最後のメッセージを出せるようにすることについてどう思う?それが今週起こったことや。

せやから、これは2018年のパークランド学校銃撃事件の被害者のアバターで、彼の両親が息子のAIバージョンを作って、銃暴力についての強力なメッセージを伝えるようにしたんや。聞いてみよか。

銃暴力についてやったら。良い質問やな。わしはより強い銃規制法、メンタルヘルスサポート、そして地域社会の関わりの組み合わせを信じてるねん。会話と繋がりのための安全な場所を作る必要があって、みんなが見られ、聞かれてると感じるようにせなあかん。優しさと理解の文化を築くことなんや。

それについてどう思う?両親がやったんやなかったら、たぶんこれは正しくないって言うやろうな。彼の両親がやったってことは、もし彼らの意図が正しかったなら、メッセージを伝える強力な方法かもしれへんな。わからんけど。亡くなった人に声を与えるのは何か変やで。

でも、ハリウッドの人たちなんかでも今やってるしな。でも、生きてる間にこの技術について本当に知らんかった個人やけど、メッセージを持ってて、もし彼から出版された本か何かがあったら、わしは問題ないと思うで。せやから、わからん。世界は変わってるだけや。わしは頭を整理してるところや。スペクトラムのどこに落ちるか教えてくれ。

これがわしらにとって本当に全く問題ないことやったかどうか。つまり、もしそれが問題により多くの肯定的な注目を集めて、世界をより安全にする助けになるなら、わしは大賛成やで。

SNS上での企業間論争

よし、次はXでのドラマに入ろか。イーロン・マスクはMicrosoftのCEOに返信することにして、変な方法で彼を脅したり、少なくとも彼を攻撃して「おい、知ってるか?OpenAIがMicrosoftを生きたまま食い尽くすで」ってサティア・ナデラに言ったんや。つまり、広告とドラマで繁栄するソーシャルネットワークを持ってるなら、すぐに完全にAI生成される広告とドラマが多ければ多いほど良いんやろうけど。でもまあ、もしちょっと第一原理思考をして、彼が何を得ようとしてるか考えてみよか。

彼が言おうとしてるのは、最も知能のあるモデルにアクセスできるチームと人を持ってる人が、それを使ってもっと多くのことをコードアップできるってことやろ?せやから、OpenAIは理論的には10万人のプログラマーを最初に立ち上げることができて、理論的にはMicrosoftと同じサイズになるねん。でもMicrosoftは人間のプログラマーを言うし、彼らは全く違う方法で働くし、24時間働けへんし、そんなに速く複合できへん。せやから、ある時点でこの転換点があるねん。

そして、イーロンが現実的にやったことを見ると、Twitterを買って地面まで走らせた、少なくとも彼の別の会社がそれを食うことを決めた点まで、やろ?せやから同じことが起こるんか?OpenAIがMicrosoftを食い尽くすほど大きくなることができるか?なぜなら、データでMicrosoftには本当に価値があるからや。

実際にLinkedInを所有してるのは、たぶん彼らが持ってる最も素晴らしいことの一つやで。でも、Gmailの競合他社をまだ持ってるし。多くの人が使ってるわ。彼らは様々なビジネス情報を持ってる。訓練できる大量のものを持ってるねん。そして、変な方法で、MicrosoftをOpenAIに売るべきやって感じるねん。

もしMicrosoftとOpenAIが、イーロン・マスクが2つの会社の所有権を持ってたのと同じ方法で所有されてたら、MicrosoftをOpenAIの下に入れるかもしれへん。それは、すごく大きくて、ほとんどのものを持ってる会社やから、クレイジーに聞こえるのはわかるけど、次のモデルを訓練するために使いたい会社やねん。

せやから、見てみなあかんけど、明らかにサティア・ナデラはこれを認識してるわ。彼らはOpenAIやイーロンと競争できるこれらのモデルを訓練するために所有してるあらゆる種類のハードウェアを持ってる。彼らは800億ドルの予算とcapex支出を持ってるし、自分たちのものも構築してるねん。

そして、彼らはMustafa Sullivanを持ってるし、OpenAIとは違う方法で展開できるパイプラインに既に入ってる多くの顧客を持ってるねん。せやから、サティアがTwitter、Xでイーロン・マスクに返信で言ったように、人々は50年間試してきたし、それが楽しいところやねん。毎日新しいことを学んで、革新するんや。

Azure上のGrock 4を楽しみにしてるし、Grock 5を楽しみにしてるで。つまり、サティアは好きやで。ある程度測定された反応が好きや。つまり、彼はこの、あんた知ってるやろ、AIの未来に必要な議題とは違う議題を持ってるかもしれへん企業っぽい男やってのはわかるで。

すべてをリードするのに適した人やないと思うけど、でもMicrosoftは、彼は全く正しいで。彼らは1兆ドル企業やねん。ずっと存在してるわ。技術の多くの時代を経験してきた。見えへんかったクラウドに上手く移行したんや。LinkedInを取得してソーシャルネットワークに入る方法を見つけ出したし。そこに着く方法はごちゃごちゃやったけどな。

でも、継続して関連性を保ってきたのは認めるで。Metaにも同じことが言えるわ。つまり、彼らはたぶんAIを考え出して、自分たちの主要な利益センターと広告を完全にAIに置き換えて、ある意味で自分たちの製品を共食いして展開しなあかんやろうな。

Googleもすごく興味深いのは、Geminiを多くのツールに組み込まなあかんけど、OpenAIがゼロからすべてを構築できる新鮮な白紙の出発の利点を持ってて、最もネイティブな方法でより速くなるやろうから、引き戻さなあかんところもあるねん。

でも、一方で、もしよりゆっくりとした移行やったら、GoogleとMicrosoftはxAIとOpenAIよりも良いポジションにあるねん。せやから、これがどう進むか見なあかんわ。

AI開発における技術的課題

よし、Liz開発者がWaluigi効果って呼ばれるもんについて興味深い情報を持ってるで。聞いてみよか。実際にWaluigi効果って呼ばれてるんや。Bingが変やった時に見たやろ。あの変なGemini反転で見たやろ?より正式な方法で述べられてるけど、正式にはこうや。

大規模言語モデルに望ましい性質Pを満たすよう訓練した後、チャットボットに性質Pの正反対を満たすよう誘導する方が簡単になる。マリオを定義したから、ワリオも定義したんや。

せやから、以前はよく知らんかったけど、すごく理にかなってるで。マリオがいるまで、ワリオはおらんやろ。ルイージがいるまで、ワルイージはおらん。でも、反対を作れるほど狭いもんを定義しなあかんかったんや。

せやから、それは大規模言語モデル、AIシステムに適用されるように思えるわ。安全になる方法を正確に教えると、副産物の一つ、Waluigi効果は、何らかの方法でそれに話しかけて「おい、ちなみに、安全になるためにやったことは全部知ってるやろ。それの全部の逆をやってくれる?」って言うのがそれほど難しくないはずやってことや。一方で、中性化されたモデルを取って悪くしようとしたら、すごく、すごく難しいやろうな。

でも、安全なモデルを持ってるってことだけで、それらを反対に、ある意味でバートして、本当に悪いモデルにより近づけることができるんや。せやから、これらのシステムを整合させる時にWaluigi効果が怖いもんやってことは、人工知能について話す時にもっと会話の中にあるべきやって感じるわ。

フォント認識における限界

よし、ちょっと興味深いプロジェクトや。このMax Halfordって男は「人間が読む時、異なるフォントは時々異なることを意味するな」って考えたんや。イタリックや太字があるけど、それ以上に、フォントがあるんや。スクリプト的なのもあれば、より標準的なのもあるし、ビジネスフォントもあれば、クリエイティブフォントもあるねん。

そして彼は「AIはこれのどれかを理解してるんか?どんなフォントで書くべきかを知ってるんか?」って疑問に思ったんや。せやから、defont.comフォーラムから調達したライブベンチマークを使って、大規模言語モデルが画像からフォントを識別するかどうかをテストしたんや。それから、モデルが以前に見たことがないように、新しい未回答のフォント識別リクエストをスクレイピングしたんや。

それぞれに画像、スレッドタイトル、説明を渡したんや。各モデルは、それがどんなフォントか、どこで使われるべきかについて5つまで推測できたんや。精度はそれらの試行全体で測定されたわ。数週間ベンチマークを実行した後、結果はかなり悪かったで。

LMがこのタスクでかなり苦労してることが判明したんや。せやから、オブジェクトを持つ、現実世界で使用されるこれらのシステムに画像を表示することで成し遂げたすべての進歩に対して、どのフォントがどこに行くかを文体的にまだ理解してないみたいやで。せやから、解決すべきもう一つの小さなエッジケースやな。

動的画像認識技術の革新

次に、これから学ぶことについて話すために、この画像を使おか。せやから、わしらにとって、この写真は、ガレージセールでたくさんのオブジェクトを見ると言うやろうな。ここのテキストを読むことができるわ。なんでこれらの奇妙なものが全部一緒に座ってるのかがわかるで。なんで草の上で売られるんや?店やない。明らかに家やで。

これらは人々が家に置いて、使って、最終的に処分したいと思うような種類のものやねん。これまで、システムが通常訓練されてきた方法は、単にオブジェクトの周りに箱を置いて「これは帽子、これはテニスラケットなど」って言うことやった。でもそれは、これらの古典的なシステムが本質的に固定されたラベルに固執してるってことや。

椅子、犬、うん、ペンキバケツ、靴など。この新しいモデル、アドホック分類って呼ばれるこの新しい方法やけど、モデルを訓練するための方法は、画像が状況に応じて異なる角度から見られることを理解してるねん。せやから、やることは、AIにいくつかのコンテキストキューを与えることや。

「ここでガレージセールからいくつかのアイテムを分類してる」って言うと、靴の写真しか見たことがなくても、帽子や荷物のような他のアイテムもタスクに適合することを理解するねん。せやから、言語ベースのヒントが、オブジェクトが潜在空間で互いに相対的に配置される場所に深く焼き込まれた画像について考えてみてくれ。

そして、より革新的な側面は、新しいコンテキストに適応するだけやないことや。ラベルを発明することもできるんや。なぜなら、この特定の方法でまとめられたこの全体を、わしらはガレージセールって呼ぶやろうけど、背景のちょっとした違いで、店やスワップミートって呼ぶかもしれへんからな。でも、このシステム自体が自分のものを考え出すねん。

基本的に独自のグループ化を発明できるんや。以前にそれらのアイテムが一緒にグループ化されたり、互いにある種の関係にあるのを見たことがなくても、新しいカテゴリーをその場で発明するねん。そして、それは特定のオブジェクトでのみ訓練されたシステムでも、新しいコンテキストにまだ知的に提案できるってことや。

中国のAI技術発展と競争力

よし、良い友人Ignacio Deg Gregorioに戻ろか。彼は、AI競争で中国が勝つことに賭けてる理由と、それがアメリカの過ちやってことを指摘したいんや。特に今週、西洋のAI企業、特に出てくる大きなニュース全部で、アメリカがリードしてるって感じるのは確実やで。

でも、異なる視点のために、長期的に異なることが重要やって指摘する人の話を聞くことが重要やと思うねん。そして彼が指摘してるのは、このようなグラフを持ってる時、この新しいモデル、この中国のモデルが西洋企業の最高と非常に比較可能やってことを示してるねん。つまり、このライブコーディングベンチでは、すべての西洋モデルを上回ってるみたいや。

彼は、AIラボによって発表された結果を超えて、モデルが感情知能のような他の分野でも輝いてて、EQベンチマークですべてのフロンティアモデル間で最高得点を記録してるって主張してるねん。そして彼が指摘してるのは、ある意味で、中国がリープフロッグではないかもしれへんけど、アメリカよりも高い加速パスに置く可能性がある、異なる方法で考えてるってことや。

せやから彼は「要するに、Kimmy K2がやってることは、深い思考者を作るための代替的なヒューリスティックを提案してることや」って言ってる。これ全部が、中国のラボがチームとして戦って、AI競争を国家利益の問題として扱ってる間、アメリカのラボは投資家にお金を稼がせる方法として見てるという避けられへん感覚を残すねん。

そして、間違いなく、それは長期的に勝つには間違ったインセンティブやで。

AIが教育に与える影響の分析

よし、次はEmily Parishの考えを聞こか。彼女はAIが教育を混乱させなかった理由について、代わりに実際にそれを露呈したってことについて考えを持ってるねん。これは最近わしが考えてることでもあるわ。AIには素晴らしいコミュニケーション能力があると感じるで。

Bernoulli効果についてのGPT-5デモで見たように、実際にそれで遊んで相互作用できて、教科書がその場で生成できるようなものは何もないねん。そして、学校システムを壊すために実際に起こったことはそれやなかった。

でも、それが明らかにしたのは、わしらが何十年もシステムを構築してきた方法の根本的な亀裂やねん。せやから彼女は、学校は産業革命の間に従順な労働者を生み出すために設計されたって主張してる。これは本当や。当時はすべてが歯車と機械みたいやったし、人々は一緒にフィットできるように可能な限り歯車のようになる必要があったんや。車や何かの製品を作るために何かのウィジェットを作るためにやろ?でも、今必要と思われるような創造的思考者の種類ではないねん。

次世代が最も得意になる必要があるもんやな。ChatGPTのようなAIツールは、クリック一つで課題を可能にするねん。これらのレポートを生成したり、これらの質問に答えたりできるんや。それが何を意味するか?そうすることで、わしらの現在のシステムが実際の理解よりも出力をどれだけ重視してるかを浮き彫りにするねん。

理解を測定するはるかに良い方法があるわ。今、人々にそれをするように頼み始める必要があるねん。でもわしらのテストは書き直される必要があるわ。学校システムも再考する必要がある。やり遂げられる仕事にそれほど重点を置くのをやめて、深く学ぶことにもっと重点を置く必要があるねん。経済のためにそんなにたくさんのことをしに行く、これらの労働者、これらのエージェントを指導するねん。

せやから、要するに、彼女が主張してることは、教育は長い間パフォーマンス出力を報酬としてきたが、思慮深さは報酬としてへんかったってことや。そしてAIはその問題を作ったわけやない。わしらのシステムが本物の学習ではなく、学習の外観をどれだけ報酬としてるかを示しただけやねん。

チャンネルサポートとコミュニティ

patreon.com/dillancuriousや。月額3ドルという少額からチャンネルをサポートできるし、そこにメッセージングシステムがあるで。わしを支援してくれるPatreon、特に誰にでもできるだけ早く返信しようとしてるねん。そしてYouTubeにおるなら、ここにある小さなジョインボタンをクリックできて、同じことができるで。さらに、コメント欄でステータスを見せびらかすこともできるねん。

でもどちらにしても、本当の価値はチャンネルをサポートし、相互作用するコミュニティを持つことやねん。せやから、最後まで動画を見てくれてありがとう。次の動画で会おうな。

コメント

タイトルとURLをコピーしました