DeepSeek R1の検閲解除、OpenAIのOperatorがブラジルで解禁、GoogleがAI科学者を開発

AGIに仕事を奪われたい
この記事は約12分で読めます。

6,914 文字

https://www.youtube.com/watch?v=NkCqJlgX3OM

皆さん、Perplexity AIがDeepSeekに対して中国政府が課している検閲を解除する調整を行いました。また、GoogleやOpenAI、Spotifyの新情報についてもお話ししていきましょう。
Perplexity AIがDeepSeek R1の中国の検閲を解除しました。Perplexity AIはR1モデルを使用する人工知能プラットフォームで、R1に対して調整や改良を行っています。R1 1776という、専門的な後処理技術を通じて中国の検閲を克服するように設計されたDeepSeek R1の修正バージョンを公開しました。
これは興味深い点です。私がローカル版のDeepSeekを使用した際、それはLLaMAのファインチューニングで、それらのLLaMAバージョンでは検閲は見られませんでした。しかしそれらは小規模なモデルで、この元のDeepSeek R1は大規模モデルです。オリジナルのDeepSeek R1は、o1やo3 miniのような主要な推論モデルの能力に匹敵しながら、大幅に低いコストを実現したことで注目を集めました。
この効率性の優位性により、特にNVIDIAに影響を与え、米国のチップ株が劇的に下落しました。Financial Timesによると、NVIDIAは一日で5,890億ドルの時価総額を失い、これは米国企業史上最大の損失となりました。
ただし、一つ言及すべき点があります。これは23日か24日頃の出来事で、株価は147ドル程度から最安値の116ドルまで下落しましたが、その後139-140ドルまで回復し、現在は134ドルまで若干下がっています。つまり147ドルのピークから140ドルまで回復したということは、DeepSeekのニュースは一時的なパニックを引き起こしましたが、時間とともに人々は落ち着きを取り戻し、投資を再開し、企業は失った市場価値を回復しつつあります。
完全に147ドルには戻っていませんが、140-135ドル程度まで戻ってきているので、技術的にはほぼ元の水準に戻ったと言えます。
このオープンソースモデルの主な制限は、中国で検閲されているトピックの扱いでした。センシティブな問題に直接対応する代わりに、共産党の承認済みメッセージで応答していました。Perplexity AIは、R1への修正によってこれらのバイアスと検閲の制限を排除したと主張しています。
同社の後処理プロセスには、中国で検閲されているトピックに関するデータの広範な収集が含まれ、事実に基づく質問と回答を集めました。チームは約300の検閲対象トピックを特定し、それらを使用して多言語検閲検出システムを開発しました。このシステムは、以前に検閲された応答をトリガーした4,000の多言語ユーザープロンプトを捕捉しました。
基本的に、検閲された応答を受けた人々の回答を取得し、それらの検閲された応答から事実を追求し、存在しなかった事実を追加しました。
Perplexityによると、最大の課題の1つは、以前検閲されていたプロンプトに対して、正確で十分な根拠のある回答を見つけることでした。同社は、これらの回答や推論チェーンの正確な方法は公開していません。
興味深いですね。私たちは今、何が真実で何が真実でないかを決定しなければならない時代に生きています。しかし、何が正しく何が間違っているかを決めることは、そう単純ではありません。場合によっては、私たちが真実のすべてを知っていて、真実の側にいるように見えますが、実際に真実を追求し、本当に何が起こったのかを確認し始めると、それははるかに複雑になります。
R1 1776は検閲解除にもかかわらず、そのパフォーマンスを維持しています。Perplexityのテストによると、人間のアノテーターとAI判定者によって評価された1,000以上の例に基づいて、R1 1776は以前検閲されていたトピックを包括的にバイアスなく扱えるようになりました。
彼らのベンチマークは、検閲制限を解除したにもかかわらず、モデルの数学的推論能力がR1ベースと比較して変化していないことを示しています。このモデルは現在Hugging Faceのリポジトリで利用可能で、SonarのAPIを通じてアクセスできます。
つまり、Hugging Face上のPerplexityで、完全にオープンで無料のR1 1776モデルにアクセスできます。ファイルには1から256までの巨大なsafetensorsファイルがあり、各ファイルは5GB程度です。大きなファイルですが、優れたコンピュータと優れたビデオカードがあれば、自分のコンピュータで実行できます。
一方、Perplexityのインフラストラクチャを使用したい場合は、PerplexityのSonarモデルがあり、R1とR1 1776(フィルターなしのDeepSeekチャット)にAPIを通じてアクセスできます。つまり、プログラマー、開発者、人工知能の分野で働いている場合、キーを生成してこのフィルター解除されたモデルを従量課金で使用できます。
素晴らしいニュースですね。APIの使用に興味があるかコメントしてください。
次のニュースです。Googleが科学的発見を加速するためのAI研究アシスタントを開発しました。Google Researchは、人間の研究者と協力して科学的仮説を生成し、テストする新しいAIシステム「AI Scientist」を作成しました。
これについては以前も見ましたね。Sakana AIも同様のことを行っており、Metaにも同様のプロジェクトがありますが、事態は進化し改善されているようです。
GoogleのGemini 2.0の新モデル上に構築されたこのシステムは、仮想研究パートナーとして機能し、画期的な発見を加速することを目指しています。これは素晴らしいですね。
これは推論モデルの人々があまり行っていない使用法の1つです。多くの場合、人々はコードを生成したり、質問をしたり、小さなタスクを実行したりしていますが、時には答えが欲しい質問があり、推論モデルはそのために作られています。
このシステムは、潜在的な研究の方向性を生成、評価、改良するために協力して作業する複数の専門AIエージェントを使用します。また、アイデアを処理し分析するために、テスト時のコンピューティングリソースを活用します。
テスト時のコンピューティングという部分は、私たちが質問をしているときに回答する前に、自身の回答について考え始め、反省する瞬間です。
科学者はシステムと積極的に協力し、自身の仮説を提供し、提案の質に関するフィードバックを提供できます。これは興味深いですね。人工知能に考えさせながら、その評価のために一緒に考えることができます。
システムは統合されたEloレーティングシステムを採用しています。興味深いのは、科学者が目標を設定し、それに対してAI Scientistが取り組む必要があり、スーパーバイザーエージェント、生成エージェント、レビューエージェント、ランキングエージェント、進化エージェント、近接性エージェント、目標レビューエージェントを持つということです。
テストタイムコンプリーションで反省を行い、最終的にアイデアトーナメントを行い、より良いアイデアがより高くランク付けされ、トップに上がっていきます。これにより、生成されるすべてを読む代わりに、最初の最良のアイデアだけを読めばよくなります。なぜなら、これらのモデルは私たちが単独で生成できる以上のアイデアを生成するからです。
AI Scientistは、3つの生物医学的応用において、実験室での実験で既に有望な結果を示しています。システムは急性骨髄性白血病の治療のための新しい薬剤候補を提案し、その後テストによって検証されました。また、肝臓線維症の治療標的に関する有益な仮説を生成し、抗生物質耐性のメカニズムの説明を支援しました。
これは単に素晴らしいです。研究者たちは、システムの開発前に独立してこれらの一部を確認していました。つまり、AIは実際に人々が行っている研究と同じ研究を行い、人々と話す必要なく同じ結果に到達しています。
AIサイエンティストも幻覚を見ているという点について触れる必要があります。これは私たちが既に知っていることですね。これらの初期の成功にもかかわらず、Google Researchはいくつかの重要な制限を認識しています。
システムには、より良い文献検索能力と事実確認手順が必要です。評価方法は、特に異なるタイプの研究目標について、より多くの専門家によるテストを通じて拡張する必要があります。
なぜなら、まさにそうですね。システムは研究を行い、結論に達しますが、データと研究を通じてより客観的で決定的な結論に達することができる私たち人間とは異なり、人工知能が幻覚を見る場合、単に対処のしようがありません。AIによる修正自体が幻覚を見る可能性があり、人間にとって明らかに間違っていることでも、多くの意味をなさないことを通過させる可能性があります。
開発チームは、結果のクロスチェックのための外部ツールを追加し、システムの自動自己評価方法を改善することを推奨しています。自動的な自己評価方法を作ることは非常に複雑です。なぜなら、これは問題であり、回答を幻覚する同じAIが評価者としても幻覚的な修正を行う可能性があるためです。
したがって、不確実性の無限ループに入ってしまいます。レビュー後でも幻覚がそこにあるかどうかを決して知ることができません。より包括的なフィードバックを提供するために、Googleは信頼できるテストプログラムを通じて、選択された研究機関にAI Scientistへのアクセスを提供する計画です。
つまり、一歩ずつ進めていくということですね。ツールを作成し、何が起こるかを見て、それが作成する情報をテストする必要がありますが、すべてをテストできないので、ゆっくりと進めていきます。
次のニュースです。Spotifyが好きな方へ、SpotifyはAIで生成されたオーディオブックのプラットフォームを拡大します。興味深いですね。
SpotifyはElevenLabsとの新しいパートナーシップを通じて、AIオーディオブックの提供を拡大しています。ElevenLabsは、特に予算の限られた独立系作家が専門的な音声を録音できるように、従来のスタジオ録音の代替として、よりアクセスしやすいAI音声を提供しています。
非常に興味深いですね。つまり、書かれた本があり、オーディオブックを作成したい場合、ElevenLabsとSpotifyを組み合わせて使用して、本の読み手を作成し、オーディオブックを生成できます。とても面白いですね。
SpotifyはすでにFindaway Voicesプラットフォームを通じてAIナレーションのオーディオブックを提供していますが、これらは特定のパートナーに限定され、公開前に個別のレビューが必要でした。
もちろん、これはオーディオコンテンツの将来について疑問を投げかけます。まず、AI生成のナレーションは長期的にプロのボイスアクターのキャリアにどのような影響を与えるでしょうか。
現在、多くの人々が本を朗読することで生計を立てています。そして突然、すべてが自動化されるかもしれません。ただし、常に覚えておく必要があるのは、これらの自動ナレーション(私も以前、自分のチャンネル用に試みました)は、私たちにとって非常に自然な単語のアクセントや特定の話し方の抑揚を得ることが、人工知能にとってはそれほど簡単ではないということです。
第二に、Spotifyがプラットフォームにある既存の音声録音でAIモデルを訓練した場合、著作権の懸念にどのように対処するのでしょうか。著作権は本に関してのみとなり、音声などはどうなるのでしょうか。
この変更は、AI生成の音楽がすでにSpotifyで存在感を示している時期に起こっています。これは事実ですね。AI生成の音楽は大きな成功を収めています。
彼らはここで指摘していますが、オーディオブックを聴く人の数が単純に増加しています。ElevenLabsはこれに気付き始め、すでにナレーションを行っており、今後Spotifyと統合したナレーションを開始する予定です。
非常に興味深いですね。私は実際に、より多くの人々が物事を聴き、より少ない人々が読んでいることに気付いています。私たちの未来は、より多くの聴取でより少ない読書になるのでしょうか。
これは非常に興味深い点です。なぜなら、会話と聴取は読書よりもはるかに直感的だからです。一方で、読書をする人は、より集中し、より多くの知的活動を行います。これについてどう思うか、コメントしてください。
次のニュースです。OpenAIがOperatorを更多国で展開します。OpenAI Operatorが、インドネシア、オーストラリア、ブラジル(ついに)、カナダ、インド、日本、シンガポール、韓国、イギリスを含むより多くの国で利用可能になりました。
欧州連合は現時点では除外されており、スイス、ノルウェー、リヒテンシュタイン、アイスランドも同様です。しかし、これらの国々でもOperatorを利用可能にする作業は続けていると同社は述べています。
このAIエージェントはウェブブラウザで独立して動作でき、現在はChatGPTのProユーザーのみが利用可能です。つまり、月額999.99レアルの契約です。私もテストしたかったのですが、この料金を受け入れるのは難しく、APIがないため価値がありません。
もし理解できていない方のために説明すると、Operatorは基本的に自律的なウェブナビゲーションを行うAIアシスタントです。Gmailにログインして特定の人にメッセージを書いて送信するように指示すると、人のように適切にサイトにアクセスしてメッセージを送信したり、買い物をしたり、検索をしたりと、様々なことができます。
OpenAIは後日、Plus、Team、Enterpriseユーザーにもサービスを拡大する予定です。つまり、日付は未定ですが、いずれPlusユーザーにも提供される可能性があります。
Operatorの直後に導入されたPresearch機能は、最近になってようやくEUで利用可能になりました。これは非常に興味深いですね。私はこれがすぐにPlusで利用できるようになることを期待しています。
次のニュースです。GPT 4.5とGPT 5がまもなくチャットとAPIで利用可能になります。これは見てみたいですね。OpenAIのBrad LightCapによると、ChatGPTは週間アクティブユーザー数が4億人を超えています。
LightCapは、200万以上の企業ユーザーが仕事でChatGPTを使用しており、推論モデルAPIの使用はo3 miniのリリース以来5倍に増加したと述べています。OpenAIは近々、GPT 4.5とGPT 5をチャットとAPIで利用可能にする予定です。
APIの部分を理解していない方のために説明すると、これは何らかのプログラミングを行う場合、カスタマイズされた外部アシスタントを作成してウェブ部分以外からアクセスする場合に使用します。これはウェブサイトでの自動化や、Java、Pythonなどでのプログラミングなど、様々な形態をとることができます。
GPT 5は無制限で無料ユーザーにも利用可能になりますが、PlusとProユーザーはより複雑なタスクのためにより多くの推論時間を受け取ります。つまり、GPT 5は明らかに全員に、一般に提供される予定です。
OpenAIのCEOであるサム・アルトマンは最近、GPT 5がGPTとOpenAIのoシリーズを単一のモデルに組み合わせると発表しました。おそらく知能はより高くならないかもしれませんが、モデルの長いリストの代わりに単一の小さなモデルになるでしょう。
LightCapは、追加のエージェント機能とその他のいくつかの機能が今年の終わりに続くと述べています。つまり、おそらく今、新しいモデル4.5と5をリリースし、年末にさらなるニュースや新機能が出てくるでしょう。
しかし、OpenAIがこれだけしかリリースしないとは思えません。まだ1年全体があり、現在2月にすぎません。したがって、起こることはたくさんありますし、これだけではないと思います。まだまだありそうですね。様子を見ていきましょう。
GPT 5のリリースを待っているかどうか、どう思うかコメントしてください。このようなビデオを継続して見たい場合は、メンバーになって支援してください。メンバーはWhatsAppグループへのアクセスと早期動画視聴が可能です。以上です。良いねをお願いします。

コメント

タイトルとURLをコピーしました