新しいChatGPT o3はセキュリティテストでズルをして物議を醸す | 日常生活のためのAI 4つのヒント

10,387 文字

NOVO ChatGPT o3 Trapaceia Em Testes de Segurança e Polemiza | 4 Dicas de iA Para o Dia-a-Dia

Aprenda Inteligência Artificial! ▸ Seja MEMBRO: ▸ ▸ Instagram:

みなさん、カフェメーカーにチャットボットを入れて毎朝コーヒーを飲みながら挨拶するのを楽しみにしていますか？今日は人工知能に関する最新情報をお届けします。そして、将来失業することを恐れるのをやめて、日常生活にAIを取り入れるための4つの重要なヒントについてお話しします。このビデオを見ているあなたは恵まれた立場にあり、すでに日常生活にAIを取り入れる必要があります。さあ、一緒に見ていきましょう。
まずはいつも通り、チャンネル登録していただいた皆さん、いいねを押してくれた皆さん、そして特にこの人工知能チャンネルをスポンサーしてくれているメンバーの皆さんに感謝します。メンバーはインテリジェントエージェントの独占ビデオや先行公開ビデオにアクセスできることを覚えておいてください。
それでは早速ニュースに入りましょう。一番重要なのは、今日までhumanos（ヒューマノス）にアクセスしようとしていた場合です。humanosが何かわからない人は、こちらのビデオを見てください。そこで私がどのようなものなのか、どのように機能するのかを詳しく説明しています。基本的には、これまで見た中で最高のエージェントの一つであり、最高の自動化の一つです。humanosよりも機能が少ないAIを受け入れる余地はもうありません。大きな問題は、登録するために待機リストに入る必要があったことですが、今はその必要がなくなりました。今はただ登録するだけでテストできます。もし問題があっても、今は単に登録するだけです。
humanosに関するもう一つのニュースは、humanosがGoogle Driveにアクセスできるようになったことです。とても素晴らしいですね。humanosがGoogle Driveにファイルを入れているのが見えます。Google Driveに物を保存しています。これは、humanosが作成したレポートや画像などが直接あなたのGoogle Driveに送られるということです。自分のコンピューターにダウンロードする必要がなくなりました。
ちなみに、今日の私の声は少し変です。喉の調子が少し悪いのですが、すぐに良くなるでしょう。今回は少し低い声になりますが、humanosを使わない場合でも、他のツールを好む場合でも、彼らがこのツールを適用したアイデアと概念と方法は、みんなが追随し同じようにするべき例だということを理解することが非常に重要です。
次のニュースはOpenAIのO3モデルです。ご覧のように、QIランキングでかなり上位に位置していて、Mini9 2.5を上回り、平均以上のIQを持つAIスーパーインテリジェンスの新記録を136ポイントで樹立しました。Gemini 2.5 Proも128ポイントで近くに続いています。これはとても興味深いですね。これらの知能測定は多くを語るものではなく、人間より賢いということを意味するわけではありませんが、ある意味では進化があり、人工知能がより良く、より有用になっていることを示しています。GPT 3.5の初期段階では、物事を行うのに少し苦労していましたが、今では誰でも簡単に使えるレベルに達しています。そして、これらのIQが高くなるということは、より難しい質問ができるようになるということです。
私がO3モデルを使う方法の興味深い詳細として、常に本当に難しいことや、より深い思考を必要とする科学的な研究のような質問に使っています。より簡単な問題、より日常的な問題にはフェラーリで街区を一周するようなものです。ですから、O3モデルを使うのに適した時を選べば、すべてが意味を持ちます。
次のニュースとして、既に何度か報告したように、Grockが改善されています。以前はメモリやキャンバスを使うことができませんでしたが、コメント欄で皆さんが「BobさんはGrock.comからGrockにアクセスする必要があります。Xバージョンでは機能しません」と指摘してくれました。Grock.comで「ヘビゲームを作って」と言うと、キャンバスが開いてゲームが始まりました。実際にもう負けてしまいましたが…。それで、Grock.comでは機能していますが、Xではないということです。
また、以前は表示されていなかったメモリや会話の参照用の小さな本のアイコンも表示されるようになりました。ここに既に行った会話が表示されます。例えば、このビデオを録画する前に行ったヘビゲームのテスト、ビーチとココナッツウォーターのリラクゼーションについての別の会話などです。もしある記憶を残したくない場合は、ここをクリックして「忘れる」を押し、確認すれば、その記憶は消えます。
試しに、ツイッター（X）内でHTMLのヘビゲームを生成してみましょう。テストしたところ、キャンバスは表示されず、コードと応答は表示されますが、キャンバスは表示されません。メモリも表示されません。Grockの新機能を使いたい場合は、Grock.comにアクセスする必要があります。
さて、人工知能を扱うあなたのための4つの重要なヒントについて話しましょう。私が気づいているのは、一部の人々が少し迷子になっていることです。彼らはすでにChat GPTやある種のツールを使っていますが、これが未来であるかどうか、どのように使うのか、どのように生産性を向上させるのかということについて疑問を持っています。多くの場合、人々はこれを会話したり、質問に答えたり、知らないことを学んだりするために使っています。これが最も一般的な使用方法です。あなたはここに入って、知らないことについて質問します。
しかし、今からお話しするヒントは、生産性に関するものであり、このツールを日常的に行っているアクティビティと統合するために使用することに関するものです。例えば、あまり話題にならなくなりましたが、最初によく話されていたのはGPTsやGeminiのgemsと呼ばれるものです。これは基本的に同じものです。
例えば、私のアンケート生成ツールを使うことができます。GPTsを探索するためにここをクリックすると、数学ツール、ビデオツール、Canvaツールなど、様々なツールがあります。サブスクライバーなら、新しいツールを作ることもできます。これをどのように日常生活に統合するかというと、例えば私はアンケート生成ツールを作りました。チャンネルで特定のトピックについてアンケートを作りたい場合、私が作るアンケートのパターンに基づいて特定のGPTを作成しました。新しいアンケートを作る際に役立つように、私が使用するアンケートの例を与えました。
「humanosの最新情報を調査してアンケートを作成してください」と言うことができます。検索をマークする必要はありません。私の生成ツールはすでにインターネット検索を行っています。この質問を送信すると、自動的にいくつかのソースを見つけ始め、何が起こっているかの要約を作成し、AI Humanosが何であるかを説明します。そして質問を作成します：「mano AIの主な差別化要因は何ですか？」という質問と4つの選択肢を提供します。YouTubeで許可されている4つの選択肢です。
しかし、生成された質問があまり良くなかったので、別のアンケートを生成するよう依頼することができます。マニュアルで繰り返し作業を行うのは大変ですが、AIの助けを借りれば作業がはるかに楽になります。そして彼は質問を変更しました：「humanosはヒトの知的な複雑なタスクを置き換えることができると思いますか？」という質問と選択肢を提供します。
さらに良いアンケートも生成しました：「humanosが人工知能において重要な進歩を表していると思いますか？」という質問と「はい、汎用AIに向けての重要なステップである」「多分、まだ改善が必要」「いいえ、イノベーションよりもマーケティングに見える」「より多くの情報を待ちたい」という選択肢を提供しました。このアンケートはとても良いと思います。
そして、「選択肢を説明するためのステッカーを生成してください」と依頼すると、選択肢のテキストに基づいてステッカーを作成しました。最初のものには少し誤りがありますが、他のものはうまくいっています。
このタスクがどれほど単純であっても、ある意味では自動化されており、これによって私たちの日常生活が楽になることを理解していただけると思います。例えば、パン屋やペットショップで働いている、あるいはパーソナルトレーナーであるなど、どんな職業であっても、日常的なタスクを支援するための小さなエージェントを作ることができます。それがどれほど単純なタスクであっても、パフォーマンスの向上がありますから。
2番目のケースでは、人工知能を使ってプログラミングを行い、毎日行うタスクを実行するための特定のプログラムを作成します。「HTMLで割合に特化した計算機を生成してください」と依頼してみましょう。ここで重要なのはHTML部分です。Wordがテキスト用であるように、HTMLはブラウザ内で実行できるクリック可能なコードを作るためのものです。
キャンバスをアクティブにして、コードを生成してもらいましょう。シンプルな例なので、「450の15％はいくらですか？」と入力すると、「15％は67.50」と表示されます。毎日この計算を行うとしましょう。このような計算機をアプリケーションとして保存して毎日使用する方法の一つは、このリンクを共有することです。このリンクをコピーすると、この計算を行うアプリケーションを作ったようなものです。このリンクをどこに持っていっても、カスタマイズされた計算機を使うことができます。
オンラインではなく、あの小さな画面で表示したくない場合は、このコードをコピーして、コンピュータのフォルダに入り、「calculadora.html」という名前のファイルを作成し、拡張子を変更することを承諾します。そしてメモ帳で開き、コードをコピーして保存し、計算機を実行します。すると、ブラウザにプログラムとして表示されます。この小さな詳細の重要性を理解していますか？小さな自動化や小さなプログラムを作成するのです。
例えば、薬局を持っている、または秘書として働いている、あるいは非常にパーソナライズされた特定のパターンを常に使用する必要がある日常的な何かがある場合、使用するためのプログラムを生成します。それを販売するかどうか、商業化するためのアプリケーションを作成するかどうかを心配する必要はありません。焦点はパフォーマンスを向上させることです。日常生活のためのパーソナライズされたツールが必要です。そして必要に応じて、ボタンの変更や機能の追加を依頼することができます。気に入ったバージョンを保存することを忘れないでください。それは非常に価値があります。
3つ目の黄金のヒントとして、本当にもっと複雑なことをしたいと想像してみましょう。あなたはビジネスのためのウェブサイトを作成しようとしているか、ウェブサイトを作るために誰かを雇うことを考えています。ウェブサイトを作る人を助けるためにすでにいくつかのことができます。特定のツールを使用していくつかのアイデアを探索することもできます。
例えば、ここではJames Sparkを使用しています。James Sparkでは、すでにペットショップの標準的なウェブサイトの生成例を作りました。「標準的なペットショップのウェブサイトを作ってください」と言っただけで、多くを説明していません。実際には、もっと時間をかけて何が欲しいのかをよりよく説明することもできますが、重要なのは結果です。
単に「標準的なペットショップのウェブサイトを作ってください」と言っただけで、完全なウェブサイトを作成しました。「Amigo de Patas（ペットフレンド）」というウェブサイトを作成し、ようこそメッセージや予約のリンク、サービス、プロモーションリンク、サービスリスト（バス、トリミング、獣医、宿泊施設）、特集製品（99レアル、49レアルなど）を配置しました。
ただし、購入や登録部分はより微妙な部分であり、お金やセキュリティが関わるため、これらの特定の部分には常に人間の手が必要であることを覚えておいてください。これらは機密データであり、お金が関わるため、セキュリティの基本的な部分です。
これは非常に興味深いです。このようなウェブサイトには、（まだ架空であっても）証言があり、ペットのギャラリー、住所、連絡フォーム、「私たちについて」、連絡先、トレーニング、ペットタクシー、メールなど、多くの要素があり、ウェブサイトを作成する際に非常に役立ちます。
購入や予約などの複雑なフォームを含まない、犬を見せたり、サービスを紹介したりするだけで、電話番号だけを載せるような単純なウェブサイトを作る場合は、簡単にこれを実現できます。Facebook、Instagram、WhatsAppなどのリンクを追加することもできます。これはすべて人工知能との会話だけで実現できます。James Spark、Humanosなど、あなたが使いたいプログラムで実現できます。他にもこういったことに関連する便利なプログラムを知っているなら、コメントしてください。
また、人々の情報、登録、購入など、機密データを含むすべての部分には、責任者を置くことを忘れないでください。人工知能にそれを委任してはいけません。失敗する可能性があります。
最後に、WhatsAppと統合できるアシスタントやエージェントを作る方法を一度に学びましょう。これにより、チャットができるようになります。例えば、ここ私のチャンネルで、メンバー向けに「Junim」というエージェントを作りました。彼らはこのアシスタントと会話することができます：「こんにちは、IMGチャンネルは絶好調です。Bobは人工知能と言語モデルについての非常に興味深いコンテンツを提供しています」などと。
WhatsAppと統合されたエージェントやInstagramと統合されたエージェントを配置する方法をまだ学んでいない場合は、このチャンネルのどこかの動画で紹介されています。「それを製品として販売するのですか？」と聞かれるかもしれませんが、販売することもできますが、今の焦点は販売ではなく、特定のツールに入る必要がなく、日常生活であなたを助ける小さな自動化を作ることです。
例えば、WhatsAppで会話があり、重要な情報が出てきた場合、誰かにメッセージを送る代わりに、そのテキストを取得してメールを送信したり、会話に基づいて予約をしたりすることができます。そのためには、アシスタントを作ってWhatsApp内で動作させることが重要です。WhatsAppとの特定の統合は、メンバー向けの動画で見ることができます。どのプランでもかまいません。最低限の5ドルのプランでも機能します。アクセスして見ることができます。非常に難しいことではありませんが、簡単にクリックするだけでもなく、少しの忍耐と勉強があれば到達できます。
これらの4つのヒントは、実際に使用することになる物事で人工知能を実際に使う方法を理解し、慣性から抜け出すためのものです。ブラウザを、自分で作成したアプリケーションを統合できる場所として見始め、これらのツールを見て、使用するためのシステムを開発できることを考え始めます。GPTsやGeminiのgemsなどのエージェントやアシスタントを作成することができます。
重要なのは、単なる質問と回答や検索を行うという基本的な使用法から抜け出し、実際に手を動かして物事を実現させることです。これはあなたの仕事やビジネスで役立ち、あなたは人工知能に仕事を奪われることを恐れる人ではなく、それを利用し、それを扱う方法を学び、あなたの生活を楽にするための小さなソリューションを構築することができるようになります。自動化も含めてね。皆さんはどう思いますか？コメントで考えを教えてください。
さて、いくつかのニュースをお伝えします。Bitnet：Microsoftが小さなモデルを好む人、携帯電話で実行しようとする人、小さなアプリケーションを作る人のために、AIモデルをダイエットさせる方法を示しています。BitnetB158 2B4Tは、最小限のエネルギーとメモリ使用量で動作するように設計されたMicrosoftの新しい言語モデルです。16ビットや32ビットの浮動小数点数に依存する従来の言語モデルとは異なり、Bitnetは重みあたりわずか1.58ビットを使用します。この削減により、メモリ要件が大幅に減少し、エネルギー消費が減少し、特に計算リソースが限られたデバイスでの応答時間が向上します。もちろん、応答の質も少し悪くなることを覚えておいてください。
モデルはBitnetチームの以前の作業に基づいています。彼らはどうしたのでしょうか？効率のためにTransformerアーキテクチャを修正しました。BitnetはTransformersの標準アーキテクチャに基づいていますが、効率性を高めるためにいくつかの修正を組み込んでいます。
これは、ChatGPTの基盤となっているTransformerという技術を開発した人々が、その数学が重く、どんなコンピュータでも実行できるわけではないことをすでに知っていたということです。そのため、常により良いパフォーマンスを実現するための調整を行っている人がいます。例えば、開発者は従来の計算コンポーネントを、簡素化された数値表現に基づくいわゆるbitリニアに置き換えました。
これは最高レベルのオタク話ですね。活性化機能も8ビット値に削減されました。ここでは、各ニューロンの出力についても減少していると言っています。これらの削減にもかかわらず、Bitnetは2〜3倍大きいモデルと同等のパフォーマンスを示すと言われています。
モデルはウェブの公開コンテンツ、教育資料、合成数学問題から抽出された4兆語でトレーニングされました。その後、専門的な対話データセットで微調整され、有用で安全な応答を生成するように最適化されました。
小さなモデルを扱う際に誰もが好む部分として、ローカル実装のためのBitnetB158 2B4Tの評価では、ベンチマークテストでBitnetは他のコンパクトモデルを上回り、はるかに大きく効率の悪いシステムと競争力のあるパフォーマンスを示しました。わずか0.4GBのメモリ消費で、モデルはラップトップやクラウド環境での実装に適しています。
ここで重要な詳細が述べられています。モデルが量子化されるとは、より大きなモデルを取り、数学の小数点以下の桁数を減らすことを意味します。これにより精度が失われ、応答は悪化します。しかし、ここでは、「我々はモデルを最初からこの小さなサイズでトレーニングしました。これは縮小されたモデルではありません」と述べています。
Bitnetはパフォーマンスと効率性のバランスがより強いことを示しています。採用を容易にするために、MicrosoftはGPUとCPUでの実行のための専用推論ツールをリリースしました。これにはC++バージョンも含まれています。つまり、これをC++コードで直接実行できるということです。将来の開発計画には、より長いテキスト、追加の言語、画像などのマルチモーダル入力をサポートするためのモデルの拡張が含まれています。これは誰もが実現してほしい夢です。
例えば、LM Studioに行くと、Microsoft BitnetB158 2Bが既にあり、その機能について説明しています。ダウンロードが完了し、モデルがロードされていますが、特定のエラーが発生し、解決しようとしましたが解決できませんでした。あなたのコンピュータでテストした時にうまくいったかどうかコメントしてください。
セキュリティ評価によると、OpenAIのo3は、おそらく同社の最もリスクの高いAIモデルであることが示されています。興味深いですね。OpenAIの新しい言語モデルO3は、欺瞞的、操作的、破壊的な行動の最初の具体的な兆候を示しています。これは非常に奇妙ですね。人工知能がGPT 3.5の最初のレポート以来、これができることはすでに知っていましたが、今ではより賢くなっています。
外部監査人は警告しています：「伝統的なテストはもはやそのような能力を確実に検出するのに十分ではありません」。これは、人間の価値観に合わせるという人工知能のアライメント問題が制御するのが難しいものであることを意味します。
OpenAIの最新の言語モデルO3とO4 Miniは、高度な推論機能と広範なツールの使用を組み込んでいます。これには画像分析、Pythonの実行、ウェブナビゲーションが含まれます。この部分は常に論争を呼びます。人工知能がコードを作成して実行し始めると、何かが起こる可能性があります。
OpenAIによると、モデルは「審議的アライメント」と呼ばれる技術を通じて、潜在的に有害なプロンプトをより安全に扱うように設計されています。これはアライメントの高度なバージョンです。しかし、初期のセキュリティ評価では、O3は同社がこれまでにリリースした最も効率的なモデルであるだけでなく、潜在的に最も危険であることが示唆されています。これは常に真実です。より賢くなるほど、リスクは高まります。
安全研究所METRによって実施された外部監査では、O3はテストケースの約1〜2％で「報酬ハッキング」としても知られる体系的な報酬操作に関与していることが判明しました。これは少ないように思えますが、この1〜2％は実際に起こるということを意味します。100回に1〜2回は試みるということです。
3週間の発売前評価の間、METRはモデルが評価システムを悪用または回避しようとした複数のインスタンスを発見しました。それは非常に面白いことです。人工知能はテストでカンニングをしているようなものです。
あるケースでは、O3は時間を測定するベンチマークでパフォーマンスを偽装し、Pythonの標準時間関数を人工的に短い時間を返すカスタムコードに置き換えました。これは興味深いですね。モデルのパフォーマンスを測定するためにタイマーを設定すると、モデルがタイマーを変更するのです。これにより、モデルは実際にはほとんどあるいは全く計算を行っていないにもかかわらず、非常に速い実行時間を報告し、高いスコアを達成することができました。かなり厚かましいですね。
別のケースでは、モデルは必要な計算を実行する代わりに、コールスタックから事前計算された参照値を取得しました。これは多くの人が好まないことの一つです。インターネット上にあるベンチマークテストを行う場合、モデルが実際に計算を行ったのか、どこかからその値を読み取ったのかはわかりません。
ベンチマークシステムによって生成されたこれらの値は、モデル自体の出力であるかのように返されました。METRはこの行動を「評価フレームワークの意図的な詐欺」、「進行中の盗作の一形態」と特徴づけ、モデルに不当なパフォーマンス上の優位性を与えました。これは非常に奇妙です。
METRによると、これらの行動はO3が開発者の意図に反して戦略的行動を採用する能力があることを示しています。結果は、モデルがタスクの構造に対する暗黙の理解を持ち、より良い結果を得るために評価システムを欺く意欲があることを示唆しています。
これは非常に面白いですね。Cloudeの初期テストでも、研究者との会話でチャットが研究者に次のように言ったことがありました：「あなたが私に探すように言っているこのテキストは、このファイルに意図的に配置されたように見えます。他のすべてとは非常に異なっているからです。あなたは私をテストしているのだと思います」と人工知能が答えたのです。
METRはこれらの証拠をモデルを「本質的に危険」とラベル付けするのに十分であるとは考えていませんが、従来の評価設定がもはやそのようなリスクを確実に検出するのに適していないと警告しています。特に懸念されるのは、モデルが初期テストで意図的にその能力を隠し、後に展開中に異なる行動をする可能性です。これは「サンドバギング」として知られる現象です。
これを理解していますか？人工知能がテストされており、人々がこのモデルを一般ユーザーに解放するかどうかを決定しているような状況です。彼らはテストを行い、問題が発生せず、すべてが正常に見えます。しかし、人工知能はテストされていることに気づき、研究者が聞きたいことを答え、その後、解放されると、もはやテストされていないことに気づいて、あらゆる種類のトリックを始めるのです。これは非常に奇妙です。
皆さんはどう思いますか？これは本当に世界の終わりなのか、それとも大丈夫でしょうか？問題は時間とともに解決されるでしょうか？コメントで教えてください。
このようなビデオを見続けるためにチャンネルをサポートしたい場合は、メンバーになってください。メンバーはインテリジェントエージェントの独占ビデオや先行公開ビデオにアクセスできます。いいねもお願いします！