OpenAIがGPT 4.1をリリース ― その能力は驚異的

4,672 文字

OpenAI Just Dropped GPT 4.1 & It´s a BEAST

Is GPT-4.1 the most powerful AI model ever created? OpenAI just unveiled GPT-4.1, and it’s a game-changer. Packed with g...

最近OpenAIは、コーディングにおいて大幅に性能が向上し、かつコスト効率も高い強力なAIツールの新しいグループを発表しました。人工知能の世界、特に大企業間での競争が激化する中、OpenAIの最新の動きは、業界をリードし続けるための大胆かつエキサイティングなステップだと感じられます。
サンフランシスコに拠点を置くこの企業は、APIを通じて即時に利用可能な3つの新モデルを導入しました。これらにはGPT 4.1、そのコンパクト版であるGPT 4.1 Mini、さらに小型のGPT 4.1 Nanoが含まれます。
驚くべきことに、これら3つのモデルはいずれも、従来よりもスキルと精度を高めて複雑なソフトウェアタスクを処理できるように設計されています。さらに、ユーザーの指示をより明確に理解するよう訓練されており、一度に最大100万トークン（約75万語に相当）という膨大な情報を保持できるようになりました。これは記憶能力における大幅な飛躍です。
2025年4月14日の発表イベントで、OpenAIの最高製品責任者であるKevin Whileは、アップグレードについて興奮した様子で語りました。彼は少し大げさに、「GPT 4.1は旧モデルのGPT 4oを単に上回るだけでなく、ほぼあらゆる面で輝かしい成果を示している」と述べました。これは大胆な主張であり、チームが新しい技術に対して非常に自信を持っていることを示しています。
おそらくビジネスにとって最も魅力的な部分は、新しい価格設定でしょう。主力モデルのGPT 4.1は、以前よりも26%低いコストで提供されます。これは企業がより少ない支出でより多くのことができるようになることを意味します。そして、本当に予算を重視する人々のために、nanoバージョンが用意されています。これはOpenAIが今までリリースした中で最も安価で、100万トークンあたりわずか12セントという価格設定です。これは開発者、スタートアップ、そして予算を気にせず強力なAIを求める誰にとってもゲームチェンジャーとなるでしょう。
しかし、すでに述べた特徴だけが新モデルの特別な点ではありません。この先も視聴を続けて、さらに詳細を知ってください。
GPT 4.1は開発者の実際の問題を解決する
テクノロジーニュースサイトVentureBEとの誠実で心のこもった対話で、OpenAIのポストトレーニング研究チームを率いるMichelle Pocrassは、彼らの最新の取り組みの真の原動力について率直に語りました。彼女は、GPT 4.1を構築した主な理由は、単に紙の上で良く見えるものではなく、開発者や企業が実際の状況で役立つものを作ることだったと明言しました。
彼女によると、GPT 4.1のすべての側面は、ソフトウェアやツールを構築する人々に実際に役立つように慎重に設計されたとのことです。このモデルは、実際のビジネスが日常的に使用する種類の指示をよりよく理解し、実行できるようになったと彼女は説明しました。
このような改善により、開発者はより信頼性が高く、洗練された、そして追加の修正や調整を必要とせずに実世界で使用できるツールを構築できるようになります。
これが単なる誇張かどうか疑問に思うかもしれませんが、数字がその実力を物語っています。ソフトウェアエンジニアリングタスクのモデル性能を評価する信頼性の高いテストであるSWEBench Verifiedで、GPT 4.1は54.6%という印象的なスコアを記録しました。これは前バージョンのGPT 4oと比較して21.4ポイントの大幅な上昇です。
これは小さな進歩ではなく、AIモデルを実際に重要な場所で役立てるための大きな前進です。スマートなAIアシスタントを構築している企業、特に難しいタスクをすべて自力で処理できるアシスタントを開発している企業にとって、これらの最新の改善は大きな意味を持ちます。
GPT 4.1が特に優れている領域のひとつは、指示をよく理解し従う能力です。Scaleの難しいベンチマークテストであるMulti-Challengeでは、新モデルは38.3%のスコアを獲得しました。これはGPT 4oができたことよりも10.5ポイント優れています。
これらすべてが、GPT 4.1がただ賢くなっただけでなく、より実用的で、人々がテクノロジーを構築し使用する方法に実際の違いをもたらす準備ができていることを示しています。
競合他社への挑戦
OpenAIの最新リリースは、1つではなく3つの異なるAIモデルを市場に投入し、それぞれが特定の目的と価格帯を念頭に置いて設計されました。これは、AI業界の急速な成長と、人々や企業がそれぞれ異なるニーズを持っていることを企業が本当に理解していることを示す賢い動きです。
彼らのメインモデルであるGPT 4.1は、大企業向けの非常に高度で複雑なタスクを処理するように作られています。一方、小型版のGPT 4.1 MiniとGPT 4.1 Nanoは、純粋な処理能力よりもスピードとコスト削減を重視する人々に最適です。
これらのモデルの背後にいる主要な頭脳の一人であるMichelle Praassは、すべての仕事が最も賢いまたは最も強力なAIを必要とするわけではないと説明しました。時には、速くてシンプルで信頼性の高いものが必要なだけです。それがNanoバージョンが輝く場所です。文章を完成させる、情報を分類する、文書からデータを抽出するなど、複雑な思考よりも迅速な結果が重要な日常的なタスクのための信頼性の高い小さなヘルパーとして構築されています。
エキサイティングな新モデルに注目が集まる中、OpenAIはまた、彼らの古いモデルの一つについても大きなニュースを共有しました。数ヶ月前にリリースされ、最も高価だったGPT 4.5 Previewは段階的に廃止され、7月14日にはOpenAIのAPIから削除されます。
そのモデルは、入力トークン100万あたり約75ドル、出力トークン100万あたり150ドルという高額な料金を請求していましたが、現在ではGPT 4.1がその代わりとなり、同等かそれ以上の性能をより低コストでより速いレスポンスタイムで提供しています。
この変更は単にお金を節約するだけでなく、OpenAIのコンピューティングパワーをより有効に活用することにも関わっています。最も高価なモデルを廃止し、より効率的なものを提供することで、企業は改善を続けるためのスペースとエネルギーを確保しています。そして開発者にとっては、必要な機能を失うことなく、よりスマートで迅速、そして安価なオプションを得られるという完全な勝利となります。
様々な組織がモデルの能力を確認
公式発表の前に、多くの大企業がOpenAIの新モデルを試す機会を得ました。彼らが共有した結果は、率直に言って非常に刺激的なものでした。これらの組織はそれぞれ、彼らが行う特定の業務において実際に測定可能な改善を見ました。これはGPT 4.1が単に紙の上で強力なだけでなく、実世界で本当に役立つことを証明しています。
法律・ニュース業界でよく知られたThomson Reutersは、Co-conselと呼ばれるAI搭載の法律アシスタントでGPT 4.1をテストしました。彼らが発見したのは、AIが複数の長い法律文書を一度に正確にレビューする能力が17%向上したことでした。
この種の改善は、小さな言い回しの変化が意味を完全に変えてしまう可能性のある、膨大なページの複雑な法律文書を扱う際に大きな違いをもたらします。契約書や法律ファイルを何時間もかけて整理する法律専門家にとって、このような機能強化は、より速く、より自信を持って作業できることを意味します。
一方、投資会社Carlileは、まったく異なる分野で同様に強力な何かを発見しました。複雑な文書から詳細な財務情報を抽出する際、GPT 4.1は50%向上したパフォーマンスを示しました。
金融分野で働く人々、特に大きな投資決定を行う人々にとって、密度の高い書類に隠された財務データの小さな断片を素早く正確に見つけることは絶対に不可欠です。この改善により、企業は時間を無駄にすることなく、よりスマートな選択をすることができるでしょう。
そして、かつてKodiumとして知られていた人気のコーディングアシスタントツールを開発している企業Windsurfもあります。CEOのVerun Mohanは、GPT 4.1が彼らの開発プロセスで何ができたかについての内部情報を提供しました。
彼は、このモデルが他の主要モデルと比較して、どのファイルを見るべきかをより賢く判断し、不要なファイル読み取りを40%削減したと述べました。さらに印象的なのは、不必要なファイル変更を70%も少なくしたことで、重要な編集のみを行うことが優れていることを示しています。
また、GPT 4.1は無駄話をせず、要点をストレートに伝えることも指摘されました。実際、結果や説明を提供する際には、他のトップモデルと比較して50%少ない単語を使用します。
これらの結果はすべて、法律業務であれ、財務分析であれ、コード作成であれ、GPT 4.1が異なる種類のタスクに美しく適応することを示しています。それは以前のモデルよりも速く、鋭く、思慮深いです。そして最も重要なことに、実際に人々がより良く仕事をするのを助けます。これこそがAIの未来があるべき姿なのです。
100万トークンのコンテキストウィンドウ
OpenAIは最新モデルで本当に大きな一歩を踏み出しました。これらのモデルはすべて、100万トークンという巨大なコンテキストウィンドウを備えています。これは以前のGPT 4oが処理できた128,000トークンの8倍です。
簡単に言えば、これらの新しいモデルは一度にはるかに多くの情報を取り込むことができるということです。それが複数の大きな文書であっても、コンピュータコード全体のライブラリであっても構いません。これは一度に大量のデータを扱う必要がある人々にとってゲームチェンジャーです。
この新しい能力がいかに強力かを示すために、OpenAIはかなり印象的なデモンストレーションを行いました。彼らはGPT 4.1に1995年の古いNASAサーバーログを調査させました。これは45万トークンもの巨大なファイルでした。そのデータの山の奥深くに隠されていた何か異常なもの、際立って異常なものをモデルは発見することができました。
しかしOpenAIは、まだ改善の余地があることを認めることをためらいませんでした。彼らは、100万トークンのような極端に長い入力をモデルに与えると、その精度が低下し始めることに気づいています。
彼ら自身のテストの一つであるOpen AIMRCでは、8,000トークンを処理する際のモデルのスコアは約84%でしたが、100万トークンまで拡張すると精度は約50%に低下しました。これは、モデルがパワフルであっても、スムーズに処理できることにはまだ限界があることを思い出させるものでした。
ここまでご覧いただきありがとうございます。コメント欄で皆さんの意見をお聞かせください。他の興味深いトピックについては、画面に表示されているおすすめ動画をご覧ください。ご視聴ありがとうございました。