
3,914 文字

ロンドンで開催されたOpenAI Dev Dayで、o1が注目の的になりましたわ。今日は素晴らしいデモをいくつか見ていきましょう。
まず最初に、OpenAIのチームがドローンを制御する完全なスタックアプリケーションをo1で構築するデモをお見せしますわ。めっちゃクールなんで、ご覧ください。
そこに置いて、ターミナルに戻って、作成したばかりのサーバーを起動しますわ。実行状態を確認してみましょう。バッテリーの状態も良好ですわ。ビデオストリームを開始してみます。うまくいきましたね。
ほんじゃ、本当のテストです。離陸させて何が起こるか見てみましょう。うまくいきました。ボタンが正しく動作するか確認してみましょう。イベントが正しく配線されているようですわ。これは良い兆候ですね。めっちゃ素晴らしいです。
次に移りましょう。この動画のスポンサーであるAI portとTuring Postに感謝します。これらは、AI界の最新情報を網羅した素晴らしいニュースレターです。最新のAIニュースやブレークスルーを、読みやすい形で解説してくれます。
最近、彼らは興味深い研究プロジェクトを行いました。AIモデルが私たちのステレオタイプをどのように反映するかを示すものです。例えば、Stable Diffusion、Midjourney、Yandex Art、Ernie VGなどのテキスト画像生成AIに、X世代、ミレニアル世代、Z世代などの異なる世代がどのように見えるかを生成させたんです。
結果は非常に興味深かったです。Midjourneyはベビーブーマー世代を悲しげでノスタルジックに捉える一方、他のモデルは彼らを人生を謳歌している姿で表現しました。つまり、使用するモデルによって結果が異なり、そのバイアスが反映されるということです。
このチャンネルをご覧の方なら既にご存知かと思いますが、多くのモデルがX世代の表現に苦戦していて、X世代が実際にどのように見えるのかという定義が定まっていないようでした。これは、私たちがこれらのモデルをどのように訓練しているのかについて、多くの疑問を投げかけるものです。
このような研究レポートは、AI portとTuring Postが扱っている内容の一例です。これらのニュースレターをチェックしてみてください。リンクは説明欄に載せておきます。AI portとTuring Postには、この動画のスポンサーとなっていただき、重ねて感謝いたします。
では、動画に戻りましょう。次は本当に驚くべきデモです。o1が音声を使って、Wanderlustというプラットフォームを通じて、旅行プランを立て、ホテルを探し、最終的にはベーカリーに電話して注文を入れるというものです。もう衝撃的ですわ。ご覧ください。
ここに入力してみましょう。ロンドン…はい、ロンドンが表示されました。リアルタイムAPIクライアントで数行のコードを追加したので、会話ができるようになっています。
では見てみましょう。来週、ロンドンとシンガポールに旅行を計画しています。シンガポールはあなたの訪問を待っていますよ。観光できる場所を教えてもらえますか?はい、シンガポールの素晴らしいスポットをご紹介しますね。
周辺のホテルも探したいんですが、手伝ってもらえますか?シンガポールのホテルをご紹介しますね。この3つのホテルについて、詳しく教えてもらえますか?はい、ホテルの詳細情報をお伝えします。
ここで2つ注目すべき点があります。左側では、会話の内容がリアルタイムで文字起こしされています。右側では、最も素晴らしい機能として、リアルタイムAPIがツールにアクセスできることです。
皆さんも独自の関数やAPI、ツールを呼び出すことができます。この場合、地図にピンを配置したり、地図に注釈を付けたり、ズームしたり、インターネットから詳細情報を取得したり、画面に詳細を表示したりすることができました。
リアルタイムAPIは、皆さんにきっと気に入っていただけると思います。運転中、料理中、学習中、移動中の生産性向上など、ユーザーの皆さんはこの新しいインタラクション方法に喜んでいただけるはずです。
さらに難しいことにも挑戦してみましょう。このリアルタイムAPIと、APIやツールに接続する機能を使って、音声インターフェース以外のことができないか試してみましょう。
会話に戻って、別のシナリオを試してみます。ロンドンに戻りましょう。具体的には、チズウェルストリートにあるブルワリー周辺です。ここに何百人もの開発者がいるので、軽い食事を楽しめるかもしれません。近くのパイショップを探してもらえますか?
はい、パイショップをご紹介します。この3つの店について詳しく教えてもらえますか?はい、パイショップの詳細情報をお伝えします。
ここで一旦止めますね。2番目の店がデモ用のスポットで実在しないことにお気づきかもしれません。他の2つは実在する店です。この2番目の店がAIによる注文を受け付けるようなので、Wanderlustアプリのコンテキストで、リアルタイムAPIだけでなく、電話機能も使って電話をかけて注文してみましょう。
そのために、開発者体験チームのイーランに登壇してもらいます。会話に戻って、リアルタイムとの機能を活用するアクションをWanderlustにお願いしてみましょう。
イーランのところが面白そうですね。電話してもらえますか?肉とベジタリアンのパイを200個くらい注文したいんですが、予算は5,000ポンド以内でお願いします。
はい、イーランパイに電話して注文を手配します。もしもし、イーランベーカリーですか?はい、アンズですが、ご用件は?パイの種類について伺いたいのですが。はい、肉のパイ、ベジタリアンパイ、アップルパイなど、色々ございます。
肉100個とベジタリアン100個でいくらになりますか?それはかなりの量ですね…1,200ポンドくらいになります。予算が800ポンドなんですが…イベントで宣伝していただけるなら1,000ポンドでどうですか?
分かりました。1,000ポンドで肉100個とベジタリアン100個ですね。配達はいつ頃になりますか?場所はどちらですか?ブルワリーです。ああ、すぐ隣ですね。素晴らしい、43秒ほどで届きます。ありがとうございます。
次は、リアルタイムAPIの力、つまり高度な音声モードと、人間が学びたいことについての人間とAIの対話を見ていきましょう。今回は惑星について学んでみます。
太陽系で一番大きな惑星は何か教えてくれますか?はい、太陽系最大の惑星は木星です。他の惑星を全部合わせた質量の2倍以上もある巨大な惑星です。木星は巨人の中の巨人なんです。
リアルタイムでの対話がうまくいっていますね。これは学習をより楽しくする方法になると思いますが、もっとインタラクティブにしてみましょう。
地球について知りたいんですが。もちろん、地球は太陽から3番目の惑星で、生命を育む唯一の惑星として知られています。多様な生態系、豊富な水、有害な太陽放射線から守る保護大気層を持っています。地球の特徴についてもっと知りたいですか?
水がたくさんあるように見えますが、陸地と水の割合を教えてください。地球の表面の約71%が水で覆われており、残りの29%が陸地です。青い惑星という呼び名にふさわしいですね。円グラフで示してみましょう。地球の表面の内訳です。
ありがとうございます。火星について質問があります。赤い惑星の火星について、何を知りたいですか?火山がたくさんあると聞きましたが、一番大きな火山について教えてください。
はい、火星最大の火山、そして太陽系最大の火山はオリンポス山です。高さは約13.6マイルで、エベレスト山の約3倍です。オリンポス山についてもっと詳しく知りたいですか?
はい、3つの最大の火山とその高さを教えてください。火星の3大火山は以下の通りです:
オリンポス山:13.6マイル(22km)
アスクレウス山:約11.3マイル(18.1km)
アルシア山:約11.2マイル(18km)
これは素晴らしいデモでしたね。全てが動的に生成されており、事前に定義されていないことに注目してください。これは教育の未来のビジョンを示すものです。
OpenAIには他にもいくつかの小さな発表がありました。より表現力があり、制御可能な5つの新しい音声を使って、音声から音声への体験を構築できるようになりました。
また、プロンプトキャッシュを使用して価格を下げています。キャッシュされたテキスト入力は50%割引、キャッシュされた音声入力は80%割引です。測定するには安すぎるほどの知能への大幅な割引です。
会場の全員がo1プレビューへのアクセス権を得ました。フルバージョンのo1だと思った人もいましたが、OpenAIのプロダクト責任者であるオリビエ・ゴッドマンは「o1プレビューへのアクセスを提供しています。フルバージョンのo1はまだ開発中で、近日中にリリースする予定です」と述べています。もちろん、ジミー・アペルもすぐにコメントを寄せました。
少し変な話ですね。私たちは既にo1プレビューにアクセスできていましたから。ヨーロッパではまだo1プレビューにアクセスできなかったのかもしれません。いずれにしても、とても素晴らしい内容でした。
以上がDev Day Londonでの主な更新内容です。この動画が面白かったと思っていただけたら、いいねと購読をお願いします。また次回お会いしましょう。


コメント