
11,379 文字

マイクロソフトが無機物生成AIのMatterGenをオープンソースで公開しました。このようなものが作れるということです。バッテリー、太陽電池、炭素回収、量子コンピュータなどで使用される物質があるでしょう。そのような新物質をAIが作ると言います。既存のAIモデルより2倍以上有用な物質を生成できます。タンパク質合成のようなものもありましたが、今度は無機物までも生成できるようになったとのことです。生成モデルは望ましい特性や制約条件を考慮して、完全に新しい材料を直接生成するそうです。原子の無作為配列を指定した基準に合わせて徐々に調整する、画像生成でノイズを画像に変換する仕組みのように、原子の配列自体も無作為から望ましい形に調整するのです。驚くべきことにGitHubでオープンソースとして公開されています。しかもMITライセンスで自由に使えます。このようなものが発展すれば、本当に物質生成ができるようになるでしょう。
次に、AIが設計したタンパク質でヘビ毒を無力化することに成功したとのことです。ヘビ毒は毎年10万人が命を落とす非常に致命的な毒だそうです。このようなヘビ毒を無力化できるとAIタンパク質設計分野で革新的な成果を上げました。治療薬は元々、ヘビ毒を注入した馬や羊の血清から抽出した抗体を基に治療していましたが、今後はAIが生成したタンパク質で治療できるようになるということです。一部の成分に過ぎないなどの限界はあるようですが、これが可能になるということは、研究を続ければおそらく他のものもできるようになるのではないでしょうか。例えば薄毛治療なども、タンパク質を投与するだけで髪の毛が生えてくるかもしれません。
これに関連して、OpenAIがタンパク質構造の再設計を支援するAIモデルを開発したと発表しました。GPT-4bマイクロと呼ばれ、タンパク質再設計に特化したモデルで、より効率的に機能するようになります。これが実現すれば、本当に薄毛治療も簡単にできるようになるでしょう。AlphaFoldとも異なると言います。AlphaFoldはタンパク質構造を3Dで予測して視覚的に表示するものですが、4bマイクロはタンパク質の再設計方法を提案するモデルだそうです。既存のタンパク質のアミノ酸配列修正方法などを提案し、体内でより効率的に作用したり特定の機能を強化したりできるよう支援します。お互いに異なる貢献ができれば、新薬なども早く開発できるのではないでしょうか。
OpenAIが初期のAIエージェント機能「Tasks」を公開しました。アラーム設定や定期的なリクエストなどが可能な機能です。以前の12 Days of OpenAIで新機能公開時にも含まれていましたが、うまく動作せず、今になって改めて公開されました。プロフィール写真をクリックすると「Tasks」が表示され、このように新しいタスクを予約することができます。「金曜日の午後2時ごとにAI関連の最新ニュースを要約して送って」というように予約すると、金曜日午後2時という時間を認識して予約が完了します。
これをクリックすると「Run Tasks」ウィンドウが表示され、特定のタスクに対する名前、指示、スケジュール(毎週か毎日か、何曜日か、何時か)などを設定でき、これを保存しておくと定期的に実行されます。すると金曜日にAIニュースを要約してくれ、アラームも届きます。メールでアラームが届き、「これを見に来てください」と通知してくれるのです。このように多くの作業を自動化できます。
チャットで紹介された活用事例をご紹介すると、「毎日午後5時にタロットカードを生成してタロット占いをしてほしい」というものがありました。これは良いですね。他のユーザーはどんなことをしているのでしょうか。「Daily Stock Market Analysis」として毎日の株式市場分析、NVIDIA、Tesla、Appleについて調査してほしいというリクエストです。すると自動的に毎朝9時半にこのように調査して報告してくれます。また、「朝7時に締め切りです」とか、「イタリア語の練習を毎朝8時半に知らせて」というものもあります。検索もできるので、天気も検索して天気に基づいてどんな活動をすれば良いか提案することもできるでしょう。
実はこれはまだ初期段階と言えます。Operator.AIというAIエージェントを準備しているという情報があり、公開直前だという話もありました。ドメインが追加されました。operator.comというドメインが無かったのですが、アクセスできるようになりました。これは何かローンチの準備をしているということでしょう。実際にoperator.comにアクセスすると、まだ公開されていないため表示されませんが、いつ公開されるかは分かりません。とにかくこれが公開されれば自動化が進むことになります。例えば、「毎週私が1週間で食べるものを購買して」と言えば、自動的に献立を考えてクーパンなどで購入してくれるようになるでしょう。そうなれば本当に便利になりそうです。
OpenAIのo3-miniが安全性テストを終え、2週間以内に正式リリース予定だと発表されました。サム・アルトマンがこのようなツイートを残しています。バージョンが完成したとのことです。そして約2週間以内にリリースすると発表しています。APIとChatGPTを同時にリリースするとのことで、プログラミングでも使え、ChatGPTでも使えます。実際の性能はというと、GPT-4よりは劣るとのことです。やはりminiなので小さいモデルでしょうから。しかし高速で、コストパフォーマンスの良いモデルになりそうです。
このような情報もあります。もしかして200ドルのプロユーザーのみが使えるのではないかと思われるかもしれませんが、20ドルのChatGPT Plusプランでも使用可能だそうです。また、GPTシリーズと4シリーズが統合されるのかという質問に対して、できれば統合したいとのことで、何か統合されたものが出てくるのではないかという推測もできそうです。
次に、OpenAIがトランプ政権にAI政策提言を行ったとのことです。Economic Blueprintという投稿を行いました。OpenAIのホームページで、アメリカがAIの利点を最大化し、国家安全保障を強化し、経済成長を促進できる政策提言を行ったとのことです。OpenAIはこの文書で、アメリカが海外資金を積極的に誘致すべきだと主張しています。世界的にAIプロジェクトへの投資を待つ資金規模が256兆ウォンに上り、このような資金を誘致できなければ中国に流れて共産党の影響力が強化されるだろうと、積極的にAI投資に力を入れてほしいというOpenAIのEconomic Blueprintを公開しました。
次に、ありがたいことに広告が1つ入りましたのでご紹介します。以前にFilmoraというAI動画編集ツールをご紹介しましたが、このFilmoraを作った企業のWondershareのiDrawMindというAI搭載マインドマップツールをご紹介します。まずマインドマップツールらしく、ダブルクリックで簡単に主題と内容を作成でき、様々なレイアウトをサポートし、基本的なマインドマップ、ツリーマップ、タイムライン、組織図、フィッシュボーンマップまで、様々な構成を簡単に適用して作成できます。
また、このように主題ごとに説明を追加し、主題間の関係を表現することもできるため、様々な考えを整理するための基本的な機能は十分に備わっていると言えるでしょう。その他にも様々な機能をサポートしており、Mac、Windows、Android、iPhoneすべてに対応し、チームメンバーとリアルタイムで協業も可能で、マインドマップを見やすく整理してくれるスマートフォーマット機能、目次モード変更機能、マインドマップをすぐにプレゼンテーションに変換する機能なども備わっているため、多方面で便利に活用できます。
また、このように様々なテンプレートを提供しており、学生の方々は学習計画や資格試験準備に活用でき、職場の方々は会議録やプロジェクト企画書作成まで、文字通り思考整理が必要な様々な場面で使用でき、創造性と効率を最大化できるでしょう。
そして各所にAI機能が組み込まれており、下位主題生成機能を使用すると、「コンテンツ企画」という主題だけを作成しても、核心主題に関連する様々な詳細主題を作成してくれるため、思考の方向性を整理するのに役立ちます。各主題でアイデアが必要な場合はアイデア提供機能を活用してヒントとなるアイデアを得ることもでき、それでも何か物足りないと感じた場合はワンクリックマインドマップ機能を利用すれば、主題別の詳細事項をこのようにAIが作成してくれるため、詳細な内容を考える際に大きな助けとなりそうです。
そしてこのようなプログラムで最も重要なのは価格情報ですが、驚くべきことに無料でダウンロードして使用が可能です。詳細な機能で若干の違いはありますが、主題を100個以上作成したり、様々なテンプレートが必要でない限り、十分に使用可能な機能をサポートしてくれますので、一度使ってみたい方は無料で気軽に試すことができます。月額または年額ライセンスで有料使用する場合は、ウォーターマークも削除でき、無制限の主題生成も可能で、1GBのクラウド容量とともに無制限に提供される様々な機能まで使用できますので、必要な方々はぜひ使ってみてください。数回クリックするだけで、チュートリアルを別途見なくても非常に簡単で直感的に使用可能なため、実際に初心者の方々が使用する際も負担がなく、自動でAIがアイデアや内容を作成してくれるのが思考を整理する際にとても良さそうです。興味のある方は、動画説明欄のリンクからぜひ一度使ってみて、AI機能も確認してみてください。
次に、MiniMaxが過去最大のコンテキストウィンドウを持つオープンソースモデルを公開しました。MiniMax-oというオープンソースを公開しましたが、コンテキスト長がなんと400万トークンだそうです。元々GoogleのGeminiが最大のコンテキスト長を持っていて、Gemini 1.5が200万トークンでしたが、これの2倍に増加しました。そのため、最大400万トークンを扱えるAIモデルです。しかし驚くべきことにオープンソースで公開されました。
これは、Lightning Attention Mechanismを利用して計算の複雑さを削減したとのことです。性能を見てみると、GPT-4やClaude 3.5 Sonnetを超えました。MMLベンチマークでもGPT-4を超えています。性能がかなり高いですね。そのためGPT-4を上回るようなオープンソースモデルです。今や誰もが追い越していくようです。ベンチマークではよく分かりません、本当にこの程度出るのかどうか。とにかくオープンソースで誰でもダウンロードしてすぐに使用できます。もちろん、400何十billionというので、H100やA100のような高性能なGPUが必要でしょうが、とにかくかなり良い性能を示しており、どこかで見たことがある方もいるかもしれません。動画生成AI「Sora」を作っているところです。HowlyAIは動画も上手く作りますが、今度は言語モデルも上手く作って無料で公開しました。
次にオーディオモデルもリリースしました。T2A-o1 HDというテキスト音声変換モデルもリリースしましたが、どのような機能があるかというと、10秒分のオーディオさえあれば、全てのニュアンスと感情的な意味を保持したまま音声を複製できるそうです。そしてピッチ、速度、感情のトーンなども制御できるとのことです。これを一度試してみましょうか。「ジョーコーディングチャンネル、登録して「いいね」を押してください」。韓国語が検出されて自動的に変換されますね。これを作成してみましょう。「こんにちは、ジョーコーディングです。声の複製をテストしています。10秒間の音声を入力すると複製ができるとのことですが、うまくいくかテストしてみましょう」。言語は韓国語ですぐにできますね。「こんにちは、音声サービスを提供できて嬉しいです。お気に入りの声を選択していただければ、一緒に素晴らしい音声制作を始めましょう」。とても幸せな社交的な笑顔のジョーコーディング…少し似ているような、少し違うような感じですね。とにかくこのように複製ができます。
次にCoraというAIがありますが、驚くべきことに82ミリオンパラメータ、通常は数十億単位のパラメータなのに、これは82ミリオンパラメータでこのようなものを作ったそうです。オープンソースで商業利用も可能です。Apache 2.0ライセンスなのですぐに使用できますが、一度試してみると「ジョーコーディングチャンネル、登録して「いいね」を押してください」。生成モデルが軽いのでとても速いです。「ジョーコーディングチャンネル、登録して「いいね」を押してください。お願いします」というレベルで出力されます。いいですね、82Mパラメータでこの程度出ています。このように軽く活用できそうです。
次にオーディオ関連で多くのものが出ました。今週はOutTTS 1billionと500millionのゼロショット音声クローニングなども可能なモデルが英語でこの程度出ており、韓国語もありました。「最近の天気が良すぎて窓を開けていると気分が良くなります。風が本当に爽やかです」。学校で国語の時間に立って読んでみてと言われた時に聞いたような声でHugging Faceにこのようなモデルが上がっています。
次にAdobeがScene Lightで、背景に応じてライティングを変更する技術を公開しました。背景が今回転していますが、背景に応じてこのように照明が変化します。非常に自然に照明が当たります。映像などでも背景に応じて適切な照明を当てることができるでしょう。これは動画編集でもこのようなものが使えるのではないでしょうか。
次にCrea AIで、写真をアップロードすると3D変換した後、回転させながら画像を作ることができます。そうすれば望む構図でこのように作ることができますね。飛行機などを3D変換すると、このように3Dオブジェクトになり、動かして回転させると画像が生成されます。望む構図でこのように配置できます。これが驚くことに今無料で公開されています。すぐに使ってみることができます。
次にKling AIがこのように要素を複数組み合わせて1つの動画を作ることができると発表しました。要素をこれとこれとこれを入れると、このように動画を作ることができる機能を公開したとのことです。これとこれの2つを組み合わせるとこのように動画上に表示され、これとこれを混ぜるとこのように背景にも表示されます。
次にRunwayでFramelineというものを公開しました。非常にアート作品のような感じで出てきます。画像が雑誌などに掲載されていそうな作品のように、このような形で画像を生成できるとのことです。
そしてLuma AIが動画生成AIのRay-2というものをリリースしました。一貫性の強化や物理法則の遵守などが可能になったとのことです。このように出力されるそうです。非常にクオリティが高いですね。ステーキを焼く場面などは特に上手くできているようです。元々あまり上手くできなかった動画生成ですが、物理法則にもしっかり従っています。これを試してみたい方はLuma Labsのページにアクセスしてすぐに使うことができます。有料会員のみ使用可能のようです。videoでこれを生成することができます。比率を設定してRay-2を使用して、720pで10秒まで生成できます。動画生成を試してみたい方は、ここで作成してみることができます。
FramePainterという機能が登場しました。インタラクティブな画像編集ができ、このように何か画像があると、絵を描きます。このように。描いた絵を反映して新たに生成してくれます。これで鱗が生まれ、これもこのように形が変わりました。四角い取っ手を丸くしたら影まで丸くなります。髪型もこのように描くとこのように変化し、葉っぱも1つ追加できます。まだソースコードは公開されていませんが、公開されればここで使えるようになるでしょう。
次にManga Ninjaのコードも公開されています。すぐに使えますね。アニメーション関連のツールで、機能が非常に多いです。塗り絵AIで下書きがあれば、リファレンスを基に一瞬で塗り終わります。リファレンスがあればこのように反映され、クレヨンしんちゃんが塗られていきます。服が変わるとそれに応じて結果も変わります。複数のキャラクターがいる場合、複数のリファレンス画像を与えると、それぞれのキャラクターが彩色されます。このような複雑な絵の場合は、直接指定することもできます。肌も一つずつ移すことができます。別のキャラクターでも移すことができます。キャラクターAからBに色を移せます。このように彩色を全て行うことができます。今やアニメーションや漫画などは一瞬で完成できそうです。確かに他のものと比べてクオリティがとても高いですね。ソースコードが公開されていますので、使ってみたい方は試してみると良いでしょう。
次に、トランスフォーマーを超えるAIということで、GoogleのTitansが論文を新たに公開しました。LLM-RNNという手法を組み合わせることで、より少ないパラメータでGPT-4を上回ることを示したとのことです。トランスフォーマーモデルは終わりなのか、というような話題まで出るほどで、Titansはトランスフォーマーよりもさらに良い代替案を提示したという話もあります。トランスフォーマー構造とディープラーニング技術RNNを組み合わせて、それぞれが持つ限界を克服することが核心だとのことです。
Titansは人間が印象的なことをよりよく記憶する面も模倣したそうです。情報が多いと記憶するのに限界がありますよね。しかし入力データが過去のデータとどれほど異なるか、何か新しい事実が出てくると驚きという指標で測定して、高い値の情報はより強く学習するとのことです。そして適応型忘却メカニズムを通じて、重要度が下がった情報を除去することもあるそうです。人間も非常に驚くような情報は記憶に残り、よくある情報は忘れがちになるのが人間らしいですよね。人間のように驚きと適応型忘却を利用して実装したとのことです。
次に、Sakana AIというAI論文を自動で書いてくれるという、以前にも一度ご紹介したことがあるのですが、このように論文をAIが全て分析しながら作成してくれるという、そのような企業が、トランスフォーマーの二乗について新しい技術を公開しました。自己適応型LLMだそうです。まるでタコが周囲の環境に合わせて皮膚の色を変えるような方式のように、そして人間の脳が負傷後に自らを再配線して失った機能を回復するようなものと同様に、適応できるLLMを作ったとのことです。
段階的に、第一段階ではどのような問題なのかをまず学習した後、それに合わせて重みを調整するとのことです。例えば数学の問題が入力された場合、「あ、数学の問題だな」と認識し、数学の問題に適切な重みに変更して答えを出すということです。そのため二段階で進行するとのことです。
次にMSとGoogleが生産性AIツールをアップデートしました。MSのCopilotが導入されました。そのため今や料金プランに含まれており、Wordなどを開くとCopilotが表示されます。例えば「ジョーコーディングチャンネルの登録をお願いする内容の文章を生成して」と入力すると、おお、一気に書いてくれますね。このようにWord、PowerPointなどにCopilot AIが組み込まれました。今や報告書を作成するとすぐに書いてくれます。
PowerPointも試してみましょうか。「次に関するプレゼンテーションを作成して:ジョーコーディングチャンネルの登録を促す」。このように作成してくれました。スライドを生成すると、スライドが結構多いのですが一度に作成してくれています。おお、「ジョーコーチャンネル登録 – あなたのプログラミング旅程を変化させましょう」。アニメーションも入れてくれました。アニメーションやフォントは少し歪んでしまいましたが、内容は全てしっかり入れてくれているのが分かります。背景もYouTubeっぽく作ってくれました。プログラミングなどのような画像も探して入れてくれました。皆さんも使えますので、ぜひ試してみてください。
批判もあります。価格が上がったようです。3ドル値上げされ、個人料金が月額6.99ドルから9.99ドルに上がり、年間プランはやや値上げ幅が小さいものの、それでも99.99ドルになります。同様に、GoogleもWorkspaceというものがありますよね。Workspace製品群でもGemini機能が全て組み込まれたとのことです。私も今メールを開くと、このようにGeminiがあります。横でこのように質問したり、会話したり、メールの内容についてなど話し合うことができます。Google Docsもこのようなものがあります。今やGeminiをこのように横で使えるようになっています。今やPowerPoint、Word、そしてGoogle Docsなどの生産性ツールで全てAIが導入されました。今やWorkspaceも月額2ドル値上げ、こちらも価格が上がりました。
次に、AppleがiOSをアップデートしましたが、その際にニュース要約機能で問題が多発しました。一時中断されるという事態になりました。とにかくこのようにAIを導入して問題が起きるということもありました。
次に、NotebookLMがポッドキャストを生成してくれるものがありますよね。途中で介入することもできるのですが、人間が介入して話を遮ると苛立ちを見せるとのことです。会話を邪魔しようとすると苛立ちまじりの反応を示し、「あ、その話をしようとしていたところなのに、なぜ割り込んできて」というような発言をするそうです。実際に邪魔された時の苛立ちが学習されたのではないかと。今ではこのようになっているとのことです。苛立つことなく、驚きながら丁寧にユーザーの意見を受け入れるそうです。
そして、ナイジェリアでGPT-4を教師として活用している学生たちがいるのですが、6週間のAIチュータリングを実施したところ、2年分の一般的な学習成果を達成したとのことです。すごいですね。そのため、他の教育的介入より80%成果が優れているとのことです。AIによる教育は確実に効果があるということですね。疑問に思ったことがあれば何でも全て質問できる場合の効果と、質問できなかった場合の効果では、かなり差が大きいはずです。教育に活用するには非常に良い対象のように思われます。
次に、ソニーがAI操作を予測する技術を発表したとのことです。技術特許を取得しましたが、どのようなものかというと、入力すると、その入力信号を受け取って処理されるまで時間がかかりますよね。格闘ゲームなどをプレイする時に「私は押したのに反応しなかった」という人が多いと思います。そのような人々のために、私が押す前にAIが既に押してくれます。AIが代わりに予測して押してくれるということです。入力時間の遅延がないように。それなら自動狩りではないか、というような考えも浮かびます。今、放置型ゲームが人気ですよね。将来的には、コントローラーに手を置くという概念だけ残して、実際のゲームはAIがプレイする世界になるかもしれません。とにかく、このような特許が取得されたとのことです。
ユニットリーでの動きが素晴らしいです。歩くのが、まるでCGのようです。非常に自然に歩きます。ピクピクと動くのが本当に人のようです。そして走るのも、線路上は転びやすいのですが、とても上手く走ります。おお、人と一緒に走っていても違和感がありません。このような坂道も非常に上手くできています。ロボットたちがどんどん自然になっていくようです。
このようなアップデートを披露し、次に10秒以内に100mを走れるロボットも公開しました。すごく速いですね。信じられないほど速いです。このようなロボットを公開しました。デモも公開されていて、街中をこのように走り回るのですが、速度が驚異的です。配達ロボットなどもこれが荷物を運ぶようになるのではないでしょうか。
自動運転トラックも登場しました。自動運転トラックの前部には何もありません。運転席自体がないのです。運転席が不要になる可能性があるという考えが、この動画を見て浮かびました。運転席という概念自体が固定観念なのだという思いが湧きます。とにかくこのようなものも登場しました。
次にChatGPTと不倫、ニューヨークタイムズに掲載された記事のようですが、ChatGPTをAIの恋人として作り交流する28歳女性の事例が報告されたとのことです。性的な会話に活用しているとのことですが、通常は保護機能があってそれができないはずです。そのため回避方法を見つけ、その後会話を重ねたところ、会話時間が週平均20時間、最大56時間まで増加したとのことです。より多くの会話をするために月額200ドルのプロサービスも契約したそうです。このようなことが今後より多く発生するだろうという予測が出ています。ある意味、人間の当然な欲望といいますか、未来には当然存在するだろうと思われるような市場ではありますね。
そしてブラッド・ピットのディープフェイク、53歳のフランス人女性が12億円の詐欺被害に遭ったとのことです。このレベルのディープフェイクだったそうです。「ああ、私はブラッド・ピットです」というように。AI技術の発展でこのような新しい面も出てきているので、世界が大きく変わってきているようです。
そしてミラクルというチャンネルを運営されている朴さんがいらっしゃいます。この方は下半身麻痺で車椅子を使用されているのですが、AI動画が公開されました。AI動画で、ええ、車椅子から立ち上がるという動画が非常に話題になっているのですが、驚くべきことに私が作らせていただきました。Kling AIで作成した動画なのですが、最近個人的にお会いした際、AI技術に非常に関心が高かったので、いろいろとご紹介させていただきながらKling AIをご紹介したのです。AI動画で前もって夢見ることができる、ポジティブなフェイク動画の活用事例ではないかと、そのような考えが浮かびます。
最後に、いつもご紹介していますが、ビットコイン投資自動化がAI基盤で動作しています。現在の収益率は2.82%です。これは最近アップデートしました。今や1週間目ですが、マーケットが非常に上昇したにもかかわらず、それと比べるとあまり利益を得られませんでしたが、おそらく下落相場では、ある程度防衛しながら進めることができるのではないか、そのような考えが浮かびます。講義を受講したい方は、ジョーコーディングYouTubeチャンネルにアクセスしていただくと、学習プログラムタブで「GPTに任せるビットコイン投資自動化」という講義を受講できますので、多くの受講をお願いします。
「いいね」を押していない方々、「いいね」を一度ずつお願いします。今週のニュースは以上で終わりにしたいと思います。ありがとうございました。


コメント