Kimi k2思考エージェントがChatGPTとClaudeを合わせたよりも優れていると約束、そして他のニュース

Moonshot AIが発表したKimi k2 F thinkingは、ChatGPTやClaudeを上回ると主張する思考型AIエージェントである。本動画では実際にコーディング、SVG生成、旅行プランニングなどの実践的なタスクでKimi k2をテストし、その実力を検証する。また、サム・アルトマンによるAIが完璧な詩を創造しても人々は気にかけないという予測や、Metaが発表した1,600言語対応の音声認識技術Omnilingua ASRについても考察する。テスト結果からKimi k2は平均的な性能を示し、最新の主要AIモデルには及ばないものの、オープンソースモデルとしては十分に優れた能力を持つことが確認された。

NOVO Kimi K2 Thinking Agent Promete Ser Melhor que CHATGpt e Claude Juntos e Outras Notícias

Aprenda Inteligência Artificial! ▸ Aprenda Agentes iA: ▸ Seja MEMBRO:

Kimi k2 F thinkingの登場とAI業界の新展開
Kimi k2の実力を徹底検証

Kimi k2 F thinkingの登場とAI業界の新展開

皆さん、Moonshot AIがKimi k2 F thinkingのアップデートを発表しました。彼らはこれがCloudよりも優れていて、OpenAIよりも優れていて、GPT-5よりも優れていると言っているんです。そこで私たちはここでテストを行います。実際に試してみて、私たち自身の結論を導き出せるようにしましょう。また、サム・アルトマンの人工知能に関する意見も見ていきますし、Metaの特定の詳細についても、かなり興味深い考察をする必要がありますので見ていきます。それでは始めましょう。

いつも「いいね」を押してくれた皆さん、チャンネル登録してくれた皆さんに感謝しています。このAIチャンネルをスポンサーしてくれているチャンネルメンバーの皆さんには特別な感謝を。メンバーの皆さんは、WhatsApp統合、MCP、PDF読み取り、その他多くのことを教える知的エージェントに関する独占動画にアクセスできることを覚えておいてください。

また、事前公開動画にもアクセスできます。そして、アシスタントが欲しいけれど自分で作りたくない方、つまり誰かにこの問題を解決してもらいたい方、結局のところデータベースやAPI統合の問題に対処したくない方、そういったことは知りたくなくて、ただ小さなエージェントに会社の対応をさせたいという方。

近々それに関するニュースや情報をお届けします。注目しておいてくださいね、もうすぐお知らせしますから。では、行きましょう。今日まず話すのは、サム・アルトマンが言ったことに関する考察です。見てください、アルトマンはAIが完璧な詩を創造すると予測していますが、誰も気にかけないだろうと言っています。

皆さん、これは私自身がChatGPTが登場する前から話していたことなんです。新しいものはみんな知りたがるけれど、新しくなくなったら誰も気にしなくなる、そういうことってありますよね。AIのこの効果、このインパクトを私たちは今感じていますが、AIと一緒に生まれた人たちは気にもかけないでしょう。

でも見てください、面白いですよ。アルトマンは、AIが人間レベルの10点満点中10点に達したとしても、それでも気にしない人がいると言っているんです。そして今日でさえ、AIを気にしない人がすでにいます。きっとあなたも、何にもAIを使わず、知りたくもなく、心配もしていない人を知っているはずです。

そして何が起こる可能性があるか分かりますか。もしかしたら何も起こらないかもしれません、皆さん。なぜなら、もしいつかAIが本当に代替不可能になって、使わない人が本当に大きく遅れをとる人になるとしたら、もしかしたら将来そうなるかもしれません。でも考えてみてください、今日でも携帯電話を使わない人がいるんですよ、皆さん。

ですから、特定の技術が100%の普及率を持たないのは非常に普通のことで、AIでも違いはないでしょう。でもこの重要な点を見てください。アルトマンは、芸術に価値を与えるのは人間の起源だと言っています。つまり、AIによって作られた素晴らしい詩があったとしても、人間によって作られたものであるということには非常に特別な価値があるんです。私たちはそれが好きなんです。

AIが技術的に完璧な詩を書いたとしても、おそらく真の感情的な核心が欠けているでしょう。そして私はもう少し先まで言いたいと思います。もしAIが自分自身の存在に一致した詩を作れば、つまり機械の知性としての存在に一致したものを作れば、そのときこそ私たちの心に触れることができるでしょう。なぜなら共感的なものになるからです。

私たちは「うわあ、このAIは本当に理解している、いや理解していない」と言うでしょう。でもアルトマンはチェスと比較した例を挙げています。機械とチェスをすることはずっと前からありますが、友達や人間と対戦する方がずっと楽しいです。特に、チェスやサッカーや何かゲームをすることを想像してみてください。

そこにある感情的な関係性、ゲームに存在する心理的な駆け引き、フェイント、反対側の応援席にいる友達をからかうこと、これらすべてがもっと複雑なものの一部なんです。単にゲームをしてそこで勝つか負けるかだけではないんです。そして彼はここでコメントしています、二つのAIがプレイするのを見ても、ほとんどの観客にとってそれほど面白くはないと。

ここで私は注釈をつけたいと思います。もしAIにマーケティングをすれば、たとえばIBMのWatsonで以前行われたように、Watsonは医者だ、これだ、あれだというような雰囲気全体がありました。その意味で、もし名前のついたAIがあって、それに何か関連するものがあれば、私たちは見たくなるかもしれません。

そして彼はここでコメントしています、ね。AIが生成したテキストや画像がより一般的になるにつれて、人々は本物の人間が制作したコンテンツをさらに評価するようになるでしょう。これはかなり可能性がありますよね、皆さん。特に本当に人間的なものに焦点を当てたコンテンツについては。

一部のコンテンツは100%自動化されて、誰もそれがAIによって作られたかどうかを気にしないだろうと私は信じています。でも人間の効果にはインパクトがありますよね。たとえば、コンサートに行って、バンドの代わりにスピーカーから音楽が流れているのは、バンド全体がいるのとは大きく違います。

それ以上に、コンサートに行って歌手が口パクをしていると、人々はそれに気づきます。彼らはそれが好きではなく、本当に歌ってほしいと思っています。そこで本当に歌っているという確信を持ちたいのであって、バックで機械的な音楽が流れているのは望んでいません。

ですから、事態はもっと複雑です、事態はもっと複雑なんです。これについてあなたが何を考えているかコメントしてください。次のニュースです。MetaのOmnilingua ASRが16言語に音声認識をもたらします。さて、なぜこれが面白いと思うのか。なぜこの1,600言語というのがとんでもないことなのか。なぜなら、ここで私たちはAIの最も強力な能力の一つである言語に触れているからです。

そして1,600言語は、最高の専門家でも、最高のポリグロットでも到達できない言語の量なんです。これは、皆さん、見てください、面白いですよ。最も多くの言語を話す人間のポリグロットを探してみると、見てください、このGregg Coxは64言語を読み書きし、11の方言を話します。

ですから、全部合わせると75になります。Ziad Fazahは59言語を話します。そしてCarlos Amaral Freireは135言語を学習し、そのうち5言語に流暢です。つまり、注意してください、流暢なのは5言語だけで、135言語すべてに流暢なわけではありません。そしてJosep Kasparは72言語です。Alexander Arguellesは50言語です。つまり、もうお分かりですよね。

60、70、130言語を話す人間は、すでに非常に異常なレベルにいる人なんです。そしてこの135言語という値は、一般的にAIが話す言語の数とだいたい同じです。調べてみる必要がありますが、この数字だということが分かるでしょう。でも1,600言語を話すと考えると、事態は変わります。

ほとんどの音声認識ツールは、多くのリソースと音声転写が利用可能な数百の言語に集中していました。それは私が言ったことです。でも見てください、これは世界で話されている7,000以上の言語のうち、数千の言語をほとんどまたは全くサポートしていない状態にしていました。

つまり、見てください、皆さん、世界には7,000の言語があり、このAIはすでに1,600を話しています。これは、多くの先住民の言語、わずかな人々しか話さない言語が、おそらく今後数年でデジタル化され、これらの言語が会話のデジタルリソースとして残るということを意味します。

これは言語学者や言語を扱う人にとって素晴らしいことです。Metaは、サポートされている1,600言語のうち500言語は、これまでどのAIシステムでもカバーされたことがないと主張しています。つまり私たちが理解できるのは、Metaが目標を拡大しているということです、ね。目標を倍にするまでには至りませんでしたが、かなりの数を増やすことができました。

このOmnilingualはオープンソースで、ライセンスはPart 2.0です。ですから、使いたければ使えますし、無料です。そしてこれらの1,600言語の重要性は何か。まさにこれなんです、皆さん。人々がAIがいつか何らかのスキル、何らかの能力で人間の能力を超えるかどうかを議論し始めるとき、たとえばこの会話能力では、すでに超えています。

そしておそらく、行われている調整や未来、技術の改善によって、他の能力もこのレベルに到達して人間の能力を超えるかもしれません。AIが私たちのすべての能力、または少なくともそのほとんどを超えたとき、何が起こる可能性があるか考えたことはありますか。これはかなり興味深いことです。

私はよく、私たち人間は人間を理解しようとするアリのようなものだと言います。アリは人間を理解する知性を持っていません。そして私たち人間は、宇宙にとっては私たちにとってのアリと同じです。私たちは何が起こっているのかを理解できる頭脳を持っていません。事態はあまりにも複雑すぎます。

そしておそらく、私たちが理解できないことを理解し把握するには、本当にAIが必要なのかもしれません。これについてあなたが何を考えているかコメントしてください。いつか私たちのすべての能力を超えることができるでしょうか。なぜなら今日私たちが気づくのは、幻覚のせいで、感情を持たないという事実のせいで、私たちのような意識を持たないという事実のせいで、まだ私たちが持つニュアンスを持つことができず、言っていることを正確に言うことができないからです。なぜなら、何が起こっているのかをまだ確認する方法を知らないからです。

まだテキスト生成器なんです。そしてこのテキスト生成器は、まだ確認のいくつかの問題に悩まされています。私たち人間がより自然に確認できることです。でもまだ始まったばかりで、もしかしたらこれは良くなるだけかもしれません。ですから追いかけていきましょう、これは本当にクレイジーですから。

Kimi k2の実力を徹底検証

次のニュースです。Kimi AIがここでローンチを発表しました。Kimi k2 F thinkingをローンチしています。思考エージェントモデルがここにあり、オープンソースです。そして彼らは、これが行うすべての良いことをコメントしています。200から300の連続したツール呼び出しを行います。推論、検索、コーディングで際立っています。

そしてコンテキストウィンドウは256Kです。これは最大のコンテキストウィンドウではありません。たとえばGeminiは100万で、時には200万に達することもあります。約200Kのモデルはより古いモデルですが、それでもこの小さなウィンドウには利点があります。なぜなら数学的に言えば、より小さなコンテキストを扱う方が、そこでAIを機能させるのがより簡単だからです。

でもこの話は別の動画で、今は詳しく説明しませんが、彼らがここで言っているのは、このエージェント思考、つまり思考エージェントが、テスト時間のスケーラビリティにおける最新の努力すべてを表しているということです。ですから、ここで結果を見ると、青いのがKimi k2 thinking、灰色がGPT-5、もう一つの灰色がClaude Sonnet 4.5 F thinkingです。

つまり、人類の最後の試験、つまりAIが意識に到達したかどうかを知るためにPNAが発明したあの試験で、ここで44.9%の正解率を出しています。これはChatGPTとCloudの両方よりも高いスコアです。ここのエージェント検索でも、ChatGPTとCloudの両方に勝っています。

そしてここの現実世界の情報収集でも、ChatGPTとCloudの両方に勝っています。しかしここのコーディングでは、Claudeを少し下回り、ChatGPTよりは少し良かったです。エージェントコーディングでは両方を少し下回りました。そして競技プログラミングでは、ChatGPTが勝ち、Claudeが3位で、Kimが2位でした。

つまりこれは何を意味するのか。テストする必要があるということです、ね、皆さん。テストに行きましょう。テスト1、カートのテスト。皆さんがすでに知っている、よく知っているものです。プロンプトを一つだけ送りました。きれいにコードを生成しました。Think Modeの小さなボックスがここできちんとアクティブになっています。見てください、何が起こったか。

きちんと動きました、皆さん。すべてが機能しています。カートが機能していて、衝突も機能しています。お願いしたことすべてが起こっています。コインがあります。スコアボードが増えていっています。プレイヤー2、つまり私です。コインを集めることができています。列車があり、木があります。

カートは、AIが生成したもので初めて、方向の問題がありませんでした。時々左が右と入れ替わったり、前進が後退と入れ替わったりすることがありますよね。ここではそれは起こりませんでした、きちんと動きました。前進ギアもあり、すべてあります。ですからこれは非常に興味深い生成だと思いました。ただし、雲のような詳細、いくつかのAIがすでに入れているものは作りませんでした。

ですから、うまく機能していますが、それほど目立つほど良いわけではありません。これは理にかなっています、なぜなら彼らのコーディング部分は、一度も1位になっていないからです。ここで1位になったと言っているエージェント部分を想像してください。落ち着いて、そこに到達します。

私たちのパゴダ生成で、皆さんがすでに見慣れているものでは、これも非常にきちんとした生成でした。機能的で、すべてきちんとしています。たくさんの要素があります。彼はここでパゴダに配置したすべての要素についてコメントしています、ね。シーン、構造物、庭、視覚効果、すべて説明されていて、すべてきちんとしています。

物事は機能していますが、個人的にはかなりシンプルなパゴダだと思いました。パゴダはこの小さな家です。つまり、素晴らしい、良い、完璧ですが、それほど注目を集めるものではありません、あの驚くべきものではありません。でももっと悪い可能性もありましたよね。ですから、ここでも平均的だと言えます。

リオデジャネイロ生成のパゴダは、かなり時間がかかっています。ここでプレビューを開始してから、実際に機能し始めるまで、すべてがうまくいくまで、たくさんのwaitが出ます。ここを見てください。wait。機能し始めるまでに約3回waitを出す必要があります。なぜならブラウザのメモリをかなり消費していて、ここのシステムのメモリをかなり消費しているからです。でもこれはチャットと一緒に開いているからでもあります。

つまりチャット、HTML、コード、ゲーム以外にもたくさんの他のものが実行されています。でも見てください、皆さん、機能しました。少し遅くて、バグっぽいですね。でも今録画しているので、これが録画されるかどうか、フリーズするかどうか分かりません。ここでいくつかのことが私の注意を引き、とても気に入りました。まず、見てください、ヤシの木、皆さん。

ヤシの木があります。ここのコルコバードのキリスト像を見てください、少し奇妙ですが、キリスト像です。雲を配置し、ここに街を配置しました。パン・デ・アスーカルがそこを通過しています。あれがパン・デ・アスーカルだと思います。ここに小さな森があります、2色で、ね。明るい緑と濃い緑です。

ここに何か街か丘のように見えるものがあります。正確に彼らがここで何と説明したか分かりません。そしてここにビーチがあります、オレンジ色で、きちんとしています。彼はここに海があると言いました、ビーチとオーシャン。でも海は、正直なところ、ここで海は見えませんでした。海であるはずの青い部分は、実際には余ったマップです。

個人的にはこのアートは素晴らしいです。ここでこのリオデジャネイロのマップの生成を以前行ったことがありますが、小さな人形、腕、ヤシの木、街、これは見たことがありませんでした、ここの地面の2色も。ですからこれは良い生成だったと考えています。うまく機能しました。

ここの私たちのMatrixスタイルのペットショップでは、かなりシンプルで面白みがないと思いました。実際、このペットショップはもう少し良くなる可能性がありましたが、すでにいくつかのエフェクトがあります。たとえば、ここ、ペットショップMatrixが動いていて、ボタンにはすでにいくつかのエフェクトがありますが、たとえばサイトの背景、あの文字の雨があるはずですが、ありません、表示されませんでした。

かなりシンプルなものになりました。いくつかのエフェクトがあり、すべて機能しているにもかかわらず。ですから、私が気づくのは、ここも平均的で、あまり良すぎて多くを褒めるわけでもありませんが、すべてきちんとしていて、何も間違っていません。

SVGでの自転車に乗るペリカンについては、これも平均よりやや上だと考えています。ただの平均ではありません。なぜなら自転車があり、2つの車輪があり、ペリカンがいて、足があり、すべてきれいに色付けされていて、きちんとしています。この自転車は少し奇妙ですが、本当ですが、すでにここに地面があります。

何が足りないと感じたか。もう少し的確さですね。ペダルが欠けていて、特に背景が欠けていました。一般的に太陽があったり、山があったりすると、この生成でより正確に成功するモデルです。SVGはここでプログラミングする方法だということを覚えておいてください。線が欲しいとき、円が欲しいときに座標を書きます。

つまり、これは最終的にはAIが自分の頭脳から作っているアートなんです。さて、最も重要なこと、これまで一度も行ったことのないテストで、初めて行うものです。フロリアノポリスからサンパウロへの12月の最初の2週間、つまり来月の往復航空券の最良価格を検索してください。

滞在期間は1週間で、機内持ち込み手荷物のみの大人1名です。つまり、機内持ち込み手荷物のみの1人です。なぜなら預け入れ荷物を入れると、預ける必要がある場合、価格が変わるからです。1泊300レアル以下で地下鉄に近く、良い立地の地域にあるホテルを見つけてください。つまり、サンパウロに行く人は地下鉄の近くにいたいと分かっているなら、そうすればどこへでも行けますから、サンパウロで移動する最良の方法です。

空港からホテルまでのUberの価格見積もりを作成してください。これを書いたとき、もしかしたら人は地下鉄で行けるかもしれないということを忘れていました、特にグアルーリョスにいる場合は。でも旅行した人にとってUberの方がより興味深いかもしれません。そしてその人はフロリアノポリスのラゴア・ダ・コンセイサンの中心部から出発しています。これはかなり有名な地域で、空港から比較的遠いですが、よく知られた地域です。

そして最後に、旅行のおおよその費用の表を作成してください。さて、結果を見る前に、フロリアノポリスからサンパウロへの往復旅行は、安い価格で、本当に安い価格で、約350から400レアルの範囲になると言えます。だいたいそれくらい支払うことになります。ですから、もしこの価格帯の値を見つけたら、すべて完璧です。

そして、皆さん、彼は小さなまとめを作り、たくさんの情報を作りました。彼が研究したすべてのファイルを生成し、彼が見つけていった情報、チケット、価格を入れて、小計を作りました。私たちが好きなすべてのことを生成しています。

これを行うには、ここでOK Computerと呼ばれるものをアクティブにする必要があります。ここで見てください、OK Computer、これはまさに知的エージェントにこの研究、このアクセス、この検索、私たちが行っているこのすべてのことをしてもらうことです。ですから、価格調査やそういったことをしたい場合は、OK Computerで行います。

彼はここで削除もしました。新しいチャットをしたい場合は、最初からやり直す必要があると言っています。でもこれはHumanoにかなり似ています。彼はやろうとしていることのすべてを始めました。航空券を検索します、サンパウロのホテルを探します、Uberのコストを見積もります。つまり、Humanoに慣れている場合、彼が行ったのはまさにこれです。

そして彼が進めるにつれて、ここでチェックマークをつけていきます。すでに完了したステップにXをつけ、実行中のステップに棒線をつけます。一つずつ実行していきます、行っていきます、実行して、Pythonコードを書いて、ここの最後まですべてのステップを行います。ここで部分的な結果を作り、すべてこのファイルにあると言います。

このファイルに到達すると、ここにあるものの一つがサイトのあるインデックスです。そして私のためにここに表示されます、完全な旅行プラン、12月の2週間の期間、機内持ち込み手荷物のみの大人1名、期間7日6泊。彼はGOL航空で347と369のチケットがあると言いました。

LATAM航空では350と369があります。これが往復かどうか、この購入を行うリンクは何かについて、多くの情報を提供しませんでしたが、私のプロンプトにもありませんでした。一方、他のAIはすでにリンクを配置していたでしょう、もう少し詳細なものを配置していたでしょう。明らかにすべて正しいようですが、もしこの会話を続けるなら、リンクを知りたいです。

彼はここでホテルのいくつかの推奨をしています。ここでIbis Budget São Paulo Paulistaを見つけました。1泊250から300になります。Ibisやメトロ隣の経済的なホテルでも、より安い値段で見つけられると思います、1泊200から280です。上のはパウリスタ駅で、下のはサウーデ駅です。正直に告白しますが、サンパウロに行ってから時間が経っています。

サウーデという名前の駅があるかどうか覚えていません、ね。でも彼がそう言っているなら、調べる必要があります。でもパウリスタ駅とコンソラサン駅は確かにあります。かなり有名な場所で、こちらの方がずっと興味深いでしょう。

Uber料金は、ここで25kmで計算され、45から60レアルになりました。ラゴア・ダ・コンセイサンからも40から60レアルで、サンパウロのメトロチケットの価格もここに入れました。そして結局、ここの航空券を考慮して、ホテル、Uber、交通、さらに食事を考慮して、ここで2,848から3,258という値に到達しました。かなり興味深いものに見えます。

この場合、彼に予約をしてもらうことも何もしてもらうことも頼みませんでした。価格調査とこの旅程を作成してもらうように言っただけです。このプランニングはかなり興味深いものだと考えています。そのような旅行が価値があるかどうかのアイデアをすでに得ることができます。そしてこの価格はかなり現実的だと思います、ね。ここのチケット358レアルを考慮して、ここのホテル7泊を考慮して、サンパウロ到着時とフロリアノポリスでのUberの往復旅行を考慮して、さらに食事を考慮しています。

つまり、非常に完璧で、非常に興味深いです。価値があると言えます。ある人のケースを聞きました、これはChatGPTでのことでしたが、バイクでいくつかの都市を旅する旅行の計画を立てた人がいて、その人はChatGPTが言ったすべての予定、ホテル、すべてのことを100%信頼しました。

彼女はChatGPTのそれらの日付を取り、すべてをスプレッドシートに入れ、すべてのホテル予約などをしました。しかし、旅の途中で、ある都市から別の都市への道のりが1日でできるように見えましたが、実際には2日必要でした。そしてホテルを再予約するのに大変なことになりました。なぜなら、1日でできるはずだった旅がもうできなくなったからです。

1日遅れることになるため、たくさんの宿泊をキャンセルしなければなりませんでした。人がもう到着できなくなったからです。すべての予約が1日遅れることになりました。そして事態は少し混乱し、複雑になりました。ですから常に確認する必要があります、ね、皆さん。これらの情報はよく確認する必要があります。

たとえば、サウーデ駅、あると思います。そして簡単な検索をすると、これがあります。サウーデ駅Ultrafarma。本当に、でもそこにあります、機能しています、駅は存在します。ですから、決してその確認を忘れないでください。さて、Kimについてどう思いましたか。価値がありますか。テストを始めますか、それともしませんか。

個人的には、平均的なモデルだと思いました、非常に強いモデルでも非常に弱いモデルでもないと思いました。古いモデルと比較すると、強いモデルです。でも現在のモデルと比較すると、OpenAI、Claude、Geminiがより興味深いことをしていると思います。でも彼がオープンモデルであるという単純な事実と、いくつかの利点を持っているということで、今日、一般の人々の手には、ここでかなり興味深いことができるかなり進歩したAIがすでにあることが分かります、ね。本当に気に入りました。

すでにコメントしてください、あなたが何を考えているか、あなたが行って気に入ったテストがあるか、またはあなたが行ってあまりうまくいかなかったテストがあるか。そしてこのような動画を見続けるためにチャンネルをサポートしたい場合は、メンバーになってください。メンバーは知的エージェントの独占動画と事前公開動画にアクセスできます。以上です、いいねをしてください。ありがとう。