ツール呼び出し

中国

中国の勝利:2025年版AI業界レポート

2025年のAI業界は激動の年となった。OpenRouterが公開した大規模なデータ分析レポートは、100兆トークンを超える実際のLLM推論データに基づき、AIモデルの利用実態を明らかにしている。最も注目すべき発見は、オープンウェイトモデル...
GPT-5、5.1、5.2

GPT-5.2への反発は研究に値する

OpenAIが発表したGPT-5.2は、ベンチマーク上では過去最高の性能を記録し、コーディング、長文推論、ビジョン、エージェント的ツール呼び出しなど、あらゆる測定可能な指標で大幅な向上を示した。しかし、オンラインでの反応は祝福や興奮ではなく...
LLM・言語モデル

OpenAIとGoogleに衝撃を与えた史上初のオープンソースAIエージェント

Zhipu AIが発表したGLM 4.6Vは、オープンソース初となる真のマルチモーダルAIエージェントとして業界に衝撃を与えた。このモデルは画像、動画、スクリーンショット、ウェブページを直接入力として扱い、テキスト変換なしでツール呼び出しを...
Anthropic・Claude・ダリオアモデイ

AnthropicがMCPを必死に修正しようとしている件について

Anthropicが提供するモデルコンテキストプロトコル(MCP)は、当初から深刻な設計上の欠陥を抱えている。MCPはツール定義を常にコンテキストに含める必要があり、数万トークンもの無駄なデータがすべてのリクエストで送信される。これによりモ...
Anthropic・Claude・ダリオアモデイ

Anthropicが勝利した。これが私の新しいお気に入りモデルです(ごめんねGemini…)

Anthropicが新たにリリースしたClaude Opus 4.5は、コーディングにおいて過去最高の性能を発揮する大規模言語モデルとなった。従来のOpusモデルから価格が3分の1に削減されながら、トークン使用効率が大幅に向上し、SWEBe...
LLM・言語モデル

KIMI K2がAI業界を揺るがした…その「秘密」とは

中国発のオープンソース思考モデルKIMI K2が、人類最後の試験で最高得点を記録し、Claude 4.5 SonnetやGPT-5を上回る性能を示した。訓練コストはわずか460万ドルと、米国の巨大研究所が費やす額の一部に過ぎない。この背景に...
LLM・言語モデル

Kimi K2は史上最高のモデルである(ある意味では…)

Moonshot AIが発表したKimi K2 thinkingは、これまでで最高のツール呼び出し性能を持つオープンウェイトモデルである。1兆パラメータという巨大なモデルサイズでありながら、Humanity's Last ExamやBrow...
LLM・言語モデル

新登場 Kimi K2 Thinking – 最高のオープンモデルか?

中国のMoonshot AIが開発したKimi K2 Thinkingモデルは、オープンソースの推論モデルとして、OpenAI、Anthropic、Googleといったプロプライエタリモデルに匹敵、あるいはそれを凌駕する性能を示している。1...
LLM・言語モデル

中国発の新たな1兆パラメータ推論AI – Kimi K2 Thinking

中国発のKimi K2 Thinkingは、米国のトップクラスモデルに挑戦する新たな推論モデルである。最大の特徴は200から300の連続したツール呼び出しが可能な点で、これはエージェントシステムの基盤となる機能だ。1兆パラメータを持ちながら...
AIエージェント

より効果的なAIエージェントの構築

本動画では、Anthropicでマルチエージェント研究を担当するErikが、Claudeがエージェントタスクに優れている理由とその最新動向について詳しく解説している。Claudeは訓練過程で長時間実行されるタスクやツール使用の実践を重ね、強...
OpenAI・サムアルトマン

オープンモデルを活用した開発

本動画は、OpenAIが2025年8月にリリースした最新のオープンソースモデルシリーズ「GPTOSS」について、その特徴と活用方法を詳細に解説するものである。GPTOSSは12Bと20Bの2つのモデルで構成され、MacBookなどの高性能な...
MCP

MCPは間違った抽象化である

本動画は、Anthropicが提唱するMCP(モデルコンテキストプロトコル)の構造的な問題点と、Cloudflareが提案する革新的な代替アプローチを詳細に解説するものである。MCPは多数のツールを直接LLMに公開する従来の方式であるが、ツ...
Anthropic・Claude・ダリオアモデイ

プロダクション運用対応ユースケースの構築:LovableがClaudeでスケールする方法

本動画は、AnthropicとLovableの戦略的パートナーシップを通じて、プロダクション運用可能なAIエージェントの構築とスケーリングについて詳細に解説したウェビナーである。Anthropicの応用AI チームのPritiがエージェント...
OpenAI・サムアルトマン

Build Hour: エージェンシックツール呼び出し

この動画はOpenAIの開発者向けセッション「Build Hour」の2025年第1回目で、エージェンシックツール呼び出しをテーマとしている。OpenAIのスタートアップマーケティング責任者Sarah Urbonusと開発者体験チームのAl...
GPT-5、5.1、5.2

俺、ChatGPT-5の使い方間違っとったわ。実はめっちゃヤバい(完全ガイド)

この動画は、GPT-5の真の実力を引き出すためのプロンプト技術を解説した内容である。多くのユーザーがGPT-5に対して否定的な反応を示している中で、実際は使い方が間違っているだけであり、正しいプロンプト手法を用いれば他のAIモデルを凌駕する...
AIエージェント

なんでこんなにAIエージェントは失敗し続けるんや?

この動画は、AI界で注目されているModel Context Protocol(MCP)エージェントの性能問題を深掘りした内容である。Salesforceの研究に続いて発表された学術論文「MCP 101」を詳しく解説し、7つのエラー分析フレ...
GPT-5、5.1、5.2

GPT-5をより良くするプロンプトの作り方

OpenAIが発表したGPT-5に特化したプロンプトガイドを詳細に解説する動画である。GPT-5の性能を最大化するための具体的なテクニックとして、エージェント的積極性の調整、ツールプリアンブル、推論努力パラメータの設定などを紹介している。特...
LLM・言語モデル

これはDeepSeekより大きな出来事かもしれない

この動画は、中国のMoonshotが開発した新しいAIモデル「Kimmy K2」について詳しく解説している。話し手は、このモデルがDeepSeek R1と同等かそれ以上に重要である可能性があると主張している。特にツール呼び出し(tool c...