画像認識

AI画像

新しいDeepSeekが驚くべきことをやってのけた…

DeepSeekが新たに発表したDeepSeek OCRは、画像認識技術に革新的なアプローチをもたらした。従来の画像認識技術とは異なり、このモデルはテキストを画像として表現することで、10倍のテキスト圧縮を実現しながら97%の精度を維持する...
中国

Qwen 3 Omni — すべてをこなすオープンソースAIモデル

この動画では、Alibabaが開発したQwen 3 Omniという最新のマルチモーダルオープンソースAIモデルについて詳細に解説している。このモデルは動画、画像、テキスト、音声を同時に処理でき、テキストと音声のストリーミング応答を生成可能で...
Apple・ティムクック

Appleの最新オープンソースAI「Fast Vision」の高速性能

この動画はAppleが新たにリリースしたオープンソースのビジョン言語モデル「Fast VLM」について解説している。このモデルは従来のLLaVA-1.5と同等の性能を持ちながら、初回トークン生成時間において85倍高速化を実現している。特筆す...
Google・DeepMind・Alphabet

Nano Bananaは狂気的なAI画像エディタ…

この動画は、GoogleのNano Bananaという革新的なAI画像編集・生成モデルについて詳しく解説している。既存の画像に対する編集能力が従来のモデルを大幅に上回り、物体の追加、人物の合成、写真の修復・カラー化、3Dメッシュ生成など多様...