OCR | ASIに仕事を奪われたい

新しいDeepSeekが驚くべきことをやってのけた…

DeepSeekが新たに発表したDeepSeek OCRは、画像認識技術に革新的なアプローチをもたらした。従来の画像認識技術とは異なり、このモデルはテキストを画像として表現することで、10倍のテキスト圧縮を実現しながら97%の精度を維持する...

2025.10.23

AI画像

本動画は、IBMの開発者向けポッドキャスト「The Flow」第7エピソードであり、IBMの上級研究員でDockling.aiのコアコミッターであるMikuel Aduliを招いてDockling について解説している。DocklingはP...

2025.09.16

AI活用・導入

この動画はAppleが新たにリリースしたオープンソースのビジョン言語モデル「Fast VLM」について解説している。このモデルは従来のLLaVA-1.5と同等の性能を持ちながら、初回トークン生成時間において85倍高速化を実現している。特筆す...

2025.08.30

Apple・ティムクック

この動画では、Mistral AIの有料OCR APIを上回る性能を誇るという無料のOCR（光学文字認識）ソリューション「Nanonets OCR-S」について詳しく解説している。この小型モデルは手書き文書やスキャン文書を含む様々な画像やP...

2025.06.17

世界モデル・マルチモーダル