xAI發布支持視覺的多模態AI模型Grok-1.5V
火幣HTX報道,馬斯克旗下人工智能公司xAI宣布推出首個多模態AI模型Grok-1.5V。除了強大的文本處理能力,Grok還能夠處理各種視覺信息,包括文檔、圖表、屏幕截圖和照片等。 在多個領域的基準測試中,Grok-1.5V的表現均可與現有的前沿多模態模型相媲美。尤其在xAI新推出的RealWorldQA基準測試中,Grok在現實世界空間理解能力上超越了同類模型。RealWorldQA數據集包含700多張圖像,旨在評估多模態模型對物理世界的基本理解能力。Grok-1.5將很快向早期測試人員和現有用戶開放。
版權聲明:本站所有文章皆是來自互聯網,如內容侵權可以聯系我們刪除!