Foresight News によると、イーロン・マスクは Grok-1.5 V のプレビューを公開したとのことです。ドキュメントの説明によると、Grok はテキスト機能に加え、ドキュメント、チャート、スクリーンショット、写真など、さまざまな視覚情報を処理できます。Grok-1.5 V はまもなく、初期テスターと既存の Grok ユーザーに公開される予定です。

今後数か月で、チームは画像、音声、動画などさまざまなモードにわたる Grok のマルチモーダル理解および生成機能を大幅に改善する予定です。これは、さまざまな種類のデータを処理および理解するプラットフォームの能力を強化し、より包括的なユーザー エクスペリエンスを提供するという戦略的な動きを示しています。