艾巴生活网

您现在的位置是:主页>科技 >内容

科技

xAI的Grok最新版本可以处理图像

2024-04-14 08:55:44科技传统的飞鸟
由埃隆·马斯克创立的 OpenAI 竞争对手xAI推出了第一个可以处理视觉信息的 Grok 版本。 Grok-1 5V是该公司的第一代多模态,它不仅可以

由埃隆·马斯克创立的 OpenAI 竞争对手xAI推出了第一个可以处理视觉信息的 Grok 版本。 Grok-1.5V是该公司的第一代多模态,它不仅可以处理文本,还可以处理“文档、图表、屏幕截图和照片”。在 xAI 的公告中,它给出了一些如何在现实世界中使用其功能的示例。例如,你可以向它展示一张流程图照片,并要求 Grok 将其翻译成 Python 代码,让它根据绘图写一个故事,甚至让它解释一个你无法理解的模因。嘿,不是每个人都能跟上互联网上吐出的一切。

xAI的Grok最新版本可以处理图像

新版本是在该公司发布Grok-1.5几周后发布的。该模型的设计目的是比其前身更擅长编码和数学,并且能够处理更长的上下文,以便它可以检查来自更多来源的数据,以更好地理解某些查询。 xAI 表示,其早期测试人员和现有用户很快就能享受 Grok-1.5V 的功能,但没有给出具体的推出时间表。

除了推出 Grok-1.5V 之外,该公司还发布了一个名为 RealWorldQA 的基准数据集。您可以使用 RealWorldQA 的 700 张图像中的任何一张来评估 AI 模型:每个项目都附带您可以轻松验证的问题和答案,但这可能会难倒 Grok 等多模态模型。 xAI 声称,当该公司使用 RealWorldQA 与 OpenAI 的 GPT-4V 和 Google Gemini Pro 1.5 等竞争对手进行测试时,其技术获得了最高分。