xAI的Grok最新版本可以处理图像
由埃隆·马斯克创立的 OpenAI 竞争对手xAI推出了第一个可以处理视觉信息的 Grok 版本。 Grok-1 5V是该公司的第一代多模态,它不仅可以
由埃隆·马斯克创立的 OpenAI 竞争对手xAI推出了第一个可以处理视觉信息的 Grok 版本。 Grok-1.5V是该公司的第一代多模态,它不仅可以处理文本,还可以处理“文档、图表、屏幕截图和照片”。在 xAI 的公告中,它给出了一些如何在现实世界中使用其功能的示例。例如,你可以向它展示一张流程图照片,并要求 Grok 将其翻译成 Python 代码,让它根据绘图写一个故事,甚至让它解释一个你无法理解的模因。嘿,不是每个人都能跟上互联网上吐出的一切。
新版本是在该公司发布Grok-1.5几周后发布的。该模型的设计目的是比其前身更擅长编码和数学,并且能够处理更长的上下文,以便它可以检查来自更多来源的数据,以更好地理解某些查询。 xAI 表示,其早期测试人员和现有用户很快就能享受 Grok-1.5V 的功能,但没有给出具体的推出时间表。
除了推出 Grok-1.5V 之外,该公司还发布了一个名为 RealWorldQA 的基准数据集。您可以使用 RealWorldQA 的 700 张图像中的任何一张来评估 AI 模型:每个项目都附带您可以轻松验证的问题和答案,但这可能会难倒 Grok 等多模态模型。 xAI 声称,当该公司使用 RealWorldQA 与 OpenAI 的 GPT-4V 和 Google Gemini Pro 1.5 等竞争对手进行测试时,其技术获得了最高分。
推荐阅读
- alfa romeo车标含义?(阿尔法罗密欧车标)
- 华为鸿蒙os如何操作 华为鸿蒙os2.0系统官网报名入口
- 14款沃尔沃s60l二手车能买吗?(沃尔沃s60为什么贬值厉害)
- power mp3 wma converter(mp3格式转换器)软件介绍(power mp3 wma converter(mp3格式转换器))
- 42岁李贞贤宣布平安生女,网友:歌声击退山贼的那个
- 热火朝天的高铁WiFi迟迟未到(5G能否破局)
- 华为手机性价比最高是哪几款2022? 华为哪款手机性价比高最值得入手
- 进口捷豹全部车型报价?(捷豹报价大全价格表)
- 韩庚江铠同疑相恋,两人同游马尔代夫遭曝光
- 八卦格字帖软件介绍(八卦格字帖)
- 虚拟机 操作系统(操作系统整合:虚拟机管理程序的下一步)
- 比亚迪f6参数配置?(比亚迪f6)
- 奥沙利文获世锦冠军,奥沙利文得了几次世锦赛冠军
- Evel Knievel手游游戏介绍(Evel Knievel手游)
- 索尼wi1000x拆解(SONYNZW-X1000系列高清拆解图集)
- 4座硬顶敞篷跑车都有哪几款?(4门4座硬顶敞篷车推荐)
- 艺术体操团体全能决赛,艺术体操团体全能决赛中国
- 工人物语6通用修改器游戏介绍(工人物语6通用修改器)
- 简述电机换向器的工作原理图(简述电机换向器的工作原理)
- Atheros-AR5007EG无线网卡驱动软件介绍(Atheros-AR5007EG无线网卡驱动)