Stable Diffusion 3.5会更贴近你的提示并产生更多元的人
Stable Diffusion 是Midjourney和DALL-E等 AI 图像生成器的开源替代品,现已更新至3.5 版。新模型试图纠正广受批评的 Stable Diffusion 3 Medium 的一些错误(这可能是轻描淡写)。Stability AI 表示,3.5 模型比其他图像生成器更能遵循提示,并且在输出质量方面可与更大的模型相媲美。此外,它还针对更多样化的风格、肤色和特征进行了调整,而无需明确提示。
新款型号有三种款式。Stable Diffusion 3.5 Large 是三款产品中功能最强大的一款,质量最高,同时在快速贴合方面也处于行业领先地位。Stability AI 表示,该型号适合专业用途,分辨率为 1 MP。
同时,Stable Diffusion 3.5 Large Turbo 是大型型号的“精简版”,更注重效率而非最高质量。Stability AI 表示,Turbo 版本仍可通过四个步骤生成“高质量图像,且具有出色的快速一致性”。
最后,Stable Diffusion 3.5 Medium(25 亿个参数)专为在消费级硬件上运行而设计,在质量和简便性之间取得平衡。由于其定制起来更加容易,该模型可以生成分辨率在 0.25 到 2 百万像素之间的图像。然而,与目前可用的前两款型号不同,Stable Diffusion 3.5 Medium 要到 10 月 29 日才会上市。
继 6 月份失败的Stable Diffusion 3 Medium之后,这款新三款产品也相继问世。该公司承认,这款产品“没有完全满足我们的标准或社区的期望”,因为它在响应本不要求的提示时产生了一些可笑的怪异身体恐怖。Stability AI 在今天的公告中多次提到出色的及时遵守可能并非巧合。
尽管 Stability AI 在其公告博客文章中只是简要提及,但 3.5 系列拥有新的滤镜,可以更好地反映人类的多样性。该公司将新模型的人类输出描述为“代表世界,而不仅仅是一种类型的人,具有不同的肤色和特征,无需大量提示。”
希望它足够复杂,能够考虑到微妙之处和历史敏感性,不像谷歌今年早些时候的失败。在未经提示的情况下,Gemini 制作了一系列极其不准确的历史“照片”,比如种族多元化的纳粹分子和美国开国元勋。反对声如此强烈,以至于谷歌直到六个月后才重新纳入人类世代。
推荐阅读
- alfa romeo车标含义?(阿尔法罗密欧车标)
- 华为鸿蒙os如何操作 华为鸿蒙os2.0系统官网报名入口
- 14款沃尔沃s60l二手车能买吗?(沃尔沃s60为什么贬值厉害)
- power mp3 wma converter(mp3格式转换器)软件介绍(power mp3 wma converter(mp3格式转换器))
- 42岁李贞贤宣布平安生女,网友:歌声击退山贼的那个
- 热火朝天的高铁WiFi迟迟未到(5G能否破局)
- 华为手机性价比最高是哪几款2022? 华为哪款手机性价比高最值得入手
- 进口捷豹全部车型报价?(捷豹报价大全价格表)
- 韩庚江铠同疑相恋,两人同游马尔代夫遭曝光
- 八卦格字帖软件介绍(八卦格字帖)
- 虚拟机 操作系统(操作系统整合:虚拟机管理程序的下一步)
- 比亚迪f6参数配置?(比亚迪f6)
- 奥沙利文获世锦冠军,奥沙利文得了几次世锦赛冠军
- Evel Knievel手游游戏介绍(Evel Knievel手游)
- 索尼wi1000x拆解(SONYNZW-X1000系列高清拆解图集)
- 4座硬顶敞篷跑车都有哪几款?(4门4座硬顶敞篷车推荐)
- 艺术体操团体全能决赛,艺术体操团体全能决赛中国
- 工人物语6通用修改器游戏介绍(工人物语6通用修改器)
- 简述电机换向器的工作原理图(简述电机换向器的工作原理)
- Atheros-AR5007EG无线网卡驱动软件介绍(Atheros-AR5007EG无线网卡驱动)