资讯

Stable Diffusion最新版本发布,带来重大升级

Stability AI推出了最新的图像生成模型Stable Diffusion XL 1.0,这是目前为止公司最先进的版本。此版本在GitHub和Stability的API及其消费者应用程序中均可获取,它在颜色、对比度、阴影和光照方面的表现比以前的版本有了显著提升。这一版本拥有35亿的参数,能够在几秒钟内生成全1兆像素分辨率的图像,并且支持多种纵横比。 此外,Stable Diffusion XL 1.0在处理文本生成任务方面也有所改进,能够生成具有高度清晰度的图像,包括可以识别复杂的文字和字体。该模型还支持图像修复(inpainting)、图像外扩(outpainting)和图像到图像的提示转换,使用户能够输入一张图片并添加一些文字提示来创建更详细的图片变体。 Stability AI表示,尽管Stable Diffusion XL 1.0具备强大功能,但它的开源性质意味着理论上可能被滥用,如生成非合意的深度伪造内容。因此,公司在模型的训练数据中采取了额外的筛选措施,以减少生成有害内容的风险,并封锁了许多问题提示词。 Qualcomm也展示了在安卓智能手机上使用Stable Diffusion进行离线图像生成的能力,这标志着AI图像生成技术的又一重大突破。该功能在Snapdragon 8 Gen 2 SoC支持下运行,展示了在不到15秒内完成图像生成的能力,这对于需要在移动设备上迅速生成图像的应用程序来说是一个重要进展。 随着这些技术的进步,Stability AI和其他公司如OpenAI和MidJourney之间的竞争愈发激烈,预示着AI在视觉艺术和功能实用性方面将持续带来革命性的变化。

Stable Diffusion的最新动态:多模型升级和创新应用

最近,Stable Diffusion发布了其最新版本——Stable Diffusion 3。这一版本提供从800M到8B参数的多个模型选择,旨在通过更精细的扩展性和质量选项来实现技术民主化。此外,Stable Diffusion 3采用了扩散变换器架构和流匹配技术,大幅提高了多主题提示的处理性能和图像质量。 尽管Stable Diffusion 3目前还未广泛发布,但已经开放了早期预览的等候名单,允许用户提前体验并提供反馈,以便进一步优化模型的性能和安全性。Stability AI公司表示,他们正在与研究人员和社区合作,通过不断的创新确保人工智能的安全和普遍可访问性。 除了最新的Stable Diffusion 3,Stability AI也提供了Stable Diffusion XL和其改进版本SDXL Turbo。SDXL Turbo利用了一种新的蒸馏技术,称为对抗性扩散蒸馏(ADD),这使得模型能够在单步骤中合成图像,并实现实时的文本到图像输出,同时保持高采样保真度。 这些模型不仅支持高质量的图像生成,还包括面向多语种的改进模型,例如专为理解日语表达而设计的日语Stable Diffusion XL,以及具备图像描述能力的日语Stable VLM。 Stable Diffusion的所有版本均采用开源策略,用户可以自由地用于商业和非商业目的。随着技术的不断进步,Stability AI公司承诺将推出更多创新功能,以激发全球用户的创造潜力。