AI绘图领域又卷起来了谷歌强势入局

AI绘图领域又卷起来了谷歌强势入局-3

Google推出最新玩具Imagen 2,AI画家进阶,扩散技术搞笑又灵活。逼真手部、面部,聪明懂事,学会各种画风,更有修图、扩展功能。安全措施SynthID,水印防篡改,拒绝暴力冒犯。谷歌笑称,Imagen 2在图像质量上超越一切,连AI缺陷都消灭了。未来或许为视频AI开新局,Google的画笔再次引领潮流!

嘿,瞧瞧,Google又来搞事情了!他们刚刚推出了全新的 Imagen 2 图像生成器,说是能画出手部、面部等细节比真实还真实的图像哦!

Google DeepMind 最新的AI玩具 Imagen 2 又火了,它可是基于那个广受欢迎的扩散技术的。听说 Imagen 2 不仅在图像质量上创下了Google的新高,而且还听话地按照用户的提示画图,简直是AI画家的梦想。

Imagen 2 还变得更加“懂事”了

原来是这样,Google DeepMind 在训练它的时候加了一些额外的说明,让它更聪明。Imagen 2 不仅学会了各种标注风格,还能更深入地理解各种神秘的提示。

这不得了的改进让它能更深刻地理解提示中的上下文和微妙的区别。OpenAI 的 DALL-E 3 也用了类似的招数,看来AI画家们都在追求更高级的懂画画技能。

谷歌表示,Imagen 2 在许多领域都有了巨大的提升,这些领域通常是其他文本到图像系统的老大难问题。比如说,画一个逼真的手和面部,Imagen 2 都能轻松搞定。谷歌还说,它们家的AI画图已经基本上消灭了常见的缺陷,别再担心画出个歪脸了!

AI绘图领域又卷起来了谷歌强势入局-4

为了让图像更漂亮,他们还搞了一个美学模型,考虑到了人类对好光影、构图、曝光和锐度等的钟爱。每张图像都有一个“美感分数”,这样 Imagen 2 就能更加专注于训练数据集里符合人类审美的图像了。

Imagen 2 还有修图、扩展和各种花式的风格控制功能

听说 Imagen 2 的扩散技术特别灵活,能轻松掌握各种风格,甚至可以通过参考图像来调整风格,真是潮到不行。

Imagen 2 还内置了一些图像编辑功能,比如修图和扩展,直接在原图上加点料或者放大图像边缘都不在话下。这些功能对于追赶 Adobe Firefly 的生成填充和 Midjourney 的缩小功能都是必备。

虽然 Imagen 2 现在还不适合个人使用

听说最终用户可能以后可以玩这个新玩具,但是谷歌还是希望先减少一些潜在的风险和挑战。从设计到实施,他们都采取了一些安全措施,希望多点测试能给大家更安心的使用体验。

其中一个安全措施是 SynthID,一个用来给AI生成的内容加水印的工具包。这样,经过授权的 Google Cloud 用户就可以在图像上插入数字水印,而不影响图像质量。即使图像在存储过程中被处理,水印也会保留。

嗯,谷歌还表示他们做了一些技术保障,限制了一些有问题的输出,比如暴力、冒犯性或者色情内容。总之,他们对训练数据、提示以及系统生成的输出都做了安全测试。

Imagen 2 是 Google 对 OpenAI 最新图像模型 DALL-E 3 的回应,DALL-E 3 不仅在画画上得分高,而且通过 ChatGPT 的使用也很成功。虽然 Google 还没说怎么推广 Imagen 2,但和 Bard 的整合似乎是迟早的事。

这个 Imagen 2 是在2022年5月推出的第一代 Imagen 之后发布的。当时,Google 技术上还领先 OpenAI,不过这个竞争对手早已迎头赶上。

Imagen 2 还可能为 Google 的视频AI开拓新天地,就像 Imagen 是 Imagen Video 的基础,或者 Meta 在 Emu Video 中使用图像生成器 Emu 一样。看来未来的AI画家和视频编辑都要有点“高端玩具”了!

版权声明:
作者:小火箭
链接:https://www.xiaohuojian6.top/406.html
来源:小火箭官网
文章版权归作者所有,未经允许请勿转载。

THE END
分享
二维码
< <上一篇
下一篇>>