1. XenForo 1.5.14 中文版——支持中文搜索!现已发布!查看详情
  2. Xenforo 爱好者讨论群:215909318 XenForo专区

科技 DALL-E文本到图像AI模型迎来边界画幅扩展升级 很快就被网友们玩坏

本帖由 漂亮的石头2022-09-06 发布。版面名称:新闻聚焦

  1. 漂亮的石头

    漂亮的石头 版主 管理成员

    注册:
    2012-02-10
    帖子:
    486,020
    赞:
    46
    上周,OpenAI 为其“文本到图像”AI 模型 DALL-E 添加了“outpointing”功能,为系统带来了能够拓展任何给定图片边界的功能。在此基础上,许多网友开始通过 Beta 测试阶段的每月 50 次免费访问来生成新的视觉效果,并在社交网络上分享了许多有趣的内容。

    [​IMG]

    以《戴珍珠耳环的少女》为例,你可看到 DALL-E 是如何在人工智能技术的加持下,“想象”出在 Johannes Vermeer 画框之外的场景。

    [​IMG]

    让人感到震惊的是,即使仅提供了相当有限的初始信息,AI 系统还是能够努力匹配原画作者的风格 —— 比如物体的阴影和高光。


    Extend creativity and tell a bigger story with DALL-E images of any size(via)​

    在 Twitter 上分享的这段视频中,艺术家 August Kamp 展示了如何将图像逐级“放大”。可知 DALL-E 会经常随着画幅的扩展,而重新计算出匹配的画面。

    [​IMG]

    《玩扑克的狗》(油画原作者为 Cassius Marcellus Coolidge)​

    需要指出的是,DALL-E 的系统并没有单独生成扩展出来的画面。与所有“文本转图形”AI 一样,该模型同样要求人类辅助描述想要看到怎样的视觉效果。

    [​IMG]

    “末世”蒙娜丽莎​

    随着公测的开启,网友们也开始疯狂地拿 DALL-E 对各个“世界名画”开涮。

    [​IMG]

    光影朝向不对劲的派拉蒙片头​

    此外尽管许多“文本到图像”AI 模型都有提供类似的画幅延伸功能,但它们往往与升级前的 DALL-E 一样,需要相当繁杂的人工介入。

    [​IMG]

    这位骑马的男子,有一个响当当的名字(拿破仑)。​

    在 Beta 测试阶段,OpenAI 有提供超百万的用户访问。如果用完了一个月 50 次的免费服务,也可支付 15 美元来购买 115 次额外的图像生成。

    [​IMG]

    披头士《Abbey Road》专辑封面(原版只有四人走过人行道)​

    [​IMG]

    “桂格”震怒(假如该燕麦品牌的形象代言人是一位身材丰满的酒吧女招待)​


    相关文章:

    OpenAI的DALL-E绘画AI 已能够扩展创作更大的图像
     
正在加载...