openai官网(openai画图)_游戏技能

美国当地时间周三，人工智能初创公司OpenAI首席技术官米拉·穆拉蒂(Mira Murati)接受了媒体记者的独家专访。在采访中，她谈到了该公司最新的文本转视频工具Sora，预计将于今年晚些时候向公众发布，并且还将添加语音功能；此外，团队会在发布前对其进行优化，以减少计算资源消耗。

以下为译文全文：

当你早上醒来时，你是否想象过一头公牛悠闲地走在一家精致的瓷器店里？实现这一幻想的方法有3种：

A) 联系当地驯兽师和知名家居品牌Crate Barrel；

B) 聘请好莱坞顶级动画制作人；

C) 使用神奇的AI工具Sora，只需输入命令即可。

欢迎来到人工智能的下一个“魔法世界”。在这里，您的话语可以变成真实、流畅、细腻的视频图像。

OpenAI 计划在今年晚些时候向公众推出其文本到视频转换工具Sora。虽然正式上线还需要一段时间，但OpenAI 已经向我们展示了这个工具的惊人潜力：只需精心设计的文字指令，它就可以创作出几乎足以取代许多视频制作专业人士的作品。《华尔街日报》专栏作家乔安娜·斯特恩(Joanna Stern) 向该公司提交了她自己的几条提示，例如美人鱼和她的螃蟹同伴在评论智能手机，或者一头公牛在精美的瓷器店里自由漫步。

随后，斯特恩亲身体验了Sora 的魔力，她使用该工具与OpenAI 首席技术官Mulati 进行了模拟虚拟视频采访，两人剖析了这些有趣的问题并详细讨论了该主题。探讨了该技术的潜在问题。

上个月，OpenAI 首次推出了用其生成人工智能工具制作的视频预览，引起了互联网的狂热。与以往间歇性、低分辨率的AI视频技术相比，Sora生成的内容无疑是一场视觉盛宴，堪比高质量的自然纪录片或大预算电影。

与之前的人工智能技术类似，Sora 让我们首先惊叹它的能力，然后担心它对社会的影响。为了回应Stern 的担忧，Mulati 向她保证OpenAI 将采取谨慎的步骤来发布这个强大的工具。但这并不意味着一切都会无忧无虑。

这些超现实的视频真的是Sora制作的吗？

斯特恩对索拉制作的视频感到震惊：从意大利阿马尔菲海岸的无人机视图，到拿着自拍杆的柯基犬，再到冲浪板上活泼的动画水獭。这些都展现了Sora强大的创造力和细节处理能力。她进一步要求空创造一个更贴近日常生活的场景：“两名30 多岁的棕色头发职业女性坐在明亮的工作室里接受新闻采访。”

在Sora生成的视频中，两名女子的嘴唇和头发移动自然流畅，皮夹克的细节清晰可见。 Murati 透露，这段20 秒长、720P 分辨率的视频只用了几分钟就完成了，尽管还没有添加声音。但她承诺OpenAI 正计划为Sora 添加语音功能。

为了将Sora 与其他工具进行比较，Stern 还在另一个AI 视频生成器Runway 中输入了相同的提示。然而，结果却截然不同。跑道上出现了两个模糊、幽灵般的女性形象，看起来就像是从噩梦中走出来的。

那么，Sora究竟是如何实现这一神奇转变的呢？虽然解释其内部工作原理可能比解释美人鱼的进化更复杂，但简单来说，Sora 背后的人工智能模型学会了识别和理解各种物体和动作。输入文字提示后，模型可以快速勾勒出整个场景的基本轮廓，并逐帧添加细节。

包括Runway首席执行官在内的行业观察家和竞争对手将这些非凡的成就归功于OpenAI庞大的计算资源和海量的训练数据。但OpenAI最近也因未经授权使用大量在线内容来训练其ChatGPT模型而面临侵犯版权的指控。

当被问及OpenAI 使用哪些数据来训练Sora 时，Mulati 表示：“我们主要使用公开数据和授权数据”。当被进一步追问这些数据是否包括YouTube、Instagram 和Facebook 上的视频时，穆拉蒂表示，她不清楚具体细节，但后来证实，授权材料确实包括来自知名版权图片网站Shutterstock 的内容。

对于普通用户来说，人工智能模型往往是一个神秘的黑匣子。我们看到的是输入和输出，但中间的处理是未知的。因此，我们可能永远无法完全理解为什么生成的内容表现出某些风格或特征。例如，斯特恩提到的美人鱼旁边的甲壳类同伴，有着与《海绵宝宝》中的蟹老板类似的胡须。这是模式的创新还是某种偶然？

Mulati 还告诉Stern，目前用Sora 生成视频的成本比该公司的图像生成器Dall-E 高得多。但她承诺，在Sora正式向公众发布之前，团队将对其进行优化，以减少计算资源消耗。

如何识别AI生成的视频？

在早期阶段，人工智能生成的内容仍然存在一些明显的缺陷。

例如，在Sora 生成的采访视频中，一名浅色头发的女性似乎一只手上多了五个手指。 “准确地再现手部动作确实很困难，”穆拉蒂解释道。

在另一项测试中，斯特恩希望看到机器人从电影制片人手中抢走相机的场景。但空生成的是一个人类电影制片人变异成机器人，场景显得突兀且不自然。更重要的是，背景中的黄色出租车不知何故变成了一辆银色汽车。穆拉蒂承认，该模型“在保持一致性方面做得很好，但并不完美。”

这就提出了一个深刻的问题：当这些缺陷得到纠正并且人工智能生成的视频变得更加真实时，我们如何区分真实的视频和人工智能生成的视频？

Sora 生成的每个视频下面都会有一个水印。穆拉蒂解释说，最终这些视频还将包含元数据，以表明它们是如何生成的以及它们来自哪里。此外，OpenAI还有一个安全测试小组，名为“Sora Red Team”。该团队的作用是提供探索潜在漏洞、偏见和其他潜在有害结果的提示。 “这就是为什么我们还没有广泛部署这些系统，”穆拉蒂说。 “我们需要先解决这些问题，然后才能自信地将它们推向市场。”

对于Sora的提示词政策，Mulati透露可能会学习OpenAI的另一个工具Dall-E。例如，为了防止滥用和侵犯隐私，用户将无法使用Sora生成公众人物的图像。当斯特恩试图输入“美国现任总统的电视新闻片段”时，索拉拒绝了这一请求。

斯特恩还试图让索拉制作一段“士兵在东欧小镇行走”的视频，但也被拒绝了。对于裸露等敏感内容的提示，穆拉蒂表示，OpenAI正在与艺术家和专家密切合作，探索如何在不妨碍创意表达的情况下设置合理的“护栏和限制”。

将与好莱坞合作

随着技术的发展，像Sora 这样的人工智能工具将变得更加强大和复杂。这些进步可能会改变传统工作，例如无人机操作员或插画师的角色，从而在好莱坞引起既令人期待又令人担忧的反响。

演员、电影制片人和工作室老板泰勒·佩里(Tyler Perry) 表示，当他宣布停止耗资8 亿美元的工作室扩建计划时，他看到了Sora 的潜力。他相信这项技术可以降低布景和外景拍摄的成本，但他也担心电影业和演员的未来。

代表好莱坞和全国动画艺术家的动画协会主席珍妮特·莫雷诺·金也表示，虽然艺术创作决策仍然需要人类的参与和判断，但未来充满了不确定性。

爱德华·萨奇(Edward Saatchi) 和他的人工智能视频工作室《神鬼寓言》(Fable) 梦想着创建人工智能版本的Netflix：只需文本提示即可呈现完整的电视剧集。

关于Sora对视频制作行业的潜在影响，Mulati重申了OpenAI缓慢而谨慎的做法。她表示，OpenAI正在与业内人士合作进行早期测试和反馈收集，希望世界各地的电影人和创作者能够加入到这个探索过程中，共同推动电影产业的发展。

如果OpenAI 比作在瓷器店里自由漫步的公牛，那么它目前可能需要小心行事。但最终，它可能不可避免地带来一些破坏。

openai官网(openai画图)

相关推荐