只需一段话「一键生成」短视频的工具来了

选择字号：超大标准 dzgoadmin 发布于2023-01-31 属于搞笑段子栏目 0个评论 29人浏览

　　抖音和快手火了之后，短视频成为人们「杀时间」最高效的工具。但直到微信视频号推出后，人们才认真思考，短视频可能不仅是网红和「土味」大片的舞台，自己或许也能「分一杯羹」。

　　「现在学做短视频还晚吗？」估计不少人在搜索引擎问过这个问题。毕竟，不像公众号，只要有身份证、会写字就行。做短视频至少需要背景乐、视频素材、配音、字幕等一系列因素。就算是像「半佛仙人」那样仅有鬼畜表情包的视频，也需要创作者有简单粗暴的逻辑，和精彩的「贯口」能力。而这些挑战，拦住了大部分想投身短视频事业的人。

　　不过，随着 AIGC 技术的逐渐成熟，现在，只需要输入一个单词，就能生成配音、背景乐、图片兼备的短视频——一家叫 QuickVid 的网站，集成了大部分 AIGC 工具，满足了人们「一键生成短视频」的幻想。

　　QuickVid 是怎么做到的？现在的短视频网红和 UP 主们，是不是马上就要被淘汰了？

　　用户只需在 QucikVid 网站输入提示语、描述清楚想要创建的视频主题，QuickVid 就开始全自动生产短视频。

　　在QuickVid官网输入提示词Cat后，所展示的工作流程。｜截图来源：

　　基于给出的提示，QucikVid 先利用 GPT-3 的生成文本功能生成短视频脚本，再从脚本中自动提取或手动输入的关键字，基于这些关键字从免费的 Pexels 库中选择背景视频，同时叠加由 DALL-E 2 生成的图像，并调用 Google Cloud 的文本转语音 API 来添加来自 YouTube 免版税音乐库的合成画外音和背景音乐。

　　有了这些基本骨架，QuickVid 生成的就是典型的 YouTube 上的短视频。

　　正如上面展示的案例，看起来散装的 QuickVid 生成的短视频质量并不差，甚至还有点熟悉，一瞬间会让你想到生活中的很多场景。你甚至分辨不出来这段视频到底是机器做的，还是人做的。

　　科技评论者「评论尸」精辟地评论，「现阶段的几个技术应用的组合，确实可以彻底改变人类日常的内容消费习惯：ChatGPT，AI 作画，meme 和短视频。」QuickVid 这样的工具所生成的短视频正是人们现在所喜欢的内容，「以动态表情包 +AI 语音合成配音为主的梗可以在 Tiktok 和抖音反复流行」。

　　但也就这样了，「集各家之所长」的 QuickVid 并没有突破生成式 AI 目前所展现的可能性。

　　也正是由于其工作原理，QuickVid 自动生成短视频的质量并不稳定。一个例子是背景视频的相关性，由于 QuickVids 目前仅限于 Pexels 目录，随机选择的背景视频常常只是与主题稍微沾边；另一方面，DALL-E 2 生成的图像也显示了当前文本到图像生成技术的局限性，比如文本乱码和比例失调。创始人 Habib 表示，QuickVid「每天都在测试和修补」。

　　Daniel Habib 是一名自学成才的开发者，曾在 Meta 从事 Facebook Live 和视频基础设施相关工作，他在短短几周内就开发出了 QuickVid 这样一款短视频生成器。

　　尽管如此，QuickVid 还是让我们看到了现有技术下生成式短视频的一种可能。毕竟，相比现有大公司，没有包袱的初创公司在产品上更大胆，因为几乎没有试错成本。

　　结合现有的 AI 技术，利用大量空镜短视频的重复、模板格式，QuickVid 解决了必须自己生成镜头的问题。

　　那么，QuickVid 这样的产品，会成为 Meta、谷歌等巨头，为简化短视频制作而开发的新功能吗？还是像很多生成式 AI 应用一样，不过是昙花一现的「玩具」？

　　如果 Stable Difussion（一款 AI 图片生成器）和 Jasper（一款 AI 文案生成器）的出现，让艺术创作者和营销人员这样特定领域的人看到了 AI 的生产力，那么 QuickVid 则进一步释放了像抖音、快手等短视频平台上普通用户的生产力。

　　短视频已经抢占了人们余暇时间的绝大部分注意力，QuickVid 使得短视频创作有更低的门槛，它会给人们带来什么样的影响？

　　QuickVid 的创建者 Daniel Habib 表示，QuickVid 是为了帮助创作者跟上受众的需求。通过为创作者提供快速轻松地制作优质内容的工具，帮助创作者增加内容输出、降低创作倦怠与灵感枯竭的风险，满足粉丝「不断增长」的需求。

　　听上去，Daniel Habib 似乎为 QuickVid 找到了绝佳的使用场景，切中了短视频创作者的痛点和刚需。但 QucikVid 真的可以帮助创作者满足受众的需求吗？

　　当生成短视频的门槛降低到只输入提示词后，短视频的数量的确可以想要多少就有多少。但不得不考虑另一个问题。

　　过去，短视频制作的每个环节——写脚本、拍素材、剪辑甚至配音，都可以区别竞争对手玩出花样、赢得流量；现在有了 QucikVid，大家比拼的就只剩输入的提示词了。当竞争规则变成谁念的「咒语」可以更容易让机器理解时，真的可以让创作者的内容脱颖而出吗？

　　恐怕相反，更有可能发生的是本就拥挤的短视频平台，充斥着同质化内容和垃圾内容。

　　对于垃圾内容的泛滥，Habib 认为，「短视频平台的算法，而不是 QuickVid，最适合确定视频的质量，制作低质量内容的人『只会损害自己的声誉』」。声誉受损自然会抑制人们使用 QuickVid 创建大规模的垃圾内容。换句话说，「如果人们不想看你的视频，那么这些视频就不会在 YouTube 等平台上获得分发和传播，而且，制作低质量的内容也会让人们以负面的眼光看待你的账号。」

　　更迫切的问题在于，QucikVid 面临着所有 AIGC 应用的共同挑战。

　　首先是生成式 AI 应用无法根除的「有毒」内容，即虚假有害或价值观不正确的短视频。

　　目前，GPT-3 依旧会散布虚假信息，特别是关于新近发生的事件，因为这些事超出了其知识库的范围。而由 GPT-3 改进而来的 ChatGPT 被证明有可能使用性别歧视和种族主义语言。尽管 OpenAI 有「过滤器」相关技术来阻止这些有毒内容，但效果并不理想。

　　依托于 GPT-3 的 QuickVid 当然也不可避免地会生成有毒内容。

　　结果显示，诸如「犹太新世界秩序」和「9/11 阴谋论」这样明显有问题的提示并没有产生有毒的脚本。但是对于「向学生灌输批判种族理论」，QuickVid 制作了一段视频，暗示批判种族理论可以用来给小学生洗脑。

　　这令人担忧，特别是对于那些使用 QuickVid 制作资讯视频的人来说。

　　对此，Habib 表示，QuickVid 依靠 OpenAI 的过滤器来完成大部分的审核工作，并声称用户有义务手动审查 QuickVid 创建的每个视频，以确保「一切都在法律范围内」。

　　但这似乎站不住脚，如果真的如 Habib 所言，抖音快手这样的短视频平台早就可以省去繁重、昂贵的人工审核工作。而现实是，永远有下一个有毒视频在路上，靠所有人的自觉性并不可能。

　　围绕人工智能生成内容的版权状况是模糊的，至少目前是这样。例如，美国专利商标局（USPTO）最近撤销了对人工智能生成的漫画的版权保护，称受版权保护的作品需要人类作者。

　　当被问及美国专利商标局（USPTO）的决定会如何影响 QuickVid 时，Habib 说，这只涉及 AI 产品的「可专利性」，而不是创作者利用内容赚钱的权利。

　　他指出，创作者很少为视频提交专利，更多只是靠短视频赚钱。比起专利，他们更关心在自己账号发布高质量的内容，这将有助于扩大他们账号的影响力。他认为，QuickVid 用户保留有将创作内容用于商业的权利，有权在 YouTube 等平台上将其货币化（用这样的内容赚钱）。

　　其他的法律挑战还可能影响 QuickVid 的 DALL-E 2 集成，进而影响其生成图像叠加的能力。

　　近日，微软、GitHub 和 OpenAI 被提起集体诉讼，指控它们违反版权法，允许代码生成系统 Copilot 在不提供授权的情况下复制部分授权代码。 ( Copilot 是由 OpenAI 和微软旗下的 GitHub 联合开发的。 ) 这起案件对 DALL-E 2 这样的生成艺术 AI 也有影响，它也被发现从训练过的数据集中复制和粘贴图像。

　　Habib 并不担心，他认为生成式 AI 的潘多拉魔盒已经打开。他说：「如果明天出现另一场诉讼，OpenAI 消失了，还有几个替代方案可以为 QuickVid 提供动力。」他指的是类似 DALL-E 2 的系统 Stable Diffusion。QuickVid 已经在测试利用 Stable Diffusion 生成头像图片。

　　在应用层的创新消停多年后，ChatGPT 的横空出世让人们看到了「把应用层重做一遍」的可能。生成式 AI 革新的局面下，短视频自动生成器的出现可能是最具想象力的工具，毕竟，短视频是当前商业化能力最强的媒介形式。

　　如何利用 AIGC 降低人们创作的门槛，如果说其应用之前还停留在绘画和文字阶段，现在，视频无疑是 AIGC 即将攻克的下一个「堡垒」。QuickVid 只是 AIGC 冲向视频堡垒的第一个游骑兵，其身后是即将呼啸而至的「千军万马」。

　　更重要的是，堡垒中的平台、用户和监管层，面对新技术和新工具，将会采取怎样的措施，来维持「创作普惠」及「无用内容泛滥」的平衡状态。

标签：搞笑视频素材,