作者 | 金展
导读:百家号作为百度为创作者打造的集创作、发布、变现于一体的内容创作平台,在图文、短视频方面已经深耕多年,基于百度基础AI能力,通过视觉、语音、 NLP等技术将图文内容智能合成视频是目前主要的探索方向,目前每天帮助创作者制作数千条接近于真人制作水平的视频。视频渲染合成作为内容视频化的最后一个制作环节,决定着视频内容质量、时效性等关键指标,本文将带你了解百家号视频渲染合成的技术实现,详细介绍AE在视频渲染方面的独特优势。。
全文8634字,预计阅读时间22分钟。
01 背景
短视频作为近年来移动互联网兴起的重要内容形式,市场规模持续增长,根据2021年12月CNNIC的数据报告,短视频用户规模就已达9.34亿,占互联网用户的90.5%。如何高效智能地进行短视频合成来满足用户的视频内容消费,越来越成为内容创作者的一个挑战。百家号作为百度为创作者打造的集创作、发布、变现于一体的内容创作平台,在图文、短视频方面已经深耕多年,如何基于百度基础AI能力,通过视觉、语音、 NLP等技术将图文内容智能合成视频是目前主要的探索方向。
早期,百家号是基于VidPress(https://ai.baidu.com/creativi...) ,通过五大步骤实现图文自动转视频;VidPress的工作原理和剪辑师制作视频的步骤类似:先准备文字脚本,然后收集媒体素材,再将素材处理成视频片段,将脚本配音和视频进行对齐,最后进行编辑和检查。通过 AI 技术,VidPress 可以实现文字分析和摘要、视频内容搜索、素材智能化处理、音视频对齐,以及智能剪辑等5个步骤的自动化。这不仅保证了视频生成质量接近于真人制作水平,同时也大幅提升视频创作的效率。
基于该技术,百家号已服务数十家媒体,在热点资讯、媒体报道等多个领域开展了多次应用,每天帮助创作者自动生产数千条视频内容。整体的业务功能如下:
而随着百家号的业务迭代,更多的个性化需求为智能合成视频带来了一些挑战,例如:度晓晓播报天气,在视频中添加虚拟人等,在完成了文字分析和摘要提取、视频素材智能化处理、音视频合成之后,视频的呈现效果是百家号业务要解决的核心问题之一,视频创作不仅需要AI的加持,同样离不开视频合成这个关键环节;视频渲染合成作为内容视频化的最后一个制作环节,决定着视频内容质量、时效性等关键指标。
所以,百家号从今年3月份开始致力于渲染部分的优化工作,本文我们将重点聊聊视频渲染合成这个环节。
△度晓晓播报天气视频效果
02 为什么选择AE
谈到视频合成,我们会想到 FFmpeg、OpenGL、Shader 这些基础库,以及建立在这些基础库之上的Adobe After Effects(简称 AE) 、UE4、Unity 3d等视频处理软件和渲染引擎。
FFmpeg 在视频处理方面功能十分强大,被誉为多媒体领域的瑞士军刀,在视频合成方面(https://ffmpeg.org/ffmpeg.html)和转场效果(一个例子:https://trac.ffmpeg.org/wiki/...) 方面都有着出色的表现,FFmpeg 的命令比较强大,可以实现视频转码,视频拼接、图片合成、音频合成,也是我们业务中视频合成的基础依赖之一。
例如:你只需要准备 img01.png,img02.png两张尺寸相同的图片,在安装FFmpeg以后,执行以下代码就能生成一个带有过渡效果的视频。
ffmpeg -loop 1 -t 5 -i img01.png -loop 1 -t 5 -i img02.png -filter_complex "[0][1]xfade=transition=fade:duration=1:offset=4,format=yuv420p" output.mp4
- OpenGL方案