引言
1988年,从H.26x系列标准的初代成员H.261面世,这一标准是由 ITU-T VCEG(视频编码专家组,Video Coding Experts Group)针对视频会议系统制定的,并获得商业化成功的第一个视频编码标准,自此传统视频编码技术开始了快速发展,各种国际标准持续涌现和迭代。H.264 作为目前市占率最高的视频编码标准,其开源x264的实现被各个视频厂商青睐,仍然有着较高的使用场景。
2021 年云栖大会,平头哥半导体发布首颗为云而生的 CPU 芯片倚天 710,该芯片针对云场景研发,同时兼顾了性能与易用性。而搭载倚天 710 的 ECS 自设计初就是一款云原生服务器,凭借其灵活、先进、弹性的云原生芯片特性和优异的 CPU 算力,超低功耗,与视频的转码服务特点强匹配,为视频编解码业务带来更多可能。
倚天ECS x264性能
本文将基于x264这个场景实测对比倚天ECS c8y实例和Intel c7 实例的编码性能。
被测ECS实例配置如下:
实例 | CPU Type | OS |
ecs.c8y.8xlarge | Yitian 710 | Alibaba Cloud Linux 3 |
ecs.c7.8xlarge | Intel Icelake Platinum 8369B | Alibaba Cloud Linux 3 |
测试序列
测试的视频类型包括了射击游戏、晚会、综艺、足球、MOBA游戏、F1赛车、直播带货等场景,共计9个视频,取9个视频综合的性能进行比较。测试序列均为分辨率1080P的视频。
测试软件版本
测试软件使用的是开源的x264 master版本,以及平头哥团队针对倚天平台做的性能优化版本。
点播场景
点播场景的测试为:通过不断增加编码路数,直到32C下总FPS不再增加,记录此时编码速度FPS。
使用的测试命令为:
#倚天版本的性能优化开关由lossy-speedup=1参数控制,额外增加此选项 测试数据:
32C 实例下多个序列的平均的编码速度(FPS)
测试路数 | ecs.c8y.8xlarge(Yitian 710) | ecs.c7.8xlarge(Intel Icelake) | |
open-x264 (FPS) | yitian-x264 (FPS) | open-x264 (FPS) | |
1 | 49.96 | 59.02 | 70.37 |
2 | 98.33 | 116.33 | 137.04 |
4 | 195.87 | 230.71 | 197.07 |
6 | 273.73 | 323.13 | 241.73 |
8 | 291.02 | 345.07 | 249.24 |
10 | 297.44 | 353.33 | 250.89 |
12 | 300.13 | 357.47 | 251.6 |
14 | 301.16 | 358.87 | 252.31 |
16 | 302.58 | 359.82 | 252.62 |
测试结果显示,在高并发路数下, 开源版本的x264的点播场景 ecs.c8y.8xlarge相比ecs.c7.8xlarge 平均将近20%的性能优势,优化版本的x264更是在性能上领先达40%以上。
直播场景
直播场景的测试为:通过ffmpeg的-re参数控制编码速度与源fps一致,增大并发直到fps开始下降,记录最大并发路数。
测试命令为:
#倚天版本的性能优化开关由lossy-speedup=1参数控制,额外增加此选项 测试数据:
各个视频序列的最大并发路数:
测试序列类型(帧率) | ecs.c8y.8xlarge(Yitian 710) | ecs.c7.8xlarge(Intel Icelake) | |
open-x264 (最大并发路数) | yitian-x264 (最大并发路数) | open-x264 (最大并发路数) | |
射击游戏1 (30fps) | 20 | 23 | 16 |
晚会 (25fps) | 17 | 22 | 15 |
综艺 (25fps) | 21 | 24 | 16 |
射击游戏2(30fps) | 17 | 19 | 13 |
足球 (25fps) | 22 | 25 | 17 |
MOBA游戏(40fps) | 17 | 20 | 13 |
F1赛车(25fps) | 20 | 23 | 16 |
MOBA游戏2 (25fps) | 23 | 26 | 18 |
直播带货(25fps) | 39 | 44 | 29 |
Average | 25.1 | 21.8 | 17 |
测试结果显示,在直播场景下,使用开源版本的x264,ecs.c8y.8xlarge相比ecs.c7.8xlarge 平均超过25%的性能优势,优化版本的x264更是在性能上领先达45%以上。
总结
本文基于x264编码针对点播场景和直播场景分别对ecs.c8y和ecs.c7进行评测,测试结果显示c8y实例性能领先于c7。这个主要得益于yitian芯片的强劲算力和稳定的物理核,使得在负载增加的情况下,表现出来的性能更加稳定。此外,基于倚天710的c8y实例售价比c7实例更低,更好的性能以及更低的价格,使得倚天710的性价比更加突出,不失为在视频编解码场景一个更佳的选择。
好啦!小弹的分享到此为止。我们更欢迎您分享您对阿里云产品的设想、对功能的建议或者各种吐槽,请扫描提交问卷并获得社区积分或精美礼品一份。https://survey.aliyun.com/apps/zhiliao/P4y44bm_8
【扫码填写上方调研问卷】
欢迎每位来到弹性计算的开发者们来反馈问题哦~