内容
活动
关注

芯片竞争格局及最佳匹配场景|开发者分享会

简介: 今天分享的内容来自阿里云智能解决方案架构师冯英飞的“芯片竞争格局及最佳匹配场景”。本文主要从ARM芯片市场竞争与生态分析、倚天竞争力分析以及优势业务场景介绍这三个内容进行讲解。

今天分享的内容来自阿里云智能解决方案架构师冯英飞的“芯片竞争格局及最佳匹配场景”。本文主要从ARM芯片市场竞争与生态分析倚天竞争力分析以及优势业务场景介绍这三个内容进行讲解。

一、ARM芯片市场竞争与生态分析

1. 芯片商业竞争格局:商业驱动市场平衡与再分配

高通的加入,英伟达、AMD的摩拳擦掌,让原本不温不火的PC市场竞争更加白热化。不同架构的选择所带来的性能、功耗、生态还只是第一步,真正的战场是AI。

比如高通发布的骁龙X Elite支持在终端侧运行超过130亿参数的生成式AI模型,在终端侧已经是极大的突破,目前手机端的参数规模在10-70亿左右。但网络端的大模型有几百亿乃至上千亿的参数量。

因此二者不是替代关系,而是互补关系。智能终端厂商希望的是,在PC端、手机端都能实现和在云端一样的操作,二者协同,称为“混合AI”。微软高管注意到了苹果基于ARM 架构的芯片在 AI 处理等方面的高效,希望由此获得类似的性能。这也可视为微软对在 PC 市场中占比越来越大的苹果的一次反击。

2. ARM 服务器CPU发展历程

第一波浪潮(2008-2013),ARM开始考虑做服务器芯片最早可以追溯到2008年从投资startup calxeda公司开始,当时还是ARM V7架构,32位处理器。后面ARM发布v8架构,在手机移动处理器上所向披靡,但相比于服务器上的多核高性能,ARM在服务器领域因为性能不足没有什么竞争力,所以很快就落下帷幕,基本上没有开始就结束了。

第二波浪潮(2011-2018)有三个标志性的时间点。第一个是2016年Broadcom,Vulcan说要开始做服务器芯片,这也是ARM联合一些合作厂商做出的一个尝试。第二个是2018年底发布了ARM SBSA,它是服务器的一个标准的加工模板,相当于给ARM服务器打了一个很好的基础。

第三个是2018年AWS Graviton2 发布。在此之前CPU厂商、芯片厂商做ARM的芯片基本都已经宣告失败了,直到2018年AWS Graviton2 发布,开启了ARM处理器在服务器领域成功的先河,它给ARM芯片在服务器领域成功指明了道路。云厂商基于ARM架构会有一定的优势,它可以通过自身iaas和paas这些云的标准服务,给用户提供的是一套ARM的解决方案,而不是一个单纯的芯片。因为如果只是ARM芯片,它在生态和软件上会导致用户的使用成本比较高。

第三波浪潮(2019~至今),2019年阿里巴巴开始自研ARM服务器芯片。此外,Google、Microsoft也都是陆续宣布要开始自研服务器芯片的开发。2021年,倚天710经过两年的研发终于进行了量产,目前已经在阿里巴巴集团、阿里云都实现了规模化使用。

二、倚天竞争力分析

1. 算力分析:V9架构ARM算力的分水岭

倚天710采用业界已上市产品中先进的5nm工艺,基于最新的ARMv9架构,SPECint 2017领先业界标杆20%,对比上一代X86平台领先40% 。

接下来介绍一下倚天710这款芯片的主要规格。

  • 双 DIE结构,每个DIE 360 毫米2。
  • 两个DIE 600 亿晶体管。
  • 业界首次使用ARM V9架构和CPU 核– Perseus。
  • 主频:3GHz。
  • 8 Channel DDR5 x4800。
  • 96 Lane PCIe 5.0。
  • Max Power: 300 W。

2. 倚天性价比分析:云上最优性价比ECS实例

  • 1U2机型,CIPU实现整机核的高密度,可达256core,
  • 极限功耗300w,实际应用中功耗大约在100w~150w之间,功耗优势明显
  • 性能领先x86 六,七代30%~60%,成本低10%~30%,与AMD热那亚打平,成本低30%+;

三、优势业务场景介绍

1. 大数据场景:倚天技术收益高,资源规模大,ROI高

大数据是我们非常重要的一个领域,因为它是一个重负载的计算场景,对于倚天这种高性能的CPU来说是非常适合的场景。在集团业务方面,倚天ECS实例已经有效支持阿里618、99大促以及双十一压测等多个活动,涉及电商、数据库、存储蚂蚁支付多个业务场景。其中电商核心交易系统相比于X86竞对产品有20%-30%的成本优势。

2. 音视频编解码:高负载,高算力,场景适配简单

在阿里云外部客户方面,X短视频客户,基于自身业务测试视频编解码场景,性能收益高达30%以上,性价比收益高达80%+。Y游戏客户,基于自身游戏对于计算和网络的高要求,倚天c8y在客户实测中跑分是X86架构同级的120%,综合性价比近乎200%。目前基于倚天710的ECS实例已经成为了外部客户降本增效的利器。

3. redis/nginx场景:重定义业务安全水位

  • 业务场景简单,适配工作量小
  • Redis 5不支持IO-thread 多线程配置,建议提高部署密度,结合zstd压缩。
  • Nginx场景,带宽优势+ gzip压缩优势。
  • Nginx与redis场景,cpu负载控制在30%~40%,预留20%负载,否则RT劣化,使用倚天服务器,日常可保持50%水位,70%为安全水位,可节省40%资源;

4. NLP:集团语音ASR,机器翻译场景已落地,收益明显

  • AI场景综合性价比由计算算力、内存子系统带宽、算法效率(优化)等方面决定 。
  • 倚天710计算算力-内存带宽平衡,性价比出众,是语音NLP、识别分类、推荐系统等推理应用的理想负载。

好啦!小弹的分享到此为止。我们更欢迎您分享您对阿里云产品的设想、对功能的建议或者各种吐槽,请扫描提交问卷并获得社区积分或精美礼品一份。https://survey.aliyun.com/apps/zhiliao/P4y44bm_8

【扫码填写上方调研问卷】

欢迎每位来到弹性计算的开发者们来反馈问题哦~

相关文章
|
3月前
|
人工智能 运维 安全
重塑 AI 算力底座!阿里云服务器操作系统 V4 正式发布
Alinux 4不仅是技术突破,更是产业变革的催化剂。
|
8月前
|
安全 API 数据库
借助淘宝拍立淘API,打造超便捷商品识别引擎
淘宝拍立淘API是基于图像识别技术的强大工具,允许开发者通过上传商品图片,在淘宝海量数据库中精准查找相关商品。它支持高精度识别、快速响应、丰富结果展示,并易于集成到各类应用中。用户只需上传图片,即可获取商品基本信息及链接,大幅提升搜索效率。该API采用严格安全机制保障数据隐私,同时提供Python等多语言支持,方便开发者调用。体验链接:c0b.cc/R4rbK2。
|
11月前
|
人工智能 自然语言处理 自动驾驶
Qwen-Agent:基于Qwen 2.5模型的智能Agent构建与应用
Qwen-Agent:基于Qwen 2.5模型的智能Agent构建与应用
3036 20
|
搜索推荐 安全 数据安全/隐私保护
构建高效网站后台会员管理系统:实战指南与代码示例
【7月更文挑战第5天】在当今的互联网时代,几乎每个网站或应用程序都需要一个强大的会员管理系统来维护用户信息、权限控制以及个性化体验。一个设计良好的会员管理系统不仅能够提升用户体验,还能增强数据安全性和运营效率。本文将深入探讨如何从零开始构建一个网站后台会员管理系统,涵盖系统设计思路、关键技术选型、功能模块实现,以及实战代码示例。
1285 3
|
机器学习/深度学习
RNN 和 Transformer 复杂度比较
RNN 和 Transformer 复杂度比较
339 0
|
运维 监控 安全
SD-WAN异地组网加速:提升企业网络性能的关键
随着企业全球化扩展,异地组网成为重要需求。传统广域网(WAN)存在延迟高、带宽不足等问题,而SD-WAN通过智能流量调度、降低成本、提升安全性和快速部署等优势,成为理想解决方案。本文详细解析SD-WAN在异地组网中的优势、应用场景及最佳实践,帮助企业实现高效跨地域网络连接。
|
算法 计算机视觉 异构计算
基于FPGA的图像一维FFT变换IFFT逆变换verilog实现,包含tb测试文件和MATLAB辅助验证
```markdown ## FPGA 仿真与 MATLAB 显示 - 图像处理的 FFT/IFFT FPGA 实现在 Vivado 2019.2 中仿真,结果通过 MATLAB 2022a 展示 - 核心代码片段:`Ddddddddddddddd` - 理论:FPGA 实现的一维 FFT/IFFT,加速数字信号处理,适用于高计算需求的图像应用,如压缩、滤波和识别 ```
|
安全 Linux 数据安全/隐私保护
详解如何登录Docker Registry
【8月更文挑战第24天】
1429 0
|
前端开发
uniapp 实战 -- 创建 uni-admin 项目,部署到 uniCloud 前端网页托管(免费云空间)
uniapp 实战 -- 创建 uni-admin 项目,部署到 uniCloud 前端网页托管(免费云空间)
1110 0

热门文章

最新文章

下一篇