补齐拼图后，高通终于猛推“三端归一”

　　当地时间10月20日下午，记者抵达美国夏威夷茂宜岛，参加10月21日开启的高通骁龙峰会。在峰会的前两个主题日，高通在智能手机和汽车平台拿出了三款骁龙Elite(至尊版)新品。其中最引人关注的，莫过于高通自研CPU架构Oryon的“开枝散叶”。在去年首次应用于高通AI PC芯片骁龙X Elite之后，Oryon CPU走进了此次发布的一款手机芯片平台和两款汽车芯片平台。加上高通自研的Adreno GPU和Hexagon NPU，高通补齐了自研SoC的最后一块拼图，也统一了PC、手机、汽车三条产品线的芯片架构。

　　完成四年前的规划第二代Oryon CPU亮相

　　本次骁龙峰会上，高通公司总裁兼CEO克里斯蒂亚诺·安蒙(Cristiano Amon)没有参与三款新品的发布，但他花了相当的篇幅发布贯穿三款新品的主线：第二代Oryon CPU。

安蒙用一张图总结一年来高通在Oryon CPU上的成果

　　Oryon CPU的研发，可以追溯到2021年高通斥资14亿美元收购CPU设计企业Nuvia。虽然Nuvia当时仅仅创立两年，创始团队却拥有在苹果、谷歌等企业担任芯片架构师的经验，在公司成立一年后就推出了自研CPU架构“Phoenix”，以更低功耗实现了显著高于竞品的峰值性能。

　　在2021年3月完成收购后，安蒙就表示高通计划将下一代 CPU 集成到智能手机、PC、数字驾驶舱、ADAS系统等产品线。而这一愿景，在之后三年的骁龙峰会上，一步一步走进现实。

　　在2022年骁龙峰会，高通公布了下一代名为“Oryon”的CPU核心设计，但并未展现具体细节。在2023年骁龙峰会，Oryon CPU正式亮相，采用12个3.8GHz高性能核心，单核性能跑分领先竞品的同时，达到竞品峰值性能所需的功耗减少30%~70%，率先搭载于同期发布的新款PC芯片骁龙X Elite。

　　本次骁龙峰会发布的第二代Oryon CPU，性能相比第一代提升了30%，同等性能下功耗降低了57%。在单核、多核以及达到相同峰值性能所需的功耗等参数领先竞品的同时，Oryon CPU在设备不插电的情况下，性能不会衰减。这一特点使Oryon CPU在不插电模式下，处理速度比竞品CPU快134%，也使骁龙X Elite在不插电模式下相比竞品处理器快90%。同时，由于第二代Oryon CPU将首次搭载到手机平台，因此相比竞品，Oryon CPU能够将性能和能效的提升兑现在更小的封装中。

　　在生成式AI的浪潮袭来之后，围绕算力的竞争更加白热化，头部处理器厂商都不约而同地缩短了产品发布周期，从过去的2年一迭代走向1年一迭代。高通对于Oryon CPU似乎也有此打算。安蒙表示，对于下一代Oryon CPU，他已经看到了一些高通工程团队所作的工作并为此感到振奋，请关注明年骁龙峰会的发布。

　　面向手机、汽车芯片要求进一步定制

　　自研CPU架构的利好，就是能够根据不同产品线的需求，对CPU进行微架构层面的调优和定制。“我们从头开始打造IP，Oryon CPU正是我们自研SoC的最后一块拼图。这种方式让我们拥有对CPU的完全自主权，能够直接定义和定制所有处理通道的配置，不再依赖外部(第三方)。”高通技术公司产品管理总监Manju Varma表示。

　　由于第二代Oryon CPU从PC平台走进手机平台，因此高通CPU设计团队首先面向移动平台进行架构调整。高通工程副总裁、Oryon CPU设计负责人Gerard Williams(曾为Nuvia创始人)在回顾团队这一年的工作时表示，他们大幅提升了Oryon CPU的时钟速度，同时降低功耗，这是推动Oryon CPU走进移动终端的核心驱动力。同时，为了适应移动设备更小型的体积和电池，团队也在降低减少芯片面积上下了功夫。

　　具体来看，骁龙8至尊版搭载的Oryon CPU采用了面向移动端设计的全新微架构。在核心设计上采用了2颗超级内核+6颗性能核心，不再采用能效核。超级内核引入全新的数据时序预取器，基于模式检测预取所有缓存行(CPU缓存存储数据的基本单位)，并预测特定使用情况下哪些缓存行会被使用，以实现更高的频率(4.32GH)和性能，并提升在紧凑产品外形设计下的能效表现。6个性能核都经过调优，在保证能效的前提下运行密集型的应用程序。

　　对于不再使用能效核，高通的解释是，用乱序性能内核取代能效核，能够提供更好的性能和功耗组合，并配合超级内核实现更高的处理速度。

高通技术公司产品管理总监Manju Varma介绍骁龙8至尊版CPU设计

　　内存同样是提升CPU处理速度的关键。高通为每个CPU丛集配置了24MB专用缓存。通常，增加一级缓存或二级缓存都会导致时延的增加。因此，高通在提升一级缓存容量的同时，采用缓存一致性协议，将时延保持在1纳秒内。同时，为了解决二级缓存扩容造成的时延，高通设计了与CPU内核同步的二级缓存，以降低时延和功耗。考虑到生成式AI高度依赖内存，骁龙8至尊版配备了目前最高速的LPDDR5内存。这样的微架构和内存系统升级，能够为用户带来更快的应用启动速度、更流畅的多任务处理以及生成式AI功能。

　　而骁龙座舱和RIDE至尊版使用的Oryon CPU，围绕车用平台进行了三方面的提升。一是处理能力较前一代车规平台的CPU提升了三倍。二是强化了安全功能。三是面向汽车应用设计的适应性架构，能够支持先进舱驾功能和自动驾驶功能，也能够在同一块SoC上同时支持舱、驾功能，这无疑契合了当前舱驾一体的融合趋势。

　　“在汽车平台，Oryon CPU的定制化聚焦安全系数，以确保汽车在智能驾驶等场景下的安全性，让GPU、NPU、DSP等IP模块在安全的基础上运行。”高通技术公司汽车、行业解决方案和云事业群总经理Nakul Duggal向记者表示。

　　当然，相比芯片平台本身，手机、PC和汽车厂商能够结合最新芯片能力设计出哪些功能，或许是消费者更为关注的点，而这需要高通与OEM及终端、车企继续加深合作，并通过高通AI Hub等模型库，为广大应用开发者提供更加趁手的工具和平台。

　　(文章转载自中国电子报作者张心怡)

相关文章