给Apple M1 Pro 和 M1 Max泼点冷水 :大力出奇迹,喜忧参半

专栏更新中~

昨晚Apple M1 Pro和M1 Max正式发布了,和预想一样的8个大核心+2个小核心+16/32 GPU的设计,没想到的是采用了256bit LPDDR5以及512bit LPDDR5的恐怖位宽,没期待到的则是多Tile设计的M1。

如果简短评价M1 Pro和M1 Max的话,我想说:M1 Pro和M1 Max性能真的很强,但是也一点不让人惊喜。M1 Pro 和 Max的若干优势都是大力出奇迹堆出来的。 以下图片部分来自Anandtech。

大力气出奇迹的晶体管堆砌

M1 Max的晶体管是570亿,M1 Pro的晶体管是337亿。但是你要知道Nvidia的RTX 3090只有280亿晶体管,和Apple的16个GPU+256bit LPDDR5+一些编码器比并没有高太多(M1 Max-M1 Pro=233亿晶体管)。 而CPU部分的话,Intel没有数据,按照实际密度40亿多的话,Tiger Lake U以及Tiger Lake H什么距离100亿应该都还有差距。 AMD的话8核心CCD 大约42亿晶体管。

所以单从晶体管规模上来说,M1 Pro和M1 Max是真的夸张,这放在PC那边是很难想象的。还好苹果这边是走手机SoC高密度方向,而且还是最新的5nm工艺。

如果细看M1 Max的Die Shot,也可以进一步验证这个问题。 这回M1 Max的GPU面积相当不小,并且为了能耗比而用的512bit LPDDR5内存控制器面积相当之大,粗看下来是比CPU的面积还要大。

如果说看到M1 Max我想到什么,大概就是AMD给游戏主机的APU了吧。都是非常类似的设计,GPU占据超大的面积,CPU甚至没有现存控制器占得面积大。另外说一句,XBOX Series X的APU是153亿晶体管,360的面积以及N7的工艺,大概是M1 Max 1/3多一些的晶体管,2/3的面积,输出12.15T的GPU 浮点性能,对比之下真是节省成本好手(当然也就费电和少功能了)。

性能表现:业界标杆

随后说一说性能。 如果从产品的角度来看,M1 Pro和M1 Max的性能和能耗比毫无疑问是炸裂全场的。CPU部分的话,多核性能大概是同样功耗的11800H的1.7倍性能,虽然选了Intel不擅长的30W区间,但Apple还是给了Intel面子了。不然可以学着某家。

而GPU部分呢,M1 Max对比RTX 3080的话,大概可以直接总结,在Apple自己的跑分侠(我对Apple的GPU跑分不是很信服),M1 Max略高的性能下节省40%的功耗,亦或者是在类似的性能下节省100W的功耗,其实也是大约40%不到。


其实上下两个图选择的都是Nvidia的RTX 3080 GPU,上面是雷蛇的8GB 版本低功耗版本下面是微星的16GB版本。在苹果的跑分体系下,第一张图里M1 Max其实性能要高于3080 105W的,感觉是为了给后面做铺垫。因为第二张图里,M1 Max的性能要低于3080。 实际上3080的同性能大约在140W,实际只多了80W,一张图给对手留了点面子,一张图给自己留了点优势。

还有一个问题,我是不知道苹果怎么计算功耗的。独显是有GDDR6显存功耗的,必须要算到自己身上。而M1 Max是共享内存,那么这个功耗包含了吗? 虽然不会很大,但依旧是个问题。你看8GB和16GB的3080在曲线上差别就不小。

友商看法:大概 Intel AMD Nvidia都放心了

从目前的角度来看,M1 Pro和Max性能和能耗比都毫无疑问是最强的。但是Intel AMD Nvidia老三家其实压力没有变的更大。因为M1 Pro和Max是暴力堆砌晶体管,用钞能力换来的东西,大家走的就不是一条路,再加Apple的东西也不可能卖给别家,相安无事。

性能上,M1 Pro和M1 Max并没有如同A系列领先安卓那样领先X86. 从目前泄露的GB5跑分来看,M1 Max的单核心原地踏步,多核心对比M1提升55%,距离苹果说的77%有一点差距,可能是测试机或者跑分软件选择问题。

这个水平的话,大概是能比11800H (单核1550附近,多核8000-9000附近,依据散热会有差距)要高,AMD的话也是类似。 这里11800H不是30W的,M1 Max领先大概55%, 如果是降低功耗,那么领先11800H 70%不是问题。

但是这并没有比起X86太强,Intel 马上要出Alder Lake P了,通过大小核组合一共14个核心,到时候不会输得太惨(更何况还有H55)。

目前只有12900K的测试跑分,到了移动端估计最后Alder Lake P单核会和M1 Pro类似,多核的话我不太敢估计。非要算的话,小核心除以2算,那么12900K一共12个P核,Alder Lake P H45一共10个P核,满血跑大概14400多分。 但是不知道这个12900K什么功耗。

如果12900K和11900K比较的话,功耗可能类似,多核提升了70%。 而回想苹果给的M1 Pro 30W下领先11800H 70% ,那么Alder Lake P感觉也会和M1 Pro多核相差不远的样子(虽然P少了核心,但是Gracemont在这个频率区间能耗比更高,姑且也算70%)。10ESF和架构能耗比不高,但是耐不住核心多啊。所以,我感觉X86阵营的CPU不慌。 X86目前性能还是更高工艺红利少,M1系列能耗比更高工艺红利高,其实进水不犯河水。

而GPU的话,直接吐槽就好了,真的拉胯。刨除主场滤镜算60W的M1 Max和 3080的100W性能一样(可能还高估了),能耗比领先堪忧。 不太清楚苹果为什么宁可堆那么多GPU,也只给了CPU8+2的规模,你看CPU面积那么小,大约只有8个GPU核心的规模。

3080用的8LPP工艺对比N5落后两代。3080是GA104芯片,晶体管174亿,都没有M1 Max和M1 Pro的233亿差值要大。 3080 的频率Boost 1.6G,苹果1.28G。3080用GDDR6显存,M1 Max用LPDDR5. 苹果这个能耗比真就是堆规模,低频拉上来的,实际一算GPU的能力,真的差好多。 这东西给了别家,别家造出来去卖怕不是要破产,成本真的太高。

总结来看就是: CPU架构能耗比、IPC都很强,但是堆料不够。GPU的话架构能耗比、面积效率都不行,但是堆料拉回来了,所以大家都不慌。

另外从GPU架构来说,假设同样工艺同样面积同样功耗的PPA比较,我直觉上Apple应该比NAI都要差,大概是Nvidia Ampere >> AMD RNDA2 =/> Intel Xe HPG > Apple。前三者在移动版3070的性能附近都有产品,依据功耗工艺面积进行了排序,Apple的话明显就效率低很多了。

成本:

之前我还是比较担心Apple的芯片成本问题的,不过现在发现我也多虑了。Apple 去除了制造商加价,并且再在自己选配SKU上的加价幅度,最后按照整机利润去计算,应该还是不差。 之后还是再看看有没有M1 胶水板了。

就先更新到这里吧,吃饭睡觉干活去了,下一篇继续~

发布于 2021-10-19 12:44