#通知# 微博评论请保持平和理性
在评论版里为他人科普解惑的人,我对你表示感谢。但我也希望你能注意说话的语气。微博本来就是个普通人占绝大多数的网络平台,普通人没有精英的眼界和知识,他的看法与观点难免有很多局限,但他对时事的热情,对知识的渴望,不应被否认。人都是从小白过来的,我希望大神能对他们宽容些,不要摆出高高在上教训人的态度。
当然,如果你只是想教育我,那无所谓。只要我觉得你说的有道理,我会让你一直说下去。我收获了见识,你发泄了戾气,公平交易。在抗压背锅吧那几年,什么垃圾话我都见识过,我是无所谓的 --- 但如果只是喷,我会拉黑你。我可不能让你白喷,是不 [笑而不语]
但我不希望你在我的微博评论里对其他朋友这样。所以,我特此通知。以后再犯,别怪我把你拖进小黑屋。
在评论版里为他人科普解惑的人,我对你表示感谢。但我也希望你能注意说话的语气。微博本来就是个普通人占绝大多数的网络平台,普通人没有精英的眼界和知识,他的看法与观点难免有很多局限,但他对时事的热情,对知识的渴望,不应被否认。人都是从小白过来的,我希望大神能对他们宽容些,不要摆出高高在上教训人的态度。
当然,如果你只是想教育我,那无所谓。只要我觉得你说的有道理,我会让你一直说下去。我收获了见识,你发泄了戾气,公平交易。在抗压背锅吧那几年,什么垃圾话我都见识过,我是无所谓的 --- 但如果只是喷,我会拉黑你。我可不能让你白喷,是不 [笑而不语]
但我不希望你在我的微博评论里对其他朋友这样。所以,我特此通知。以后再犯,别怪我把你拖进小黑屋。
距离2019结束,进入倒计时。是不是应该对自己这一年说点什么?读了几本书,看了什么电影?有遇到什么事情?做了什么?有什么感想和收获?
回看微博,这一年大概写了500多篇。也算是收获吧!杂七麻八的,想哪说哪,看到什么写什么,不为别人,只为自己日后有迹可循。也算作是能公开的日记吧!感谢微博平台,让我把自己的想法分享給喜欢看的人。
回看微博,这一年大概写了500多篇。也算是收获吧!杂七麻八的,想哪说哪,看到什么写什么,不为别人,只为自己日后有迹可循。也算作是能公开的日记吧!感谢微博平台,让我把自己的想法分享給喜欢看的人。
Andrei日常把极不精确的QRD数据放了出来,而且对功耗测试的结果表示这次865的比855/845的参考价值更低。
(原因当然还是QRD极其反常的空载功耗——在当前流行的SoC能效的测量和分析中,关于空载功耗究竟意味着什么、它在多大程度上和待机调度和IC基础漏电有关似乎仍然是个不清楚的点,已经退烧的本扁希望各位大佬有兴趣的话把这个点试着解释一下[doge])
反正,真机还早,凑合看看吧。
【CPU部分】
这次865的大中小核频率与855完全一致,这也免去我们算IPC的麻烦了,直接对比,图1显示,大核的整数和浮点性能(峰值同IPC)分别提升了25%和29%;能效提升为6%和14%。
这组数据看下来应该能总结出8个字:稳定提升,表现良好。
横向对比的话——相比A11大核,峰值性能几乎追平(无论借用Geekbench的比例还是直接混合19子项几何平均都与A11还存在微小差距),能效则拥有24%的巨大优势[doge];而相比k994,int/fp峰值性能领先20%/23%,能效落后10%和3%,也可以算得上有大半代的领先了。
——如果只看这些,结果似乎还比较美妙。
但——我们暂且认为功耗测试是可以参考的——峰值功耗int/fp分别提升了18%/16%,来到了2.4W/3W。。。回顾845到855的进步,其中不容忽视的一环就是大核采用1+3后很好地控制了多核负载的总功耗,把功耗从7W/10W的移动设备极限拉了回来,而865因为频率没有任何改变,我们可以预见的是……功耗可能又要加回845的水平了。
不过大致也OK——这要感谢竞争对手海思用了A76再战一年——像当年845一样,虽然功耗高但领先了一个身位的性能。
然后我们再看回性能提升,整数25%浮点29%。让我们回忆ARM的PPT(图2),会发现ARM承诺的IPC提升是在同缓存同内存延迟条件下的23%和35%。而855到865,内存和缓存都有了明显进步,所以int提升25%勉强可以理解,至于fp……我们似乎只能高喊理解万岁了[doge](如果和内存延迟稍微占优的k994对比的话就更惨了)。这点也可以看到图3中Andrei当时预估的2.6GHz下的A77表现,相比之下865能效占优基本上得益于工艺的小幅进步。
另外还有个有趣的巧合,我们看到A11到A12的SPEC各项数值,无论是性能、功耗还是能效,也无论是整数还是浮点,和855到865的进步都十分相似。所以就用户体验来说,我们似乎可以借着A11到A12的经验估计一下865的进步幅度(信号体验除外)。
【GPU部分】
之前就说过,说到数码圈最毒的奶,绝对绕不开我当年吹Adreno的话[允悲]
其实也是赶得巧,我开始仔细研究SoC那会儿正赶上高通上下XX年最优秀的835,以及Adreno的巅峰540。当时他们以7mm^2出头的面积(同时注意到10LPE的出片密度实际上只有43M/mm^2左右,远低于S/T两家10nm标称的50~55)和3.8W的功耗做出了当时移动端旗舰级的GPU性能,在性能位居第一档的同时Manhattan3.1的PPA值达到至今没有其他家超越的1.42FPS/W/mm^2。。那时候谁能料到6系能这么完蛋[跪了]
其实按今天这组数据看也没有那么差,至少安卓端仍然是旗舰水平(虽然k995的能效可能高一些但你拿76FPS的能效打89FPS也不讲道理),而且26%的性能提升也比前两代大得多(和改动了架构有关,之前有提到)。但俗话说逆水行舟不进则退,且不说那些画饼充饥的农企合作款,一边Mali逐渐步入正轨,另一边水果收归自研以后直接甩开一个次元……用Andrei的话说,人家热成狗的A13都全方位比你峰值强,你哪来的勇气跟人提“持续输出能力”?[允悲]
真的,如果明年他通再搞出来个a660而不是a730,请Adreno团队解散吧……
【AI部分】
刚才说Adreno 6系完蛋,其实630也没完蛋,虽然功耗高了一点PPA下降了一点,性能至少是大跃进的,当时还是跟住了苹果初代自研的A11。
Adreno真正的完蛋,要从高通正经开始推异构AI、把GPU当运算器说起。
我已经数不清楚高通到底加了几次规模了,但总之是从10nm能跑710MHz搞成了7+的587MHz……当年我们在Mali身上所厌恶的一切,可以说都在Adreno身上发生了。
图5-图7是FP16的测试,拿GPU生吃FP16 ML跟人家NPU打(偶尔还能打赢),这是怎样可歌可骂的倔强。。。
fp32和int8的结果我就不贴了,硕大无比的Adreno和丧心病狂的六边形DSP摆着,屠个榜也没什么好奇怪的。同样由于架构的升级,CPU的AI性能提升也在情理之中。
(不过目前“通用”的AI测试在横跨各家平台的“通用性”上都还存在一定的问题,这些测试结果也只能作为参考,并不像CPU/GPU的测试一样有说服力。)
我记得高通最早把“异构AI”当个概念宣传的时候,我大概地表达过这么个意思——对一个解决方案来说,思路上的自然并不意味着技术上的优秀。
尽管我真的很喜欢他们编的“让SoC像人脑一样各个分区都协同参与进行人工智能运算,才是真的人工智能”这个故事。
无论这个方案的真实目的是复用单元节省成本,还是规避专利,或是真的如宣传那样出于彻底的“仿生学”思路,至少目前看来,牺牲CPU的访存延迟和GPU的能效来换取多模块复用的AI算力不是个优秀的技术方案。高通是不是要一条道走到黑,谁知道呢?[允悲]
另外话说回来,VR/AR/XR、无边框全面屏、以及可以预见的DxO跑分,消费电子这块儿的卖点已经凉了一个又一个了,而AI这个以“co-ISP”和语音助手为主打的畸形卖点还能存活多久,谁知道呢?[doge]
行吧,又是一条长微博写了俩小时。。。
总结一下就是:骁龙865中规中矩。
(另外听说865的ISP提升挺大的,不过且不说厂商能利用几成功力,失去了某厂在营销上的积极推动,拍照这个卖点在手机上还能持续多久我都有点怀疑……)
orz,技术瓶颈造就的牙膏时代,索然无味[doge]洗洗睡了[哈欠]
(原因当然还是QRD极其反常的空载功耗——在当前流行的SoC能效的测量和分析中,关于空载功耗究竟意味着什么、它在多大程度上和待机调度和IC基础漏电有关似乎仍然是个不清楚的点,已经退烧的本扁希望各位大佬有兴趣的话把这个点试着解释一下[doge])
反正,真机还早,凑合看看吧。
【CPU部分】
这次865的大中小核频率与855完全一致,这也免去我们算IPC的麻烦了,直接对比,图1显示,大核的整数和浮点性能(峰值同IPC)分别提升了25%和29%;能效提升为6%和14%。
这组数据看下来应该能总结出8个字:稳定提升,表现良好。
横向对比的话——相比A11大核,峰值性能几乎追平(无论借用Geekbench的比例还是直接混合19子项几何平均都与A11还存在微小差距),能效则拥有24%的巨大优势[doge];而相比k994,int/fp峰值性能领先20%/23%,能效落后10%和3%,也可以算得上有大半代的领先了。
——如果只看这些,结果似乎还比较美妙。
但——我们暂且认为功耗测试是可以参考的——峰值功耗int/fp分别提升了18%/16%,来到了2.4W/3W。。。回顾845到855的进步,其中不容忽视的一环就是大核采用1+3后很好地控制了多核负载的总功耗,把功耗从7W/10W的移动设备极限拉了回来,而865因为频率没有任何改变,我们可以预见的是……功耗可能又要加回845的水平了。
不过大致也OK——这要感谢竞争对手海思用了A76再战一年——像当年845一样,虽然功耗高但领先了一个身位的性能。
然后我们再看回性能提升,整数25%浮点29%。让我们回忆ARM的PPT(图2),会发现ARM承诺的IPC提升是在同缓存同内存延迟条件下的23%和35%。而855到865,内存和缓存都有了明显进步,所以int提升25%勉强可以理解,至于fp……我们似乎只能高喊理解万岁了[doge](如果和内存延迟稍微占优的k994对比的话就更惨了)。这点也可以看到图3中Andrei当时预估的2.6GHz下的A77表现,相比之下865能效占优基本上得益于工艺的小幅进步。
另外还有个有趣的巧合,我们看到A11到A12的SPEC各项数值,无论是性能、功耗还是能效,也无论是整数还是浮点,和855到865的进步都十分相似。所以就用户体验来说,我们似乎可以借着A11到A12的经验估计一下865的进步幅度(信号体验除外)。
【GPU部分】
之前就说过,说到数码圈最毒的奶,绝对绕不开我当年吹Adreno的话[允悲]
其实也是赶得巧,我开始仔细研究SoC那会儿正赶上高通上下XX年最优秀的835,以及Adreno的巅峰540。当时他们以7mm^2出头的面积(同时注意到10LPE的出片密度实际上只有43M/mm^2左右,远低于S/T两家10nm标称的50~55)和3.8W的功耗做出了当时移动端旗舰级的GPU性能,在性能位居第一档的同时Manhattan3.1的PPA值达到至今没有其他家超越的1.42FPS/W/mm^2。。那时候谁能料到6系能这么完蛋[跪了]
其实按今天这组数据看也没有那么差,至少安卓端仍然是旗舰水平(虽然k995的能效可能高一些但你拿76FPS的能效打89FPS也不讲道理),而且26%的性能提升也比前两代大得多(和改动了架构有关,之前有提到)。但俗话说逆水行舟不进则退,且不说那些画饼充饥的农企合作款,一边Mali逐渐步入正轨,另一边水果收归自研以后直接甩开一个次元……用Andrei的话说,人家热成狗的A13都全方位比你峰值强,你哪来的勇气跟人提“持续输出能力”?[允悲]
真的,如果明年他通再搞出来个a660而不是a730,请Adreno团队解散吧……
【AI部分】
刚才说Adreno 6系完蛋,其实630也没完蛋,虽然功耗高了一点PPA下降了一点,性能至少是大跃进的,当时还是跟住了苹果初代自研的A11。
Adreno真正的完蛋,要从高通正经开始推异构AI、把GPU当运算器说起。
我已经数不清楚高通到底加了几次规模了,但总之是从10nm能跑710MHz搞成了7+的587MHz……当年我们在Mali身上所厌恶的一切,可以说都在Adreno身上发生了。
图5-图7是FP16的测试,拿GPU生吃FP16 ML跟人家NPU打(偶尔还能打赢),这是怎样可歌可骂的倔强。。。
fp32和int8的结果我就不贴了,硕大无比的Adreno和丧心病狂的六边形DSP摆着,屠个榜也没什么好奇怪的。同样由于架构的升级,CPU的AI性能提升也在情理之中。
(不过目前“通用”的AI测试在横跨各家平台的“通用性”上都还存在一定的问题,这些测试结果也只能作为参考,并不像CPU/GPU的测试一样有说服力。)
我记得高通最早把“异构AI”当个概念宣传的时候,我大概地表达过这么个意思——对一个解决方案来说,思路上的自然并不意味着技术上的优秀。
尽管我真的很喜欢他们编的“让SoC像人脑一样各个分区都协同参与进行人工智能运算,才是真的人工智能”这个故事。
无论这个方案的真实目的是复用单元节省成本,还是规避专利,或是真的如宣传那样出于彻底的“仿生学”思路,至少目前看来,牺牲CPU的访存延迟和GPU的能效来换取多模块复用的AI算力不是个优秀的技术方案。高通是不是要一条道走到黑,谁知道呢?[允悲]
另外话说回来,VR/AR/XR、无边框全面屏、以及可以预见的DxO跑分,消费电子这块儿的卖点已经凉了一个又一个了,而AI这个以“co-ISP”和语音助手为主打的畸形卖点还能存活多久,谁知道呢?[doge]
行吧,又是一条长微博写了俩小时。。。
总结一下就是:骁龙865中规中矩。
(另外听说865的ISP提升挺大的,不过且不说厂商能利用几成功力,失去了某厂在营销上的积极推动,拍照这个卖点在手机上还能持续多久我都有点怀疑……)
orz,技术瓶颈造就的牙膏时代,索然无味[doge]洗洗睡了[哈欠]
✋热门推荐