解析按摩店与牙膏厂之间相爱、相伤之局

选择字号：超大标准发布时间：2017年08月08日 | 作者：admin | 2个评论 | 7385人浏览

以下文章大部源自网络文章摘选及部分个人对技术的理解，仅作为个人观点并作学习留档，未持任何主观立场亦不做任何商业用途。因个人水平问题，行文不当之处，敬请谅解。

话说近六年处理器市场上按摩店和牙膏厂的撕逼过程，农药党可以做以下形容：

牙膏厂：我推塔了！

按摩店：我打野！

牙膏厂：我进攻高地了！)

按摩店：我打野！

牙膏厂：我要推水晶了！

按摩店：我打野！

牙膏厂：你丫搞毛啊？又想害我垄断被开罚单啊！！！

按摩店：稳住！猥琐发育，我能赢！

牙膏厂：……

牙膏厂推塔阶段

在完成对ATI的GPU技术资源整合后，按摩店对未来市场的判断形成了自已的技术信仰：计算机通用计算会继续向多线程发展；浮点计算会越发倾向依靠GPU驱动；巨幅提升时钟速度是可行的。K10（AthlonⅡ X4 640/PhenomⅡX4 965）的荣光结束（或者说主动结束）后，按摩店于2011年推出了其第一代APU产品以及代号为推土机（Bulldozer）的处理器架构。

先来说说APU(Accelerated Processing Unit)。按摩店一直想把CPU和GPU完美的的融合起来。而APU正是这样思想下的的产物，它第一次将中央处理器和独显核心做在一个晶片上。这样的想法非常的好，大家都知道现在的超级计算机基本上都是同时安装CPU与显卡的，就是因为CPU和GPU因为结构上的原因，在不同的计算上各有优势。如果CPU和GPU完全融合起来，在最底层的架构上融合，就能极大的提高效率。也就是CPU与GPU的计算能力理论上可以根据要求和最佳的搭配方式自由的分配给CPU和GPU。比如运行游戏时CPU/GPU一个满载一个空载的情况将得到极大的改变。然而按摩店似乎没有和他想法相配的实力、运气、和地位。从2011年发布第一代APU，一直到最近的Kaveri一代（A8-765K），才刚刚实现统一寻址，完全底层融合还很远。不过内存统一寻址已经是很大的突破了，有他就可以实现GPU和CPU对内存的共享，以及CPU和GPU之间数据的快速交换，因为CPU和GPU能够直接读取对方存放在内存中的数据。

在聊推土机之前，我们先统一一个基本概念：IPC ( Instruction per Clock 既CPU每一时钟周期内所执行的指令多少)。IPC代表了一款处理器的设计架构水平高低，一旦该处理器设计完成之后，IPC值就不会再改变了。在这里，IPC值的高低起到了决定性的作用，而频率似乎不再高于一切。我们常说的CPU主频，只有在同一架构下比较才有意义，CPU性能可以近似等于IPC乘以频率。这也可以理解，为什么有些服务器处理器频率看着很低，但性能碾压绝大多数桌面处理器。按摩店在2011年第一次发布的推土机架构CPU处理器（第一代FX处理器），具有大量的同时多线程，较窄的管线以及较少的浮点资源。这里的原理在于时钟速度和GPU独立显卡会弥补管线较窄和浮点运算力较低的缺陷。通俗讲，就是我知道我IPC不行（拼架构拼不过牙膏厂），但是如果我时钟速度快，同时我多开几个线程同时跑，我一样跑过你，至于浮点运算那就拉快牛逼的显卡呗！那么，按摩店就得祈祷所有的线程都能不停地跑工作才行。

然而在当时单线程的运行依旧是重头戏，第一代推土机产品搭载四个核心模块八个线程的高级桌面处理器有大量的整数线程富余，大多数用户的工作量仍然没法被平均分配到八个线程上去。另一方面，浮点单元的共享意味着充满浮点算术的应用程序就没有足够的运行资源（不要一提到浮点运算就想到GPU，CPU也可以做浮点运算）。虽然基于GPU的计算在一些特定工作中非常重要----比如科学超级计算----但主流应用程序还是更依赖CPU来带着显卡做浮点运算。再多说句浮点运算，简单说就是小数点后数字的运算能力，在进行大量计算时，如果不考虑小数点后数字，误差会不断叠加影响精度，比如在高端游戏时，贴图刷新慢，出现大量块状图案等。所以，好CPU配好显卡的图形显示就越细腻且帧数快的道理就在这。还是回到推土机，若是时钟速度能达标的话，这些问题勉强还能接受，既IPC低的处理器如果能以高的时钟速度运行那也还凑合。但遗憾的是，推土机连它最开始的设计目标也没能达到。结果，第一代推土机处理器在很多工作上都比前一代的K10运行的更缓慢，更别提与同时期的牙膏厂产品竞争。对于牙膏厂而言，曾经面临的K10巨大竞争压力已然烟消云散。而对于按摩店而言，开弓已无回头箭，总不能再去挖K10的坟吧？

牙膏厂进攻高地阶段

按摩店的确做出了快速响应。第二代打桩机（Piledriver）架构问世，提升了时钟速度，再结合一些内部改良，打桩机比推土机的IPC高出近40%（实在是推土机惨不忍睹）。然而这也带来了更高的能耗。怎么办？继续改！第三代压路机（Streamroller）出场，在IPC上又较打桩机高出9%。接着改！第四代挖掘机（Excavator）又在压路机的IPC基础上提高了15%。然并卵，该丢的市场份额还在一直丢，该被推上高地还是被毫无悬念推上高地。

水晶就在前方

按摩店依然在野区发育……难道什么都不做，准备GG坑死牙膏厂吗？不！按摩店开始偷塔了。前面有提到第一代APU的底层融合度不高，并不能实现APU的设计理念。但随着推土机的不断进化，最新一代的Kaveri APU采用了全新的异构系统架构（Heterogeneous System Architecture，简称HSA），该架构的特点之一是能够使APU中的CPU单元和GPU单元实现内存统一寻址，该技术被称为异构内存统一访问（heterogeneous Uniform Memory Access，简称hUMA）。在HSA架构诞生之前，CPU单元和GPU单元分别控制着各自的内存区域，当CPU和GPU交互数据时，需要将自身内存区域中现有的数据复制一份到对方的内存区域中，这样在无形中降低了平台的工作效率。全新的APU平台CPU部分采用压路机架构，在性能以及核心数量上都比上一代产品有了显著的提升。其中规格最高的A10-7860K拥有多达4核的CPU以及8核的GPU，而中端型号A8-765K也拥有4核CPU以及6核GPU。值得一提的是，新架构下的主频明显都比上两代产品都有不同程度的下降，但由于新架构以及全新的工艺带来的IPC的提升，反而带来了更强劲的性能和更低的功耗。总之，整合了压路机架构的Kaveri APU终于成为一个能正面牙膏厂的对手。

然而，牙膏厂的塔并不好偷，Kaveri再进步依然只是按摩店出品。按摩店的市场份额只有两成，它对行业下游基本无法控制。而且软件开发也渣得可以。营销投入比起牙膏厂也基本可以忽略。APU想法好，但显然它的这个是需要软件对其深度匹配的。虽然有支持它的软件可以显示出惊人的效率。不过谁在乎呢？牙膏厂直接靠绝对的性能碾压就是了。你以为牙膏厂就想不到了？并不是，因为牙膏厂手里并没有很强的GPU技术，所以他走了另一条路罢了。

牙膏厂带核芯显卡的处理器始于sandy bridge(SNB)平台。但二者区别很大，APU使用了物理整合和统一供电，也就是做在一块芯片上，统一双向电源管理，运行时采用异构计算。而牙膏厂仅仅是封装到一个处理器之中，不仅芯片分为两块，最开始连制程也不一样，如SNB的图形为45NM制程，核心为32NM，直到Ivy bridge（IVB）才做到统一22NM，其供电和接口的整合度也不如APU。从应用的角度上考虑，可以说两者之间架构上存在差异，不过作用是一样的，都是集成了显示核心。但从更严格的定义上来看，APU与核芯显卡并不能混为一谈。

按摩店正是因为处理器架构的实力不够，才只能剑走偏锋。曾经它的3DNow!指令集是这样，集成内存控制器是这样，双核是这样，板载显存是这样，APU也是这样，不过是目前不够成功罢了。未来还未来，一切都还说不定呢。不论以后怎样，按摩店都应该得到一份尊重。它让DIY攒机这个圈子更加的精彩，用户多了一份选择，或许这样也就够了。

转载请注明 G4560.CN图拉丁之家

标签：AMD 牙膏厂 CPU

解析按摩店与牙膏厂之间相爱、相伤之局

猜你喜欢

已有2位网友发表了看法：

取消回复发表评论