首页 | 互联网 | IT动态 | IT培训 | Cisco | Windows | Linux | Java | .Net | Oracle | 软件测试 | C/C++ | 嵌入式开发 | 存储世界 | 服务器
网络设备 | IDC | 安全 | 求职招聘 | 数字网校 | 网页设计 | 平面设计 | 技术专题 | 电子书下载 | 教学视频 | 源码下载 | 搜索 | 博客 | 论坛
热点关键词:
IT业巨头过冬策略拆解(阿里、腾讯、华360搅局杀毒市场 免费成主流模式?
您现在的位置:服务器>>评测
AMD新一代 Barcelona微架构全面解析
时间:2007-3-23 来源:ChinaItLab 作者:佚名 保存本文 进入论坛

边带堆栈优化器

    最初在Pentium M中,引进了一个叫“dedicated stack manager”(专注堆栈管理器)的特性,根据字面上解释,它是用于控制x86堆栈操作的,比如push, pop, call, return,它的意图就是为了把堆栈操作从所有运行代码中分离出来,以让处理器能够更加有效的处理其它任务。

    在Barcelona中,AMD也引进了类似的叫Sideband Stack Optimizer(边带堆栈优化器)的技术,以让堆栈指令不再需要通过3-way解码,并通过整数执行单元的堆栈操作了,这个小小的优化设计可以带来整体性能的提升。

    更快的加载

    在以前的《新处理器之王!Core 2 Duo全面大评测》文章中,我们对Core 2的智能内存访问技术进行了解析,在对比系统内存存取表现,AMD K8却因内建内存控制器而比Intel Core微架构优胜,但由于Core微架构采用短Pipeline Stage架构及频率相对Netburst微架构低,加上高容量的L2 Cache并内建Shared Router Bus减少FSB使用,因此系统内存控取的表现差距已不像与上代Netburst微架构产品那么严重。而为了进一步拉近与K8架构上的内存性能距离,Intel还在Core微架构中加入全新的内存读取技术,称为Memory Disambiguation。


    Memory Disambiguation是一个十分聪明的设计,通过Out of Order过程把内存读取次序作出分析。在传统的微架构里,内存读取是按流程顺序而被执行,如图上例子,Load 4是独立的Data X读取执行,也必需要等待其他Store 1、Load 2及Store 3工作完毕,即使Load 4的Data X和前面的资料存取动作并无关系,因为处理器并不会得到前面的动作是否会改变Data X的数值,所以不能重新排序并分析Load 4能否提前执行。

    在Intel Core微架构中通过智能的分析机制,能预知Load 4的Data X是完全独立,并可让它提前执行。正因如此Memory Disambigutaion能减少处理器的等候时间减少闲置,同时减低内存读取的延迟值,而且它可以侦出冲突并重新读取正确的资料及重新执行指令,保证运作结果不会出现严重,但在正常情况下Memory Disambirutation出错的机会率很低。 

    可以看出Intel Core微架构,一个主要特性是加载指令可以绕过以前加载和存储的指令,平均来说在程序中所有指令的1/3是在加载的时候就完成了,所以如果能够提升加载性能,你就可以全面提升程序的运行性能,在Core微架构中,加载可以被重新排序,以确保需要这些数据的指令在存储访问非常繁忙的时候被执行。

    AMD K8架构没有上面同等的乱序执行的协调能力。在没有集成内存控制器的情况下,Intel能够很轻松的执行更多的内存操作,Barcelona采用了类似的方法修正了这个问题,它也能够重新排序这些加载。但是Barcelona需要等待在决定是否这个加载可以被优先于存储执行之前,才把存储地址计算出来,通过这种方式,Barcelona不会有机会预测错误。AMD的设计者考虑到采用类似Intel的预测器的做法,但是好像对它的架构并没有太大益处,AMD能每个周期产生三个存储地址,因为它有3个AGUs (Address Generation Units),而相比Intel只有1个,所以Barcelona在这方面有优势。

    从上面看,Barcelona的乱序执行能力加强后,应该会在这方面性能强于Core 2。

更快的内存控制器

    我们知道AMD在K8上的成功,很大程度上是大胆的采用了集成内存控制器的做法,不过在Barcelona中它的性能又有了加强。

    在Intel Xeon服务器的FB-DIMM内存架构中,可以同时执行读和写命令到AMB,而在标准的DDR2内存中,你只能同时进行一个操作,而且读和写的切换会有非常大的损失。如果是一连串的随机混合执行的话,将会带来非常严重的资源浪费,而如果是先全部读然后再转换到写的话,就可以避免性能的损失。K8内存控制器就采用读取优先于写的策略来提高运行效率,但是Barcelona则更加智能化。

    但是读取的数据会被先存放在buffer中,而不采用先直接执行写,但当它的容量达到了极限就会溢出,为了避免这种情况,在此之前才对读写之间进行切换,同时可以带来带宽和延迟方面效率的提高。

    K8核心配备的是128-bits宽度的单内存控制器,但是在Barcelona中,AMD把它分割成两个64-bit,每个控制器可以独立的进行操作,因此它可以带来效率上的不小提升,尤其是在四核执行的环境下,每个核心可以独立占有内存访问资源。

    Barcelonas中集成的北桥部分(注意不是主板北桥)也被设计成更高的带宽,更深的buffers将允许更高的带宽利用率,同时北桥自身已经可以使用未来的内存技术,比如DDR3。

    新的预取器

    预取在很多领域的更多部件中都被广泛采用,当NVIDIA发布nForce2的时候,它就强调了智能预取的能力,来充分利用好128-bit内存总线的性能,而更近的Intel的Core 2处理器中被重点强调的每核心三预取器(prefetchers)可以明显减少内存的延迟。

    而K8核心每个核心拥有两个预取器,一个是指令,另一个是数据,Barcelona核心仍然保留同样的数目,但是对他们进行了加强,最大的改变是数据预取器,现在可以把数据传到L1数据Cache中,而不是K8核心的L2 Cache。AMD认识到K8预取器的先进性,所以他们只做了上面的处理,同时AMD也提升了L1指令缓存的灵活性,来配合这两个高效请求的工作。

    综合来看,似乎Intel的prefetchers在规格方面更有优势,Core 2处理器的每个核心带有两个数据和一个指令prefetchers,加上额外的两个L2 cache prefetchers,可以说是更为可观,但是不一样的设计,最终的性能胜负还不得而知。

    Barcelona核心内部拥有自己的数据和指令prefetchers,但是最主要的改进是DRAM prefetcher(内存prefetcher),它位于内存控制器里面,在此前AMD从来没有使用过这样的逻辑设计,这个新的DRAM prefetcher掌管了所有的内存请求和动作,由于DRAM prefetcher要协调四个核心,它就掌控了整个芯片的性能的发挥,同时它不占用L2、L3 caches,它拥有自己独立的buffer来解决数据溢出问题,这个buffer拥有20 - 30个cache线路,其实这个buffer已经在前面提到过。

上一页  [1] [2] [3] [4] [5] [6] 下一页

责任编辑:Chuan

相关文章
IBM与AMD再度联手 3款高能效服务器上阵
Sun推出基于AMD四核皓龙处理器服务器新品
AMD巴塞罗那近期市场分析
AMD将一分为二 制造业务与设计分家
手机大小的Linux服务器采用AMD 400MHz平台
AMD计划推出原生六核处理器Istanbul
HP入门级AMD单路CPU服务器ML115仅4300
AMD否认业绩未达预期悄然裁员5%传言
决战四核 英特尔和AMD谁将胜出?
戴尔力挺AMD 连推四款四核服务器
热点推荐
 65纳米宝刀不老 戴尔塔式PE1900现11800
 联想首款单路机架式服务器万全R150问世
 “东方系列”降价!IBM四核X3610仅9100
 嵌入式高效虚拟化 戴尔R805服务器首测
 管理首选!IBM四核X3650送服务器监控卡
 全新双至强主机 5M独享仅9800元
 托管不花冤枉钱 1U单路机架服务器推荐
 IBM力推Power6服务器 Power5明年淡出
 2分钟设置 实战戴尔R905嵌入式虚拟化
 小企业入门应用!惠普ML150 G5仅10200
 文章评论
 精彩友情推荐
·Asp源码 PHP源码
·CGI源码 JSP源码
·建站书籍教程
·服务器软件 .net源码
·建站工具软件
·IDC资讯大全
·机房品质万里行
·IDC托管必备知识
·全国IDC报价
·网站推广优化
 
人物焦点
最新更新
 思杰:虚拟化之路
 IBM借FileX完善数据保护策略
 Sun公司第四财季净利润大幅下滑73%
 当布线成为战略性投资
 联想发布首款单路机架式服务器万全R150
 IBM启动“绿色创新工程”应对数据中心能
 惠普:安腾服务器是数据中心运营基石
 解决交换机故障 提高网络效率
 性能呈现 服务器评测方法研究之CPU篇
 65纳米宝刀不老 戴尔塔式PE1900现11800
热门文章
 入门级首选 低价塔式服务器选购分析
 中小企业购机导购 一周服务器评点
 嵌入式高效虚拟化 戴尔R805服务器首测
 直播北京奥运 视频服务器选购分析
 高端精简 一万到两万元机架服务器导购
 网管秘笈:轻松搞定服务器管理
 蓝色基因 IBM X3650机架式服务器评测
 强氧最新推荐“氦”1400G3系列 1U服务器
 带HDMI的笔记本? 惠普新款工作站评测
 5款2-3万主流中小企业部门级服务器导购
 Chinaitlab Group 旗下网站:  中国IT实验室 | 中国IDC圈 | 存储世界 | 数字网校 | 21世纪IT人才网
关于我们 | 广告服务| 成功客户 | 合作媒体 | 网站历史 | 联系我们 | 招聘信息 | 免责声明
Copyright © 2001 - 2007 All Rights Reserved
粤ICP备05089709