|
T2600整合了32KB L1数据缓存和32KBL1指令缓存,均为8路关联。全速L2缓存容量为2MB,8路关联,256bit位宽。
Intel Pentium D缓存结构
 |
| Intel Core Duo缓存结构 |
通过上面的两张图片,我们可以很容易发现Intel Core Duo同Pentium D处理器在缓存设计方面的差异。Pentium D处理器是每个核心整合1MB的L2缓存,两个核心虽然封装在一个处理器外壳内,但是需要通过前端总线来通信。Intel Core Duo处理器的两个核心则是共享2MB L2缓存,Intel将这种设计称为智能缓存架构(Smart Cache Architecture)。
不过,我们没有找到关于Intel Core Duo在缓存一致性方面的资料,不清楚它是否在MESI的基础上做了一定程度的改进。可以肯定的是,SCA缓存架构可以实现两个核心之间更高速的通信。这样的设计还可以降低前端总线的负载,相应的整个系统的效能也会有一定的提升。
Intel Core Duo缓存采用了动态缓存分配机制(Dynamic Cache Allocation),每个核心工作的时候都尽可能的利用2MB L2缓存的所有容量。
 |
| 核心级低电压状态 |
 |
| 封装级低电压状态 |
Intel Core Duo处理器可以进行核心级(core level)和封装级(package level)电源管理,也就是说一个核心可以独立的进入到某种状态,比如C1/autoHALT、C1/MWAIT,或者整个处理器进入到某种状态。
| 核心级电压状态 |
封装级电压状态 |
| C0 State |
Normal State |
| C1/AuoHALT Powerdown State |
Stop-Grant State, |
| C1/MWAIT Powerdown State |
Stop Grant Snoop State |
| Core C2 State |
Sleep State |
| Core C3 State |
Deep Sleep State |
| Core C4 State |
Deeper Sleep State |
| 本表中仅仅罗列两种级别的电压状态,并非一一对应的关系。 |
由于本文的重点在于讨论不同处理器之间的性能差异,因此我们不对其电源管理做更深入的介绍。
测试平台和测试方法
|
测试平台配置 |
| 处理器 |
Dual Xeon 3.0 |
Intel Pentium M T2600 |
Intel Pentium D 830 |
AMD Opteron 265 |
| 核心 |
Nocona |
Yonah |
SmithField |
Italy |
| 制程 |
90nm |
65nm |
90nm |
90nm |
| 核心电压 |
- |
0.900-1.400v |
1.2-1.4v |
1.350v |
| 主频 |
3.0GHz |
2.16GHz |
3.0GHz |
1.8GHz |
| 倍频 |
x15 |
x13 |
x15 |
x9 |
| FSB或HTT |
200MHz |
167MHz |
200MHz |
200MHz |
| 总线频率 |
800MHz |
667MHz |
800MHz |
- |
| L1 D-Cache |
16KB,8路 |
32KB,8路 |
16KB,8路 |
32KB,2路 |
| L1 I-Cache |
12KB,8路 |
32KB,8路 |
12KB,8路 |
32KB,2路 |
| L2 Cache |
2MB,8路 |
2MB,8路 |
2x1MB,8路 |
2x1MB,16路 |
| L2与核心关系 |
- |
共享2MB |
每核心1MB |
每核心1MB |
| |
|
|
|
|
| 主板 |
ASUS RS160-E2 |
TCL M31EI |
ASUS P5MT |
MSI MS9245 |
| 芯片组 |
E7520、6300ESB |
i945GM、ICH7 |
E7230、ICH7R、6702PXH |
AMD8111、AMD 8131 |
| 内存 |
Ramaxel 512MB 1Rx8 PC2-3200R-333 LF |
Ramaxel 256MB 1Rx16 PC2-4200S-444 LF |
Samsung 256MB 1Rx8 PC2-4200E-444-10-A3 |
Kingston KVR400D8R3A |
| 容量 |
512MB x 4 |
256MB x 2 |
256MB x 2 |
1GB x 2 |
我们在上述配置的服务器上分别安装了Microsoft Windows 2003企业版(英文、32bit),正确安装了各个硬件的驱动程序,确保服务器工作在最佳的状态。
我们所使用的评测软件如下:
SEPCCPU2000可以评估服务器系统中处理器的整数性能和浮点性能,我们进行的是SPECint_base2000和SPECfp_base2000两个项目的测试。ScienceMark v2.0一款用于评估处理器科学计算能力的软件,它提供了评估被测系统内存带宽的功能,这款软件可以很好的支持多线程。IOMeter是一款可以用于单个系统或者集群系统的I/O子系统评估工具,我们仅仅使用了它的磁盘测试功能。WebBench和NetBench是两款在服务器评估中普遍使用的软件,前者也是侧重于服务器CPU子系统的性能评估,后者则侧重于IO子系统的性能评估。
Sisoft Sandra 2005 Pro测试
我们使用了Sisoft Sandra 2005 Pro SR2a对于各个系统进行了测试,这个测试结果对于普通的读者来说更加熟悉,甚至可以利用共享版本直接测试自己系统,因此会对于我们的测试结果有更加直观的概念。
CPU Arithmetic Benchmark包括了Dhrystone ALU、Whetstone FPU、Whetstone iSSE2三个子项目,多处理器、超线程技术对于这个测试的影响非常的明显。ALU测试中,Pentium M T2600拔得头筹,FPU和iSSE2测试中,启用了超线程技术的双Xeon服务器则显示出来了明显的优势。
CPU Multi-Media Benchmark测试包括了2个子项目,双Xeon平台的表现是最好的,其次是Pentium M T2600,Pentium D 830和Opteron 265的表现相近。根据以往我们的测试经验来看,Sisoft Sandra 2005的测试结果同专门的服务器性能评估软件的测试结果所显示的趋势并不完全吻合。
上一页 [1] [2] [3] [4] 下一页 |