| 上月10日,AMD于全球市场发布Barcelona四核心服务器处理器——也即部分业内人士所称的K10处理器,自此,服务器市场的喧闹再次演变为真刀真枪的四核争霸。
AMD于此次推出的第三代Opteron处理器有2路(2-way)(23**)与多路(4/8-way)(83**)两种,而每种同时具有普通版与低功耗版两种版本,并将在以后陆续推出高性能版。
本次送测的华硕RS161-E5服务器,采用1U机架式外观设计,并支持双路处理,主板配备16条DIMM插槽,但是整系统只预设了2个硬盘位——高性能处理与相对较低的存储配备,昭显其典型的集群等HPC运算市场定位。
在国庆前的Barcelona预演篇,我们了解到如下一些情况:AMD官方公布的数据显示,采用Barcelona皓龙处理器的服务器平台,能够在更低的能耗下实现更高的性能,而华硕官方给出的RS161-E5服务器数据显示,在节省66%能耗的情况下,还能实现14%的性能提升。
此外,华硕在RS161-E5整系统上还联合AMD添加诸如DDPM的动态电源管理的新技术、热门的系统智能温控技术、消除总线架构的Dual Link技术、AMD-V虚拟技术
本次测试,我们将主频相同的双路Opteron 2212平台与送测的双路四核Asus RS161-E5平台进行对比,两平台不仅同样采用AMD的双路Opteron系列平台,而且同样采用Asus主板,详细参数对比如下:
| 系统参数 |
Asus RS161-E5平台 |
双路Opteron 2212平台 |
| 主板 |
Asus KFSN4-DRE |
ASUS KFN4-16 |
| 芯片组 |
nVIDIA nForce Pro 2200, AMD Hammer |
nVIDIA nForce Pro 2200, AMD Hammer |
| 处理器 |
AMD Opteron 2350*2(Socket F) |
AMD Opteron 2212*2(Socket F) |
| 主频 |
四核2.0GHz*2 |
双核2.0GHz*2 |
| HTT/FSB |
1000MHz |
1000MHz |
| 接口 |
Socket F |
Socket F |
| L1 |
[64K(Data)+64K(Instruction)]/Per core |
[64K(Data)+64K(Instruction)]/Per core |
| L2 |
1MB*4 |
1MB*2 |
| 处理器设置 |
AMD Power Now! (Disable) |
AMD Power Now! (Disable) |
| 内存 |
Kingston DDR2 667 Ecc 1G*2 |
Kingston DDR2 533 Reg Ecc 512M*8 |
| 磁盘控制器 |
集成 |
独立LSI Logic PCI-X Ultra320 SCSI Host Adapter |
| 磁盘 |
HITACHI 80GB 7200转 SATA II(型号HDS721680PLA380) |
Seagate 73GB万转SCSI(型号ST373307LC) |
| 操作系统 |
Microsoft Windows Server2003SP1,5.02.3790,开启PAE |
Microsoft Windows Server2003SP1,5.02.3790,开启PAE |
| 网卡 |
Broadcom NetXtreme Gigabit Ethernet (BCM5750整合GbE) |
Broadcom NetXtreme Gigabit Ethernet (BCM5780整合GbE) |
两平台除了处理器以外,主要的差距表现在内存容量、磁盘与磁盘控制器上:Asus RS161-E5服务器平台仅为2条1G,而Opteron 2212平台则采用了8条512M内存;Opteron 2212采用更高转速的万转SCSI磁盘,而ASUS仅为7200转SATA II磁盘;Opteron 2212采用独立的LSI Logic PCI-X Ultra320 SCSI Host Adapter磁盘控制器。
另外,两处理器除了核心数量不同外,其他重要指标均未产生变化——原生四核Barcelona仍然采用其经典的直联架构,而Barcelona平台的芯片组、接口甚至HTT、缓存等重要参数均与双核Opteron 2200相同,可以实现两平台的平滑升级。
在这两个平台中,我们都关闭了“AMD Power Now!”功能。通过这个简单的优化设置,可以减少测试过程所受其他项目的干扰,从而保障两平台尽量工作在最大性能状态下。
功能介绍:
AMD Power Now!: AMD产品的一种节电技术,依据处理器的负载情况实现自动调频调压,以达到省电效果。关闭此项功能,可以让平台的处理状态时刻保持高速运行。
在本次测试过程中,我们进行了必要的常规测试项目:
SPEC是标准性能评估公司(Standard Performance Evaluation Corporation)的简称。SPEC是由计算机厂商、系统集成商、大学、研究机构、咨询等多家公司组成的非营利性组织,这个组织的目标是建立、维护一套用于评估计算机系统的标准。
SPEC CPU2000是SPEC组织推出的一套CPU子系统评估软件,它包括CINT2000和CFP2000两个子项目,前者用于测量和对比整数性能,而后者则用于测量和对比浮点性能。计算系统中的处理器、内存和编译器都会影响最终的测试性能,而I/O(磁盘)、网络、操作系统和图形子系统对于SPEC CPU2000的影响非常的小。
SPECfp测试过程中同时执行多个实例(instance),测量系统执行计算密集型浮点操作的能力,比如CAD/CAM、DCC以及科学计算等方面应用可以参考这个结果。SPECint测试过程中同时执行多个实例(instances),然后测试系统同时执行多个计算密集型整数操作的能力,可以很好的反映诸如数据库服务器、电子邮件服务器和Web服务器等基于整数应用的多处理器系统的性能。
我们在被测服务器中安装了Intel C++ 8.1 Compiler、Intel Fortran 8.1 Compiler这两款SPEC CPU2000必需的编译器,另外安装了Microsoft Visual Studio 2003.net提供必要的库文件。按照SPEC的要求我们根据自己的情况编辑了新的Config文件,可以满足Base测试。然后我们根据被测系统实际可同时处理的线程数量,设定用户数量,分别运行SPEC base和SPEC rate base测试的结果(其中SPEC base代表系统执行某个任务的速度,而SPEC base rate测试代表系统可以同时处理任务的能力)。
- ScienceMark v2.0 Membench
ScienceMark v2.0是一款用于测试系统特别是处理器在科学计算应用中的性能的软件,MemBenchmark是其中针对处理器缓存、系统内存而设计的功能模块,它可以测试系统内存带宽、L1 Cache延迟、L2 Cache延迟和系统内存延迟,另外还可以测试不同指令集的性能差异。
IOMeter是一款功能非常强大的IO测试软件,它除了可以在本机运行测试本机的IO(磁盘)性能之外,还提供了模拟网络应用的能力。在这次的测试中,我们仅仅让它在本机运行测试服务器的磁盘性能。为了全面测试被测服务器的IO性能,我们分别选择了不同的测试脚本。
-
Max_throughput(read):文件尺寸为64KB,100%读取操作,随机率为0%,用于检测磁盘系统的最大读取吞吐量
-
Max_IO(read):文件尺寸为512B,100%读取操作,随机率为0%,用于检测磁盘系统的最大读取操作IO处理能力
-
Max_throughput(write):文件尺寸为64KB,0%读取操作,随机率为0%,用于检测磁盘系统的最大写入吞吐量
-
Max_IO(write):文件尺寸为512B,0%读取操作,随机率为0%,用于检测磁盘系统的最大写入操作IO处理能力
SiSoftware Sandra是一款可运行在32bit和64bit Windows操作系统上的分析软件,这款软件可以对于系统进行方便、快捷的基准测试,还可以用于查看系统的软件、硬件等信息。今年该软件推出了2007版,该版本新增了4项基准测试,包括Power Management Efficiency、Memory Latency、Physical Disks和CD-ROM and DVD这四个项目。另外,它还对于原有的几个基准测试模块进行升级,比如在Arithmetic benchmarks中增加了对SSE3 & SSE4 SSE4的支持,在Multi-Media benchmark中增加了对于SSE4的支持,另外还升级了File System benchmark和Removable Storage benchmark两个子项目。对于新的硬件的支持当然也是该软件每次升级的重要内容之一。SiSoftware Sandra所有的基准测试都针对SMP和SMT进行了优化,最高可支持32/64路平台,这也是我们选择这款软件的原因之一。
WebBench是针对服务器作为Web Server时的性能进行测试,我们在被测服务器上安装了IIS6.0组件,以提供测试所需的Web服务。在测试中我们开启了网络实验室中的56台客户端,分别使用了WebBench 5.0内置的动态CGI以及静态页面脚本对服务器进行了测试。
静态测试是由客户端读取预先放置在服务器Web Server下的Web页面(wbtree),这项测试主要考察的是服务器磁盘系统以及网络连接性能。我们使用了实验室中的56台客户端,配合Static_mt.tst多线程静态脚本测试向被测服务器发送请求。
动态测试偏重于对服务器CPU子系统的性能测试,它对于Web服务器提供了足够的负载。我们将一个C语言编写的CGI源文件Simcigi.c编译为Simcgi.exe,并将其作为动态测试中的CGI脚本。在测试过程中,每台安装了WebBench客户端软件的PC,会在300秒的时间内持续向服务器发送CGI请求,而控制台会纪录并汇总服务器所响应CGI请求的数据。CGI测试的成绩高低,主要取决于服务器处理器子系统性能的优劣。处理器子系统包括CPU、内存以及内存控制器,CPU频率、缓存以及内存容量大小和内存带宽,都会影响该项成绩。
NetBench是针对文件服务器的性能测试软件,影响NetBench性能的主要是服务器的磁盘子系统,服务器磁盘控制器、条带大小、读写缓存、硬盘类型、组建磁盘阵列模式、内存容量、网络拓朴结构等都会对测试结果有明显的影响。我们在被测服务器上设立了文件服务器,NetBench通过网络实验室中60个客户端来模拟网络中的PC向文件服务器所发出的文件传输请求,文件服务器则将存储在磁盘上的文件数据发送给相应的客户端。在测试过程中,客户端会以每四台一组的步进依次增加并且向服务器发送文件传输请求,测试结束后控制台收集数据并绘制出服务器的数据传输变化曲线。
大部分的服务器应用都同数据库有着密切的联系,因此我们今年开始着手在在服务器测试中加入对于数据库性能的测试。我们选择了Benchmark Factory 4.6软件和Microsoft SQL2000 SP4来测试不同的硬件平台在数据库应用中的表现。
我们选择了BF内置的标准测试脚本AS3AP,这项测试可用于对于ANSI结构化查询语言(SQL)关系型数据库进行测试,它可用于测试DBMS(单用户微机数据库管理系统),也可用于测试高性能并行或者分布式数据库。
我们使用UNI-T UT71E智能数字万用表对于被测服务器系统的整体功耗进行了监测,利用随机附带的接口程序,我们可以记录被测服务器任意时间段内的功率变化。
|
Sisoftware.Sandra.Enterprise.w2007.5.10.98 |
| 处理器型号 |
Asus RS161-E5平台 |
双路Opteron2212平台 |
增长率 |
| Processor Arithmetic |
| Dhrystone ALU(MIPS) |
34709 |
29069 |
19.4% |
| Whetstone iSSE3(MFLOPS) |
29367 |
24593 |
19.4% |
| Processor Multi-Media |
| Integer x8 iSSE4(it/s) |
|
|
|
| Integer x4 Aemmx/aSSE(it/s) |
87673 |
75228 |
16.5% |
| Floating-Point x4 isse2(it/s) |
97770 |
81870 |
19.4% |
Sisoftware Sandra Enterprise 2007在Arithmetic benchmarks中增加了对SSE3 & SSE4的支持,在Multi-Media benchmark中增加了对于SSE4的支持。
对比进行测试的两个服务器平台,其处理器对于指令集的支持情况相同,均为AMD Opteron 2212:MMX(+)、3DNow!(+)、SSE、SSE2、SSE3、X86-64。
从以上对比数据我们可以看到:
在Sisoftware 2007单机处理性能测试项目中,送测的Asus RS161-E5相对双路Opteron 2212平台实现16.5-19.4%明显的增长,而且各项指标的增长幅度相对比较均衡。
双网口同样可实现内外网设计或负载均衡
在Web性能的测试环节,Asus RS161-E5出现更大的性能提升:
| Webbench 5.0 dynamic_cgi.tst |
Asus RS161-E5平台 |
双路Opteron 2212平台 |
| 1_c |
284.325 |
203.546 |
| 4_c |
1405.775 |
1396.683 |
| 8_c |
2762.200 |
2723.379 |
| 12_c |
3865.262 |
3776.683 |
| 16_c |
4249.483 |
4131.058 |
| 20_c |
5242.629 |
4972.159 |
| 24_c |
6175.541 |
5669.567 |
| 28_c |
7301.638 |
6271.792 |
| 32_c |
9290.258 |
6713.629 |
| 36_c |
9798.975 |
6948.383 |
| 40_c |
10164.742 |
7024.904 |
| 44_c |
10083.325 |
7035.958 |
| 48_c |
10005.808 |
6998.117 |
| 52_c |
9934.067 |
6960.696 |
| 56_c |
9919.271 |
6928.529 |
| 60_c |
10031.375 |
6915.633 |
在作为对照的双路Opteron 2212平台中,网络负载峰值仅为7036 Request/s,而Asus RS161-E5的峰值则到达10164 Request/s,相对提升45%;两平台在接入不同终端数时的数值,也是配置双路四核Barcelona的Asus RS161-E5显示出大幅度的性能提升,可以从下图中更直观地看出:
可以发现,在同等终端数前提下,Asus RS161-E5的Web负载平均值相对作为参照的同频率双路Opteron 2212平台也有非常明显的提升,而从数据又了解到,Asus RS161-E5负载的平均值比双路Opteron 2212平台要高出31%。
我们在被测服务器上安装了Microsoft SQL 2000 SP4,按照测试要求建立了数据库。BF在测试之前会在数据库中生成9个表,其中包括4个500万行的表格,每行包括100字节的数据,因此每个表格容量大约是476MB,整个数据库容量为1.86GB。我们用60个客户端模拟1600个用户,并且以8个一组依次增加,在这个数据库中进行查询、添加、删除、修改等操作。在测试期间,数据的吞吐量很小,因此磁盘吞吐量和网络吞吐量都不会成为瓶颈。
从上图,我们可以直观地了解到,两测试平台的数据库性能差异非常明显:Asus RS161-E5的数据库性能较双路Opteron 2212的数据库性能有爆发式的提升。
从测试数据来看具体差异数值:当接入终端数为700个时,Asus RS161-E5达到处理数据库请求峰值76893 TPS,而作为参照的双路Opteron 2212平台处理数据库请求峰值仅为34480 TPS,Asus RS161-E5处理数据库请求的峰值提升达123%,而平均值的提升同样为极其相近的122%。
在本次进行对比的Asus RS161-E5与双路Opteron 2212两平台中,双方配置在重要部件的配置上除了处理器以外,影响整机与网络整系统性能的主要有以下差别:
1)Asus RS161-E5采用2条1G DDR2 667Mhz ECC内存,双路Opteron 2212平台采用8条512M DDR2 533Mhz ECC Reg内存,品牌相同;
2)Asus RS161-E5采用HITACHI 80G 7200转 SATA II磁盘,双路Opteron 2212平台采用Seagate 73GB 万转 SCSI磁盘;
3)Asus RS161-E5采用集成在南桥里的磁盘控制器,双路Opteron 2212平台采用LSI Logic PCI-X Ultra320 SCSI Host Adapter独立控制器。
从以上涉及的内存、磁盘、磁盘控制器这三个影响整机与网络整系统性能的数据来看,Asus RS161-E5的配置相对都要低,在此基础上,Asus RS161-E5仍然实现单机处理与网络应用测试的大幅提升:
1)单机处理性能测试中,多个测试项目显示其在不同的方面性能提升介于16.5%-19.4%;
2)网络应用测试中,Web性能峰值提升45%,平均值提升31%;
3)网络应用测试中,数据库性能峰值提升123%,平均值提升122%。
值得注意的是网络应用的数据库性能测试,其作为整机系统与网络环境的综合均衡性能反映,在网络环境相同而除处理器和主板外配置更低的情况下,相对目前主流的第二代服务器系统还出现了超过100%的提升,很清晰地向世人展现了1+1>2的理论。
本次送测的时间相对紧促,仅针对 服务器的综合 网络应用性能和部分单机重点性能指标进行了测试,但也从中发现Asus RS161-E5的一些明显的优势:
1)市场定位明确
Asus RS161-E5采用1U外观设计,系统支持2路Opteron 2200/2300处理器,支持DDR2 533/667Mhz两种规格的ECC内存,并配备16DIMM,支持最高64G大容量内存,标配2个3.5寸硬盘位——高性能与相对较低的存储空间对碰,显示其明确的HPC集群市场定位。
2)性能提升显著
服务器系统的数据库网络应用,需要从处理器、内存、磁盘、磁盘控制器、网络设备、线路、终端等各方面性能的综合均衡,相对以往同主频的服务器平台,在系统内部内存、磁盘、磁盘控制器等配置更低,而外部网络、线路、终端等保持不变的情况下,采用双路Barcelona处理器的Asus RS161-E5实现数据库处理请求超过100%的提升(峰值123%,均值122%)。
华硕主板与整机系统、AMD的处理器设计组合而成的整系统网络应用性能,很好地诠释了1+1>2的理论。
3)实用优化功能
支持AMD “split power plane”技术,内存控制器与处理器核心将可以工作在不同的电压之下;支持dual link技术,双路处理器的互通将消除总线瓶颈,实现更好的处理效能。而这两项技术的结合,同样为系统性能展现1+1>2理论贡献了一把大力。
作为华硕新一代Opteron服务器,Asus RS161-E5在1U的空间内表现出如此高的性能提升,在验证华硕与AMD联合实力的同时,也显露出华硕强力渗透HPC市场的决心。 |