编织人生论坛

 找回密码
 注册会员

QQ登录

只需一步,快速开始

手机短信,快捷登录

扫码登录更安全

39 人签到
查看: 2278|回复: 4

手把手教你装电脑--第一章 电脑灵魂CPU

[复制链接]
发表于 2005-5-29 09:43:15 | 显示全部楼层 |阅读模式 来自: 江苏省南京市 电信
  CPU前言

  在所有配件中,CPU是最重要的东西,没有它,电脑必定是死蟹一只,通常,追求最快的速度(=跌价最快:()花在CPU上的价格也是最多的。所以我们就先来侃侃CPU吧

第一讲 CPU全接触

* CPU的概念与重要性能指标

  CPU的英文全称是Central Processing Unit,即中央处理器。CPU从雏形出现到发展壮大的今天,由于制造技术的越来越先进,其集成度越来越高,内部的晶体管数达到几百万个。虽然从最初的CPU发展到现在其晶体管数增加了几十倍,但是CPU的内部结构仍然可分为控制单元,逻辑单元和存储单元三大部分。CPU的性能大致上反映出了它所配置的那部微机的性能,因此CPU的性能指标十分重要。 CPU主要的性能指标有以下几点:

第一:主频,也就是CPU的时钟频率,简单地说也就是CPU的工作频率。一般说来,一个时钟周期完成的指令数是固定的,所以主频越高,CPU的速度也就越快了。不过由于各种CPU的内部结构也不尽相同,所以并不能完全用主频来概括CPU的性能。至于外频就是系统总线的工作频率;而倍频则是指CPU外频与主频相差的倍数。用公式表示就是:主频=外频×倍频。 (笨笨熊注:我们购买计算机主要看CPU的主频)

第二:内存总线速度或者叫系统总路线速度,一般等同于CPU的外频。内存总线的速度对整个系统性能来说很重要,由于内存速度的发展滞后于CPU的发展速度,为了缓解内存带来的瓶颈,所以出现了二级缓存,来协调两者之间的差异,而内存总线速度就是指CPU与二级(L2)高速缓存和内存之间的工作频率。

第三:工作电压。工作电压指的也就是CPU正常工作所需的电压。早期CPU(386、486)由于工艺落后,它们的工作电压一般为5V(奔腾等是3.5V/3.3V/2.8V等),随着CPU的制造工艺与主频的提高,CPU的工作电压有逐步下降的趋势,Intel最新出品的Coppermine已经采用1.6V的工作电压了。低电压能解决耗电过大和发热过高的问题。这对于笔记本电脑尤其重要。 (笨笨熊注:新赛扬是1.5V)

第四:协处理器或者叫数学协处理器。在486以前的CPU里面,是没有内置协处理器的。由于协处理器主要的功能就是负责浮点运算,因此386、286、8088等等微机CPU的浮点运算性能都相当落后,自从486以后,CPU一般都内置了协处理器,协处理器的功能也不再局限于增强浮点运算。现在CPU的浮点单元(协处理器)往往对多媒体指令进行了优化。比如Intel的MMX技术,MMX是“多媒体扩展指令集”的缩写。MMX是Intel公司在1996年为增强Pentium CPU在音像、图形和通信应用方面而采取的新技术。为CPU新增加57条MMX指令,把处理多媒体的能力提高了60%左右。(笨笨熊注:现在“铜矿”PⅢ还有MMX2技术,将来还会有三代、四代MMX技术,名称可能不同,意思是一样的)

第五:流水线技术、超标量。流水线(pipeline)是 Intel首次在486芯片中开始使用的。流水线的工作方式就象工业生产上的装配流水线。在CPU中由5~6个不同功能的电路单元组成一条指令处理流水线,然后将一条X86指令分成5~6步后再由这些电路单元分别执行,这样就能实现在一个CPU时钟周期完成一条指令,因此提高了CPU的运算速度。超流水线是指某型 CPU内部的流水线超过通常的5~6步以上,例如Pentium pro的流水线就长达14步。将流水线设计的步(级)数越多,其完成一条指令的速度越快,因此才能适应工作主频更高的CPU。超标量是指在一个时钟周期内CPU可以执行一条以上的指令。这在486或者以前的CPU上是很难想象的,只有Pentium级以上CPU才具有这种超标量结构;这是因为现代的CPU越来越多的采用了RISC技术,所以才会超标量的CPU。

第六:乱序执行和分枝预测,乱序执行是指CPU采用了允许将多条指令不按程序规定的顺序分开发送给各相应电路单元处理的技术。分枝是指程序运行时需要改变的节点。分枝有无条件分枝和有条件分枝,其中无条件分枝只需要CPU按指令顺序执行,而条件分枝则必须根据处理结果再决定程序运行方向是否改变,因此需要“分枝预测”技术处理的是条件分枝。

第七:L1高速缓存,也就是我们经常说的一级高速缓存。在CPU里面内置了高速缓存可以提高CPU的运行效率。内置的L1高速缓存的容量和结构对CPU的性能影响较大,不过高速缓冲存储器均由静态RAM组成,结构较复杂,在CPU管芯面积不能太大的情况下,L1级高速缓存的容量不可能做得太大。采用回写(Write Back)结构的高速缓存。它对读和写操作均有可提供缓存。而采用写通(Write-through)结构的高速缓存,仅对读操作有效。在486以上的计算机中基本采用了回写式高速缓存。

第八:L2高速缓存,指CPU外部的高速缓存。Pentium Pro处理器的L2和CPU运行在相同频率下的,但成本昂贵,所以Pentium II运行在相当于CPU频率一半下的,容量为512K。为降低成本Intel公司曾生产了一种不带L2的CPU名为赛扬。(笨笨熊注:现在铜矿及新赛扬的L2缓存与CPU同频,所以高端1G以上的芯片大战中Intel暂时领先于L2只有主频一半或三分之一的AMD的K7)

第九:制造工艺, Pentium CPU的制造工艺是0.35微米, PII和赛扬可以达到0.25微米,最新的CPU制造工艺可以达到0.18微米,并且将采用铜配线技术,可以极大地提高CPU的集成度和工作频率。(笨笨熊注:听说索尼的PS4采用的情感芯片第三代将用0.01微米技术,集成5亿个晶体管,技术进步真可怕)

1-1 话说电脑灵魂--CPU   

CPU是怎么制造出来的

     CPU发展至今已经有二十多年的历史,其中制造CPU的工艺技术也经过了长足的发展。下面简述CPU的制造过程:第一步,取出一张利用激光器刚刚从硅柱上切割下来的硅片,它的直径越大可以切割的CPU就越多,生产成本就越低,这就是半导体加工厂为什么千方百计要提高晶圆直径的原因,现在工艺先进的半导体加工厂已经把晶圆的直径提高到了12英寸。接着就是硅片镀膜了,在硅片表面增加一层由二氧化硅(SiO2)构成的绝缘层,随后就是镀胶,光刻掩膜,之后对半导体硅进行掺杂工艺,因为纯硅里只有掺入杂质才能变成半导体,最后布上金属配线,再把完工的晶体管接入自动测试设备中,这个设备每秒可作一万次检测,以确保它能正常工作。在通过所有的测试后必须将其封入一个陶瓷的或塑料的封壳中,这样它就可以很容易地装在一块电路板上了。一块CPU的雏形就这样产生了。

CPU的历史

    可以说Intel公司的历史就是一部CPU的发展史,下面以Intel为例简单说一下CPU的历史。

    1971年。世界上第一块微处理器4004在Intel公司诞生了。它出现的意义是划时代的,比起现在的CPU,4004显得很可怜,它只有2300个晶体管,功能相当有限,而且速度还很慢。

    1978年,Intel公司首次生产出16位的微处理器命名为i8086,同时还生产出与之相配合的数学协处理器i8087,这两种芯片使用相互兼容的指令集。由于这些指令集应用于i8086和i8087,所以人们也这些指令集统一称之为X86指令集。这就是X86指令集的来历。

    1979年,Intel公司推出了8088芯片,它是第一块成功用于个人电脑的CPU。它仍旧是属于16位微处理器,内含29000个晶体管,时钟频率为4.77MHz,地址总线为20位,寻址范围仅仅是1MB内存。8088内部数据总线都是16位,外部数据总线是8位,而它的兄弟8086是16位,这样做只是为了方便计算机制造商设计主板。
    1981年8088芯片首次用于IBM PC机中,开创了全新的微机时代。

    1982年,Intel推出80286芯片,它比8086和8088都有了飞跃的发展,虽然它仍旧是16位结构,但在CPU的内部集成了13.4万个晶体管,时钟频率由最初的6MHz逐步提高到20MHz。其内部和外部数据总线皆为16位,地址总线24位,可寻址16MB内存。80286也是应用比较广泛的一块CPU。

    1985年Intel推出了80386芯片,它X86系列中的第一种32位微处理器,而且制造工艺也有了很大的进步。80386内部内含27.5万个晶体管,时钟频率从12.5MHz发展到33MHz。80386的内部和外部数据总线都是32位,地址总线也是32位,可寻址高达4GB内存,可以使用Windows操作系统了。

    1989年,Intel推出80486芯片,它的特殊意义在于这块芯片首次突破了100万个晶体管的界限,集成了120万个晶体管。80486是将80386和数学协处理器80387以及一个8KB的高速缓存集成在一个芯片内,并且在80X86系列中首次采用了RISC(精简指令集)技术,可以在一个时钟周期内执行一条指令。它还采用了突发总线(Burst)方式,大大提高了与内存的数据交换速度。
看完这里,相信大家会对CPU的发展历程有一个初步的认识。下面介绍一下当今的主流CPU。


1-2 三国鼎立看主流

主流CPU的发展

    相信大家最关心的要算是今日CPU的发展状况了,而我们大我数人接触到的也就是这个阶段的CPU,我们先从Intel公司讲起。
Intel
    Pentium: 就是大名鼎鼎的“奔腾”处理器,它是Intel在1993年推出的全新一代的高性能处理器,内部代号是P54C。Pentium的内部含有的晶体管数量高达310万个,并内置了16K的一级缓存。时钟频率由最初推出的60MHz和66MHz,最终达到200MHz。由于Pentium的制造工艺优良,可超频性很好,也就是可以把它的时钟频率提高1~2档来使用,使得超频逐渐流行开来。同时它得浮点性能一举超过了竞争对手Cyrix和AMD,从此Intel公司把浮点桂冠一直保持到AMD推出Athlon芯片。由于以上原因,使得Pentium赢得了586级CPU的大部分市场份额。从奔腾75开始,CPU的插座技术正式从以前的Socket4转换到同时支持Socket5和Socket7,其中Socket7还一直沿用至今,AMD后来又把它发展成了Super7,这是后话了。

    Pentium Pro:Intel在1996年推出的第六代X86 CPU。Pentimu Pro的内部含有高达550万个的晶体管, Pentium Pro的一级(片内)缓存为8KB指令和8KB数据。值得注意的是在Pentimu Pro的一个封装中除Pentium Pro芯片外还包括有一个256KB的二级缓存芯片,它运行频率和处理器一样,两个芯片之间用高频宽的内部通讯总线互连,这个总线和系统总线无关。Pentimu Pro最引人注目的地方是它具有一项称为“动态执行”的创新技术,这是继Pentium在超标量体系结构上实现实破之后的又一次飞跃, Pentimu Pro主要用于服务器。

    Pentium MMX:与1996年底又推出了Pentium 系列的改进版本,内部代号P55C,也就是我们平常所说的Pentium MMX(多能奔腾)。MMX技术是Intel最新发明的一项多媒体增强指令集技术,它的英文全称可以翻译成“多媒体扩展指令集”。Pentium MMX可以说是直到1999年初一直是在电脑市场上占有率最高的CPU产品。Pentium MMX系列的频率只有三种:166MHz/200MHz/233MHz,一级缓存从Pentium的16KB增加到了32KB,核心电压2.8v,倍频分别为2.5、3、3.5。插槽都是Socket 7。

    Pntium Ⅱ:1997年5月,Intel又推出了和Pentium Pro同一个级别的产品PentiumⅡ。PentiumⅡCPU有众多的分支和系列产品,其中第一代的产品就是代号Klamath的芯片。它运行在66MHz总线上,主频分233MHz、266MHz、300MHz、333MHz四种。PentiumII采用了与Pentium Pro相同的32位核心结构并加快了段寄存器写操作的速度,并增加了MMX指令集。Intel全部采用CMOS工艺,将750万个晶体管集成到一个203平方毫米的硅片上。在总线方面,PentiumⅡ处理器采用了双独立总线结构,即背侧总线技术。其中一条总线连接二级高速缓存,另一条连接到内存。为降低成本,PentiumⅡ使用了一种脱离芯片的外部高速缓存,可以运行在相当于CPU自身时钟速度一半的速度下。在接口技术方面,为了击垮竞争对手,同时获得更大的内部总线带宽,PentiumⅡ首次采用了专利的Slot1接口标准,它不再用陶瓷封装,而是把CPU和二级缓存都做在一块印刷电路板上。封装起来就是所谓的SEC(Single-edgecontactCartridge) 卡盒。 PentiumⅡCPU内部集合了32KB片内L1高速缓存(16K指令/16K数据);57条MMX指令;8个64位的MMX寄存器。L2缓存是具有512K四路级联片外同步突发式SRAM高速缓存。

     Celeron:赛扬是Intel针对PentiumII提出的廉价版本,其核心技术与PentiumII相同,企图攻占低价位个人电脑市场,可以说是Intel为抢占低端市场而专门推出的,Intel当然不甘心低端市场这块肥肉被AMD和Cyrix给抢走。赛扬处理器就象是去掉二级缓存的PentiumⅡ。最初Celeron采用0.35微米工艺制造,外频为66MHz,有266MHz与300MHz两款。接着又出现了333MHz,从这开始就采用了0.25微米的制造工艺。最初的Celeron犯了一个错误,就是把赛扬的二级缓存给去掉了。因此它的性能不理想,成为玩家手中的鸡肋,唯一的好处是非常耐超频。随后Intel改正了这个错误,在赛扬内部集成了128KB的全速Cache,而且全部采用0.25微米的制造工艺,为了和原来的赛扬300有所区别,就把集成了128KB缓存的300MHz的赛扬叫做赛扬300A,随后推出的赛扬都具有内置128KB二级缓存,由于集成了128KB L2缓存,它们具有19M的晶体管。




 

   为了进一步降低成本,Intel又回到了曾经放弃的Socket结构,因为赛扬的二级缓存是内置的,也就是没有了外置的背侧总线,把赛扬安在一块PCB板上纯粹是多余的。所以Intel又把赛扬做成了Socket结构,不过不再是Socket7了而是全新的Socket370。370表示它有370个针脚,比Socket7 CPU的321针多出49针,所以两种Socket无法兼容。为了使原来Slot1的用户也能使用Socket370结构的CPU,又出现了一种Socket370到Slot1的转换卡。Socket370结构的赛扬除了接口不一样外,核心都是一样的。赛扬不支持Intel最新的SSE指令集,但它的结构有优于PentiumIII之处。赛扬的L2 Cache只有Pentium II和Pentium III的四分之一,但是其速度与处理器相同,这样的结果是运行一般运算负荷的应用程序,赛扬处理器比同级的Pentium II略差。赛扬和PentiumII/III另一个差异就是总线速度:赛扬的总线速度目前还是66MHz,以后才会有100MHz总线速度的赛扬。

     Xeon :至强处理器,主要是用于高端的NT服务器的,说明Intel对服务器CPU市场的高额利润垂涎已久,希望能分到一杯羹。Xeon系列处理器具有在x86时代从未见过的强大功能。它兼容前几代英特尔微处理器结构;PentiumII处理器采用P6微结构中的双独立总线结构和动态指令执行技术。Xeon 处理器具有内置的512KB甚至2MB字节的二级高速缓存,运行在和CPU一样的总线速度上,我们看到至强的SEC盒比PII的要高一倍,就是因为它内置全速二级缓存的缘故。至强最多支持到8个处理器,它的接口不在是Slot1了,而是Slot2接口,支持至强的芯片组是Intel的440GX。

    Intel PentiumIII :PentiumIII的时钟频率速度从PentiumII的顶级450MHz起跳,但这并不是Intel这颗最新处理器受到重视的原因。其受瞩目的原因是其在多媒体方面性能的增强,能加速需要密集处理运行的程序。PentiumIII新增加了70条指令集,是其他处理器所没有的:SSE新指令——专门设计来改善3D图形表现、3D声效及语音识别。再加上Pentium III能兼容MMX指令、SSE指令以及同步浮点运算,因此为游戏厂商和其他程序开发者提供了更多,更新方式的多媒体应用。





      最新的PentiumⅢ处理器是代号Coppermine(铜矿)的CPU,它采用0.18微米工艺,包括Slot 1(图片copperpic.jpg)及新式FC-PGA(图片fcpga1.jpg)封装二种型号,外频有100MHz和133MHz两种。为了有效降低处理器成本,英特尔在转到0.18微米工艺后,可以将二级高速缓存(L2 Cache)整合入芯片内,其二级高速缓存容量增加至256K;类似于内置128K的赛扬,可以采用Socket结构了。Coppermine可采用Socket插槽式的FC-PGA(Flip Chip-PGA)封装,以降低制造成本。依照英特尔的产品规划时程,在2000年3月份,Pentium Ⅲ处理器将全部转换至FC-PGA封装型式,即Pentium Ⅲ处理器将采用与Celeron处理器相同的Socket 370架构,现有的Slot 1架构Pentium Ⅲ处理器将成为历史。在PentiumⅢ处理器由Slot 1架构过渡至Socket 370架构的阶段中,英特尔仍将供应Slot 1结构的新款Pentium Ⅲ处理器,新款Slot 1结构的PentiumⅢ处理器的处理器电路板上已不见第二层高速缓存,全部整合入Coppermine核心内。
  




1-2 三国鼎立看主流

AMD


    AMD是一家值得敬佩的公司,要不是它紧紧咬住Intel不放,我们现在就不能买到如此便宜的CPU了。Intel一直想把AMD扼杀掉。 Intel在486之后就再也没有出过以阿拉伯数字命名的CPU,而是推出了一个拉丁文的Pentium,AMD也随即推出了自己设计并且生产的K5 CPU。K5系列CPU的频率一共有六种:75MHz/90 MHz /100 MHz /120 MHz /133 MHz /166 MHz,总线的频率和Pentium差不多,都是60 MHz或者66MHz。作为一款与Pentium竞争的产品,AMD的确做得非常出色,虽然在浮点运算方面比起Intel的来说是略逊一筹,但是在整数运算方面却一点也不比Intel差,由于K5系列CPU都内置了32KB的一级缓存,比Pentium内置的16KB多出了一倍,再加上它的体系结构一直比Intel的先进一些,因此在整数运算和系统整体性能方面甚至要比同样时钟频率的Pentium要高。
    K6: K6这款CPU的设计指标是相当高的,具有MMX技术、更多的片上一级高速缓存(32K指令、32K数据)和更深的流水线,可以并行地处理更多的指令,并运行在更高的时钟频率上。在整数运算方面,AMD无疑是做得非常成功的。由于K6具有更大的L1缓存,所以随着频率的增长,它能获得比Pentium MMX更显著的性能提升。K6稍微落后的地方是在运行需要使用到MMX或FP(浮点指令)的应用程序方面,比起同样频率的Pentium MMX,甚至没有MMX的奔腾都要差许多,这样就使K6在某些3D游戏方面的表现远不如Intel的出色了。另外,AMD的MMX单元一次只能处理一条指令,而Intel的MMX单元能够处理两条指令。因此K6 在执行MMX指令和浮点指令时性能要差一些。
    AMD的K6在处理某些MMX操作的时候具有比Intel的CPU更短的处理周期,但单个操作的吞吐量是一样的,而且较短的处理周期并不能弥补K6不能同时处理两个MMX指令的不足。虽然Intel的MMX CPU可以同时处理两个MMX指令,但它的MMX单元只含有一个乘法单元和一个移位单元,所以它不能同时进行这些关键操作。而且同时只能有一个MMX指令操作内存和整数寄存器在浮点处理方面起作用,因此K6在某些操作上的处理周期仍比Intel的短,但它每两个时钟周期才能开始一个操作,而Intel的芯片可以每个周期开始一个。最终的结果是对于许多浮点操作来说,AMD的芯片的吞吐量只能达到Intel芯片的一半。
    K6系列CPU一共有五种频率,分别是:166 MHz /200 MHz /233 MHz /266 MHz /300 MHz,五种型号都采用了66 MHz外频,但是后来推出的233 MHz /266 MHz /300 MHz已经可以通过升级主板的BIOS而支持100 MHz外频,是CPU的性能得到了一个飞跃。在倍频方面,K6系列是从2.5~4.5不等,核心电压则是有2.9V,3.2V,2.2V三种,特别值得一提的是他们的一级缓存都提高到了64KB,比MMX足足多了一倍,这也是K6的整数性能为什么要比MMX好的缘故了。
  1998年中,AMD最新K6-2处理器正式推出。这是首款采用3Dnow!技术的微软视窗操作系统兼容型X86微处理器。它采用了全新的硅晶体制造技术(C4倒装),这是由IBM开发的技术,将硅晶精度提高到了0.25微米,硬是将原来K6晶体面积(Die size)的168mm2降到了现在的68mm2,同时晶体数量也增加了50万个(成为930万个),其余结构基本同K6相同,L1 CACHE仍是64KB,但它的面积也比以前的小了,仅有原来的1/2大。此外它的工作电压也从2.9V/3.2V降到了2.2V。AMD在推出K6-2 CPU时,就率先加入3Dnow!浮点/3D加速技术,64位双路浮点缓存器,21条全新的3Dnow!指令集,加入单指令多数据指令(SIMD:Single Instruction,MultiDatas)。而AMD的3Dnow!技术,也随着K6-2的推出,立刻获得游戏厂商、软件厂商和图形卡驱动程序的支持,成为一项重要的工业标准。

K6-3处理器采用0.25微米线程,由二千一百三十万个晶体管组成。K6-3处理器是三层高速缓存(TriLevel)结构设计,K6-3处理器核心内建有64K的第一级高速缓存(Level 1)及256K的第二层高速缓存(Level 2),主机板上则配置第三级高速缓存(Level 3)。K6-3处理器的第一与第二层高速缓存总共320K,全部内建在处理器芯片核心内,与处理器的时钟频率相同,此高速缓存的执行速度与处理器同速运作(Full Speed)。K6-3的三层高速缓存(TriLevel)结构设计,可再支持配备在主机板上的1024K第三级高速缓存,在Super 7结构的主机板上,第三层高速缓存的时钟频率是100MHz。相较于Pentium Ⅱ仅具有32K第一层高速缓存与512K半速的第二层高速缓存,AMD的三层高速缓存结构能加大系统的高速缓存容量,以提升系统整体效能。

    K6-3处理器支持3D Now!指令集。3D Now!指令集与英特尔的KNI(Katmai New Instruction)指令集的功能类似,都是采用增加指令的方法加快3D绘图等多媒体处理及需要运用大量浮点运算的应用程序的运算速度。
    由于成本上和成品率方面的问题,K6-3处理器在台式机市场上并不是很成功,因此它将逐渐从台式机市场消失,将逐步转进笔记本市场。AMD将推出专供笔记型计算机使用的K6-3+版本处理器,K6-3+采0.18微米线程,芯片内建第二级高速缓存,除此,笔记型K6-3+将拥有自动升降电压的双模式功能(AMD代号为Gemini),类似于英特尔下一步将推出的笔记本型处理器。使用室内交流电供电时,K6-3+处理器拥有较高的时钟频率;若使用电池供电,则K6-3+处理器将自动降速,以延长电池的寿命。

    真正让AMD扬眉吐气的是原来代号K7的Athlon处理器。Athlon具备超标量、超管线、多流水线的Risc核心(3Way SuperScalar Risc core),采用0.25μ微米工艺,集成2,200万个晶体管,管芯面积为184mm,目前已经推出了更先进的0.18μ微米工的Athlon。下一步就是采用铜配线技术,AMD在制造工艺上向来就不落后于Intel。(图片athlon.jpg)
Athlon包含了三个解码器,三个整数执行单元(IEU),三个地址生成单元(AGU),三个多媒体单元(就是浮点运算单元),Athlon可以在同一个时钟周期同时执行三条浮点指令,每个浮点单元都是一个完全的管道。K7包含3个解码器,由解码器将解码后的macroOPS指令(K7把X86指令解码成macroOPS指令,把长短不一的X86指令转换成长短一致的macroOPS指令,可以充分发挥RISC核心的威力)送给指令控制单元,指令控制单元能同时控制(保存)72条指令。再把指令送给整数单元或多媒体单元。整数单元可以同时调度18条指令。每个整数单元都是一个独立的管道,调度单元可以对指令进行分支预测,可以乱序执行。K7的多媒体单元(也叫浮点单元)有可以重命名的堆栈寄存器,浮点调度单元同时可以调度36条指令,浮点寄存器可以保存88条指令。在三个浮点单元中,有一个加法器,一个乘法器,这两个单元可以执行MMX指令和3DNow指令。还有一个浮点单元负责数据的装载和保存。由于K7强大的浮点单元,使AMD处理器在浮点上首次超过了Intel的处理器。
    Athlon内建128KB全速高速缓存(L1 Cache),芯片外部则是1/2时频率、512KB容量的二级高速缓存(L2 Cache),最多可支持到8MB的L2 Cache,大的缓存可进一步提高服务器系统所需要的庞大数据吞吐量。
    Athlon的封装和外观跟Pentium Ⅱ的SECC卡匣相似,但Athlon采用的是Slot A接口规格。Slot A接口源于Alpha EV6Bus,时钟频率高达200MHz,使峰值带宽达到1.6GB/S,在内存总线上仍然兼容传统的100MHz总线,现在的PC-100 SDRAM还是可以用的,这样就保护了用户的投资,也降低了成本。今后还可以采用性能更高的DDRSDRAM,这和Intel力推的800MHz RAMBUS的数据吞吐量差不多。EV6总线最高可以支持到400MHz,可以完善的支持多处理器。所有具有天生的优势,要知道Slot1只支持双处理器而SlotA可支持4处理器。SlotA外观看起来跟传统    242pin的Slot1插槽很像,就像Slot1插槽倒转180度一样,但两者在电气规格、总线协议是完全不兼容的。Slot 1/Socket370的CPU,是无法安装到Slot A插槽的Athlon主板上,反之亦然。
    AMD为了进一步扩大3Dnow!软件平台的支持范围,同时拉近原先3Dnow!与SSE之间的差距,在Athlon处理器中提供了Enhanced 3Dnow!技术,新添加了24条指令。其中19条控制指令,刚好跟Intel在PentiumⅢ的SSE指令中,针对现有的64位MMX缓存器所添加的视频运算、内存快速预先读取指令是完全兼容的,因此针对PentiumⅢ的SSE指令集开发的软件,只需少许修改就能顺利转移到Athlon上,发挥强悍的MMX缓存器的SIMD加速性能。另一方面,Athlon增加5条新指令,可以使CPU像DSP芯片一样直接处理模拟/数字信号的转换工作。它可以运用在软调制解调器(Soft Modem)、ADSL网络转换传输及Dolby AC-3的解码上,而Intel的CPU到目前为止,还未提供类似功能的指令。显然在新一代处理器指令集的开发中,AMD又再度发挥了创新精神。
   讲了这么多,Athlon处理器实际效能如何呢?以同样是600MHz的Athlon与600MHz PentiumⅢ相比较(Xeon目前只到550MHz而已),Athlon的整数性能(CPUMark99、WinStone99),比同频的PentiumⅢ快了10%左右;而浮点性能更是Athlon扬眉吐气之处,WinBench99的FPUmark测试值虽然仅仅快了8%左右,但是以跨平台工业评估标准的SPECfp_base95的测试结果,则快了约38%;在3D性能方面, 3D WinBench的3D Winmark以及3DMark 99 Max等软件的测试下,均领先36~38%。在运行3D Studio Max R3.0时, Athlon平台在着色处理(Rendering)的速度,大约比PentiumⅢ快了33%。由于PentiumⅢ与PentiumⅢ Xeon的差别在于L2缓存的容量与速度(Xeon为全速L2缓存),如果拿只有512KB L2缓存的入门级Xeon处理器来比较,跑大多数软件时,Xeon只有整数性能比PentiumⅢ快一点,浮点性能两者完全相同。因此在Athlon vs PentiumⅢ&Xeon的实测结果,1/2频率的L2 Cache设计的Athlon,在任何软件的表现上都击败全速L2 Cache设计的Xeon处理器。
    最近AMD又推出了800MHz的Athlon;Athlon 800MHz处理器仍是SlotA结构,不过新款式的Athlon处理器皆是K75核心,800MHz的Athlon处理器即已采用0.18微米铝工艺,晶圆面积为102平方厘米,比起采用0.25微米线程制造的旧款式Athlon处理器,800MHz款式发热更低。
    由AMD公布的Athlon处理器与Pentium Ⅲ处理器效能测试数据显示,在Business Winstone 99(Windows NT 4.0)部分,Athlon 800MHz的测试值是42.5,Athlon 750MHz是41.4,Pentium Ⅲ 733MHz是41.3;在WinBench 99CPUmark 99部分,Athlon 800MHz的测试值是71.9,Athlon 750MHz是67.9,而Pentium Ⅲ 733MHz是65.8;在WinBench 99 FPU WinMark部分,Athlon 800MHz的测试值为4,370,Athlon 750MHz为4,103.3,Pentium Ⅲ 733MHz为3,890。
    因此AMD把Athlon处理器的定位,锁定在Xeon的等级,在价位上则定位在Xeon到PentiumⅢ之间,希望能打入商业、高阶工作站、服务器的市场,这应该是很具竞争力的市场策略。

1-2 三国鼎立看主流

Cyrix,IDT,RISE


    Cyrix 也算是一家老资格的CPU开发商了,早在X86时代,它和Intel,AMD就形成了三雄并立的局面。自从Intel开发了Pentium之后,Cyrix也很快推出了自己的新一代产品--5X86。5X86可以说是一款失败的产品,因为它的性能比起同频的Pentium要低不少,因此5X86在市场上仅昙花一现。
    自从Cyrix与美国国家半导体公司合并后,Cyrix拥有了自己的芯片生产线,其产品日益完善和完备。Cyrix的6x86是其投放到市场上的与Pentium兼容的处理器。它使用的是PR等级评定来进行CPU的标称。其PR-133CPU,运行在120MHz,性能却同Pentium 133是相同的。但其发热量很大。后期发布的是6x86LCPU,采用双电压设计,即核芯电压是3.3,I/O电压是5V。从而大大降低了CPU的发热量。到了MMX时代,Cyrix推出了他们的MX CPU,这一档次的CPU全是采用双电压设计,频率从166-233MHz,到266-300MHz时用MII来命名。Cyrix的MX CPU的整数性能是无与伦比的,但其MMX和FP性能和AMD一样,都比同档次的Pentium要差。
Cyrix作为非Intel阵营的另一个重要成员,1998年主要是在原有产品基础上进行改进,推出新的升级产品。1997年Cyrix曾推出了低价位和高集成度的Media GX,促进了1000美元以下PC机市场的兴起。Cyrix在1998年作的第一件事,就是把Media GX升级为具有MMX功能的版本。同时,Cyrix对它的拳头产品6X86MX作了进一步的改进,采用了新的名称MⅡ,并在1998年4月问世。MⅡ采用了更先进的技术,因此具有更快的内核速度和总线速度。


    1999年,Cyrix的CPU设计部门被VIA收购,为了继续向中、低端市场进攻,Cyrix又打算推出最新一代的CPU--Jushua。
Joshua处理器内建64K的第一级高速缓存及256K第二级高速缓存,处理器芯片核心总共内建320K全速高速缓存容量,而英特尔的Celeron仅内建128K高速缓存。Joshua处理器预计可支持100MHz及133MHz外频,内建加速3D绘图等多媒体运算指令集,时钟频率由433MHz开始起跳,接着有466MHz、500MHz、533MHz,目前初步规划至566MHz。据Cyrix表示,Joshua处理器设计将与Celeron处理器兼容,采用CPGA 370封装,处理器脚位、耗电、电源及热量规格要求皆符合Celeron处理器的规定,以利主机板厂商设计。


    美国IDT公司(Integrated Device Technology)作为新加入此领域的CPU生产厂商,一上来就把着眼点放在了低端市场上。1997年IDT推出的第一个微处理器产品是WinChip(即C6),由于问世较晚且生产规模也不大,因此在整个CPU市场上所占的份额很小,还不足1% 。1998年5月,IDE宣布了它的第二代产品WinChip 2 。WinChip2有两种版本,一种带有3DNow!指令集,命名为WinChip 2-3D;另一种不带3DNow!指令集,其命名为WinChip 2,没有后缀3D。WinChip 2在原有WinChip的基础上作了一些改进,增加了一个双指令的MMX单元,增强了浮点运算功能。改进后的WinChip 2比相同频率的WinChip性能提高约10%,基本达到Intel处理器的性能。
     1999年的第一季度里面,IDT发布了新处理器WinChip 2+NB,CPU内集成了主板北桥芯片,将会加快芯片到内存的存取速度。但此种做法有几个缺点:一是必须购买新主板;二是提高了芯片的面积,只够集成64K全速缓存到CPU中(性能与存取速度为3-1-1-1的256K二级缓存相当),毕竟,更大的一级缓存肯定比小量L1 cache+大量L2 cache要好。WinChip 2+NB使用0.25微米工艺制造,芯片面积约58平方毫米。在VIA收购了IDT的CPU设计部门后,新款的IDT的CPU Samuel将在2000年6月进入市场,其起始的主频将为500MHz,定位在低端1000美元以下的PC市场。
   另外一家CPU设计的公司是瑞思电子,该公司成立于1993年11月。Rise公司主要业务是为笔记本及1000美元以下市场开发基于Socket 7的x86兼容CPU-mP6。mP6的耗能很低,其中mP6-233的最大功率是8.2W,要知道K6-2 233MHz是9W,K6-2 266是9.8W,PII 266更高,为19.5W。另外mP6使用了特殊的电路来作芯片的能源管理工作,无须用户干涉,十分适合用作笔记本电脑的CPU。mP6使用Socket 7/Super 7兼容插座,现在正在和ALI合作生产主板芯片组,它可以提供100MHz总线、AGPX2支持、DVD软解压、软件调制解调器、高级电源管理系统。1999年10月12日,SiS(Silicon Integrated System)宣布取得Rise的微处理器技术转让,范围包括Rise所有的技术和相关的知识产权。预计将于2000年第4季推出集成处理器和芯片组的新产品,恰巧VIA和Intel同时也有新产品推出,可以预见的是,集成型CPU市场将进入激烈的竞争时期。

CPU最新发展情报

Intel公司近斯的发展计划

  1、“铜矿赛扬”将上市,主要是把Coppermine内核用于赛扬处理器,但是把“铜矿”的256KB Cache减少到128KB,以拉开产品线。今年第二季度Intel还会推出代号为“Willamette”处理器,一开始主频就是1GHz,并采用200MHz的背侧总线,不过不会是AMD用的EV6总线,将会是一种新的总线结构。
  2、64位的Itanium将在年中上市,Intel公司日前表示,它正在向电脑硬件和软件开发商提供采用Itanium微处理器原型产品的系统,以便让这些开发商开发基于Itanium微处理器技术的软、硬件产品。预计将于今年年中批量投放商业市场的Itanium微处理器,是Intel公司生产的第一种采用64位结构的微处理器。去年八月份,Intel公司宣布它已经成功制造出了第一枚Itanium微处理器。现在,它又开始向电脑软硬件开发商提供采用Itanium微处理器原型产品的服务器和工作站系统,用来加快未来采用这种新型微处理器的电脑系统和软件产品的开发工作。在此前大约一年多的时间里,电脑软硬件开发商都一直在使用模拟软件,来模拟Itanium微处理器和它的新64位结构环境。Intel日前表示,预计在明年第1季度,它将向电脑软、硬件厂商送出数千台采用64位Itanium微处理器的原型电脑系统,以便让它们开发出基于该处理器技术的软硬件产品。同时,Intel还在努力开发新的支持Itanium处理器的芯片组460GX。按Intel的计划,这些产品将在明年中期批量投放市场。
  3、Intel处理器的步伐,今年第一季度Intel将会推出850~866MHz的PⅢ,而第四季度会推出1GHz的CPU。不过PⅢ的大限是933MHz,Celeron则是633MHz。Intel 2000年的发展蓝图里最令人讶异的是BX主板芯片组的生命周期竟然会延续到今年第三季度,要等Camino 2或Solano 2出现之后,BX才会消失。而原来计划的815(Solano),则意外推迟到今年第二季度末才出现。简单的说,今年上半年的主流芯片组还是BX,在Value PC方面则是810以及少部份i810E为主。
  
AMD公司的发展计划
  1、AMD的64位处理器计划,AMD在其第八代微处理器中将采用“闪电数据传输”技术。这枚代号为SledgeHammer的处理器支持64位x86体系和系统总线,同时向后兼容32位x86技术,包括应用软件和操作系统。据AMD声称,其他任何64位技术都不能同时支持32位和64位x86技术。
  2、AMD的行军图,在2000年第一季度,K6-2+将成为AMD在低端用户市场的主流产品,它首先把K6-3内置的256K Cache减少到128KB,以降低成本和增加成品率。K6-2+最先推出的是版本是533MHz,跟使用Coppermine核心的新赛扬一样,采用0.18微米工艺制造,继续采用Super7结构。有趣的是,533MHz采用的是97MHz(97×5.5)外频,并不是133MHz外频,目前并没有多少Super7主板支持97MHz外频,但相信其能很容易在100MHz FSB上运行。
新的Athlon处理器将在第二季度出现:代号Spitfire(烈火)AMD K7的“Celeron”杀手,采用0.18铝芯片互连技术,“烈火”将会首先使用在“Socket A”插槽上,而不是目前的“Slot A”。“烈火”采用先进的K75核心,从700MHz的Athlon开始,都采用了新的K75核心。它包含新的3D Now!核心指令集,采用内置全速L2-Cache。随后发布代号Thunderbird(雷鸟)的专业级的Athlon处理器,同样采用0.18铝芯片互连技术,不过支持512K L2 Cache,是最后一款支持“Slot A”的AMD处理器,“雷鸟”很快与Spitfire一样使用在“Socket A”插槽上,“雷鸟”看起来跟新赛扬不是一个等级,采用更高速度的前端总线,性能会相当强劲。
  第三季度: "雷鸟”会转向使用0.18微米铜芯片互连技术。
代号Mustang(野马)号称“Athlon Ultra",Athlon的超级版本,采用0.18微米铜芯片技术,集成2MB L2 Cache,属于服务器级版本,支持133MHz DDR SDRAM和400MHz DDR DRDRAM,可提供2.1GB/秒的数据带宽,支持AMD-760,VIA KX266,Samsung's Caspian以及Micron Samuria DDR芯片组。

异军突起的威盛
  1、威盛Joshua处理器今年第一季度登场
Joshua处理器将以低价电脑市场为主要目标,威盛电子表示,Joshua处理器将以系统组装及OEM市场为主,同时仍会在零售市场上销售,不过在一般市场上,要求较高的升级狂们不会成为Joshua的用户。Joshua处理器将以组装新机消费者为重,提供较高的性价比。
  2、威盛继续延继IDT的生命
威盛还在进行以IDT WinChip C5核心的Samuel处理器的开发,不过推出时间较Joshua要晚,威盛预计在第三季度推出Samuel。由于WinChip C5处理器的芯片尺寸比一般处理器小,而且散热量相对少,所以更适合在笔记本电脑上使用,或是用在未来热门的信息家电产品上。不过,目前威盛并不排除Samuel可使用在桌面电脑领域内。和Joshua不同,Samuel以实际主频命名,预计有500MHz、550MHz、600MHz、650MHz,甚至会有700MHz以上的品种。它同样采用Socket 370结构,支持66MHz、100MHz和133MHz 前端总线和3D指令加强功能。
  3、威盛的其他动作
威盛朝低价计算机处理器市场发展策略明确,明年除上述处理器外,若进度顺利,整合型处理器可望在下半年推出,威盛预计明年拿到一成处理器市占率,若以每颗平均单价约76美元计算,估计明年CPU营收贡献将约10亿美元。

  微处理器市场的超级黑马,Transmeta正式上市
由微软创办人Paul Allen及前升阳(Sun)UltraSparc芯片首席工程师Dave Ditzel所创办的微处理器公司Transmeta正式亮相,该公司于近斯宣布推出与英特尔x86兼容的Crusoe家族产品。

  

   该公司表示,将一连推出适用于手持式装置及IA产品的TM3120处理器,及适用于笔记型计算机的TM5400处理器,两者均采超长指令字符(VLIW)结构。其中,采0.22微米线程、交由IBM生产的TM3120处理器率先登场,至于采0.18微米线程的TM5400,则将在今年中问世。
TM3120处理器的运算时钟为400MHz,主要市场为手持式装置及Linux操作系统的信息家电(IA)产品。Torvalds表示,适用于这些产品的操作系统Mobile Linux,也将随之推出。
    TM5400的目标则对准Windows操作系统的笔记型计算机,运算时钟为500~700MHz,同时把250MHz的L2 Cache整合至芯片内,并运用电源管理技术,使得该芯片耗电量仅有1瓦,一般运用的电池效力可达8小时,如果需执行较大运算量的软件,其耗电量也不超过2瓦,电池效力达3~4个小时。
和Intel刚刚发布的含有Intel SpeedStep技术的笔记本专用PentiumⅢ处理器做比较。PentiumⅢ芯片在插电时的耗电量为11瓦,用电池时则为6瓦。至于Transmeta的TM5400的耗电量仅在1瓦,主要由于该芯片的结构设计,及该公司发展出的LongRun电源管理技术,在省电模式下,可减少更多的耗电量。
Transmeta芯片的特色是利用软件将Intel芯片所能执行的指令集,转换为Transmeta芯片执行的语言,转换过后的指令集可重复使用,不需再行转换,但缺点是在转换的过程中,会有一小段时间的落差,使得同时钟速率的Transmeta芯片,性能仍落后于Intel。对此,Transmeta的解释是,这主要源于测试速度的指针软件把此段落差计算进去。
    英特尔近来逐步加重笔记型计算机及IA产品的比例,Transmeta的出现,势必对英特尔有所影响,不过,分析师指出,Transmeta芯片的制造成本及市场接受程度,仍是未来需要观察的重点。
另外,在手持式装置方面,Transmeta所遭遇到的竞争对手,可能不仅于英特尔,同时尚有日立(Hitachi)、MIPS等,而且产品通常需通过较长的验证过程时间,系统设备厂商是否采用,也将是这个新兴公司所碰到的考验。
发表于 2005-5-29 16:34:18 | 显示全部楼层 来自: 河南省平顶山市 电信
看来楼主是个电脑高手,偶要跟着好好学习
发表于 2005-5-30 18:02:38 | 显示全部楼层 来自: 福建省福州市连江县 电信
偶要跟着好好学习
发表于 2005-6-4 09:45:46 | 显示全部楼层 来自: 浙江省宁波市北仑区 电信
好好学习
楼主继续啊!!!!
您需要登录后才可以回帖 登录 | 注册会员

本版积分规则

论坛地图|手机版|小黑屋|Archiver|颜色表|下载APP客户端|编织人生 ( ICP12028468-2 )

GMT+8, 2025-4-26 07:51

Powered by Discuz! X3.4

Copyright © 2001-2021, Tencent Cloud.

快速回复 返回顶部 返回列表