×
嵌入式 > 嵌入式开发 > 详情

带宽 前端总线 QPI总线

发布时间:2022-07-05 发布时间:
|
带宽(band width)又叫频宽,是指在固定的的时间可传输的资料数量,亦即在传输管道中可以传递数据的能力。在数字设备中,频宽通常以bps表示,即每秒可传输之位数。在模拟设备中,频宽通常以每秒传送周期或赫兹 (Hz)来表示。

频宽对基本输出入系统 (BIOS ) 设备尤其重要,如快速磁盘驱动器会受低频宽的总线所阻碍。
对于带宽的概念,比较形象的一个比喻是高速公路。单位时间内能够在线路上传送的数据量,常用的单位是bps(bit per second)。计算机网络的带宽是指网络可通过的最高数据率,即每秒多少比特。
严格来说,数字网络的带宽应使用波特率来表示(baud),表示每秒的脉冲数。而比特是信息单位,由于数字设备使用二进制,则每位电平所承载的信息量是1(以2为底2的对数,如果是四进制,则是以2为底的4的对数,每位电平所承载的信息量为2)。因此,在数值上,波特与比特是相同的。由于人们对这两个概念分的并不是很清楚,因此常使用比特率来表示速率,也正是用比特的人太多,所以比特率也就成了一个带宽事实的标准叫法了。
描述带宽时常常把“比特/秒”省略。
例如,带宽是10M,实际上是10Mb/s。
这里的M 是10^6。
“带宽”有以下两种不同的意义:
1.指信号具有的频带宽度。信号的带宽是指该信号所包含的各种不同频率成分所占据的频率范围。
2.在计算机网络中,带宽用来表示网络的通信线路所能传送数据的能力,因此网络带宽表示在单位时间内从网络中的某一点到另一点所能通过的“最高数据率”。
在网络中有两种不同的速率:
信号(即电磁波)在传输媒体上的传播速率(米/秒,或公里/秒)
计算机向网络发送比特的速率(比特/秒)
这两种速率的意义和单位完全不同。
在理解带宽这个概念之前,我们首先来看一个公式:带宽=时钟频率x总线位数/8,从公式中我们可以看到,带宽和时钟频率、总线位数是有着非常密切的关系的。其实在一个计算机系统中,不仅显示器、内存有带宽的概念,在一块板卡上,带宽的概念就更多了,完全可以说是带宽无处不在。
那到底什么是带宽呢?带宽的意义又是什么?简单的说,带宽就是传输速率,是指每秒钟传输的最大字节数(MB/S),即每秒处理多少兆字节,高带宽则意味着系统的高处理能力。为了更形象地理解带宽、位宽、时钟频率的关系,我们举个比较形象的例子,工人加工零件,如果一个人干,在大家单个加工速度相同的情况下,肯定不如两个人干的多,带宽就像是加工零件的总数量,位宽仿佛工人数量,时钟工作频率相当于加工单个零件的速度,位宽越宽,时钟频率越高则总线带宽越大,其好处也是显而易见的。
主板上通常会有两块比较大的芯片,一般将靠近CPU的那块称为北桥,远离CPU的称为南桥。北桥的作用是在CPU与内存、显卡之间建立通信接口,它们与北桥连接的带宽大小很大程度上决定着内存与显卡效能的大小。南桥是负责计算机的I/O设备、PCI设备和硬盘,对带宽的要求,相比较北桥而言,是要小一些的。而南北桥之间的连接带宽一般就称为南北桥带宽。随着计算机越来越向多媒体方向发展,南桥的功能也日益强大,对于南北桥间的连接总线带宽也是提出了新的要求,在INTEL的9X5系列主板上,南北桥的带宽将从以前一直为人所诟病的266MB/S发展到空前的2GB/S,一举解决了南北桥间的带宽瓶颈。
带宽是显示器非常重要的一个参数,能够决定显示器性能的好坏。所谓带宽是显示器视频放大器通频带宽度的简称,一个电路的带宽实际上是反映该电路对输入信号的响应速度。带宽越宽,惯性越小,响应速度越快,允许通过的信号频率越高,信号失真越小,它反映了显示器的解像能力。该数字越大越好。
带宽是代表显示器显示能力的一个综合指标,指每秒钟所扫描的图素个数,即单位时间内每条扫描线上显示的频点数总和,以MHz为单位。带宽越大表明显示控制能力越强,显示效果越佳。
带宽的详细计算公式如下:理论上带宽 B=r(x) ×r(y) ×V
r(x)表示每条水平扫描线上的图素个数
r(y)表示每桢画面的水平扫描线数
V 表示每秒画面刷新率(即场频)
B 表示带宽
再来说说显卡,玩游戏的朋友都晓得,当玩一些大制作游戏的时候,画面有时候会卡的比较厉害。其实这就是显卡带宽不足的问题,再具体点说,这是显存带宽不足。众所周知,目前当道的AGP接口是AGP 8X,而AGP总线的频率是PCI总线的两倍,也就是66MHz,很容易就可以换算出它的带宽是2.1GB/S,在目前的环境下,这样的带宽就显得很微不足道了,因为连最普通的ATI R9000的显存带宽都要达到400MHZ X 128Bit/8=6.4GB/s,其余的高端显卡更是不用说了。正因为如此,INTEL在最新的9X5芯片组中,采用了PCI-Express总线来替代老态龙钟的AGP总线,与传统PCI以及更早期的计算机总线的共享并行架构相比,PCI Express最大的特点是在设备间采用点对点串行连接,如此一来即允许每个设备都有自己的专用连接,不需要向整个总线请求带宽,同时利用串行的连接特点将能轻松将数据传输速度提到一个很高的频率。在传输速度上,由于PCI Express支持双向传输模式,因此连接的每个装置都可以使用最大带宽。AGP所遇到的带宽瓶颈也迎刃而解。
为了在实际使用计算机的过程中得到更多总线带宽,根据带宽的计算公式,一般会采取两种办法,一是增加总线速度,比如INTEL的P4 CPU和赛扬CPU就是最好的例子,一个是400总线,一个是533/800总线,在实际应用的效能就有了很大的区别(当然,二级缓存也是一个重要的因素)。另外一个常用的方法是增加总线的宽度,如果当它的时钟速度一样时,总线的宽度增加一倍,那么尽管时钟下降沿同未改变之前是相同而此时每次下降沿所传输的数据量却是以前的两倍,这一点在相同核心,但是显存位宽却不一样的显卡上表现特别明显。

什么是前端总线:“前端总线”这个名称是由AMD在推出K7 CPU时提出的概念,但是一直以来都被大家误认为这个名词不过是外频的另一个名称。我们所说的外频指的是CPU与主板连接的速度,这个概念是建立在数字脉冲信号震荡速度基础之上的,而前端总线的速度指的是数据传输的速度,由于数据传输最大带宽取决于所有同时传输的数据的宽度和传输频率,即数据带宽=(总线频率×数据位宽)÷8。目前PC机上所能达到的前端总线频率有266MHz、333MHz、400MHz、533MHz、800MHz、1066MHz、1333MHz几种,前端总线频率越大,代表着CPU与内存之间的数据传输量越大,更能充分发挥出CPU的功能。现在的CPU技术发展很快,运算速度提高很快,而足够大的前端总线可以保障有足够的数据供给给CPU。较低的前端总线将无法供给足够的数据给CPU,这样就限制了CPU性能得发挥,成为系统瓶颈。

前端总线的英文名字是Front Side Bus,通常用FSB表示,是将CPU连接到北桥芯片的总线。选购主板和CPU时,要注意两者搭配问题,一般来说,如果CPU不超频,那么前端总线是由CPU决定的,如果主板不支持CPU所需要的前端总线,系统就无法工作。也就是说,需要主板和CPU都支持某个前端总线,系统才能工作,只不过一个CPU默认的前端总线是唯一的,因此看一个系统的前端总线主要看CPU就可以。

北桥芯片负责联系内存、显卡等数据吞吐量最大的部件,并和南桥芯片连接。CPU就是通过前端总线(FSB)连接到北桥芯片,进而通过北桥芯片和内存、显卡交换数据。前端总线是CPU和外界交换数据的最主要通道,因此前端总线的数据传输能力对计算机整体性能作用很大,如果没足够快的前端总线,再强的CPU也不能明显提高计算机整体速度。数据传输最大带宽取决于所有同时传输的数据的宽度和传输频率,即数据带宽=(总线频率×数据位宽)÷8。目前PC机上所能达到的前端总线频率有266MHz、333MHz、400MHz、533MHz、800MHz几种,前端总线频率越大,代表着CPU与北桥芯片之间的数据传输能力越大,更能充分发挥出CPU的功能。现在的CPU技术发展很快,运算速度提高很快,而足够大的前端总线可以保障有足够的数据供给给CPU,较低的前端总线将无法供给足够的数据给CPU,这样就限制了CPU性能得发挥,成为系统瓶颈。显然同等条件下,前端总线越快,系统性能越好。

QPI
intel的全新架构,Bloomfield将采用全新的LGA 1366 Socket,Package Size为42.5 x 45mm,散热器设计虽然和LGA 775类似,但Mounting Holes为80mm,相较LGA775的72mm2更大,因此散热器不能另相兼容,VRM采用全新的11.1版本,最高TDP为130W 。
利用双向串联点对点传输,它可提供与FSB相近的Latency,可让软件及操作系统管理,并且针对部份Streams(Threading、ISOC、LT/VT)及out of order requests作出了优化,单向最高速度暂 定为6.4GT/s,双向最高速合共10.8GT/s,相比AMD采用的Hyper-Transport 3.0的速度更高。

Intel的QuickPath Interconnect技术缩写为QPI,译为快速通道互联。事实上它的官方名字叫做CSI,Common System Interface公共系统界面,用来实现芯片之间的直接互联,而不是在通过FSB连接到北桥,矛头直指AMD的HT总线。无论是速度、带宽、每个针脚的带宽、功耗等一切规格都要超越HT总线。

QPI最大的改进是采用单条点对点模式下,QPI的输出传输能力非常惊人,在4.8至6.4GT/s之间。一个连接的每个方向的位宽可以是5、10、20bit。因此每一个方向的QPI全宽度链接可以提供12至16BG/s的带宽,那么每一个QPI链接的带宽为24至32GB/s。(不过,这仍是逊色于AMD的Hypertransport3---单条连接最大传输带宽可以达到45GB/s,但我们相信未来英特尔仍会对QPI进行进一步提速改进。)在早期的Nehalem处理器中,Intel预计使用20bit的链接位宽,大约能提供25.6GB/s的数据传输能力。这个数字是Intel在上一季IDF中公布的。举例来说,在X48芯片组中,FSB的速度为1600MHz,这是目前为止规格最高的FSB总线了。不过最初的QPI总线具备25.6GB/s的吞吐量,这个值相当于1600MHz FSB带宽的2倍。

QPI技术特点——效率更高

此外,QPI另一个亮点就是支持多条系统总线连接,Intel称之为multi-FSB。系统总线将会被分成多条连接,并且频率不再是单一固定的,也无须如以前那样还要再经过FSB进行连接。根据系统各个子系统对数据吞吐量的需求,每条系统总线连接的速度也可不同,这种特性无疑要比AMD目前的Hypertransport总线更具弹性。

例如,针对服务器的Nehalem处理器将拥有至少4组QPI传输,可至少组成包括4枚处理器的4路高端服务器系统(也就是16枚运算内核至少32线程并行运作)。而且在多处理器作业下,每颗处理器可以互相传送资料,并不需经过芯片组,从而大幅提升整体系统性能。随着未来Nehalem架构的处理器集成内存控制器、PCI-E 2.0图形接口乃至图形核心,QPI架构的优势将进一步发挥出来。

为了降低QPI总线的延迟,Intel打算在4路处理器以上的系统中使用一种叫做粘贴缓存的技术。它主要是倚靠更大容量的二级高速缓存来存储南桥和北桥的数据,使处理器不必反复通过QPI总线来读取南北桥信息。同时,为了更高提升数据处理效率,英特尔还将在处理器内部集成内存控制器(IMC)。QPI和IMC结合,可以让Intel更轻松地扩展多路系统和高性能计算(HPC)应用,而Intel现有的处理器架构更关注于指令执行引擎和缓存架构,以便在单线程应用中提高性能,导致双路服务器平台性能受限,也无法在对内存带宽需求甚高的HPC中发挥作用。对于第一代采用QPI总线的Nehalem Xeon来说,集成了3通道的DDR3内存控制器,这样在搭配DDR3 1066的情况下,每个处理器自己就能得到25.6GB/s的内存带宽,大概是现在Tigerton系统的5倍,并且这个带宽数量随着处理器插座的增长而增长,对于四插座系统,总的带宽将增长到恐怖的102.4GB/s。强大的内存性能将保证即使每个插座上边采用8核心的处理器,内存带宽也不会成为性能发挥的瓶颈。需要说明的是在QPI中,对于四路系统来说,任何两个处理器之间都可以直接通信,这样,一个处理器可以很方便的访问到其他处理器控制的内存,这可以大大提升效率。另外,由于在QPI系统下不同处理器可以直接通信,同步缓存称为很方便的事情,再也不用通过北桥的内存读写来进行了。

结语:

随着QPI的正式推出,英特尔主导的QPI及AMD的HT 两大未来总线系统将会正面冲突。为了让多核心的系统更高效的工作,我们相信今后的芯片组会更加复杂,多条系统总线连接才是今后系统总线发展的王道。需要说明的是,英特尔在季秋IDF是已经在展示了可以工作的、首个采用QPI互联架构的Nehalem平台。我们有理由相信,QPI将冲破内存性能带来的樊篱,实现性能的新飞跃。



『本文转载自网络,版权归原作者所有,如有侵权请联系删除』

热门文章 更多
mini 2440 test 的Delay函数分析