`

处理器运算位数

 
阅读更多
转自:http://publish.it168.com/cword/3401.shtml

    CPU的位宽对CPU性能的影响绝不亚于主频。位宽是指微处理器一次执行指令的数据带宽。处理器的寻址位宽增长很快,业界已使用过4、8、16位寻址再到目前主流的32位,而64位寻址浮点运算已经逐步成为CPU的主流产品。
    受虚拟和实际内存尺寸的限制,目前主流的32位CPU在性能执行模式方面存在一个严重的缺陷:当面临大量的数据流时,32位的寄存器(注:为了处理数据,暂时储存结果,或者做间接寻址等等动作,每个处理器都具备一些内建的内存,这些能够在不延迟的状态下存取的内存就称为“寄存器”,每个寄存器的大小都相同)和指令集不能及时进行相应的处理运算。
    32位CPU一次只能处理32位,也就是4个字节的数据;而64位CPU一次就能处理64位即8个字节的数据。如果我们将总长128位的指令分别按照16位、32位、64位为单位进行编辑的话:旧的16位CPU(如Intel 80286 CPU)需要8个指令,32位的CPU需要4个指令,而64位CPU则只要两个指令。显然,在工作频率相同的情况下,64位CPU的处理速度比16位、32位的更快。





位宽原理示意图


    可以比较一下图中的32位与64位CPU,64位的代码流的数量没有改变,其宽度随着指令代码的宽度而变化;而数据流的宽度则增加了一倍。虽然理论上在一个时钟周期内64位系统处理的数据量是32位系统的两倍,但理论和现实通常都是有差距的。
 要注意的是,CPU不只需要位宽够宽的寄存器,也需要足够数量的寄存器,以确保大量数据处理。因此为了容纳更多的数据,寄存器和内部数据通道也必须加倍,因此在64位CPU中的寄存器位数一般是32位CPU中的两倍。
 不过,虽然寄存器位数增加了,但正在执行指令的指令寄存器却都是一样的,即数据流加倍而指令流不变。此外,增加数据位数还可以扩大动态范围。在通常使用的十进制中,只能得到最多10个整数(一位数情况下),这是因为0~9中只有10个不同的符号来表示相应的意思,想要表示10以上的数就需要增加一位数,两位数(00-99)才可以表示100个数。
 可以得出十进制的动态范围的计算公式:DR=10n (n表示数字位数)。在二进制体系中,相应的我们可以得到公式:DR=2n,那么目前使用的32位就可以达到232=4.3×109,升级到64位之后,就可以达到264=1.8×1019。动态范围扩大了43亿倍。
    提示:扩大动态范围可以在一定程度上提高寄存器中数据的准确性。比如,当使用32位系统处理气象模拟运算任务时,当处理的数据超过32位所能提供的最大动态范围时,系统就会出现诸如Overflow(超过了最大正整数)或Underflow(低于最小的负整数)的错误提示,这样寄存器中的数据就无法保证准确。
 除了运算能力之外,与32位CPU相比,64位CPU的优势还体现在系统对内存的控制上。由于地址使用的是特殊的整数,而64位CPU的一个ALU(算术逻辑运算器)和寄存器可以处理更大的整数,也就是更大的地址。
 传统32位CPU的寻址空间最大为4GB,使得很多需要大容量内存的大规模的数据处理程序在这时都会显得捉襟见肘,形成了运行效率的瓶颈。而64位的处理器在理论上则可以达到1800万个TB(1TB=1024GB),将能够彻底解决32位计算系统所遇到的瓶颈现象。
 当然64位寻址空间也有一定的缺点:内存地址值随着位数的增加而变为原来的两倍,这样内存地址将在缓存中占用更多的空间,其他有用的数据就无法载入缓存,从而引起了整体性能一定程度的下降。
  • 大小: 12.3 KB
分享到:
评论

相关推荐

    双旋光器结构的可重构三值光学处理器

    针对三值光计算机进行逻辑运算时处理器的数据位与像素位在数量对应关系上的差别,提出了一种新的典型光路结构——双旋光器结构来提高光学处理器的重构速度,减少数据位数的管理难度。利用提出的结构实现了以行为单位的...

    采样式仪器测量不确定度评定模型 (2010年)

    针对基于采样法的数字仪器,提出一种合成不确定度评定模型。...仿真实验验证了所得到的测量结果合成标准不确定度与模数转换位数、定点运算位数或浮点运算位数、信噪比采样样本数之间的解析关系的有效性。

    微机原理课后答案(钱晓捷版)

    (1) 计算机字长指的是处理器每个时间单位处理的二进制数据位数(例如一次进行运算、传输的位数) (2) 总线信号分成数据总线(DB:Data Bus)、地址总线(AB:Address Bus)、控制总线(CB:Control Bus)三组 (8) ...

    Delphi 检测CPU型号、显示处理器速度信息.rar

    Delphi 检测CPU型号,测试CPU速度信息,取得中央处理器型号、运算速度、以及浮点CPU型号,并可获取系统CPU详细信息,比如CPU是intel 结构还是AMD结构、页面大孝最低内存地址、最高内存地址、遮罩位数、CPU核心数目、...

    DSP接口电路设计与编程

    本书以ADSP2106x、ADSP2116x系列高性能浮点DSP为主,介绍了以数字信号处理器(DSP)为核心的实时数字信号处理的系统设计,详细论述了DSP与多种外围接口电路的设计方法,包括各种存储器、模数和数模转换电路、异步串行...

    RSA可扩展公钥处理器的高速实现 (2006年)

    RSA算法可以使用Montgomery算法来实现,但速度较慢。...该硬件系统有足够的灵活度以扩展到多种不同长度的数据运算,可以实现1024,2 048位等不同位数RSA运算。在1024位的情况下,最终可以达到8 800次/s的加密速度。

    计算机软硬件基础知识.doc

    总线的 位数决定了计算机可同时处理的位数,这一数目也就是计算机中"字"的长度。16位计算 机中"字"长16位,而32位计算机中"字"长32位。 数据总线将CPU与内存相连,并提供计算机外部设备的通道。 地址总线 内存由许多...

    《计算机应用基础》客观题附答案.doc

    A、处理器的时钟频率是2.4 GHz B、处理器的运算速度是2.4 GIPS C、处理器是Pentium4第2.4代 D、处理器与内存间的数据交换速率是2.4GB/S 4. 把用高级程序设计语言编写的程序转换成等价的可执行程序,必须经过___C___...

    硬件检测工具全套

    Super PI 这是利用CPU的浮点运算能力来计算出π(圆周率),所以目前普遍被超频玩家用做测试系统稳定性和测试CPU计算完后特定位数圆周率所需的时间。 3DMARK 这是一款多功能的性能测试工具。但由于体积庞大未收入...

    《计算机应用基础》客观题附答案.docx

    A、处理器的时钟频率是2.4 GHz B、处理器的运算速度是2.4 GIPS C、处理器是Pentium4第2.4代 D、处理器与内存间的数据交换速率是2.4GB/S 4. 把用高级程序设计语言编写的程序转换成等价的可执行程序,必须经过___C___...

    verilog+牛客网刷题自己编写代码汇总+时序分析+状态机等+刷题学习

    VL6 多功能数据处理器 VL7 求两个数的差值 VL8 使用generate…for语句简化代码 VL9 使用子模块实现三输入数的大小比较 VL10 使用函数实现数据大小端转换 02 组合逻辑 VL11 4位数值比较器电路 VL12 4bit超前进位加法...

    bitArray.js:用于存储和操作布尔值的位数组的简单、注释良好的纯 Javascript 实现

    在幕后,该库对无符号 8 位整数使用按位运算,因此它的内存和处理器消耗处于绝对最小值。 有哪些使用案例? 最初开发这个库是为了帮助学习存储库 ,这是一个测试驱动的存储库,可帮助 JavaScript 开发人员创建过滤...

    数字信号处理模块初步设计方案.pdf

    1.5 信号处理需求 光接收主模块连续输出数字信号数据,采样率 250kHz,位数 16bit,需要进行 1/10 降采样,供后续信号处理使用。 每 80ms 对接收的信号进行 1024 点处理(降采样后的 1024 点约为 40ms) ,运算包括...

    【奥鹏】大工19秋《计算机原理》在线作业3参考资料.pdf

    该题正确选项:正确 16.PPU 是一种通道结构的处理器,通常称为输入输出处理器。 该题正确选项:错误 17.DMA 的数据传送是以字节为基本单位进行的。 该题正确选项:错误 18.软堆栈的优点是速度快,缺点是容量小。 该题...

    2014计算机作业1答案.doc

    操作系统的基本功能有:系统资源的管理,处理器管理,存储器管理,文件 管理,I/O 设备管理,人机界面接口管理。操作系统是最基本的系统软件,其 他的所有软件都是建立在操作系统的基础上。 在Word2010中,如何取消...

    北航《计算机接口技术》在线作业二15秋满分答案.doc

    带有处理器的设备一般称为______设备。 A. 智能化 B. 交互式 C. 远程通信 D. 过程控制 -----------------选择:A 4. 计算机执行乘法指令时,由于其操作较复杂,需要更多的时间,通常采用______控制方 式。 A. 延长...

    TI第七代DSPTMS320VC5402的最小系统板设计.doc

    修正的哈佛结构中,允许在程序和数据空间之间传送数据,从而使处理器具有在单个周期内同时执行算术运算、逻辑运算、位操作、乘法累加运算以及访问程序和数据存储器的强大功能。与修正的哈佛结构相配合, TMS320VC...

    计算机基础知识试题(1).docx

    输出设备9、某种计算机的内存容量是640k,这里的640k容量是指多少个字节( c) a.640 b.640*1000 c.640*1024 d.640*1024*102410、计算机的运算速度取决于给定的时间内,它的处理器所能处理的数据量。处理器一次能...

    20年春北交《计算机组成原理(专)》在线作业一.docx

    准16位处理器 B.64位处理器 C.32位处理器 D.16位处理器 19.1946年研制成功的第一台电子数字计算机称为______,1949年研制成功的第一台程20年春北交《计算机组成原理(专)》在线作业一全文共12页,当前为第6页。...

    大工21秋《计算机原理》在线作业3-【答案】.doc

    【A.】错误 【B.】正确 【本题-标准-答案】:B 16.PPU是一种通道结构的处理器,通常称为输入输出处理器。 【A.】错误 【B.】正确 【本题-标准-答案】:A 17.DMA的数据传送是以字节为基本单位进行的。 【A.】错误 【B...

Global site tag (gtag.js) - Google Analytics