商用微处理器目前的设计,以及这些处理器在计算机内的布置方式,已有20多年的历史,早已过时。其效率的低下,阻碍了计算机业最大限度地利用半导体领域的技术进步提高性能。 德克萨斯州的科学家已着手尝试克服这些瓶颈,如布线和记忆存取等,他们要为主流计算机开发一个更好的设计。IBM的奥斯丁实验室(Austin laboratory)正和德克萨斯大学联手进行一项研究项目,生产一种“超级计算机单芯片”(supercomputer-on-a-chip)。一旦放大规模,此种芯片结构将能在一张硅片上每秒处理多达1万亿次数学运算。
计算机研究人员爱用行话和字母缩写,这些德克萨斯的研究人员也不例外。他们的项目名叫Trips,即万亿次高可靠智能适应性处理系统(Tera-op Reliable Intelligently adaptive Processing System),而该系统使用的结构被称为Edge,即直接数据流图像执行(Explicit Dataflow Graph Execution)。
Edge和目前使用的结构,如精简指令集运算(Risc)、超长指令字(VLIW)有重要的不同。其最大的区别在于,Edge具有更大的适配性。
“这种系统将提供前所未有的灵活性,它能和许多不同种类的软件一起运行,包括桌面电脑、信号处理、图像、游戏、服务器、科研及嵌入式应用等,”该项目在德克萨斯大学的联合领导人道格8226;伯格(Doug Burger)说。
由数字电路构成的网格使这种适配性成为可能,这种网格利用程序中数据的自然流动。网格可以改变,使一张芯片能够高效率执行多项任务,而目前这些任务靠不同的专门处理器完成。
研究人员已经确定了Trips原型的设计,他们希望能在明年年底前完成设计。这将是一个性能相对不太高的芯片,有2.5亿个晶体管,运行速率为500兆赫(每秒5亿周期)。
美国国防部先进研究项目局(DARPA)对该芯片的设计和生产给予了1100万美元的资助。该局长期赞助具有重要民用及军用价值的前瞻性科技项目。正是该机构的拨款使互联网于60年代后期问世。
德克萨斯的科学家们想要显示全面工业开发的可行性,即可以生产1万兆赫(每秒100亿周期)的芯片,这种芯片每秒能够执行1万亿次运算。这便是“万亿次运算”(tera-op)之称的由来。
如今,在全球计算机行业最强大的500台计算机中,一张万亿次运算的芯片大约位于中游水平。居榜首的是日本的“地球模拟器”( Earth Simulator),它能达到36万亿次,但它装在320个大柜子里,充斥着一幢长65米、宽50米的建筑。
设计Trips的初衷源于对现有设计结构的不满。德克萨斯大学的另一位研究员史蒂芬8226;凯克勒(Stephen Keckler)认为,目前的设计结构“已使用了20多年,不适应新兴的半导体技术”。
他指出,在过去的十年里,业界一直是通过“拨快时钟”,换句话说,加快每秒运行的周期数来提高微处理器性能。英特尔(Intel)将其在大众市场销售的x86处理器,从1990年的33兆赫升级到了如今的3400兆赫,14年中提高了100倍。但该公司在推出最新的奔腾4处理器时,拨快时钟的速度要大大慢于以往。
“这种方式的极限差不多要到了,”凯克勒博士说。功率局限性将阻碍时钟速度的进一步增大,与此同时,“管线处理”,即一种让处理器同时执行数个指令的技术,也已经走到尽头。
“由于当前设计的成效已减小,领先的业界设计人员正开始寻找新的方式,”伯格博士补充说,“进一步的性能提高,将不得不来自每一周期完成许多次运算,而这恰是现有结构无法有效做到的。”
显然,有一种方法是将许多传统的处理器放在一张芯片上。但对处理器设计师而言,这无异于放弃努力,而“把提高性能的使命推给软件程序师,”伯格先生说道。
Trips要把芯片设计师留在提高计算机性能的驾座上。其芯片原型将能在每个时钟周期执行16个不同的运算任务,而其不同寻常的记忆结构,就是为速度和灵活性的最大化而设计的。
尽管全球最大的计算机企业IBM全力支持Trips的研发,这种芯片的卓越性能也令人看好,但该原型还是要向人们展现,它在不需要额外电能耗费的情况下,性能能够超越现有的高端设备。业界还要过数年才能判断是否采用这种新结构。