4.9. Процессоры Motorola.

Motorola/IBM процессор PowerPC620 это первая 64-битовая реа­лизация архитектуры PowerPC. Имея 64-битовые регистры и внутренние магистрали данных и семь миллионов транзисторов, новому процессору требуется почти вдвое больший и сложный кристалл, чем у PowerPC 604. Модель 620 имеет четырехканальную суперконвейерную схему с шестью исполнительными устройствами: три целочисленных АЛУ, блок плавающей точки, блок загрузки/записи и блок переходов. Последний способен на четырехуровневое предсказание ветвлений в программе и условное ис­полнение с использованием схемы переименования регистров.

ПО микроархитектуре RISC-ядра 620-й похож на 604-й. Отличия сводятся в основном к ширине регистров и магистралей данных, а так­же к увеличенному числу станций резервирования для условного испол­нения команд. Прибавка производительности достигнута за счет улуч­шенного шинного интерфейса. Теперь он имеет 128-битовый интерфейс к памяти, по которому за один цикл обращения можно выбрать два 64-би­товых длинных слова, и 40-битовая шина адреса, по которой можно ад­ресовать до одного терабайта физической памяти.

В состав шинного интерфейса входить также поддержка кэш-па­мяти второго уровня объемом до 128 Мбайт, которая может работать на четверти, половине или на полной скорости ЦПУ.

 

5. Лабораторные испытания и тестирование микропроцессоров.

5.1. Лабораторные испытания процессоров i386DX.

В 1992 году на рынке появилось три новых МП, способных за­местить существующие 386DX и обеспечить повышение характеристик сис­тем на основе i386. Это: Intel RapidCAD, Chips& Technologies 38600DX, и Cyrix 486DLC. В настоящий момент предлагаются только версии 33 МГц, хотя C&T и Cyrix обещают выпустить в начале 1993 года вариант 40 МГц. Конечно, на такой частоте можно заставить работать и 33 МГц вариант, но мой опыт показывает, что это ненадежно, в любой момент машина может зависнуть. Intel RapidCAD распространяется, как про­дукт для конечных пользователей, т.е. в машину его устанавливают именно они. Напротив, C&T и Cyrix поставляют свои процессоры и производителям. Cyrix также производит процессор 486SLC, заменяющий Intel/AMD 386SX. C&T объявил о создании процессора 38600SX, но в продаже он появится только в 1993 году, если вообще появится.

RapidCAD, грубо говоря, представляет собой процессор 486DX без внутренней кэш-памяти и с цоколевкой процессора 386. Для прог­рамм он соответствует 386 с сопроцессором, так как все специфичные команды i486 удалены из набора команд. Рекламируется этот процессор, как "абсолютный сопроцессор" и, к чему и обязывает такое имя, он предназначен для замены процессора 386DX в существующих системах и резкого повышения производительности операций с плавающей точкой, таких, как CAD, электронные таблицы, математические программные па­кеты (SPSS, Mathematica и т.д.). RapidCAD состоит из двух корпусов; RapidCAD-1, в корпусе PGA (132 вывода), устанавливающийся в гнездо для i386, включает в себя ЦПУ и модуль операций с плавающей точкой, и RapidCAD-2, в корпусе PGA (68 выводов), устанавливающийся в гнез­до для сопроцессора i387, включает в себя ПЛМ, подающий сигнал на схемы системной платы для правильной обработки особых ситуаций при операциях с плавающей точкой. Большинство операций исполняется в те­чение одного цикла, как и в i486. Однако узким местом является ин­терфейс шины 386, так как каждый цикл шины равен двум циклам процес­сора. Это значит, что команды выполняются быстрее, чем считываются из памяти. Поскольку операции с плавающей точкой выполняются медлен­нее обычных команд, то замедление на них не сказывается, и они вы­полняются с такой же скоростью, как и на i486DX. Именно поэтому RapidCAD позволяет получить более высокие характеристики с плаваю­щей точкой, чем любая комбинация 386/387. Результаты теста SPEC, стандартного теста для машин под UNIX, показывают, что RapidCAD ус­коряет операции с плавающей точкой на 85%, а с целыми числами - на 15% по сравнению с любой комбинацией 386/387 при одинаковой такто­вой частоте. Потребляемая мощность при 33 МГц составляет 3500 мВт. Текущая цена RapidCAD 33 МГц составляет 300$.

Предполагается, что процессор фирмы C&T 38600DX полностью совместим с i386DX. В отличие от процессора Am386 фирмы AMD, кото­рый использует микрокод, идентичный микрокоду Intel 386, в процессо­ре 38600DX использован патентно чистый микрокод, для обеспечения полной совместимости в набор команд даже включена недокументирован­ная команда LOADALL386. Некоторые команды выполняются быстрее, чем в i386. C&T также выпустила процессор 38605DX, включающий кэш-память команд на 512 байт, что еще более повысит его производительность. К сожалению, 38605DX выпускается в корпусе PGA (144 вывода) и не мо­жет быть установлен непосредственно в разъем i386DX. При проведении испытаний я заметил, что у 38600DX есть серьезные проблемы коммуни­кации ЦПУ- сопроцессор, и из-за этого скорость выполнения в большин­стве программ операций с плавающей точкой у него падает ниже уровня i386/i387. Эта проблема существует для всех производимых на настоя­щий момент 387- совместимых сопроцессоров (ULSI 83C87, IIT 3C87, Cyrix EMX87, Cyrix 83D87, Cyrix 387+, C&T 38700, Intel 387DX). Мой знакомый по сети тоже проводил такие тесты с 38700DX и пришел к ана­логичным выводам. Он связался с C&T, и ему ответили, что знают об этом. Средняя потребляемая мощность 38600DX 40 МГц - 1650 Мвт, что меньше, чем потребление i386 33 МГц. Текущая цена 38600DX 33 МГц - 80$.

Процессор Cyrix 486DLC - последняя новинка на рынке заме­нителей i386DX. Набор его команд совместим с i486SX, установлена 1 КВ кэш-память и аппаратно реализованный 16х16 бит умножитель. Испол­нительное устройство 486DLC, созданное с использованием некоторых принципов RISC, выполняет большинство команд за один цикл. Аппарат­ный умножитель перемножает 16-разрядные значения за 3 цикла, вместо 12 - 25 циклов у i386DX. Это особенно удобно при вычислении адресов (код, генерируемый некоторыми неоптимизирующими компиляторами, мо­жет содержать много команд MUL для доступа к массивам) и для прог­раммных вычислений с плавающей точкой (напр., при эмуляции сопроцес­сора). Внутренняя кэш-память представляет собой объединенную память команд и данных сквозной записи, и может быть конфигурирована, как память с прямым отображением, или как 2-канальная ассоциативная. Из-за необходимости обеспечения полной совместимости после перезаг­рузки процессора кэш-память отключается, и должна быть включена с по­мощью небольшой программы, предоставляемой фирмой Cyrix. Если кэш-память включена при загрузке, (напр., при "горячей" перезагруз­ке, Ctrl – Alt – Del) , BIOS моего РС (пр- ва AMI) зависает при загрузке, и мне приходится либо выполнять рестарт процессора, либо отключать кэш перед перезагрузкой. Это одна из причин того, что после запуска процессора кэш-память отключается. Я уверен, что в следующих вер­сиях BIOS фирмы AMI это будет учтено и встроенная кэш-память будет поддерживаться. Кэш-память помогает процессору 486DLC преодолеть ог­раничения интерфейса шины 386, хотя процент попаданий составляет не более 50%. Фирма Cyrix предусмотрела некоторые возможности управле­ния кэш-памятью процессора, что, конечно, улучшит связь внешней и внутренней кэш-памяти. Современные системы 386 не воспринимают эти управляющие сигналы, не имеющие значения для i386DX, но в дальней­шем системы, разработанные с учетом этих возможностей 486DLC, могут использовать их. Встроенный кэш 486DLC допускает до 4-х некэшируе­мых областей памяти, что может быть очень полезно в том случае, ес­ли ваша система использует периферийные устройства, отображаемые в память (напр., сопроцессор Weitek). В существующих системах 386 пе­ресылки DMA (напр., SCSI контроллера, платы звука) могут отключить внутренний кэш, так как не существует других способов обеспечить соответствие кэш-памяти и основной памяти, что, конечно, снижает ха­рактеристики 486DLC. Потребляемая мощность 486DLC 40 МГц - 2800 Мвт. Немецкий дистрибьютор продает 486DLC 33 МГц по текущей цене 115$. 486DLC работает далеко не со всеми сопроцессорами и не во всех об­стоятельствах, особенно критичен в этом отношении многозадачный за­щищенный режим (улучшенный режим MS- Windows). При использовании 486DLC совместно с Cyrix EMC87, Cyrix 83D87 (выпуск до августа 1992) и IIT 3C87 машина зависает из-за проблем синхронизации между ЦПУ и сопроцессором при исполнении команд FSAVE и FRSTOR, сохраняющих и восстанавливающих состояние сопроцессора при переключении задач. Лучше всего использовать 486DLC с Cyrix 387+ (распространяется только в Европе) или Cyrix 83D87 выпуска после июля 1992, являющий­ся наиболее мощным сопроцессором среди совместимых сопроцессоров 486DLC. Если у вас уже есть сопроцессор Cyrix 83D87, и вы хотите знать, совместим ли он с 486LCD, я рекомендую вам мою программу COMPTEST, распространяемую как CTEST257.ZIP через анонимные ftp из garbo@uwasa.fi или другие ftp-серверы. Если программа сообщит о соп­роцессоре 387+, то у вас установлен либо 387+, либо аналогичная но­вая версия 83D87 и проблем с совместимостью не будет.

При испытаниях использовалась система:

Аппаратная конфигурация: 33,3/40 МГц системная плата, комплект микросхем Forex, кэш 128 КВ с нулевым состоянием ожидания, прямое отображение, сквозная запись, один буфер записи, 4 байта на строку, 4 цикла задержки при кэш-промахе. 8 МВ основной памяти, среднее сос­тояние ожидания 1,6 цикла. BIOS фирмы AMI. Процессор Cyrix EMC87 в режиме совместимости 387, как матсопроцессор. Этот процессор вместе с Cyrix 83D87/387+ являются самыми быстрыми сопроцессорами для рабо­ты с 386DX/486DLC/38600DX. Жесткий диск Conner 3204F, емкость 203 МВ, интерфейс IDE (пропускная способность по тесту CORETEST 1100 КВ/с, время поиска 16 мс). Плата SVGA (ISA, Diamond SpeedSTAR HiColor), используется ET4000, 1 МВ DRAM, как экранный буфер, графи­ческий ускоритель отключен. Переключатели на видеоплате установлены для наиболее надежной с быстрой работы, с пропускной способностью 6500 байт/мс при 40 МГц и 5400 байт/мс при 33 МГц.

Программная конфигурация: MS-DOS 5.0, MS Windows 3.1, HyperDisk

4.32 в режиме обратной записи, используется 2 МВ расширенной памяти, в качестве менеджера памяти используется 386MAX 6.01. Эта программа также обеспечивает DPMI в некоторых тестах.

Результаты тестов

Для тестов Whetstone, Drhystone, WINTACH, DODUC, LINPACK, LLL и Savage больший показатель означает большую производительность.

Для тестов MAKE RTL, MAKE TRANK и теста String- Test меньший показатель означает большую производительность.

33,3 МГц Intel C&T Intel Cyrix Cyrix

386DX 38600DX RapidCAD 486DLC 486DLC

кэш выкл. кэш вкл. Тесты с целыми числами

Whetstone (kWhet/s) 447 585 563 695 803

Drhystone(C) (Dhry./s) 11688 11819 12357 14150 15488

Drhystone(Pas) (Dhry./s) 10455 10877 10751 12154 13858

String-Test (ms) 459 453 441 347 327

MAKE RTL (s) 51,32 47,10 46,34 43,45 39,13

MAKE TRANCK (s) 62,42 55,47 55,37 53,64 46,12

WINTACH 4,85 4.90 5.49 5.53 6.14

Тесты с плавающей запятой

DODUC (Индекс скорости) 79.0 76.4 150.3 89.4 90.7

LINPACK (Mflops) 0.2808 0.2707 0.4578 0.3158 0.3438

LLL (Mflops) 0.3352 0.3537 0.6083 0.3816 0.4139

Whetstone (kWhet/s) 2540 2340 3990 2908 3061

Savage (решений/с) 71685 53191 72464 88757 93897


Информация о работе «Процессоры»
Раздел: Информатика, программирование
Количество знаков с пробелами: 132006
Количество таблиц: 3
Количество изображений: 0

Похожие работы

Скачать
94709
9
3

... привилегированных инструкций или операций, которые можно выполнять только при определенных уровнях CPL и IOPL (биты 13 и 14 регистра флагов). ГЛАВА 2 Архитектура 32-разрядных процессоров История 32-разрядных процессоров началась с процессора Intel386. Эти процессора вобрали в себя все свойства своих 16-разрядных предшественников 8086/88 и 80286 для обеспечения программной совместимости с ...

Скачать
102663
6
1

... конвейер. 3) поток команд порождает недостаточное количество операций для полной загрузки конвейера [3]. Рассмотрим принципы конвейерной обработки информации на примере пятиступенчатого конвейера, в котором выполнение команды складывается из следующих этапов: IF (Instruction Fetch) - считывание команды в процессор; ID (Instruction Decoding) - декодирование команды; OR (Operand Reading) - ...

Скачать
49482
0
0

... такой скорости, при которой Windows не загружается, вернитесь к предыдущему значению скорости (уменьшение скорости также проводите постепенно); - определив необходимую скорость работы процессора и, перезагрузив компьютер, проведите тестирование системы на предмет стабильной ее работы. Аппаратное и программное управление разгоном   Для изменения частоты системной шины и значения множителя на ...

Скачать
177455
0
22

... : -производитель чипсет, если возможно – модель материнской платы; -тактовые частоты процессора, памяти, системных шин; -названия, параметры работы всех системных и периферийных устройств; -расширенная информация о процессоре, памяти, жестких дисках, 3D-ускорителе; -разнообразные параметры программной среды: ОС, драйверы, процессы, системные файлы и т.д.; -информация о поддержке видеокартой ...

0 комментариев


Наверх