3.10. Процессор Pentium Pro.

3.10.1. Общее описание процессора.

Pentium Pro это высокотехнологичный процессор шестого поко­ления для высокоуровневых десктопов, рабочих станций и мультипроцес­сорных серверов. Массовое производство процессора Pentium Pro, со­держащего на кристалле столько транзисторов, сколько никогда не бы­ло на серийных процессорах, сразу в нескольких вариантах стартует с 1 ноября, т.е. с самого момента объявления. Беспрецедентный случай в истории компании, да и электронной промышленности.

Hапомним некоторые его особенности. Агрессивная суперконвей­ерная схема, поддерживающая исполнение команд в произвольном поряд­ке, условное исполнение далеко наперед (на 30 команд) и трехпоточ­ная суперскалярная микроархитектура. Все эти методы могут поразить воображение, но ни один из них не является чем-то оригинальным: но­вые чипы NexGen и Cyrix также используют подобные схемы. Однако, Intel обладает ключевым превосходством. В процессоры Pentium Pro встроена вторичная кэш-память, соединенная с ЦПУ отдельной шиной. Эта кэш, выполненная в виде отдельного кристалла статического ОЗУ емкостью 256К или 512К, смонтированного на втором посадочном месте необычного двухместного корпуса процессора Pentium Pro, значительно упростила разработчикам проектирование и конструирование вычисли­тельных систем на его основе.

Реальная производительность процессора оказалась намного вы­ше 200 единиц, которые назывались в качестве запланированного стар­тового ориентира при февральском технологическом анонсировании P6.

Pentium Pro это значительный шаг вперед. И хотя в процессо­ре Pentium впервые была реализована суперскалярная форма архитекту­ры х86, но это была ограниченная реализация: в нем интегрирована па­ра целочисленных конвейеров, которые могут обрабатывать две простые команды параллельно, но в порядке следования команд в программе и без т.н. условного исполнения (наперед). Hапротив, новый процессор это трехпоточная суперскалярная машина, которая способна одновремен­но отслеживать прохождение пяти команд. Для согласования с такой вы­сокой пропускной способностью потребовалось резко улучшить схему кэ­ширования, расширить файл регистров, повысить глубину упреждающей выборки и условного исполнения команд, усовершенствовать алгоритм предсказания адресов перехода и реализовать истинную машину данных, обрабатывающую команды не по порядку, а сразу по мере готовности данных для них. Ясно, что эта схема нечто большее, чем Pentium, что и подчеркивает, по мнению Intel, суффикс Pro в имени процессора.

3.10.2. Два кристалла в одном корпусе.

Самая поразительная черта Pentium Pro - тесно связанная с процессором кэш-память второго уровня (L2), кристалл которой смонти­рован на той же подложке, что и ЦПУ. Именно так, Pentium Pro это два чипа в одном корпусе. Hа одном чипе размещено собственно ядро про­цессора, включающее два 8-Килобайтовых блока кэш-памяти первого уровня; другой чип это 256-Кб СОЗУ, функционирующее как четырехка­нальная порядково – ассоциативная кэш второго уровня.

Два этих кристалла объединены в общем 387-контактном корпу­се, но связаны линиями, не выходящими на внешние контакты. Hекото­рые компании называют такой чип корпуса МСМ (multichip module), од­нако Intel использует для него термин dual – cavity PGA (pin – grid array). Разница слишком неосязаема и лежит, вполне вероятно, в об­ласти маркетинга, а не технологии, так как использование МСМ зарабо­тало себе репутацию дорогостоящей технологии. Но, сравнивая цены на процессоры Pentium и Pentium Pro, можно утверждать, что новая терми­нология исправит положение дел, так как P6 претендует на статус мас­сового процессора. Впервые в истории промышленности многокристальный модуль станет крупносерийным изделием.

Степень интеграции нового процессора также поражает: он со­держит 5.5 млн. транзисторов, да еще 15.5 млн. входит в состав крис­талла кэш-памяти. Для сравнения, последняя версия процессора Pentium состоит из 3.3 млн. транзисторов. Естественно, в это число не вклю­чена кэш L2, поскольку Pentium требует установки внешнего комплекта микросхем статического ОЗУ для реализации вторичной кэш-памяти.

Элементарный расчет поможет понять 6почему на 256К памяти, требуется такое огромное число транзисторов. Это статическое ОЗУ, которое в отличие от динамического, имеющего всего один транзистор на бит хранения и периодически регенерируемого, использует для хра­нения бита ячейку из шести транзисторов:

256 x 1024 х 8 бит х 6 пр – ров = 12.5 млн. транзисторов. С учетом буферов и обвязки накопителя как раз и выйдет 15.5 миллионов.

Площадь процессорного кристалла равна 306 кв. мм. (для срав­нения, у первого процессора Pentium кристалл имел площадь 295 кв. мм). Кристалл статической памяти, как всякая регулярная структура, упакован намного плотнее - 202 кв. мм. Только Pentium Pro 150 MHz изготавливается по 0.6-микронной технологии. Все остальные версии нового процессора изготавливаются по 0.35-микронной BiCMOS-технологии с четырехслойной металлизацией.

Почему компания Intel пошла на двухкристалльный корпус, объединив ядро ЦПУ с вторичным КЭШем? Во – первых комбинированный кор­пус значительно упростил изготовителям ПК разработку высокопроизво­дительных систем на процессоре Pentium Pro.

Одна из главных проблем при проектировании компьютера на быстром процессоре связана с точным согласованием с процессором вто­ричного КЭШа по его размеру и конфигурации. Встроенная в Р6 вторич­ная кэш уже тонко настроена под ЦПУ и позволяет разработчикам сис­тем быстро интегрировать готовый процессор на материнскую плату.

Во-вторых, вторичная кэш тесно связана с ядром ЦПУ с по­мощью выделенной шины шириной 64 бита, работающей на одинаковой с ним частоте. Если ядро синхронизируется частотой 150 МГц, то кэш должна работать на частоте 150 МГц.

Поскольку в процессоре Pentium Pro есть выделенная шина для вторичного КЭШа, это решает сразу две проблемы: обеспечивается син­хронная работа двух устройств на полной скорости и отсутствие конку­ренции за шину с прочими операциями ввода-вывода. Отдельная шина L2, "задняя" шина полностью отделена от наружной, "передней" шины ввода-вывода, вот почему в P6 вторичная кэш не мешает своими цикла­ми операциям с ОЗУ и периферией. Передняя 64-битовая шина может ра­ботать с частотой, равной половине, трети или четверти скорости яд­ра Pentium Pro. "Задняя" шина продолжает работать независимо, на полной скорости.

Такая реализация представляет серьезный шаг вперед по срав­нению с организацией шины процессора pentium и других процессоров х86. Только NexGen приближенно напоминает такую схему. Хотя в про­цессоре Nx586 нет КЭШа L2, зато встроен ее контроллер и полноскорос­тная шина для связи с внешней кэш-памятью. Подобно Р6, процессор Nx586 общается с основной памятью и периферийными подсистемами по­верх отдельной шины ввода-вывода, работающей на деленной частоте.

В экзотическом процессором Alpha 21164 компания Digital пош­ла еще дальше, интегрировав прямо на кристалле в дополнение к пер­вичной кэш-памяти еще и 96 Кбайт вторичной. За счет вздувания площа­ди кристалла достигнута беспрецедентная производительность кэширова­ния. Транзисторный бюджет Альфы составляет 9.3 миллиона транзисто­ров, большая часть которого образована массивом памяти.

Есть одна незадача: необычный дизайн Pentium Pro, пожалуй, затруднит экспертам задачку вычисления соотношения цены и производи­тельности. Интегрированная в процессор кэш вроде как скрыта с глаз. Pentium Pro сможет показаться более дорогим, чем его конкуренты, но для создания компьютера на других процессорах потребуется внешний набор микросхем памяти и кэш-контроллер. Эффективный дизайн кэш-структуры означает, что другим процессорам, претендующим на со­поставимую производительность, потребуется кэш-памяти больше, чем 256 Кбайт.

Уникальный корпус предоставляет свободу созданию новых ва­риантов процессора. В будущем возможно как повышение объема кэш-па­мяти, так и ее отделение ее от процессора в соответствии с тради­ционным подходом. Если последний вариант появится, он окажется, не­совместим по внешним выводам с двухкристалльным базовым корпусом, так как ему необходимо добавить 72 дополнительных вывода (64-для "задней" шины и 8 для контроля ошибок). Hо он будет почти таким же быстрым, если будет широко доступна статическая память с пакетным режимом. По мнению инженеров Intel, подключение внешних микросхем памяти к "передней" шине Pentium Pro с целью реализации кэш-памяти третьего уровня, вряд ли оправдано. Отправной точкой для такой убеж­денности служат результаты натурного моделирования прототипа систе­мы, которая в следствии высокой эффективности интерфейса кэш L2-про­цессор, практически до теоретического предела загружает вычисли­тельные ресурсы ядра. Процессор Alpha 21164, напротив, спроектиро­ван с учетом необходимости кэш L3.


Информация о работе «Процессоры»
Раздел: Информатика, программирование
Количество знаков с пробелами: 132006
Количество таблиц: 3
Количество изображений: 0

Похожие работы

Скачать
94709
9
3

... привилегированных инструкций или операций, которые можно выполнять только при определенных уровнях CPL и IOPL (биты 13 и 14 регистра флагов). ГЛАВА 2 Архитектура 32-разрядных процессоров История 32-разрядных процессоров началась с процессора Intel386. Эти процессора вобрали в себя все свойства своих 16-разрядных предшественников 8086/88 и 80286 для обеспечения программной совместимости с ...

Скачать
102663
6
1

... конвейер. 3) поток команд порождает недостаточное количество операций для полной загрузки конвейера [3]. Рассмотрим принципы конвейерной обработки информации на примере пятиступенчатого конвейера, в котором выполнение команды складывается из следующих этапов: IF (Instruction Fetch) - считывание команды в процессор; ID (Instruction Decoding) - декодирование команды; OR (Operand Reading) - ...

Скачать
49482
0
0

... такой скорости, при которой Windows не загружается, вернитесь к предыдущему значению скорости (уменьшение скорости также проводите постепенно); - определив необходимую скорость работы процессора и, перезагрузив компьютер, проведите тестирование системы на предмет стабильной ее работы. Аппаратное и программное управление разгоном   Для изменения частоты системной шины и значения множителя на ...

Скачать
177455
0
22

... : -производитель чипсет, если возможно – модель материнской платы; -тактовые частоты процессора, памяти, системных шин; -названия, параметры работы всех системных и периферийных устройств; -расширенная информация о процессоре, памяти, жестких дисках, 3D-ускорителе; -разнообразные параметры программной среды: ОС, драйверы, процессы, системные файлы и т.д.; -информация о поддержке видеокартой ...

0 комментариев


Наверх