3.10. Процессор Pentium Pro.
3.10.1. Общее описание процессора.
Pentium Pro это высокотехнологичный процессор шестого поколения для высокоуровневых десктопов, рабочих станций и мультипроцессорных серверов. Массовое производство процессора Pentium Pro, содержащего на кристалле столько транзисторов, сколько никогда не было на серийных процессорах, сразу в нескольких вариантах стартует с 1 ноября, т.е. с самого момента объявления. Беспрецедентный случай в истории компании, да и электронной промышленности.
Hапомним некоторые его особенности. Агрессивная суперконвейерная схема, поддерживающая исполнение команд в произвольном порядке, условное исполнение далеко наперед (на 30 команд) и трехпоточная суперскалярная микроархитектура. Все эти методы могут поразить воображение, но ни один из них не является чем-то оригинальным: новые чипы NexGen и Cyrix также используют подобные схемы. Однако, Intel обладает ключевым превосходством. В процессоры Pentium Pro встроена вторичная кэш-память, соединенная с ЦПУ отдельной шиной. Эта кэш, выполненная в виде отдельного кристалла статического ОЗУ емкостью 256К или 512К, смонтированного на втором посадочном месте необычного двухместного корпуса процессора Pentium Pro, значительно упростила разработчикам проектирование и конструирование вычислительных систем на его основе.
Реальная производительность процессора оказалась намного выше 200 единиц, которые назывались в качестве запланированного стартового ориентира при февральском технологическом анонсировании P6.
Pentium Pro это значительный шаг вперед. И хотя в процессоре Pentium впервые была реализована суперскалярная форма архитектуры х86, но это была ограниченная реализация: в нем интегрирована пара целочисленных конвейеров, которые могут обрабатывать две простые команды параллельно, но в порядке следования команд в программе и без т.н. условного исполнения (наперед). Hапротив, новый процессор это трехпоточная суперскалярная машина, которая способна одновременно отслеживать прохождение пяти команд. Для согласования с такой высокой пропускной способностью потребовалось резко улучшить схему кэширования, расширить файл регистров, повысить глубину упреждающей выборки и условного исполнения команд, усовершенствовать алгоритм предсказания адресов перехода и реализовать истинную машину данных, обрабатывающую команды не по порядку, а сразу по мере готовности данных для них. Ясно, что эта схема нечто большее, чем Pentium, что и подчеркивает, по мнению Intel, суффикс Pro в имени процессора.
3.10.2. Два кристалла в одном корпусе.
Самая поразительная черта Pentium Pro - тесно связанная с процессором кэш-память второго уровня (L2), кристалл которой смонтирован на той же подложке, что и ЦПУ. Именно так, Pentium Pro это два чипа в одном корпусе. Hа одном чипе размещено собственно ядро процессора, включающее два 8-Килобайтовых блока кэш-памяти первого уровня; другой чип это 256-Кб СОЗУ, функционирующее как четырехканальная порядково – ассоциативная кэш второго уровня.
Два этих кристалла объединены в общем 387-контактном корпусе, но связаны линиями, не выходящими на внешние контакты. Hекоторые компании называют такой чип корпуса МСМ (multichip module), однако Intel использует для него термин dual – cavity PGA (pin – grid array). Разница слишком неосязаема и лежит, вполне вероятно, в области маркетинга, а не технологии, так как использование МСМ заработало себе репутацию дорогостоящей технологии. Но, сравнивая цены на процессоры Pentium и Pentium Pro, можно утверждать, что новая терминология исправит положение дел, так как P6 претендует на статус массового процессора. Впервые в истории промышленности многокристальный модуль станет крупносерийным изделием.
Степень интеграции нового процессора также поражает: он содержит 5.5 млн. транзисторов, да еще 15.5 млн. входит в состав кристалла кэш-памяти. Для сравнения, последняя версия процессора Pentium состоит из 3.3 млн. транзисторов. Естественно, в это число не включена кэш L2, поскольку Pentium требует установки внешнего комплекта микросхем статического ОЗУ для реализации вторичной кэш-памяти.
Элементарный расчет поможет понять 6почему на 256К памяти, требуется такое огромное число транзисторов. Это статическое ОЗУ, которое в отличие от динамического, имеющего всего один транзистор на бит хранения и периодически регенерируемого, использует для хранения бита ячейку из шести транзисторов:
256 x 1024 х 8 бит х 6 пр – ров = 12.5 млн. транзисторов. С учетом буферов и обвязки накопителя как раз и выйдет 15.5 миллионов.
Площадь процессорного кристалла равна 306 кв. мм. (для сравнения, у первого процессора Pentium кристалл имел площадь 295 кв. мм). Кристалл статической памяти, как всякая регулярная структура, упакован намного плотнее - 202 кв. мм. Только Pentium Pro 150 MHz изготавливается по 0.6-микронной технологии. Все остальные версии нового процессора изготавливаются по 0.35-микронной BiCMOS-технологии с четырехслойной металлизацией.
Почему компания Intel пошла на двухкристалльный корпус, объединив ядро ЦПУ с вторичным КЭШем? Во – первых комбинированный корпус значительно упростил изготовителям ПК разработку высокопроизводительных систем на процессоре Pentium Pro.
Одна из главных проблем при проектировании компьютера на быстром процессоре связана с точным согласованием с процессором вторичного КЭШа по его размеру и конфигурации. Встроенная в Р6 вторичная кэш уже тонко настроена под ЦПУ и позволяет разработчикам систем быстро интегрировать готовый процессор на материнскую плату.
Во-вторых, вторичная кэш тесно связана с ядром ЦПУ с помощью выделенной шины шириной 64 бита, работающей на одинаковой с ним частоте. Если ядро синхронизируется частотой 150 МГц, то кэш должна работать на частоте 150 МГц.
Поскольку в процессоре Pentium Pro есть выделенная шина для вторичного КЭШа, это решает сразу две проблемы: обеспечивается синхронная работа двух устройств на полной скорости и отсутствие конкуренции за шину с прочими операциями ввода-вывода. Отдельная шина L2, "задняя" шина полностью отделена от наружной, "передней" шины ввода-вывода, вот почему в P6 вторичная кэш не мешает своими циклами операциям с ОЗУ и периферией. Передняя 64-битовая шина может работать с частотой, равной половине, трети или четверти скорости ядра Pentium Pro. "Задняя" шина продолжает работать независимо, на полной скорости.
Такая реализация представляет серьезный шаг вперед по сравнению с организацией шины процессора pentium и других процессоров х86. Только NexGen приближенно напоминает такую схему. Хотя в процессоре Nx586 нет КЭШа L2, зато встроен ее контроллер и полноскоростная шина для связи с внешней кэш-памятью. Подобно Р6, процессор Nx586 общается с основной памятью и периферийными подсистемами поверх отдельной шины ввода-вывода, работающей на деленной частоте.
В экзотическом процессором Alpha 21164 компания Digital пошла еще дальше, интегрировав прямо на кристалле в дополнение к первичной кэш-памяти еще и 96 Кбайт вторичной. За счет вздувания площади кристалла достигнута беспрецедентная производительность кэширования. Транзисторный бюджет Альфы составляет 9.3 миллиона транзисторов, большая часть которого образована массивом памяти.
Есть одна незадача: необычный дизайн Pentium Pro, пожалуй, затруднит экспертам задачку вычисления соотношения цены и производительности. Интегрированная в процессор кэш вроде как скрыта с глаз. Pentium Pro сможет показаться более дорогим, чем его конкуренты, но для создания компьютера на других процессорах потребуется внешний набор микросхем памяти и кэш-контроллер. Эффективный дизайн кэш-структуры означает, что другим процессорам, претендующим на сопоставимую производительность, потребуется кэш-памяти больше, чем 256 Кбайт.
Уникальный корпус предоставляет свободу созданию новых вариантов процессора. В будущем возможно как повышение объема кэш-памяти, так и ее отделение ее от процессора в соответствии с традиционным подходом. Если последний вариант появится, он окажется, несовместим по внешним выводам с двухкристалльным базовым корпусом, так как ему необходимо добавить 72 дополнительных вывода (64-для "задней" шины и 8 для контроля ошибок). Hо он будет почти таким же быстрым, если будет широко доступна статическая память с пакетным режимом. По мнению инженеров Intel, подключение внешних микросхем памяти к "передней" шине Pentium Pro с целью реализации кэш-памяти третьего уровня, вряд ли оправдано. Отправной точкой для такой убежденности служат результаты натурного моделирования прототипа системы, которая в следствии высокой эффективности интерфейса кэш L2-процессор, практически до теоретического предела загружает вычислительные ресурсы ядра. Процессор Alpha 21164, напротив, спроектирован с учетом необходимости кэш L3.
... привилегированных инструкций или операций, которые можно выполнять только при определенных уровнях CPL и IOPL (биты 13 и 14 регистра флагов). ГЛАВА 2 Архитектура 32-разрядных процессоров История 32-разрядных процессоров началась с процессора Intel386. Эти процессора вобрали в себя все свойства своих 16-разрядных предшественников 8086/88 и 80286 для обеспечения программной совместимости с ...
... конвейер. 3) поток команд порождает недостаточное количество операций для полной загрузки конвейера [3]. Рассмотрим принципы конвейерной обработки информации на примере пятиступенчатого конвейера, в котором выполнение команды складывается из следующих этапов: IF (Instruction Fetch) - считывание команды в процессор; ID (Instruction Decoding) - декодирование команды; OR (Operand Reading) - ...
... такой скорости, при которой Windows не загружается, вернитесь к предыдущему значению скорости (уменьшение скорости также проводите постепенно); - определив необходимую скорость работы процессора и, перезагрузив компьютер, проведите тестирование системы на предмет стабильной ее работы. Аппаратное и программное управление разгоном Для изменения частоты системной шины и значения множителя на ...
... : -производитель чипсет, если возможно – модель материнской платы; -тактовые частоты процессора, памяти, системных шин; -названия, параметры работы всех системных и периферийных устройств; -расширенная информация о процессоре, памяти, жестких дисках, 3D-ускорителе; -разнообразные параметры программной среды: ОС, драйверы, процессы, системные файлы и т.д.; -информация о поддержке видеокартой ...
0 комментариев