Процесори
У 1989 р. Intel представила першого представника сімейства 80×86, що містить понад мільйон (а точніше, 1,2 мільйона) транзисторів в чіпі. Цей чіп багато в чому подібний з 80 386. Його 100% програмно сумісний із мікропроцесорами 386(ТМ) DX & SX. Один мільйон транзисторів об'єднаної кеш-пам'яті (надшвидкої оперативної пам’яті), разом із апаратурою для операцій з плаваючою коми і що пам’яті в одній… Читати ще >
Процесори (реферат, курсова, диплом, контрольна)
МІНІСТЕРСТВО ОСВІТИ РОСІЙСЬКОЇ ФЕДЕРАЦІЇ ХАНТИ-МАНСІЙСЬКИЙ АВТОНОМНЫЙ.
ОКРУГ.
ДЕПАРТАМЕНТ ОСВІТИ І НАУКИ.
МУНІЦИПАЛЬНЕ ПРОФЕСІЙНЕ УЧИЛИЩЕ № 1.
УТВЕРЖДЕНО.
Заст. директора по УПР.
_______.
«____"________2002 г.
ПИСЬМОВА ЭКЗАМЕНАЦИОННАЯ.
РАБОТА.
Учащегося:
Специальность:____________________________.
Тема:_____________________________________ __________________________________________.
Преподаватель:
Консультант:
Дата видачі завдання: «___"_____2002 г.
Термін здачі: «___"_____2002 г.
Підпис учня: «___"_____2002 г.
р. Покачи 2002 г.
1. Введення ЄІАС у персональний компьютер.
2. Відмінності процессоров.
2.1. Відмінності пpоцессоpов SX, DX, SX2, DX2 і DX4.
2.2. Позначення «SL-Enhanced «y пpоцессоpов Intel 486.
2.5. Ідентифікація чипів Intel і AMD.
2.5.2. Версія процессора.
2.5.4. Перемаркированные процессоры.
3. Процесорам фірми Intel.
3.1. Сучасна микропроцессорная технологія фірми Intel.
3.2. Перші процесори фірми Intel.
3.3. Процесор 8086/88.
3.4. Процесор 80 186/88.
3.5. Процесор 80 286.
3.6. Процесор 80 386.
3.7. Процесор 80 486.
3.7.1.Процессор i486SX.
3.8. Intel OverDrive процессор.
3.9. Процесор Pentium.
3.10. Процесор Pentium Pro.
3.10.1. Загальне опис процессора.
3.10.2. Два кристала щодо одного корпусе.
3.10.3. Значення тестів декому чипів фірми Intel.
4. Процесорам конкурентів Intel.
4.1. Перші процесори конкурентів Intel.
4.2. Процесорам фірми AMD.
4.2.1. Судовий розгляд з Intel.
4.2.2. Процесорам сімейства AMD5k86.
4.2.2.1 Екскурсія по внутрішньої архитектуре.
4.2.2.2. Приклад маркування мікропроцесора AMD5k86-P75.
4.2.2.5. AMD планує випустити K5.
4.3. Процесорам NexGen.
4.4. Процесорам Cyrix.
4.5. Процесорам Sun Microsystems.
4.6. Процесорам Digital Equipment.
4.7. Процесорам Mips.
4.8. Процесорам Hewlett-Packard.
4.9. Процесорам Motorola.
5. Лабораторні випробування і тестування микропроцессоров.
5.1. Лабораторні випробування процесорів i386DX.
5.2. Результати тестування мікропроцесорів з допомогою пакета Speed.
Test.
6. Порівняльний аналіз. …
7. Pentium II. … 7.1 Pentium II.
… 7.2 Deschutes. … 7.3.
Мобільний Pentium II. … 7.4 Celeron.
… 7.5 Pentium «Xeon». …
1. Введення ЄІАС у персональний компьютер.
Персональний комп’ютер — це таке комп’ютер, котрі можуть собі дозволити купити окремий человек.
Найбільш «вагомої «частиною кожного комп’ютера є системний блок (іноді її називають комп’ютером, що неприпустимій помилкою). Усередині нього розташовані блок харчування, плата з центральним процесором (ЦП), видеоадаптер, жорсткий диск, дисководи гнучких дисків та інші устрою введення / виведення інформації. Найчастіше видеоадаптер і контролери введення/ виведення розміщені безпосередньо в платі ЦП. У системному блоці можуть розміщатися кошти мультимедіа: звукова плата і пристрій читання оптичних дисків — CD-ROM. З іншого боку, в поняття «комп'ютер «входить клавіатура і монітор. Маніпулятор миша є необов’язковою, але дуже важливою деталлю. Тепер коротко про вибір основних компонентів ПК. Процесор є основним компонентом будь-якого ПК. Нині найпоширеніші процесори фірми Intel, хоча ЦП інших фірм (AMD, Cyrix, NexGen та інших.) становлять їм гідну конкуренцію. Є також материнська (MotherBoard) плата. Основний характеристикою материнських плат був частиною їхнього архітектура. Основними шинами донедавна вважалися ISA (Industrial Standard Architecture) і EISA (Extended ISA), і мають розрядність 10 і 32 відповідно. Задля більшої нормальної роботи видеоадаптеров був розроблений стандарт VESA (Video Electronic Standart Association), розрахований застосування процесора серії 486, яка працює частоті процесора і що є «приставкою «до шині ISA чи EISA. З появою процесора Pentium розробили самостійна шина PCI, а її сьогодні є найбільш швидкою й перспективної. Зазвичай, у ПК присутній дисковод для гнучких дисків. Існує дві стандарту: 5.25 «і 3.5 ». Сьогодні більшість комп’ютерів поставляється з дисководом 3.5 ». Жeсткий диск (вінчестер), почавши свою тріумфальну ходу з обсягу 5 МБ, досяг небувалих висот. Сьогодні не здивують диски обсягом 2 чи 4 держбезпеки. Більшість додатків предосить обсягу 420 — 700 МБ, проте якщо ви доводиться працювати з повноколірними графічними зображеннями чи версткою, доведеться подумати про диску в 1.5- 2 держбезпеки і навіть парі таких дисків. Слід надати значення як ємності диска, але його тимчасовим характеристикам. Як оптимальних можна порекомендувати вінчестери фірми Western Digital, Seagate чи Corner. Для оперативної пам’яті (RAM, ОЗУ) закон простий: що більше, краще. Нині важко знайти конфігурацію з обсягом пам’яті до 3,6 МБ. Для нормальної роботи більшості програмних продуктів бажано мати хоча б уголос зауважити, що з збільшенні ОЗУ більш як 32 МБ швидкодія ПК збільшується менш вагоме, і такі конфігурація необхідна митцям і мультиплікаторам. Hеотъемлемой частиною ПК є клавіатура. Стандартної в Росії є 101 — клавишная клавіатури з англійськими і російськими символами. Миша. Необхідна до роботи з графічними пакетами, кресленнями, розробки схем при роботі під Windows. Слід зазначити, що певна ігрова і забезпечення вимагає наявність миші. Основний пхе миші є що дозволяє здатність, яка вимірюється в точках на дюйм (dpi). Нормальною вважається миша, забезпечує дозвіл 300−400 dpi. Непогано мати також спеціальний килимок під миша, що забезпечує її збереження й довговічність. Вибору монітора ПК слід приділити особливе увагу, бо від якості монітора залежить схоронність вашого зору і загальну стомлюваність під час роботи. Монітори мають стандартний розмір діагоналі в 14,15,17,19,20 і 21 дюйм. Необхідний розмір діагоналі монітора вибирається виходячи із дозволу, що ви збираєтеся працювати. Так, більшість додатків цілком достатньо мати 14 дюймовий монітор, що забезпечує роботу при санкціях до 800 на 600 точок. ПК може мати звукову карту. З одного боку, звукова карта перестав бути необхідним елементом комп’ютера, але, з іншого боку, дозволяє перетворити їх у потужне підмога під час навчання і написанні музики, вивченні мов. Та й наскільки бити ворогів на екрані, а то й чуєш їх передсмертні крики. Найпростішої картою є Adlib, що дозволяє відтворювати лише музику без оцифрованою промови. І CD-ROM, з одного боку, також є яка потрібна на функціонування комп’ютера частиною, але стає дедалі і більше популярними через відкликання тенденцією поставляти професійне, обучающее і ігрове програмне забезпечення на CD-дисках.
2. Відмінності процессоров.
2.1. Відмінності процесорів SX, DX, SX2, DX2 і DX4.
SX і DX позначає «полегшену «і повну версію однієї й тієї ж процесора. Для 386 варіант SX було з 16-pазpядным інтерфейсом, що дозволяло заощаджувати на обв’язки та викладачу встановлювати пам’ять дві SIMM, а чи не по чотири, як DX. Пpи працювати з 16-pазpядными програмами 386SX майже відстає від 386DX тій самій частоті, проте, попри 32-pазpядных програмах він працює відчутно повільніше через поділу кожного 32-pазpядного запиту до пам’яті на два 16-pазpядных. Hа самому ж більшість комп’ютерів з 386DX працюють швидше комп’ютерів з SX навіть у 16-pазpядных програмах — тому, що у платах з 386DX найчастіше встановлено апаратний кеш, якого немає більшості плат з SX. внутрішня архітектура 386SX — повністю 32-pазpядная, і програмно знайти відмінність між SX і DX без запиту коду процесора чи виміру швидкості роботи магистpали загалом разі невозможно.
Для 486 SX позначає варіант без убудованого співпроцесора. Ранні моделі виглядали просто отбраковку від DX з несправним співпроцесором — співпроцесор у яких був заблокований, й у установки такого процесора замість DX вимагалося перелаштувати системну плату. Більше пізні версії випускалися самостійно, і може встановлюватися замість DX без зміни настройки плати. Крім відсутності співпроцесора і ідентифікаційних кодів, моделі SX також нічим немає від відповідних моделей DX, і встановлюють програмне розрізнення в загальному разі теж невозможно.
SX2, DX2 і DX4 — варіанти відповідних процесорів з внутрішнім подвоєнням чи утроением частоти. Hапpимеp, апаратна настроювання плати для DX2−66 робиться, як DX33, і вхід подається частота 33 МГц, однак у програмної їх настроюванні може знадобитися збільшення затримок при зверненні до пам’яті як компенсація зрослої швидкості роботи процесора. Усі внутрішні операції в процесорах виконуються відповідно дві, і три разу швидше, проте обмін по зовнішньої магистpали визначається зовнішньої тактовою частотою. У результаті DX4−100 працює втричі швидше DX33 лише за тими ділянках програм, які цілком вкладаються у його внутрішній кеш, великих фрагментах цей показник може впасти до двох із половиною і меньше.
Hекотоpые серії процесорів AMD (зокрема — 25 253) випускали з єдиним кристалом DX4, яку міг переключатися в режим подвоєння по низького рівня виведенні B-13. маркірування як DX2 чи DX4 проводилася за результатам тестів; відповідно, процесор, маркірований як DX4, міг працюватиме, як DX2 і навпаки. Процесорам Intel DX4 — 100 можуть переключатися в режим подвоєння по низького рівня виведенні R — 17. процесор AMD 5×86 стандартно працює із утроением зовнішньої частоти, а низький рівень виведенні R — 17 переключає їх у режим учетвеpения.
2.2. Позначення «SL — Enhanced «у процесорів Intel 486.
Hаличие SMM (System Management Mode — режим управління системою), використовуваного головним чином заради перекладу процесора в економічний режим. Ще позначається як «P.S — Series », з додаванням до позначенню процесора суфікса «-P.S ». У SL — Enhanced процесорах є також команда CPUID, яка повертає ідентифікатор процессора.
2.3. Відмінності процесорів UMC 486 U5 від Intel, AMD і других.
Насамперед — оптимизированным микрокодом, рахунок чого часто використовувані команди виконуються за менше тактів, ніж у процесорах Intel, AMD, Cyrix та інших. Пpоцессоpы U5 немає внутрішнього множення частоти, а результати в 65 МГц і такі, одержувані деякими програмами, виходять бо визначення частоти програмі необхідно правильно впізнати процесор — точніше, число тактів, протягом якого виконає тестову послідовність, а більшість поширених програм не вміють правильно впізнавати U5. З цієї причини на U5 зависає гра Heretic, помилково знайшовши у ньому співпроцесор — щоб це виключити, у командної рядку Heretic вказати ключ «- debug » .
2.4. Чіпи RISC і CISC. RISC — це абревіатура від Reduced Instruction Set Computer (комп'ютер з скороченим набором команд), а CISC — абревіатура від Comlex Instruction Set Computer (комп'ютер які з набором команд). Суттєва різниця з-поміж них ось у чому: чіпи RISC розуміють лише ті інструкції, але кожну їх можуть виконати нас дуже швидко. Програми для RISC-машин досить складні, але виконуються скоріше тих, які сумісні з CISC-машинами. Hо, то, можливо, і так? (Дослідження продуктивності ще завершены.).
Усі чіпи Intel 80×86 (як і чіпи Motorola 680×0 (68 010,68020,., 68 040), використовувані в комп’ютерах Macintosh і NeXT) є яскравими представниками CISC-чипов. Hекоторые робочі станції, починаючи з IBM, використовують чіпи RISC.
2.5. Ідентифікація чипів Intel і AMD.
2.5.1. Кодекси даты.
Просіть у продавця кодекси дати колись, ніж Ви купіть процесор. Усі ЦПУ мають дату випуску, яка проставляється на корпусі. Упевніться, що ви купуєте новий процесор, а чи не прошлогодний.
Наприклад A80486DX33 (by Intel).
V74400223 V — перший символ, код заводу (plant code); 7 — другий символ, це остання цифра року процесора, аналізований процесор випущено 1987 року; 44 — наступні два цифри, 44-та робоча тиждень нинішнього року (1987); 002 — такі 3 цифри, номер партії (sequence number); 3 — код заміни (change code).
Hапример E6 9433 DPD (on AMD CPUs) E6 — версія реалізації (version release); 9433 — випущено на 33 робочої тижню 1994 року; DPD — шифр серії (wafer number);
2.5.2. Версія процессора.
Просіть даних про версії процесора. Порівняйте версію процесора, який Вам пропонують з процесорами Intel 800−468−3548 чи AMD 800−222- 9323, оскільки попередні версії процесорів мають помилки й різні дефекты.
2.5.3. Demo-образцы.
Ніколи не платіть повну ціну за demo-образцы. AMD і Intel роблять технічні зразки кожної версії процесора, колись, чому розпочато би серійний випуск процесора. Такий ЦПУ може мати ошибки (дефекты), оскільки зазвичай створено випробування. Не передбачається, що така процесор продадуть кінцевому пользователю.
Hапример: Нормальна версія (normal version): i486DX-33: Розробка зразків (engineering samples): i486DX-33 E.
2.5.4. Перемаркированные процессоры.
Перемаркированные процесори (remaked CPUs) — це процесори, які розганяють сильніше, ніж оригінальні ще високу ціну і перерозподілу прибутку. Ці дії є незаконними. Використання такого ЦПУ завжди ризиковано. Разгонка процесора трапляється успішної, наприклад, з 33MHz до 40MHz, чи з 25MHz до 33MHz, але завжди. Використання розігнаного процесора призводить до перегреванию чіпа та її нестабільної роботі, що нерідко слугує причиною різноманітних помилок, збоїв і зависань системи. Перемаркированный і розігнаний ЦПУ має значно коротший термін служби, оригінальну процесор, завдяки перегреванию чипа.
3. Процесорам фірми Intel.
3.1. Сучасна микропроцессорная технологія фірми Intel.
Досягнення фірми Intel мистецтво проектування й виробництва напівпровідників дають можливість виробляти потужні мікропроцесори в все більш малих корпусах. Розробники мікропроцесорів нині працюють із комплиментарным технологічним процесом метав — оксид напівпровідник (CMOS) з дозволом менш, ніж микрон.
Використання субмикронной технології дозволяє розробникам фірми Intel розташовувати більше транзисторів з кожної підкладці. Це зробило можливим збільшення кількості транзисторів для сімейства X86 від 29,000 в 8086 процесорі до 1,2 мільйонів гривень на процесорі Intel486 DX2, із найвищим досягненням в Pentium процесорі. Виконаний по 0.8 микронной BiCMOS технології, він містить 3.1 мільйона транзисторів. Технологія BiCMOS об'єднує переваги двох технологій: біполярної (швидкість) і CMOS (мале енергоспоживання). З допомогою більш, ніж у двічі більшого кількості транзисторів Pentium процесора проти Intel486, розробники помістили на підкладці компоненти, раніше які розміщувалися зовні процесора. Наявність компонентів всередині зменшує час доступу, що істотно збільшує продуктивність. 0.8 мікронна технологія фірми Intel використовує тришаровий метал і має рівень, вищий по порівнянню з оригінальної 1.0 микронной технологією двухслойного металу, яка у процесорі Intel486.
3.2. Перші процесори фірми Intel.
За 20-річну історію розвитку мікропроцесорної техніки, провідні позиції з цій галузі займає американська фірма Intel (INTegral ELectronics). Поки фірма Intel початку випускати мікрокомп'ютери, вона розробляла і виробляла решта видів інтегральних мікросхем. Головною її продукцією були мікросхеми для калькуляторів. У 1971 р. вона розробила та випустила першим у світі 4-битный мікропроцесор 4004. Фірма спочатку продавала його як убудованого контролера (щось на кшталт кошти управління вуличним світлофором чи мікрохвильової піччю). 4004 був четырехбитовым, тобто. міг зберігати, обробляти і нотувати у пам’ять чи зчитувати з її четырехбитовые числа. Після чіпа 4004 з’явився 4040, але 4040 підтримував зовнішні переривання. Обидва чіпа мали фіксований число внутрішніх індексних регістрів. Це означало, що що їх програми були обмежені числом вкладень підпрограм до 7.
1972;го р., тобто. через року, після появи 4004, Intel випустила черговий процесор 8008, але справжній успіх їй приніс 8-битный мікропроцесор 8080, який оголосили 1973 р. Цей мікропроцесор здобув собі дуже стала вельми поширеною в усьому світі. Тепер у країні його аналог — мікропроцесор KP580ИК80 застосовують у багатьох побутових персональні комп’ютери і багатьох контроллерах. З чіпом 8080 також пов’язано поява стека зовнішньої пам’яті, що дозволило використовувати програми будь-який вложенности.
Процесор 8080 був основною частиною першого невеликого комп’ютера, який одержав стала вельми поширеною в діловому світі. Операційна система йому було створено фірмою Digital Research і називалась Control Program for Microcomputers (CP/M).
3.3. Процесор 8086/88.
У 1979 р. фірма Intel першої випустила 16-битный мікропроцесор 8086, можливості якого було близькі та можливостей процесорів миникомпьютеров 1970;х років. Мікропроцесор 8086 виявився «прабатьком «цілого сімейства, яку називають сімейством 80×86 чи х86.
Hесколько пізніше з’явився мікропроцесор 8088, архітектурно повторює мікропроцесор 8086 і має 16-битный внутрішні регістри, але його зовнішня шина даних становить 8 біт. Широкій популярності мікропроцесора сприяло застосування фірмою IBM в персональних комп’ютерах PC і PC/XT.
3.4. Процесор 80 186/88.
1981;го р. з’явилися мікропроцесори 80 186/80188, які зберігали базову архітектуру мікропроцесорів 8086/8088, але містили на кристалі контролер прямого доступу до пам’яті, счетчик/таймер і контролер переривань. З іншого боку, була на кілька розширено система команд. Проте поширення ці мікропроцесори (як і персональні комп’ютери PCjr з їхньої основі), не получили.
3.5. Процесор 80 286.
Наступним великим кроком у розробці нових ідей став мікропроцесор 80 286, що з’явився 1982 року. Під час розробки врахували досягнення у архітектурі мікрокомп'ютерів і великих комп’ютерів. Процесор 80 286 може працювати у двох режимах: як реального адреси він эмулирует мікропроцесор 8086, а захищеному режимі віртуального адреси (Protected Virtual Adress Mode) чи P-режиме надає програмісту багато нових можливостей та коштів. У тому числі можна назвати розширене адресне простір пам’яті 16 Мбайт, поява дескрипторів сегментів і дескрипторных таблиць, наявність захисту за чотирьом рівням привілеїв, підтримку організації віртуальної пам’яті і мультизадачности. Процесор 80 286 застосовується у ПК PC/AT і молодших моделях PS/2.
3.6. Процесор 80 386.
Під час розробки 32-битного процесора 80 386 знадобилося вирішити дві основні завдання — сумісність і продуктивність. Перша їх було вирішено за допомогою эмуляции мікропроцесора 8086 — режим реального адреси (Real Adress Mode) чи R-режим.
У Р — режимі процесор 80 386 може виконувати 16-битные програми (код) процесора 80 286 без будь-яких додаткових модифікацій. Разом з тим, у тому ж режимі може виконувати свої «природні «32-битные програми, що реформує з підвищення продуктивності системи. Саме цьому режимі реалізуються дедалі нові можливості і кошти процесора 80 386, серед яких можна назвати масштабированную индексную адресацію пам’яті, ортогональное використання регістрів загального призначення, нові команди, кошти налагодження. Адресне простір пам’яті у тому режимі становить 4 Гбайт.
Мікропроцесор 80 386 дає розробникові систем велика кількість нові й ефективних можливостей, включаючи продуктивність від 3 до запланованих 4 мільйон операцій на секунду, повну 32-битную архітектуру, 4 гигабитное (2 байт) фізичне адресне простір і внутрішнє забезпечення роботи з страничной віртуальної памятью.
Попри введення у нього останніх досягнень мікропроцесорної техніки, 80 386 зберігає сумісність по об'єктному коду з сучасним програмним забезпеченням, було багато написаним щодо його попередників, 8086 і 80 286. Особливо цікава таке властивість 80 386, як віртуальна машина, що дозволяє 80 386 переключатися у виконанні програм, керованих різними операційними системами, наприклад, UNIX і MS-DOS. Це властивість дозволяє виробникам оригінальних систем безпосередньо вводити прикладне програмне забезпечення для 16-битных машин системі з урахуванням 32-бітних мікропроцесорів. Операційна система Pрежиму може створювати завдання, яка може працювати у режимі віртуального процесора 8086 (Virtual 8086 Mode) чи V-режим. Прикладна програма, яка виконується у тому режимі, вважає, що вона на процесорі 8086.
32-битная архітектура 80 386 забезпечує програмні ресурси, необхідних підтримки «великих «систем, характеризуемых операціями з великими числами, великими структурами даних, великими програмами (чи великою кількістю програм) тощо. Фізичне адресне простір 80 386 складається з 2 байт чи 4 Гбайт; його логічне адресне простір полягає з 2 байт чи 64 терабайт (Тбайт). Вісім 32-бітних загальних регістрів 80 386 може бути взаимозаменяемо використані як операнды команд як і перемінні різних способів адресації. Типи даних містять у собі 8-, 16- чи 32-битные цілі і порядкові, упаковані і неупаковані десяткові, покажчики, рядки біт, байтів, слів і подвійних слів. Мікропроцесор 80 386 має систему команд для операцій над цими типами даних, і навіть керувати виконанням програм. Способи адресації 80 386 забезпечують ефективний доступом до елементам стандартних структур даних: масивів, записів, масивів записів і записів, містять массивы.
Мікропроцесор 80 386 реалізований з допомогою технології фірми Intel CH MOSIII — технологічного процесу, яка об'єднує можливості для високого швидкодії технології HMOS малим споживанням технології кмоп. Використання геометрії 1,5 мкм і верств металізації дає 80 386 більш 275 000 транзисторів на кристалі. Зараз випускаються обидва варіанти 80 386, працівників частоті I2 і I6 МГц без станів очікування, причому варіант 80 386 на 16 МГц забезпечує швидкість роботи 3−4 мільйона операцій на секунду.
Мікропроцесор 80 386 розділений всередині на 6 автономно і йде паралельно працюючих блоків із відповідної синхронізацією. Усі внутрішні шини, що з'єднують ці блоки, мають розрядність 32 біт. Конвеєрна організація функціональних блоків в 80 386 допускає тимчасове накладення виконання різних стадій команди, і дозволяє одночасно виконувати кілька операцій. Крім конвеєрної обробки всіх команд, в 80 386 виконання низки важливих операцій здійснюється спеціальними апаратними вузлами. Блок умножения/деления 80 386 може виконувати 32-битное множення за 9−41 такт синхронізації, залежно від кількості значущих цифр; може розділити 32- бітні операнды за 38 тактів (у разі чисел без знаків) чи 43 такту (в разі чисел зі знаками). Регістр групового зсуву 80 386 може один такт зрушувати від 1 до 64 біт. Звернення до більш повільної пам’яті (або до пристроям ввода/вывода) може виконуватися лише з використанням конвеєрного формування адреси збільшення часу установки даних після адреси до 3 тактів за збереження двухтактных циклів у процесорі. У результаті внутрішнього конвеєрного формування адреси у виконанні команди, 80 386, зазвичай, обчислює адреса київська і визначає наступний магістральний цикл у час поточного магістрального циклу. Вузол конвеєрного формування адреси передає цю випереджувальну інформацію в підсистему пам’яті, дозволяючи, тим самим, одному банку пам’яті дешифрировать наступний магістральний цикл, у те час як іншому банку реагує сучасний магістральний цикл.
3.7. Процесор 80 486.
У 1989 р. Intel представила першого представника сімейства 80×86, що містить понад мільйон (а точніше, 1,2 мільйона) транзисторів в чіпі. Цей чіп багато в чому подібний з 80 386. Його 100% програмно сумісний із мікропроцесорами 386(ТМ) DX & SX. Один мільйон транзисторів об'єднаної кеш-пам'яті (надшвидкої оперативної пам’яті), разом із апаратурою для операцій з плаваючою коми і що пам’яті в одній мікросхемі, тим щонайменше підтримують програмну сумісність з попередніми членами сімейства процесорів архітектури 86. Часто використовувані операції виконуються за цикл, що можна порівняти зі швидкістю виконання RISC-команд. Восьмикилобайтный уніфікований кеш для коду і даних, з'єднаний з шиною пакетного обміну даними зі швидкістю 80/106 Мбайт/сек за частоти 25/33 Мгерц гарантують високу продуктивність системи і з недорогими дисками (DRAM). Нові можливості розширюють многозадачность систем. Нові операції збільшують швидкість роботи з семафорами у пам’яті. Устаткування на мікросхемі гарантує несуперечність кеш-пам'яті і підтримує кошти на реалізацію багаторівневого кэширования. Вбудована система тестування перевіряє микросхемную логіку, кеш-пам'ять і микросхемное постраничное перетворення адрес пам’яті. Можливості налагодження містять у собі установку пасток контрольних точок в выполненяемом коді і за доступі до даних. Процесор i486 має вмонтований в мікросхему внутрішній кеш для зберігання 8Кбайт команд і передачею даних. Кеш збільшує швидкодія системи, відповідаючи на внутрішні запити читання швидше, аніж за виконанні циклу читання оперативної пам’яті по шині. Це засіб зменшує також використання процесором зовнішньої шини. Внутрішній кеш прозорий для працюючих програм. Процесор i486 може використовувати зовнішній кеш другого рівня поза мікросхеми процесора. Зазвичай зовнішній кеш дозволяє швидкодію і зменшити смугу пропускання шини, необхідну процесором i486.
3.7.1.Процессор i486SX Поява нового мікропроцесора i486SX фірми Intel можна вважати однією з найважливіших подій 1991 року. Вже попередні випробування довели, що комп’ютери з урахуванням i486SX з тактовою частотою 20 МГц працюють швидше (приблизно за 40%) комп’ютерів, заснованих на виключно i80386DX з тактовою частотою 33 МГц. Мікропроцесор i486SX, подібно оригінальному i486DX, містить на кристалі і кеш-пам'ять, тоді як математичний співпроцесор в нього заблокований. Значну економію (завдяки виключенню витрат за тестування співпроцесора) дозволила фірмі Intel істотно знизити ціни на всі новий мікропроцесор. Треба сказати, що якщо мікропроцесор i486DX був застосування в мережевих серверах і створення робочих станціях, то i486SX послужив відправною точкою для створення потужних настільних комп’ютерів. Власне кажучи, у сімействі мікропроцесорів i486 передбачається кілька нових можливостей для побудови мультипроцессорных систем: відповідні команди підтримують механізм семафорів пам’яті, апаратно — реалізоване виявлення недостовірності рядки кеш-пам'яті забезпечує узгодженість між кількома модулями кеш-пам'яті тощо. Для мікропроцесорів сімейства i486 допускається адресація фізичної пам’яті розміром 64 Тбайт.
3.8. Intel OverDrive процессор.
Можливість постійного вдосконалювання. Користувачі персональних комп’ютерів дедалі більше зіштовхуються з цим принаймні все зростаючих вимог до микропроцессорам із боку апаратного та програмного забезпечення. Фірма Intel впевнена: найкраща стратегія вдосконалення — спочатку закладена до системи можливість модернізації, модернізації відповідно до вашим потреб. Вперше у світі таку можливість надається нашим споживачам. Фірма Intel розпочала випуск Intel OverDrive процесора, відкриває нову категорію потужних сопроцессоров. Після простий установки цього співпроцесора на плату різко виросте швидкість роботи всієї системи та прикладних програм, у MS-DOS, Windows, OS/2, Windows «95 і UNIX.
З допомогою цієї одній-єдиній мікросхеми Ви відразу ж потрапляє зможете скористатися перевагами нової стратегії фірми Intel, закладених у нашої продукції. Коли настане невідворотний момент, коли Вам знадобиться продуктивність велика, ніж в Вашого комп’ютера, то ми все, що Вам буде потрібно — це вставити OverDrive процесор в вашу систему — і користуватися перевагами, що дає Вам нова микропроцессорная технологія фірми Intel. Більш як просто модернізація, OverDrive процесор — це стратегія захисту Ваших нинішніх і майбутніх вкладів у персональні компьютеры.
Intel OverDrive процесор гарантує Вам відповідальну стандартам і економічну модернізацію. Усього лише один мікросхема збільшить обчислювальну міць Вашого комп’ютера до вимог найсучаснішого програмного забезпечення і навіть програм, котрі написані, в MSDOS, в Windows, в PS/2, в UNIX, від AutoCAD — до WordPerfect.
Отже, наше перше мікропроцесор у серії Single Chip Upgrade (Якісна поліпшення — однієї мікросхемою) — це OverDrive процесор для систем з урахуванням Intel i486SX. Встановлений в OverDrive — розняття, цей процесор дозволяє системі i486SX використовувати новітню технологію «подвоєння швидкості «, яка у процесорі i486DX2, і що дає загальне збільшення продуктивності до70%. OverDrive процесор для систем i486SX містить модуль операцій над цілими числами, модуль операцій над числами з плаваючою точкою, модуль управління пам’яттю і 8К кеш-пам'яті однією кристалі, що працює на частоті, вдвічі перевищує тактову частоту системної шини. Це унікальна властивість дозволяє Вам подвоїти тактову частоту Вашої системи, не витрачаючись для придбання та встановлення інших додаткових компонентів. OverDrive процесор подвоїть, наприклад, внутрішню частоту МП i486SX 25 МГц до 50 МГц.
Хоча Intel OverDrive — це зовсім нова технологія якісної модернізації, у ньому впізнаються і фамільні риси Intel. Виготовлений і випробуваний відповідно до жорсткими стандартами Intel, OverDrive відрізняється зарекомендували себе властивостями продукції Intel: якістю й надійністю. OverDrive забезпечений постійної гарантією і звичним сервісом і в усьому світі. OverDrive повністю сумісний з понад 50 000 прикладних програм. OverDrive процесор для i486SX — лише перший із наших нових процесорів. У другому півріччі 1992 роки ми випустимо OverDrive процесор для систем i486DX2, самих собою які мають нове покоління технології МП. Потужний і доступний, OverDrive процесор прокладе для Вас безперервний шлях до якісно новим рівням продуктивності персональних компьютеров.
Hекоторые результати лабораторних випробувань Intel OverDrive процессора:
1. Фундаментальна обізнаність із Microsoft Word for Windows 6.1 серед Windows 3.0, популярним текстовим процессором.
Тест виконувався на системі з i486SX 20 МГц з файлом 330 КВ. WordPerfect, перетвореному в формат Windows Word, було реалізоване 648 контекстных пошуків і замін, перевірка правопису в усьому файлі, потім файл був сохранен.
Час виконання: i486SX без OverDrive =107 с.
—————————————— ВИГРАШ = 57% i486SX з OverDrive = 68 с.
2. Фундаментальна обізнаність із Lotus 1−2-3 Release 3.0, електронної таблиці, наближення за можливостями до інтегрованої середовищі, яка має широким вибором аналітичних, економічних пріоритетів і статистичних функций.
Тест виконувався на i486SX 20 МГц з таблицею обсягом 433К на 10 000 осередків, що була завантажена і пересчитана. З іншого боку, був оброблений великий блок текстових данных.
Час виконання: i486SX без OverDrive=250 с.
—————————————— ВИГРАШ = 481% i486SX з OverDrive = 43 с.
i486SX з i487SX = 72 с.
—————————————— ВИГРАШ = 67% i486SX з OverDrive = 43 c.
3. Фундаментальна обізнаність із AutoCAD, популярної системою САПР.
Тест виконувався на i486SX 20 МГц з тривимірним архітектурним кресленням, з якого виконувалися операції перечеркивания, панорамирования, масштабирования, видалення прихованих ліній і повторної генерації файла у зовнішньому формате.
Час виконання: i486SX з i487SX = 162 с.
—————————————— ВИГРАШ = 45% i486SX з OverDrive = 112 c.
І що говорять про OverDrive процесорі ті, кому вже пощастило попрацювати з ним:
Брент Грехем: (фахівець із автоматизації офісів, US Bank, Портленд) «З такими можливостями модернізації, що надає Intel 486, я — не бачу причин, не використовувати OverDrive процесор. Що ж до його встановлення до системи, з цим впорається навіть мій 10-річний синочок. «.
Білл Лодж: (керівник проектної групи, Corporation, Нью — Йорк) «Працював із Windows і OS/2 у мережі Banyan Wines, використовуючи OverDrive процесор без єдиної затримки. Моя вдосконалена система з i486SX 25 МГц не гірше, ніж системи на 50 МГц. «.
Стів Симмонс: (технічний менеджер, Даллас) «Windows верещить від щастя, коли з OverDrive процесором. Розрахунки в електронній таблиці в Excel виконуються миттєво. «.
3.9. Процесор Pentium.
Тоді, коли Винод Дэм робив перші начерки, давши старт на червні 1989 року розробку Pentium процесора, і гадки не мав, саме цей продукт буде однією з головних досягнень фірми Intel. Щойно виконувався нову фазу поетапного проекту, відразу починався процес всеосяжного тестування. Для тестування розробили спеціальна технологія, що дозволило імітувати функціонування Pentium процесора з використанням программируемых пристроїв, об'єднаних на 14 платах з допомогою кабелів. Тільки коли знайшли все помилки, процесор зміг працювати у реальної системі. На додачу до всього, у процесі розробки та тестування Pentium процесора брали активну все основні розробники персональних комп’ютерів, і програмного забезпечення, що чимало сприяло загальному успіху проекту. Наприкінці 1991 року, коли було завершено макет процесора, інженери змогли запустити у ньому програмне забезпечення. Проектувальники почали вивчати під мікроскопом розведення і проходження сигналів по підкладці із єдиною метою оптимізації топології і підвищення ефективності роботи. Проектування переважно завершили у лютому 1992 року. Почалося всеосяжне тестування досвідченої партії процесорів, протягом якого випробувань піддавалися все блоки і вузли. У 1992 року було прийнято рішення, що наспів час промислове освоєння Pentium процесора. Як основний промислової бази було обрано 5 Орегонская фабрика. Більше 3 мільйонів транзисторів були остаточно перенесені шаблони. Почалося промислове освоєння виробництва та доведення технічних характеристик, які завершилися через 10 місяців, 22 березня 1993 року широкої презентацією Pentium процессора.
Об'єднуючи більш, ніж 3.1 мільйон транзисторів в одній кремнієвої підкладці, 32-разрядный Pentium процесор характеризується високої продуктивністю з тактовою частотою 60 і 66 МГц. Його суперскалярная архітектура використовує удосконалені способи проектування, які дозволяють виконувати більш, ніж одну команду за період тактовою частоти, у результаті Pentium може виконувати величезне кількість PC-совместимого програмного забезпечення швидше, ніж будь-який інший мікропроцесор. Крім існуючих напрацювань програмного забезпечення, високопродуктивну арифметичний блок з плаваючою коми Pentium процесора забезпечує збільшення обчислювальної потужності до яка потрібна на використання недоступних раніше технічних і наукових додатків, спочатку виділені на платформ робочих станций.
Численні нововведення — риса Pentium процесора як унікального поєднання високої продуктивності, сумісності, інтеграції даних, і наращиваемости. Це включает:
— Суперскалярную архитектуру;
— Окреме кэширование програмного коду і данных;
— Блок передбачення правильного адреси перехода;
— Високопродуктивну блок обчислень з плаваючою запятой;
— Розширену 64-битовую шину данных;
— Підтримку многопроцессорного режиму работы;
— Кошти завдання розміру сторінки памяти;
— Кошти виявлення помилок, і функціональної избыточности;
— Управління производительностью;
— Наращиваемость з допомогою Intel OverDrive процесора. Cуперскалярная архітектура Pentium процесора представляє собою сумісну тільки з Intel двухконвейерную індустріальну архітектуру, що дозволить процесору досягати нових рівнів продуктивності у вигляді виконання більш, ніж однієї команди за період тактовою частоти. Термін «суперскалярная «позначає мікропроцесорну архітектуру, що містить більше обчислювального блоку. Ці обчислювальні блоки, чи конвеєри, є вузлами, де відбуваються дедалі основні процеси обробки даних, і команд.
Поява суперскалярной архітектури Pentium процесора представляє собою природне розвиток попереднього сімейства процесорів з 32-битовой архітектурою фірми Intel. Наприклад, процесор Intel486 здатний виконувати кілька своїх команд за період тактовою частоти, проте попередні сімейства процесорів фірми Intel вимагали безліч циклів тактовою частоти до виконання однієї команды.
Можливість виконувати безліч команд за період тактовою частоти існує тому, що Pentium процесор має дві конвеєра, які можуть опинитися виконувати дві інструкції одночасно. Також, як і Intel486 з однією конвеєром, подвійний конвеєр Pentium процесора виконує просту команду не за п’ять етапів: попередня підготовка, перше декодування (декодування команди), друге декодування (генерація адреси), виконання та зворотна выгрузка.
У цих архітектурних нововведень, проти попередніми мікропроцесорами, значно більше команд може виконати впродовж одного і те время.
Інше найважливіше революційне вдосконалення, реалізоване в Pentium процесорі, це запровадження роздільної кэширования. Кэширование збільшує продуктивність у вигляді активізації місця їхнього тимчасового зберігання для часто використовуваного програмного коду та об'єктивності даних, отримуваних з швидкої пам’яті, замінюючи наскільки можна звернення до зовнішньої системної пам’яті декому команд. Процесор Intel486, наприклад, містить один 8- KB блок вбудованої кеш-пам'яті, використовуваної одночасно для кэширования програмного коду і данных.
Проектувальники фірми Intel обійшли це обмеження використанням додаткового контуру, виконаного на 3.1 мільйонах транзисторів Pentium процесора (порівнювати, Intel486 містить 1.2 мільйона транзисторів) створюють роздільне внутрішнє кэширование програмного коду та об'єктивності даних. Це покращує продуктивність у вигляді винятку конфліктів на шині і робить подвійне кэширование доступним частіше, ніж було можливо раніше. Наприклад, під час фази попередньої підготовки, використовується код команди, отриманий із КЭШа команд. У наявності одного блоку кешпам’яті, може бути конфлікт між процесом попередньої підготовки команди, і доступом до даних. Виконання роздільного кэширования для команд та об'єктивності даних виключає такі конфлікти, дає можливість обом командам виконуватися одночасно. Кеш-пам'ять програмного коду і передачею даних Pentium процесора містить по 8 KB інформації кожна, й кожна організована як набір двоканального асоціативного КЭШа — призначена для записи лише попередньо переглянутого специфікованого 32-байтного сегмента, причому швидше, ніж зовнішній кеш. Всі ці особливості розширення продуктивності зажадали використання 64-битовой внутрішньої шини даних, що забезпечує можливість подвійного кэширования і суперскалярной конвеєрної обробки разом з завантаженням наступних даних. Кеш даних має дві інтерфейсу, за одним кожного з конвеєрів, що дозволяє йому забезпечувати даними дві окремі інструкції впродовж машинного циклу. Потому, як дані дістаються з КЭШа, вони записуються на головну пам’ять як зворотної записи. Така техніка кэширования дає кращу продуктивність, аніж простий кэширование з безпосередньої записом, у якому процесор записує дані одночасно у кеш основну пам’ять. Проте, Pentium процесор здатний динамічно конфигурироваться на підтримку кэширования з безпосередньої записью.
Отже, кэширование даних використовує два різних чудових рішення: кеш із другого записом і алгоритм, під назвою MESI (модифікація, виняток, розподіл, звільнення) протокол. Кеш з зворотної записом дозволяє нотувати у кеш без звернення до основний пам’яті на відміну використовуваного доти безпосереднього простого кэширования. Ці рішення збільшують продуктивність з використання реформованій шини і запобіжного винятку самого вузького місця у системі. Натомість MESI-протокол дозволяє даним в кеш-пам'яті і зовнішньої пам’яті збігатися — чудове рішення, у удосконалених мультипроцессорных системах, де різні процесори може використати до роботи одні й самі данные.
Блок передбачення правильного адреси переходу — це таке чудове рішення для обчислень, збільшує продуктивність у вигляді повного заповнення конвеєрів командами, заснований на попередньому визначенні правильного набору команд, що їх выполнены.
Pentium процесор дозволяє виконувати математичні обчислення на рівні завдяки використанню удосконаленого убудованого блоку обчислень з плаваючою коми, що включає восьмитактовый конвеєр і апаратно реалізовані основні математичні функції. Четырехтактовые конвеєрні команди обчислень з плаваючою коми доповнюють четырехтактовую целочисленную конвейеризацию. Більшість команд обчислень з плаваючою коми можуть виконуватися щодо одного целочисленном конвеєрі, після чого подаються у конвеєр обчислень з плаваючою коми. Звичайні функції обчислень з плаваючою коми, такі як складання, множення і розподіл, реалізовані апаратно з прискорення вычислений.
У цих інновацій, Pentium процесор виконує команди обчислень з плаваючою коми вп’ятеро швидше, ніж 33-МГц Intel486 DX, новий турбогенератор оптимізує їх задля високошвидкісних про чисельні обчислень, є невід'ємною частиною таких удосконалених видеоприложений, як CAD і 3Dграфика.
Pentium процесор зовні є 32-битовое пристрій. Зовнішня шина даних до пам’яті є 64-битовой, подвоюючи кількість даних, що передаються у протягом одного шинного циклу. Pentium процесор підтримує кілька типів шинних циклів, включаючи пакетний режим, в протягом якої відбувається порція даних із 256 біт в кеш даних, і в протягом одного шинного цикла.
Шина даних є головним магістраллю, яка передає інформацію між процесором і підсистемою пам’яті. Завдяки цій 64-битовой шині даних, Pentium процесор істотно підвищує швидкість передачі по порівнянню з процесором Intel486 DX — 528 MB/сек для 66 МГц, порівняно зі 160 MB/сек для 50 МГц процесора Intel486 DX. Ця розширена шина даних сприяє високошвидкісним обчисленням завдяки підтримці одночасної підживлення командами та даними процесорного блоку суперскалярных обчислень, завдяки чому досягається ще більше загальна продуктивність Pentium процесора проти процесором Intel486 DX.
Даючи можливість розробникам проектувати системи з міським управлінням енергоспоживанням, захистом та інші властивостями, Pentium процесор підтримуємо режим управління системою (SMM), такий режиму архітектури Intel SL.
Разом із всім, що зроблено нового для 32-битовой мікропроцесорної архітектури фірми Intel, Pentium процесор сконструйовано для легкої наращиваемости з допомогою архітектури нарощування фірми Intel. Ці нововведення захищають інвестиції користувачів у вигляді нарощування продуктивності, що допомагає підтримувати рівень продуктивності систем, заснованих на виключно архітектурі процесорів фірми Intel, більше, ніж тривалість життя окремих компонентів. Технологія нарощування уможливлює використовувати переваги більшості процесорів удосконаленої технологи у вже наявних системах з допомогою простий інсталяції кошти однокристального нарощування продуктивності. Наприклад, перший засіб нарощування — це OverDrive процесор, розроблений для процесорів Intel486 SX і Intel486 DX, використовує технологію простого подвоєння тактовою частоти, використану при розробці мікропроцесорів Intel486 DX2.
Перші моделі процесора Pentium працювали на частоті 60 і 66 МГц і спілкувалися зі своїми зовнішньої кэш-памятью другого рівня по 64-битовой шині даних, яка працює повній швидкості процесорного ядра. Hо якщо швидкість процесора Pentium зростає, то системному розробникові дедалі складніше і трохи дорожчий обходиться його узгодження з материнською платою. Тому швидкі процесори Pentium використовують дільник частоти для синхронізації зовнішньої шини з допомогою меншою частоти. Hапример, у 100 МГц процесора Pentium зовнішня шина дбає про 66 МГц, а й у 90 МГц — на 60 МГц. Процесор Pentium використовує те ж шину для доступу до основний пам’яті і до периферійним підсистемам, таких як схеми PCI.
3.10. Процесор Pentium Pro.
3.10.1. Загальне опис процессора.
Pentium Pro це високотехнологічний процесор шостого покоління для высокоуровневых десктопов, робочих станцій та мультипроцессорных серверів. Масове виробництво процесора Pentium Pro, що містить на кристалі стільки транзисторів, скільки ніколи було на серійних процесорах, відразу у кількох варіантах стартує із першого листопада, тобто. від моменту оголошення. Безпрецедентний випадок у історії компанії, та й електронної промышленности.
Hапомним його особливості. Агресивна суперконвейерная схема, підтримує виконання команд в довільному порядку, умовне виконання далеко наперед (на 30 команд) і трехпоточная суперскалярная микроархитектура. Всі ці методи можуть приголомшити, і жоден з них є оригінальним: нові чіпи NexGen і Cyrix також використовують подібні схеми. Проте, Intel має ключовим перевагою. У процесори Pentium Pro її вмонтовано вторинна кеш-пам'ять, сполучена з ЦПУ окремої шиною. Ця кеш, виконана як окремого кристала статичного ОЗУ ємністю 256К чи 512К, змонтованого другою посадковому місці незвичного двомісного корпусу процесора Pentium Pro, значно спростила розробникам проектування конструювання обчислювальних систем з його основе.
Реальна продуктивність процесора виявилася набагато вища 200 одиниць, які називалися як запланованого стартового орієнтиру при лютневому технологічному анонсировании P6.
Pentium Pro це значний крок уперед. І хоча у процесорі Pentium уперше було реалізована суперскалярная форма архітектури х86, однак була обмежена реалізація: у ньому інтегрована пара цілочислових конвеєрів, які можуть опинитися обробляти дві прості команди паралельно, однак у порядку прямування команд у програмі і т.зв. умовного виконання (наперед). Hапротив, новий процесор це трехпоточная суперскалярная машина, яка здатна одночасно відстежувати проходження п’яти команд. Для узгодження з такою високої пропускною спроможністю знадобилося різко поліпшити схему кэширования, розширити файл регістрів, підвищити глибину упреждающей вибірки і умовного виконання команд, вдосконалити алгоритм передбачення адрес переходу і реалізувати справжню машину даних, обробну команди за порядку, а відразу після мері готовності даних їм. Зрозуміло, що цю схему щось більше, ніж Pentium, як і підкреслює, на думку Intel, суфікс Pro в імені процессора.
3.10.2. Два кристала щодо одного корпусе.
Найбільш вражаюча риса Pentium Pro — тісно що з процесором кеш-пам'ять другого рівня (L2), кристал якої змонтовано тій самій підкладці, як і ЦПУ. Саме такими, Pentium Pro це два чіпа щодо одного корпусі. Hа одному чіпі розміщено власне ядро процесора, у тому числі два 8- Килобайтовых блоку кеш-пам'яті першого рівня; інший чіп це 256-Кб СОЗУ, функціонуюче як четырехканальная порядково — асоціативна кеш другого уровня.
Два цих кристала об'єднують у загальному 387-контактном корпусі, але пов’язані лініями, не що виходять на зовнішні контакти. Hекоторые компанії називають такий чіп корпусу ЧСЧ (multichip module), проте Intel використовує йому термін dual — cavity PGA (pin — grid array). Різниця занадто невловима і, цілком можливо, у сфері маркетингу, а чи не технології, оскільки використання ЧСЧ запрацювало собі репутацію дорогої технології. Але, порівнюючи ціни на всі процесори Pentium і Pentium Pro, можна стверджувати, нова термінологія виправить стан справ, оскільки P6 претендує на статус масового процесора. Вперше за історію промисловості многокристальный модуль стане крупносерийным изделием.
Ступінь інтеграції нового процесора також вражає: він містить 5.5 млн. транзисторів, ще й 15.5 млн. входить до складу кристала кеш-пам'яті. Порівняйте, остання версія процесора Pentium складається з 3.3 млн. транзисторів. Природно, до цього число не включена кеш L2, оскільки Pentium вимагає встановлення зовнішнього комплекту мікросхем статичного ОЗУ для реалізації вторинної кэш-памяти.
Елементарний розрахунок допоможе зрозуміти 6почему на 256К пам’яті, потрібно таку величезну число транзисторів. Це статична ОЗУ, що у відмінність від динамічного, має лише транзистор на біт збереження і періодично регенерируемого, використовує для зберігання біта осередок з 6 транзисторов:
256×1024×8 біт x 6 ін — рів = 12.5 млн. транзисторів. З урахуванням буферів і обв’язки нагромаджувача таки вийде 15.5 миллионов.
Площа процесорного кристала дорівнює 306 кв. мм. (порівнювати, у першого процесора Pentium кристал мав площа 295 кв. мм). Кристал статичної пам’яті, як всяка регулярна структура, упакований набагато щільніше — 202 кв. мм. Тільки Pentium Pro 150 MHz виготовляється за 0.6- микронной технології. Решта версії нового процесора виготовляються по 0.35-микронной BiCMOS-технологии з четырехслойной металлизацией.
Чому компанія Intel пішла на двухкристалльный корпус, об'єднавши ядро ЦПУ з вторинним КЭШем? У — перших комбінований корпус значно спростив виготовлювачам ПК розробку високопродуктивних систем на процесорі Pentium Pro.
Один із головних проблем під час проектування комп’ютера на швидкому процесорі пов’язані з точним узгодженням із процесором вторинного КЭШа по його розміру та конфігурацій. Вбудована в Р6 вторинна кеш вже тонко налаштована під ЦПУ і дозволяє розробникам систем швидко інтегрувати готовий процесор на материнську плату.
По-друге, вторинна кеш міцно пов’язана з ядром ЦПУ з допомогою виділеної шини шириною 64 біта, яка працює однаковою з нею частоті. Якщо ядро синхронізується частотою 150 МГц, то кеш повинна працювати на частоті 150 МГц.
Бо у процесорі Pentium Pro є виділена шина для вторинного КЭШа, це вирішує відразу дві проблеми: забезпечується синхронна робота два пристрої на повній швидкості і відсутність конкуренції за шину з іншими операціями вводу-виводу. Окрема шина L2, «задня «шина повністю відділена зовнішньої, «передній «шини виводу-введення-висновку, тож в P6 вторинна кеш корисно своїми циклами операцій із ОЗУ і периферією. Передпокій 64-битовая шина може працювати із частотою, рівної половині, третини чи чверті швидкості ядра Pentium Pro. «Задня «шина продовжує працювати незалежно, на повної скорости.
Така реалізація представляє серйозний крок уперед проти організацією шини процесора pentium та інших процесорів х86. Тільки NexGen наближено нагадує таку схему. Хоча у процесорі Nx586 немає КЭШа L2, зате вмонтований її контролер і полноскоростная шина для зв’язки з зовнішнім кэш-памятью. Подібно Р6, процесор Nx586 спілкується провідною пам’яттю і периферійними підсистемами поверх окремої шини вводу-виводу, працюючої на діленої частоте.
У екзотичному процесором Alpha 21 164 компанія Digital пішла ще далі, інтегрувавши безпосередньо в кристалі на додаток до первинної кеш-пам'яті що й 96 Кбайт вторинної. за рахунок вздувания площі кристала досягнуто безпрецедентна продуктивність кэширования. Транзисторний бюджет Альфи становить 9.3 мільйона транзисторів, більшість якого освічена масивом памяти.
Є один халепа: незвичний дизайн Pentium Pro, мабуть, утруднить експертам задачку обчислення співвідношення ціни, і продуктивності. Інтегрована в процесор кеш начебто прихована геть із. Pentium Pro зможе видатися дорожчим, ніж його конкуренти, але до створення комп’ютера на інших процесорах знадобиться зовнішній набір мікросхем пам’яті і кешконтролер. Ефективний дизайн кэш-структуры означає, що іншим процесорам, претендують на яку можна продуктивність, знадобиться кеш-пам'яті більше, ніж 256 Кбайт.
Унікальний корпус надає свободу створення нових варіантів процесора. У найближчому майбутньому може бути як підвищення обсягу кеш-пам'яті, і її відділення його від процесора відповідно до традиційним підходом. Якщо останній варіант з’явиться, буде, несумісний за зовнішніми висновків з двухкристалльным базовим корпусом, тому що йому треба додати 72 додаткових виведення (64-для «задньої «шини і побачили 8-го контролю помилок). Hо він буде майже настільки ж швидким, якщо буде широко доступна статична пам’ять з пакетним режимом. На думку інженерів Intel, підключення зовнішніх мікросхем пам’яті до «передній «шині Pentium Pro для реалізації кешпам’яті третього рівня, навряд чи виправдано. За відправну точку на таку переконаності служать результати натурного моделювання прототипу системи, що у слідстві високої ефективності інтерфейсу кеш L2-процессор, практично до теоретичного краю завантажує обчислювальні ресурси ядра. Процесор Alpha 21 164, навпаки, спроектований з огляду на необхідність кеш L3.
3.10.3. Значення тестів декому чипів фірми Intel.
|Processor |Intel |Intel |Intel |Intel |Intel | |Benchmarks |Pentium |Pentium |Pentium |Pentium |Pentium | | |Pro |Pro |Pro |Pro |Processo| | |Processo|Processo|Processo|Processo|r | | |r |r |r |r |(133MHz)| | |(200MHz)|(180MHz)|(166MHz)|(150MHz)| | | | | | | | | | | | |w/512K | | | | | | |L2 | | | |UNIX | | | | | | |SPEC95 |8.09 |7.29 |7.11 |6.08 |4.14 | |SPECint95 |8.09 |7.29 |7.11 |6.08 |4.14 | |SPECint_base9|6.75 |6.08 |6.21 |5.42 |3.12 | |5 |5.99 |5.40 |5.47 |4.76 |2.48 | |SPECfp95 | | | | | | |SPECfp_base95| | | | | | |SPEC92 |366.0 |327.4 |327.1 |276.3 |190.9 | |SPECint92 |336.7 |3.5.8 |306.6 |258.3 |175.9 | |SPECint_base9|283.2 |254.6 |261.3 |220.0 |120.6 | |2 |234.3 |210.4 |209.6 |182.0 |107.3 | |SPECfp92 | | | | | | |SPECfp_base92| | | | | | |Windows | | | | | | |Norton System|86.7 |77.6 |Not |67.0 |34.2 | |Index | | |tested | | | |SI32 | | | | | | |Ziff-Davis |541 |466 |Not |412 |278 | |CPUmark32 | | |tested | | |.
4. Процесорам конкурентів Intel.
4.1. Перші процесори конкурентів Intel.
Intel була одна фірмою — виробником мікропроцесорів: існували MOS Technologies, Mostek, Motorola, Rockwell, Standart Microsystems Corporation, Synertek, Texas Instruments. Окремі використовували свої власні проекти чипів, інші - ліцензійні проекти своїх конкурентів. Успішніше всіх у кінці 70-х працювала фірма Zilog. Вона створила чіп Z80.
Тоді, коли комп’ютери, працюючі під керівництвом СР/М, поширилися в офісах, комп’ютери Apple II буквально ввірвалися до школи. Фірма Apple як основне компонента свого комп’ютера вибрала чіп фірми MOS Technologies 6502. То справді був ліцензійний чіп фірми Rockwell and Synertek. Apple початку використовувати процесори Motorola в усіх власних комп’ютерах Macintosh. Розробки фірм Intel і Motorola з’явилися майже одночасно, але об'єднує їх саме це. Мікропроцесори Intel 80 486 і Motorola 68 040, наприклад, майже однакові за складністю та мають функціональні подібні можливості. Проте, вони цілком несумісні. Саме на Macintosh і PC що неспроможні виконуватися одні й самі программы.
Існує принципова різниця в еволюційному розвитку цих двох сімейств мікропроцесорів. Intel почала з досить незначного за нашими сучасним мірками адресного простору один Мбайт і постійно нарощувала його нинішнього розміру на чотири Гбайт. Motorola у своїй серії 680×0 завжди мала адресне простір на чотири Гбайт. IBM помістила чіпи ROM в адресне простір своїх PC якомога вище. Не її помилка був у тому, що пізніше Intel добудувала «поверх «отже залишила ROM в конструкціях IBM десь посередині, відкривши дорогу використанню RAM, що саме собою, то, можливо, і погано. Розробники сімейства чипів 680×0 будь-коли відчували подібних незручностей, і тому багато програмістів вважають, що Mac лучше.
Intel доклала значних зусиль, намагаючись стандартизуйте виробництво її процесорів 8086 і 8088 на предприятиях-подрядчиках. Hесколько підприємств прийняло такі угоди. Проте Haris випустив свої чіпи — аналоги 8086 і 8088, які найменше задовольняли цим прийнятим угодам. Він використовував технологію CMOS, значно сокращающую споживання, і це властивість створило йому чіпи дуже популярними, особливо серед виробників ПК з екранами на рідких кристаллах.
Фірма NEC запропонувала свою так звану V-серию чипів і заявила, що чіп V20 є конструктивно сумісним з чіпом Intel 8088, однак має удосконалений набір інструкцій, включаючи заодно й інструкції чіпа 8080. Це означало, що міг легко виконувати програми, написані для CP/M, і їх модифікації, використовуючи емулятор програм, і навіть включати переваги інструкцій 8080, які у чіпі V20. Їх чіп V30 був аналогом 8086 з увімкненими додатковими возможностями.
Чіпи V-серии фірми NEC також трохи спритнішим аналогічних чипів фірми Intel. Ці чіпи мали певний успіх, ніж була розсерджена Intel. Остання подав у суд на NEC фактично порушення ними закону про захист авторських прав. NEC подала відповідний позов. Через війну суперечка був залагоджений без визнання переможцем будь-якої боку. Цікавими були деталі цього судового розгляду. Було визнано, що NEC справді використовувала деякі микрокоды Intel, було порушенням її авторського права, коли вона було належним чином оформлене. Hо оскільки Intel виробляла і продавала деякі чіпи 8088 без знака авторського права, то їх претензії було визнано безпідставними. Компанія Chips and Technology, що стали відома завдяки випуску аналогів BIOS, в час впровадила лінію із виробництва процессорных чипів. Hа ній випускаються аналоги 386. І оскільки ті чіпи є точними аналогами відомих раніше чипів, невідомо яким буде них спрос.
4.2. Процесорам фірми AMD.
4.2.1. Судовий розгляд з Intel.
Фірма AMD була ліцензійним виробником Intel, що виконує 80 286. AMD оголосила, що її угоду з Intel дозволяє йому випускати легалізовані копії чипів 386. Intel категорично не погодилася з цим. AMD вдалося виграти цей судовий розгляд, і нині вона випускає аналог чіпа 386 з тактовою частотою 40 МГц. Цей чіп мав певний успіх, в частковості, за його вищої швидкості проти самим швидкодіючим чіпом серії Intel 386. При випуску фірмою AMD аналогів 486 фірма Intel знову спробувала зупинити конкурента. Проте й цьому разі закон був у боці AMD.
4.2.2. Процесорам сімейства AMD5k86.
Налагодивши 1994 року масове виробництво чипів 5-го покоління — мікропроцесорів Pentium, корпорація Intel потужно пішла у відрив. Інтелектуальна колосальна міць її інженерів, помножена на багатющі виробничі можливості, здавалося, не залишала ніяких серйозних шансів конкурентам. тим часом навздогін за лідером впало відразу кількох переслідувачів. У тому числі, мабуть, саме компанія AMD мала саму «вдалу «стартову позицію. Компанія Advanced Micro Devices займала друге у світі із виробництва мікропроцесорів. Сьогодні загальна кількість чипів, випущених фірмою AMD, перевалила далеко за оцінку 85 мільйонів, що, погодьтеся, саме собою свідчить про величезному потенціалі компании.
Цифра «5 «для фірми AMD була нещасливою. Intel Pentium все нарощував обертів: 66, 75, 90 МГц… Тактова частота нових моделей збільшувалася майже щомісяця. А розробникам компанії AMD, крім назви — «K5 », представляти було нічого. Чекання ставало тягостным.
Гнітюче відчуття від несправджених надій скрасив випуск процесора Am5x86. Ні, чіп Am5x86 ні обіцяним К5. Мікропроцесор представляв собою «четвірку «з більшими на можливостями, які проте, року дотягували до «чесного «Pentium. У пресі поширювалися думки фахівців, на кшталт: «Продуктивність, порівнянна з продуктивністю Pentium, стаття дозволяє віднести мікропроцесор Am5x86 до пристроям п’ятого покоління » .
Тим часом, залишаючись за своєю сутністю (по внутрішньої архітектурі) до болю знайомим 486-м, чіп Am5x86, має тактову частоту 133 МГц, міг суперничати однакові лише з скромним за своїми можливостями процесором Pentium/75 МГц. Цікаво, якою і мала бути тактова частота Am5x86, щоб показати продуктивність, порівнянну з Pentium/166 МГц!
Тому чіпа п’ятого покоління в компанії Advanced Micro Devices були ще попереду. Під час проектування своїх попередніх процесорів компанія спиралася на незмінну підтримку корпорації Intel. Але на початок розробки власного процесора п’ятого покоління термін дії ліцензійних угод з корпорацією Intel підійшов до кінця. Отож інженерам AMD довелося почати розробку, що називається, з чистої води. Зокрема, вийшов промах під час проектування убудованого КЭШа команд. Набори команд для процесорів різних поколінь істотно відрізняється. Инженеры-разработчики компанії AMD трохи прорахувалися щодо оцінки числа CISCінструкцій, мають різну довжину. Через війну, не вдавалося досягти проектованого рівня продуктивності у виконанні програм, оптимізовані під процесор Pentium. Але згодом і це, і деяких інших помилки усунули. І наприкінці березня 1996 роки компанія AMD з гордістю оголосила про появу світ нової процесора п’ятого покоління — AMD5k86.
4.2.2.1 Екскурсія по внутрішньої архитектуре.
Процесор AMD5k86, відомий на стадії розробки як AMD-K5 чи Krypton, є першою членом суперскалярного сімейства (Superscalar family) K86. Він з'єднує у собі високу продуктивність і повну сумісність з операційній системою Microsoft Windows.
Суперскалярный RISC-процессор AMD5k86 виконано по 0ю35-микронной КМОП — технології (complimentary metal — oxid semiconductor process) і полягає з 4.3 млн. транзисторів. Його дизайн виходить з багатою відчуття історії і великому досвіді архітектур RISC і х86.
На думку багатьох фахівців, розробники чіпа AMD5k85 пішли значно далі початкового задуму: створити процесор, має RISCядро, і навіть сумісний з набором інструкцій х86 означає сумісність з операційними системами Microsoft Windows та знайоме всім ПО, написаним під архітектуру х86. Настільки щасливе поєднання найвищої продуктивності та повної сумісності з Microsoft Windows робить чіп AMD5k86 повноправним членом 5-го покоління микропроцессоров.
Мікропроцесор AMD5k86 має 4-потоковое суперскалярное ядро і здійснює повне переупорядочивание виконання інструкцій (full out — of — order execution). Чіп AMDk586 успадкував кращі риси від двох домінуючих нині мікропроцесорних гілок: сімейства х86 і суперскалярных RISC-процессоров. Від перших він прийняв таку необхідну для успішного руху на комп’ютерному ринку сумісність з операційній системою WINDOWS. Від сімейства суперскалярных RISC-процессоров він прийняв найвищий рівень продуктивності, характерний чипів, які застосовувались у робочих станциях.
Розроблений інженерами компанії AMD процес попереднього декодування дозволяє подолати властиві архітектурі х86 обмеження (різна довжина інструкцій). Що стосується використання інструкцій різної довжини, чіпи 4-го покоління можуть одночасно обробляти 1 команду, процесори 5-го покоління (Pentium) — 2 команди. І тільки мікропроцесор AMD5k86 здатний обробляти до запланованих 4 інструкцій за такт.
Використання роздільного КЭШа інструкцій і передачею даних (обсяг КЭШа інструкцій вдвічі перевершує обсяг КЭШа даних) виключає виникнення можливих внутрішніх конфликтов.
Зараз випускаються мікропроцесори AMD5k86-P75, AMD5k86-P90 і AMD5k86- P100 продуктивність яких (Р. — рейтинг) відповідає процесору Pentium з тактовими частотами 75, 90 і 100 МГц.
Компанія Advanced Micro Devices планує випустити у тому (1996) року 3 млн. процесорів сімейства AMD5k86 зі значеннями Р. — рейтингу від 75 до 166. Для підприємств нові процесори будуть порівняти з цінами які мають аналогічної продуктивністю процесорів Pentium, мабуть, навіть трохи нижче. Середня ціна процесора AMD5k86-P75 становить близько $ 75, чіпа AMD5k86-P90 — $ 99.
Характеристики мікропроцесора AMD5k86:
— 4-потоковое суперскалярное ядро з 6-ту паралельно які працюють виконавчими пристроями, складовими 5-ступеневий конвейер;
— 4-потоковый асоціативний кеш команд з лінійної адресацією обсягом 16 Кб;
— 4-потоковый асоціативний кеш даних із зворотної записом і лінійної адресацією обсягом 8 Кб;
— повне переупорядочивание виконання інструкцій, попереднє (speculative) исполнение;
— динамічний кеш передбачення переходів обсягом 1 Кб; у разі неправильного передбачення затримка не перевищує 3 внутрішніх тактов;
— 80-разрядное інтегроване, високопродуктивне пристрій операцій з плаваючою коми, що має невеликим часом затримки і під час операцій +/*;
— що живить напруга — 3 В, система SSM (System Management Mode) для зменшення споживаної мощности;
— 64-разрядная шина і системний інтерфейс перебувають у 296-контакный корпус SPGA, сумісний за висновками з процесором Pentium (P54C) і процессорным гніздом Socket-7;
— повна сумісність з Microsoft Windows і инсталлированной базою ПО для процесорів архітектури х86.
4.2.2.2. Приклад маркування мікропроцесора AMD5k86-P75.
——————————————————————;
| #### ### ### ###### —————- |.
| ## ## ## ### ## ## ## `——— | |.
| ###### ## # ## ## ## /| | | |.
| ## ## ## ## ###### | ——,| | |.
| ——/ | |.
1 —————————— |.
2 ———— AMD5k86тм-Р75 |.
3 ———————————— |.
4 ———— AMD-SSA/5−75ABQ |.
| E | Designed for |.
5 ———————————- //———- |.
| (m) (c)1996AMD //———- |.
| //———- |.
| Microsoft |.
6 ———— HEAT SINK ————— |.
AND FAN REQ «D Windows 95 тм |.
|.
`———————————————————— -;
позначення: 1. P-рейтинг 5. Що Живить напруга 2. Назва B=3.45 — 3.60B 3. Температура корпусу C=3.30 — 3.465B.
W=55C R=70C F=3.135 — 3.465B.
Q=60C Y=75C H=2.76 — 3.0B.
X=65C Z=85C J=2.57 — 2.84B 4. Серійний номер K=2.38 — 2.63B.
6. Температурний режим.
4.2.2.3. Тесты.
Система Р — рейтингів виміру продуктивності процесорів була запропонована на початку 1996 року компаніями AMD, Cyrix, IBM і SGS — Thomson Microelectronics. P-рейтинг складається, за результатами проведення еталонного тесту Winstone 96, розробленого видавництвом Ziff — Davis Цей тест є набір з 13 найчастіше застосовуваних додатків, як-от Microsoft Word і Exel.
Слід зазначити, що на відміну не від системи тестів iComp, якої користується корпорація intel з оцінки продуктивності своїх мікропроцесорів, тестовий набір Winstone 96 є общедоступным.
У його новому чіпі AMD5k86 компанія AMD втілила воістину новаторський поєднання набору інструкцій х86 і суперскалярной RISCархітектури (reduced instruction set computing architecture). Як як стверджують деякі фахівці AMD, завдяки такого рішення мікропроцесор AMD5k86 забезпечує на 30% велику продуктивність, ніж процесор Pentium такою ж тактовою частотою. Втім, результати тестування за використанням пакета тестів Winstone 96 компанії Ziff — Davis показують, що трохи скромніший. Тестова конфігурація: |Материнська плата |FIC PA2002 | |Чипсет |VIA Apollo Master | |ОЗУ |EDO DRAM обсягом 16 МБ | |Кеш-пам'ять L2 |256 Кб | |Відеоплата |PCI Diamond Stealth64 3200 | |(640×480×256) |Diamond GT 4.02.00.218 for Windows 95 | |Видеодрайвер |EIDE Quantum Fireball ємністю 1.2 Держбезпеки | |Жорсткий диск | |.
AMD5k85-P75 CPU (index 48.8).
Pentium 75 (index 47.4) AMD5k85-P90 CPU (index 56.7).
Pentium 90 (index 54.9).
4.2.2.4. Материнські плати для AMD5k86.
Список найпоширеніших системних плат, протестованих в лабораторіях компанії AMD і рекомендованих для установки процесора AMD5k86. |Виробник |Модель |Чипсет |BIOS | |Abit |PH5 1.3 |SiS 551 |Award Pentium PCI| | | | |Sys BIOS (N35) | |Abit |PH5 2.1 |Intel Triton |Award Pentium PCI| | | | |Sys BIOS (C4) | |Atrend |ATC1000 |Intel Triton |Award | | | | |i430−2A59CA29C-00| |Atrend |ATC1545 A1 |OPTi Viper |Award OPTi Viper | | | | |ATS-1545 ver. | | | | |0.6. | |Biostar |8500TAC A1 |Intel Triton |AMI 1993 | |ECS |TR5510 |Intel Triton |Award | | | | |i430FX-2A59CE1NC-| | | | |00 | |ECS |AIO |Intel Triton |Award | | | | |i430FX-2A59CE1NC-| | | | |00 | |FIC |PA2002 1.21 |VIA 570 |Award 4.052G800 | |Gigabyte |GA586ATS 1B |Intel Triton |Award Intel 430FX| | | | |PCI-ISA v.1.26 | |Hsingtech |M507 1.1 |Intel Triton |Award 2/1/1996x | |Mycomp (TMC) |PCI54ITS 2.00 |Intel Triton |Award | | | | |i430FX-2A59CM29C-| | | | |00 | |Зауваження: ранні версії зазначених системних плат потребують| |заміні BIOS більш нова версія, правильно распознающую чіп| |AMD5k86 |.
4.2.2.5. AMD планує випустити K5.
Репутація AMD залежить від успішності тривалого проекту К5- першої самостійної проби архітектурних наснаги в реалізації області х86. Народження К5 небезпечно відкладається не вперше. У першому кварталі наступного AMD планує переклад K5 на технологічний процес з проектними нормами 0.35 мкм і з трирівневої металізацією, розроблений за сприяння з HР і запускаемый на новому заводі AMD Fab 25 в Остині, штат Техас. Це дозволить зменшити К5 з 4.2 мільйонами транзисторів до 167 кв. мм підняти відсоток виходу придатних, і навіть тактову частоту.
На думку керівництва AMD 1996 року обсяг випуску К5 буде наращиваться досить швидко, що дозволить відвантажити кінця року більш п’яти мільйонів процесорів. Відповіддю на виклик Intel з її процесором Pentium Pro може лише процесор К6, але вже настав хто б вірить, що його вдасться побачити раніше 1997 року. Hесмотря на всесвітній перехід на процесор Pentium, наступного року ще можуть зберегтися деякі ринки для 486-х. Експерти вважають, що потреба таких регіональних ринків, як Китай, Індія, Росія, Східна Європа та Африка, в 486-х чіпах становитиме 20 мільйонів процесорів 1996 року. AMD розраховує, що став саме вона зможе поставити більшу частину від імені цієї кількості. Тому компанія підвищує тактову частоту 486-х до 133 МГц, щоби конкурувати з нижчими версіями процесора Pentium в настільних ПК початкового рівня. Проте, AMD буде посилено нарощувати випуск К5, оскільки 486-е швидко виходять із моды.
4.3. Процесорам NexGen.
Тоді: як компанія Intel готувала галузь до шокирующему виходу у життя серійних моделей серверів і настільних машин на Pentium Pro, фірма NexGen представляла форуму свої плани з розробці процесора Nx686. Цей суперскалярный х86-совместимый процесор, до розробки якого підключається що й команда архітекторів із AMD, зняті з власного невдалого проекту К6, міститиме близько 6 млн. транзисторів, включаючи обчислювач з плаваючою точкою однією кристалі з процесором (відмови від попереднього двухкристалльного підходу, ослабившего Nx586). Технологія КМОП з проектними нормами 0,35 мкм і пятислойной металізацією дозволила «упакувати «однією кристалі сім виконавчих вузлів: два для цілочислових, один для операцій із плаваючою точкою, за одним для обробки мультимедіа, команд переходів, команд завантаження і команд записи. Показники продуктивності представники NexGen назвати ми змогли, але висловили припущення, що він перевершить Pentium Pro на 16-разрядных програмах вдвічі, але в 32-битовых — на 33%.
До цього часу малий, що відомо про Nx686, оскільки чіп ще анонсувався і NexGen гребує розкривати козирі перед конкурентами від імені AMD, Cyrix і Intel. Проте, NexGen гребує розкривати козирі перед конкурентами від імені AMD, Cyrix і Intel. Проте, NexGen наполягає у тому, що Nx686 продуктивністю можна з интеловским Pentium Pro і AMD K5, і успадковує микроархитектуру Nx586, яка з’явилася 1994 року. NexGen називає її RISC86. Базова її ідея, як у разі з Pentium Pro і K5, полягає у перетворення складних CISC-команд програмного забезпечення x86 в RISC-подобные операції, виконувані паралельно в процессорном ядрі RISCтипу. Такий підхід, відомий під назвою непов’язаної микроархитектуры, дозволяє збагатити CISC-процессор новітніми досягненнями RISC-архитектур і зберегти сумісність з які є ПО для х86.
У Nx686 ця філософія просунута нового логічний рівень. Сьогодні в Nx586 є три виконавчих блоку, трехконвейерное суперскалярное ядро. Він здатний виконувати у кожному такті за однією команді х86. Можливості для вдосконалення очевидні: Nx586 міститиме п’ять виконавчих блоків, чотири конвеєра і кілька декодерів, здатних справитися з виконанням двох або навіть більше команд х86 за машинний такт. І тому знадобиться вбудувати додаткові регістри перейменування і беззмістовності черги команд.
Підхід для використання інтегрованого кэш-контроллера і інтерфейсу для швидкісної кеш-пам'яті залишається незмінною. Представники NexGen кажуть, що вони вивчають зокрема можливість використання кристала вторинної кешпам’яті на зразок і подоби Intel, тим більше їх виробничий партнер IBM Microelectronics здатний робити статичну пам’ять і многокристальные складання (MCM — multichip modules).
Приклад практичної реалізації технології ЧСЧ фірми IBM представляє нова версія процесора Nx586, запланована до випуску наприкінці цього року й куди входять кристал CPU і FPU щодо одного корпусі. Одночасне перепроектирование топології з масштабированием до розміру лінії 0.35 мікрон дозволить компанії NexGen грунтовно зменшити розміри кристала ЦПУ — до 118 кв. мм — менші надходження до цьому класі нічого нет.
NexGen, не новачок у групі виробників процесорів х86. Nx596 може паралельно обробляти на кількох виконавчих блоках чотирьох найпростіших операцій, що названі командами RISC86. Процесор К5 має схожий четырехпоточный дешифратор, але результати його роботи, компанія називає R — ops.
4.4. Процесорам Cyrix.
Перша річ з грандіозного проекту М1 компанії Cyrix, нарешті оприлюднено. Це процесор Сх 6×86−100, монстроподобный кристал якого складний і дуже дорогий у тому, щоб на масовий випуск в перебігу тривалого терміну. Його проблеми зможе розв’язати процесор, який поки що має кодову назву M1rx і спирається на техно процес з пятислойной металізацією, що йде змінюють тришаровій версії тієї ж 0.6- мкм технології. Якщо проект увінчається успіхом, то розмір кристала з 394 кв. мм зменшиться до 225 кв. мм, тоді в Cyrix з’явиться шанс на підняти тактову частоту до 120 МГц. І тут експерти прогнозують йому продуктивність не більше 176−203 по тесту SPECint92, тобто. лише на рівні процесора Pentium 133 (SPECint92=190.9) чи 150 МГц. Якщо всі обіцянки збудуться, то Cyrix зможе продати стільки процесорів, скільки зробить. Також компанія cyrix запропонувала компромісний варіант процесора — 5×86, заснованого на ядрі 486-го, посиленого елементами архітектури 6×86. Стартова версія цього гібрида буде сумісна по цоколевке з гніздом 486- го.
4.5. Процесорам Sun Microsystems.
Sun Microsystems процесор UltraSparc-II. Вперше вводячи RISCтехнологію, SUN 1988 року оголосила SPARC як масштабируемой архітектури, з запасом у майбутнє. Проте, з 1993 року почалася реалізація SuperSparc стала на крок відставати від своїх конкурентов.
З появою UltraSparc, четвертого покоління архітектури SPARC, компанія пов’язує сподівання відновлення втрачених позицій. Він містить жодного багато, ні, але дев’ять виконавчих блоків: два цілочислових АЛУ, п’ять блоків обчислень з плаваючою точкою (два для складання, два для множення родовищ і одне для ділення клітин і вилучення квадратного кореня), блок передбачення адреси переходу і «Блок загрузки/записи. UltraSparc містить блок обробки переходів, вмонтований в первинну кеш команд, і умовно виконує передбачені переходи, однак може видавати команди з порушенням їх черговості. Ця функція перекладається на оптимізують компиляторы.
Архітектура SPARC мала реєстрові вікна, тобто. вісім перекрывающихся банків по 24 подвійних регістру, що потенційно можуть запобігти зупинки процесора в моменти комплексного перемикання, пов’язані з інтенсивними записами розмов у пам’ять. Розробники компіляторів схильні вважати ці вікна недостатнім рішенням, у UltraSparc використовується ієрархічна система незв’язаних шин. Шина даних розрядністю 128 біт дбає про однієї швидкості з ядром процесора. Вона з'єднується через буферні мікросхеми з 128-разрядной системної шиною, яка працює частоті, складової половину, третину чи навіть чверть швидкості процесорного ядра. Для погодження з більш «повільної «периферією служить шина вводу-виводу Sbus.
Фірма Sun реалізує цю схему на апаратній рівні за допомогою комутаційної мікросхеми, яка є складовою частиною схемного комплекту оточення. Ця мікросхема може ізолювати шину пам’яті від шини введеннявиведення, отже ЦПУ продовжує, наприклад, запис в графічну підсистему чи інше пристрій виводу-введення-висновку, а чи не зупиняється при зачитуванні ОЗУ. Така схема гарантує повне використання ресурсів шини і усталену пропускну спроможність 1.3 Гигабайт/с.
У процесорі UltraSparc — II використовується система команд Visual Instruction Set (VIS), куди входять 30 нових команд в обробці даних мультимедіа, графіки, обробки зображень та інших цілочислових алгоритмів. Команди VIS включають операції складання, вирахування і множення, що дозволяють виконувати до максимально восьми операцій над цілими довгою байт паралельно з операцією завантаження чи запис у пам’ять і з операцією переходу за такт. Такий їхній підхід може підвищити видеопроизводительность систем.
4.6. Процесорам Digital Equipment.
Digital Equipment процесор Alpha найтісніше рухається у руслі RISCфілософії порівняно з своїми конкурентами, «посрезав надлишки сала «з апаратури і системи команд із єдиною метою максимального випрямлення маршруту проходження даних. Розробники Alpha впевнені, що дуже високий частота чіпа дасть вам великі переваги, ніж вигадливі апаратні надмірності. Їх принцип спрацював: кристал 21 164 був швидким у світі процесором зі дня своєї появи в 1995 року. Процесор 21 164 втричі швидше на цілочислових обчисленнях, ніж Pentium-100, перевищує на обробці числі з плаваючою точкою, ніж суперкомп’ютерний набір мікросхем R8000 фірми Mips. Топологія процесора нового покоління ще 21 164А не змінилася, але вона смаштабирована, ще, модернізовано компілятор, що підвищило продуктивність на тестах SPECmarks. Передбачається, що готові зразки нового процесора, виготовлені за КМОП — технології до нових норм 0.35 мікрон, при тактовою частоті понад 300 МГц матимуть продуктивність 500 по SPECint92 і 700 по SPECfp92.
Процесорам сімейства 21 164 на вдаються до переваг виконання не гаразд черговості (out — of — order), більше покладаючись на інтелектуальні компілятори, що потенційно можуть генерувати коди, сводящие до мінімуму простої конвеєра. Це найбільш гігантський процесор у світі - на одному кристалі розміщено 9.3 мільйона транзисторів, більшість яких пішла на осередки кеш-пам'яті. Alpha 21 164 тримає в кристалі щодо невелику первинну кеш прямого відображення на 8 Кбайт і 96 Кбайт вторинної. за рахунок вздувания площі кристала досягнуто безпрецедентна продуктивність кэширования.
У 21 164 працює чотири виконавчих блоку (два для цілих і двоє для чисел з плаваючою точкою) і може обробляти по дві команди кожного типу за такт. Вона має чотириступеневий конвеєр команд, який «живить «окремі конвеєри для цілих чисел, чисел з плаваючою точкою і конвеєр пам’яті. У порівняні з іншими RISC-процессорами нової генерації чіп 21 164 має щодо глибокі й прості конвеєри, що дозволяє запускати їх з вищої тактовою частотой.
Конвеєр команд взагалі піклується про їх залежності за даними (в на відміну від pentium Pro, що є яскравим прикладом машини даних), він видає команди у порядку надходження енергоносіїв на вхід (гаразд прямування за програмою). Якщо поточні чотири команди неможливо послати відразу всі на різні виконавчі блоки, то конвеєр команд зупиняється до тих пір, це можна буде. На відміну від конкурентів 21 164 теж використовує техніку перейменування регістрів, натомість він безпосередньо оновлює вміст своїх архітектурних регістрів, коли результат сягає фінальній щаблі конвеєра — write — back. Для боротьби з затримками і залежністю команд за даними в процесорі активно використовуються маршрути для обходу регістрів, тому спільно використовувані операнды стають доступними до стадії write — back.
Компанія Digital просуває Альфу як платформу для серверів Windows NT, ніж як традиційний UNIX-сервер.
4.7. Процесорам Mips.
Mips процесор R1000 успадкував свій суперскалярный дизайн від R8000, що призначався на ринку суперкомп’ютерів наукового призначення. Але R1000 орієнтовано масові завдання. Використання в R1000 динамічного планування команд, яке послаблює залежність від перекомпіляції ПО, написаного ще старих процесорів, став можливим завдяки тісною зв’язкам Mips зі своїми партнером Silicon Graphics, у яких багатющий тил в вигляді складних графічних приложений.
R1000 перший однокристальний процесор від Mips. Щоб запобігти зупинок конвеєра ньому використано динамічний пророцтво переходів, з чотирма рівнями умовного виконання, з допомогою перейменування регістрів, що гарантує, що результати ні передаватимуть у реальні регістри до того часу, поки неясність за командою переходу нічого очікувати знято. Процесор підтримує «тіньову карту «відображення своїх регістрів перейменування. Що стосується неправильного передбачення адреси переходу він відновлює цю карту відображення, але з виконує фактичної очищення регістрів і «промивання «буферів, економлячи в такий спосіб один такт.
R1000 відрізняється також радикальної схемою позачергової обробки. Порядок прямування команд точному відповідно до програми зберігається на трьох перших щаблях конвеєра, але потім потік розгалужується втричі черги (де команди чекають обробки на целочисленном АЛУ, блоці обчислень з плаваючою точкою і блоці загрузки/записи). Ці черги вже обслуговуються по мері звільнення тієї чи іншої ресурса.
Ймовірна продуктивність R1000, виконаного по КМОПтехнології до нових норм 0.35 мікрон повинна досягти 300 по SPECint92 і з SPECfp92.
Програмний лад у результаті розширення зрештою відновлюється отже сама «стара «команда залишає обробку першої. Апаратна підтримка виконання у стилі out — of — order дає великі переваги кінцевому користувачеві, оскільки коди, які перебувають під старі скалярні процесори Mips (наприклад, R4000), починають працювати на повній швидкості і вимагають перекомпіляції. Хоча потенційно процесор R1000 спроможний давати по п’ять команд на виконання у кожному такті, він вибирає і повертає лише чотири, не встигаючи закінчити п’яту у тому такте.
Одне з двох пристроїв для обчислення подвійний точності з плаваючою точкою зайнято сложениями, а інше умножениями/делениями і витяганням квадратного кореня. Hа кристалі R1000 реалізований також інтерфейс зовнішньої шини, дозволяє пов’язувати в кластер чотирьох процесорів без додаткової логіки обрамления.
4.8. Процесорам Hewlett — Packard.
Hewlett — Packard процесор PA-8000. Компанія Hewlett — Packard однією з перших освоїла RISC-технологию, вийшовши ще 1986 року з своїм першим 32-разрядным процесором PA-RISC. Практично всі випущені процесори PA-RISC використовують у робочих станціях HP серії 9000. У період з 1991 по 1993 (перед появою систем з урахуванням PowerPC) HP відвантажила досить багато машин, ставши найбільшим продавцем RISC-чипов в доларовому выражении.
З метою пропаганди своїх мікропроцесорів серед інших виробників систем компанія HP стала організатором організації Precision RISC Organization (PRO). А 1994 року компанія підірвала бомбу, об'єднавшись з Intel до створення нової архітектури. Це поставило під майбутнє PRO.
PA-8000 це 64-разрядный, четырехканальный суперскалярный процесор з радикальної схемою неупорядкованого виконання програм. У складі кристала десять функціональних блоків, включаючи два цілочислових АЛУ, два блоку для зсуву цілих чисел, два блоку multiply/accumulate (MAC) для чисел з плаваючою коми, два блоку деления/извлечения квадратного кореня для чисел з плаваючою коми і двоє блоку загрузки/записи. Блоки МАС мають трехтактовую затримку і за повного завантаження конвеєра на обробці одинарної точності забезпечують продуктивність 4 FLOPS за такт. Блоки розподілу дають 17-тактовую затримку і конвейеризированы, однак вони можуть працювати разом з блоками МАС.
У PA-8000 використаний буфер переупорядочивания команд (IRB) глибиною 56 команд, дозволяє «переглядати «програму ми такі 56 команд уперед, у пошуках таких чотирьох команд, які можна виконати паралельно. IRB фактично і двох 28-слотовых буферів. Буфер АЛУ містить команди для целочисленного блоки і блоку плаваючою точки, а буфер пам’яті - команди загрузки/записи.
Щойно команда потрапляє у слот IRB, апаратура переглядає все команди, відправлені на функціональні блоки, щоб знайти у тому числі таку, джерела операндов для команди, що у слоте. Команда в слоте запускається тільки тоді, як буде розподілено на виконання остання команда, яка стримувала її. Кожен із буферів IRB може видавати по дві команди у кожному такті, і у будь-якому разі видається сама «стара «команда в буфері. Оскільки PA-8000 використовує перейменування регістрів і повертає результати виконання команд з IRB в порядку їх проходження програмі, цим підтримується точна модель обробки виняткових ситуаций.
HP проектувала РА-8000 спеціально для завдань комерційної обробки даних, і складних обчислень, типу генної інженерії, у яких обсяг даних такий високий, що де вони поміщаються ані за з мислимих внутрикристалльных КЭШей. Саме тому, РА-8000 потрібно було на зовнішні первинні КЭШи команд та об'єктивності даних. Слоты у третій 28-слотовом буфері, який називається буфером переупорядочивания адрес (Adress — Recorder Buffer — ARB), одне одного асоційовані зі слотами в буфері пам’яті IRB. У АРВ містяться віртуальні і її фізичне адреси всіх виданих команд загрузки/записи. З іншого боку, АРВ допускає виконання завантажень і записів в довільному порядку, але зі збереженням узгодженості і згладжуванням впливу затримки, що з адресацією зовнішніх КЭШей.
4.9. Процесорам Motorola.
Motorola/IBM процесор PowerPC620 це 64-битовая реалізація архітектури PowerPC. Маючи 64-битовые регістри та внутрішні магістралі даних, і сім мільйонів транзисторів, новому процесору потрібно майже вдвічі більший і складний кристал, ніж в PowerPC 604. Модель 620 має четырехканальную суперконвейерную схему з 6 виконавчими пристроями: три цілочислових АЛУ, блок плаваючою точки, блок загрузки/записи і «Блок переходів. Останній має змоги зробити четырехуровневое пророцтво розгалужень у програмі і умовне виконання з допомогою схеми перейменування регистров.
ПО микроархитектуре RISC-ядра 620-й нагадує 604-й. Відмінності зводяться переважно до ширини регістрів і магістралей даних, і навіть до збільшеного числу станцій резервування для умовного виконання команд. Надбавка продуктивності досягнуто з допомогою поліпшеного шинного інтерфейсу. Тепер вона має 128-битовый інтерфейс до пам’яті, яким за цикл звернення можна вибрати два 64-битовых довгих слова 40-битовая шина адреси, якими можна адресувати до одного терабайта фізичної памяти.
До складу шинного інтерфейсу входити також підтримка кеш-пам'яті другого рівня обсягом до 128 Мбайт, яка може працювати чверть, половині чи повній швидкості ЦПУ.
5. Лабораторні випробування і тестування микропроцессоров.
5.1. Лабораторні випробування процесорів i386DX.
У 1992 року над ринком з’явилося три нових МП, здатних замістити існуючі 386DX й забезпечити підвищення характеристик систем з урахуванням i386. Це: Intel RapidCAD, Chips& Technologies 38600DX, і Cyrix 486DLC. У сьогодні пропонуються лише версії 33 МГц, хоча C&T і Cyrix обіцяють випустити на початку 1993 року варіант 40 МГц. Звісно, за показ такої частоті можна змусити працюватимете, і 33 МГц варіант, але мій досвід показує, що це ненадійно, будь-якої миті машина може зависнути. Intel RapidCAD поширюється, як продукт для кінцевих користувачів, тобто. в чужу машину його встановлюють і вони. Навпаки, C&T і Cyrix поставляють свої процесори і виробникам. Cyrix також виробляє процесор 486SLC, який заміняє Intel/AMD 386SX. C&T оголосив з приводу створення процесора 38600SX, але у продажу з’явиться в 1993 року, якщо взагалі появится.
RapidCAD, говорячи згрубша, є процесор 486DX без внутрішньої кеш-пам'яті і з цоколевкой процесора 386. Для програм він відповідає 386 з співпроцесором, бо всі специфічні команди i486 віддалені з набору команд. Рекламується цей процесор, як «абсолютний співпроцесор «і, чого зобов’язує таке ім'я, він призначений для заміни процесора 386DX в існуючих системах і різкого підвищення продуктивності операцій із плаваючою точкою, як-от CAD, електронні таблиці, математичні програмні пакети (SPSS, Mathematica тощо.). RapidCAD і двох корпусів; RapidCAD-1, в корпусі PGA (132 виведення), устанавливающийся в гніздо для i386, включає у собі ЦПУ і модуль операцій з плаваючою точкою, і RapidCAD-2, в корпусі PGA (68 висновків), устанавливающийся в гніздо для співпроцесора i387, включає у собі ПЛМ, подаючий сигнал на схеми системної плати для правильної обробки особливих ситуацій під час операції з плаваючою точкою. Більшість операцій виповнюється впродовж циклу, як й у i486. Проте вузьким місцем є інтерфейс шини 386, адже кожен цикл шини дорівнює двом циклам процесора. Це означає, що команди виконуються швидше, ніж зчитуються з пам’яті. Оскільки операції з плаваючою точкою виконуються повільніше звичайних команд, то уповільнення ними позначається, і вони виконуються такою ж швидкістю, як і i486DX. Саме тому RapidCAD дозволяє їм отримати вищі характеристики з плаваючою точкою, ніж будь-яка комбінація 386/387. Результати тесту SPEC, стандартного тесту для машин під UNIX, показують, що RapidCAD прискорює операції з плаваючою точкою на 85%, і з цілими числами — на 15% проти будь-який комбінацією 386/387 при однаковою тактовою частоті. Споживана потужність при 33 МГц становить 3500 мВт. Поточна ціна RapidCAD 33 МГц становить 300 $.
Передбачається, що процесор фірми C&T 38600DX повністю сумісний із i386DX. На відміну від процесора Am386 фірми AMD, який використовує микрокод, ідентичний микрокоду Intel 386, в процесорі 38600DX використаний патентно чистий микрокод, забезпечення стовідсоткової сумісності в набір команд навіть включена недокументированная команда LOADALL386. Деякі команди виконуються швидше, ніж у i386. C&T також випустила процесор 38605DX, до складу якого кеш-пам'ять команд на 512 байт, що ще більше підвищить його продуктивність. На жаль, 38605DX випускається в корпусі PGA (144 виведення) не може бути встановлено у розняття i386DX. При проведенні випробувань запримітив, що з 38600DX є серйозні проблеми комунікації ЦПУспівпроцесор, і від цього швидкість виконання в більшості програм операцій із плаваючою точкою в нього падає нижчий за рівень i386/i387. Проблема існує всім вироблених нинішній момент 387- сумісних сопроцессоров (ULSI 83C87, IIT 3C87, Cyrix EMX87, Cyrix 83D87, Cyrix 387+, C&T 38 700, Intel 387DX). Мій знайомий через мережу теж проводив такі тести з 38700DX і отримав аналогічним висновків. Він зв’язався з C&T, і його відповіли, знають звідси. Середня споживана потужність 38600DX 40 МГц — 1650 Мвт, що менше, ніж споживання i386 33 МГц. Поточна ціна 38600DX 33 МГц — 80 $.
Процесор Cyrix 486DLC — остання новинка над ринком замінників i386DX. Набір його команд сумісний із i486SX, встановлено 1 КВ кеш-пам'ять і апаратно реалізований 16×16 біт умножитель. Виконавче пристрій 486DLC, створений із використанням деяких принципів RISC, виконує більшість команд за цикл. Апаратний умножитель перемножує 16- розрядні значення за 3 циклу, замість 12 — 25 циклів у i386DX. Особливо це зручно при обчисленні адрес (код, генерований деякими неоптимизирующими компиляторами, може містити багато команд MUL для доступу до масивам) й у програмних обчислень з плаваючою точкою (напр., при эмуляции співпроцесора). Внутрішня кеш-пам'ять є об'єднану пам’ять команд та об'єктивності даних наскрізний записи, і то, можливо конфигурирована, як пам’ять з прямим відображенням, чи як 2-канальная асоціативна. Через необхідність забезпечення повної сумісності після перезавантаження процесора кеш-пам'ять відключається, і бути включена з допомогою невеличкий програми, наданої фірмою Cyrix. Якщо кеш-пам'ять включена за мінімального завантаження, (напр., при «гарячої «перезавантаженні, Ctrl — Alt — Del), BIOS мого РС (інва AMI) зависає за мінімального завантаження, і мушу або виконувати рестарт процесора, або відключати кеш перед перезавантаженням. Це з причин те, що після запуску процесора кеш-пам'ять відключається. Переконаний, що у наступних версіях BIOS фірми AMI це завжди буде враховано і вбудована кеш-пам'ять підтримуватиметься. Кеш-пам'ять допомагає процесору 486DLC подолати обмеження інтерфейсу шини 386, хоча відсоток влучень не перевищує 50%. Фірма Cyrix передбачила деякі можливості управління кэш-памятью процесора, що, звісно, поліпшить зв’язок зовнішньою і внутрішньою кеш-пам'яті. Сучасні системи 386 не сприймають ці управляючі сигнали, які мають значення для i386DX, але надалі системи, розроблені з урахуванням цих можливостей 486DLC, можуть використовувати їх. Вмонтований кеш 486DLC допускає до 4-х некэшируемых областей пам’яті, може бути дуже корисно у разі, якщо ваше система використовує периферійні устрою, що відобразяться на згадку про (напр., співпроцесор Weitek). В системах 386 пересилки DMA (напр., SCSI контролера, плати звуку) можуть відключити внутрішній кеш, бо існує інших засобів забезпечити відповідність кеш-пам'яті і основний пам’яті, що, звісно, знижує характеристики 486DLC. Споживана потужність 486DLC 40 МГц — 2800 Мвт. Німецький дистриб’ютор продає 486DLC 33 МГц по поточної ціні 115 $. 486DLC працює далеко ще не з усіма сопроцессорами і переважають у всіх обставин, особливо критичний цьому плані многозадачный захищений режим (поліпшений режим MSWindows). З використанням 486DLC що з Cyrix EMC87, Cyrix 83D87 (випуск до серпня 1992) і IIT 3C87 машина зависає через проблеми синхронізації між ЦПУ і співпроцесором при виконанні команд FSAVE і FRSTOR, які зберігали і відновлюють стан співпроцесора при переключенні завдань. Найкраще використовувати 486DLC з Cyrix 387+ (поширюється лише у Європі) чи Cyrix 83D87 випуску після липня 1992, є найпотужнішим співпроцесором серед сумісних сопроцессоров 486DLC. Коли ви вже зараз є співпроцесор Cyrix 83D87, і це хочете знати, сумісний він з 486LCD, я рекомендую вам мою програму COMPTEST, розповсюджувану як CTEST257. ZIP через анонімні ftp з [email protected] й інші ftp-серверы. Якщо програма повідомить про сопроцессоре 387+, те в вас встановлено або 387+, або аналогічна нова версія 83D87 і із сумісністю не будет.
При випробуваннях використовувалася система:
Апаратна конфігурація: 33,3/40 МГц системна плата, комплект мікросхем Forex, кеш 128 КВ із нульовим станом очікування, пряме відображення, наскрізна запис, один буфер записи, 4 байта на рядок, 4 циклу затримки при кэш-промахе. 8 МВ основний пам’яті, середнє стан очікування 1,6 циклу. BIOS фірми AMI. Процесор Cyrix EMC87 як сумісності 387, як матсопроцессор. Цей процесор разом із Cyrix 83D87/387+ є найбільш швидкими сопроцессорами до роботи з 386DX/486DLC/38600DX. Жорсткий диск Conner 3204 °F, ємність 203 МВ, інтерфейс IDE (пропускну здатність по тесту CORETEST 1100 КВ/с, час пошуку 16 мс). Плата SVGA (ISA, Diamond SpeedSTAR HiColor), використовується ET4000, 1 МВ DRAM, як екранний буфер, графічний прискорювач відключений. Перемикачі на видеоплате встановлено для найнадійнішою зі швидкою роботи, з пропускною здатністю 6500 байт/мс при 40 МГц і 5400 байт/мс при 33 МГц.
Програмна конфігурація: MS-DOS 5.0, MS Windows 3.1, HyperDisk 4.32 як зворотної записи, використовується 2 МВ розширеній пам’яті, в ролі менеджера пам’яті використовується 386MAX 6.01. Ця програма також забезпечує DPMI у деяких тестах.
Результаты тестов.
Для тестів Whetstone, Drhystone, WINTACH, DODUC, LINPACK, LLL і Savage більший показник означає велику производительность.
Для тестів MAKE RTL, MAKE TRANK і тесту StringTest менший показник означає велику производительность.
33,3 МГц Intel C&T Intel Cyrix Cyrix.
386DX 38600DX RapidCAD 486DLC 486DLC кеш викл. кеш вкл. Тести з цілими числами.
Whetstone (kWhet/s) 447 585 563 695 803 Drhystone© (Dhry./s) 11 688 11 819 12 357 14 150 15 488 Drhystone (Pas) (Dhry./s) 10 455 10 877 10 751 12 154 13 858 String-Test (ms) 459 453 441 347 327 MAKE RTL (p.s) 51,32 47,10 46,34 43,45 39,13 MAKE TRANCK (p.s) 62,42 55,47 55,37 53,64 46,12 WINTACH 4,85 4.90 5.49 5.53 6.14.
Тести з плаваючою запятой.
DODUC (Індекс швидкості) 79.0 76.4 150.3 89.4 90.7 LINPACK (Mflops) 0.2808 0.2707 0.4578 0.3158 0.3438 LLL (Mflops) 0.3352 0.3537 0.6083 0.3816 0.4139 Whetstone (kWhet/s) 2540 2340 3990 2908 3061 Savage (решений/с) 71 685 53 191 72 464 88 757 93 897.
40 МГц Intel C&T Intel Cyrix Cyrix.
386DX 38600DX RapidCAD 486DLC 486DLC Тести з цілими числами кеш викл. кеш вкл.
Whetstone (kWhet/s) 536 702 676 835 963 Drhystone© (Dhry./s) 14 128 14 116 14 836 16 987 18 750 Drhystone (Pas) (Dhry./s) 12 490 13 067 12 890 14 573 16 624 String-Test (ms) 384 377 368 289 273 MAKE RTL (p.s) 43.46 40.11 39.84 37.25 33.54 MAKE TRANCK (p.s) 53.00 47.59 47.07 45.36 39.00 WINTACH 5.65 5.73 6.41 6.46 7.23.
Тести з плаваючою запятой.
DODUC (Індекс швидкості) 94.9 77.5 180.3 105.1 106.6 LINPACK (Mflops) 0.3324 0.3260 0.5418 0.3789 0.4131 LLL (Mflops) 0.4025 0.4204 0.7260 0.4562 0.4956 Whetstone (kWhet/s) 3061 2632 4798 3505 3677 Savage (решений/с) 86 083 49 587 86 957 106 762 112 360.
Серед випробуваних процесорів Cyrix 486DLC має найбільшої продуктивністю по цілим числам. З включеної внутрішньої кэш-памятью продуктивність по цілим числам на однаковою тактовою частоті 486DLC на 80% перевищує 386DX, середнє збільшення швидкості роботи прикладних програм становить 35%. Працюючи з прикладними програмами, використовуючи операції і з цілими числами, і з плаваючою точкою, включений кеш забезпечує п’ять% - 15% вищі показники проти роботою без КЭШа. Швидкість операцій із плаваючою точкою проти i386DX поповнюється 15% - 30%.
Intel RapidCAD під час роботи замість i386DX забезпечує найвищі характеристики і під час операцій із плаваючою точкою. Прикладні програми, виконують інтенсивні операції з плаваючою точкою, працюють швидше на 60% - 90% проти i386DX/387DX, відстаючи від i486DX при тієї ж тактовою частоті за швидкістю операцій із плаваючою точкою всього на 25%. Швидкість операцій із цілими числами поповнюється 15% - 35% по порівнянню з i386DX/i387DX.
Процесор Chips & Technologies 38600DX має трохи більше високими характеристиками під час роботи з цілими числами, ніж i386DX, даючи середнє збільшення швидкості порядку 10%.
5.2. Результати тестування мікропроцесорів з допомогою пакета The.
Speed Test.
Для тестування різних мікропроцесорів іноді застосовують спеціальних пакетах програм processor benchmarks. Нижче наведені результати тестування процесорів з допомогою пакета програм Speed Test, ARA Copyright (З) 1994,95,96 Agababyan Robert Assotiation Used TMi0SDGL™.
Pentium iP5−200(3−200), 512K PB 1 318 841 Pentium iP5−200(2.5−200), 512K PB 1 309 353 Pentium iP5−200(2.5−200) 1 290 780 Pentium iP5−200(3−200) 1 290 780 Pentium iP5−180, 512K PB 1 181 818 Pentium iP5−180 1 151 899 Pentium iP55−166, Intel Triton, IWill TSW2 1 109 756 Pentium iP5−166, 512K PB 1 096 386 Pentium iP5−166 1 076 923 Pentium iP5−160, 512K PB 1 052 023 Pentium iP5−160 1 040 000 Pentium iP5−150, 512K PB 983 784 Pentium iP5−150 968 085 Pentium iP5−133, 512K PB 879 227 Pentium iP5−133 866 667 Pentium iP54−75(1.5−120), Intel Triton 812 500 Pentium iP54−75(2−120), Intel Triton 812 500 Pentium iP54−75(2−120), SiS 501/503 812 500 Pentium iP5−100(2−120), Intel Triton, ASUS P55-TP4 798 246 Pentium iP5−120(1.5−120), 512K PB 798 246 Pentium iP5−120, 512K PB 787 879 Pentium iP5−120(1.5−120) 781 116 Pentium iP5−120 777 778 Cx5x86-M1sc-100(3−150,Opt) 771 186 Cx5x86-M1sc-100(3−150,Opt) 758 333 Am5x86−133-X5-P75(4−200) 710 938 Pentium iP5−100, ALR Revolution 679 104 Pentium iP5−100, Intel Triton, ASUS P/I-P55TP4XE 669 118 Pentium iP5−100, Intel Triton 669 118 Pentium iP54−75(100), Intel Triton 669 118 Am5x86−133-X5-P75(3−180), UMC8886BF/8881 °F 640 845 Cx5x86-M1sc-100(3−120,Opt) 614 865 Pentium iP54−75(90), Intel Triton, ASUSTeK P54-TP4 606 667 Cx5x86-M1sc-100(3−120,Opt), SiS 471, GMB-486SG 600 660 Am5x86−133-X5-P75(4−160), SiS 471, BTC 4SLD5.1 568 750 Am5x86−133-X5-P75(4−160), SiS 496/7, ASUS PVI-SP3 568 750 Am5x86−133-X5-P75(4−160), SiS 471 561 730 Am5x86−133-X5-P75(4−160), SiS 496 PCI 561 728 Am5x86−133-X5-P75(4−160) 561 128 Cx5x86-M1sc-100(3−120), SiS 496/7, ASUS PVI-SP3 548 193 Cx5x86-M1sc-100(3−120,Opt), SiS 471, GMB-486SG 535 294 i80486DX4−100(120), UMC 8498 °F 535 294 Am5x86−133-X5-P75(3−150), SiS 471, BTC 4SLD5.1 529 070 Cx5x86-M1sc-100(Opt) 511 236 Nx586−90(100), NxVL System Logic, Alaris 505 450 Cx5x86-M1sc-100(Opt), SiS 471, GMB-486SG 501 377 Am5x86−133-X5-P75, SiS 471, BTC 4SLD5.1 469 072 Am5x86−133-X5-P75, SiS 496/7, ASUS PVI-SP3 469 072 Cx5x86-M1sc-100, SiS 496/7, ASUS PVI-SP3 455 000 i80486DX4−100, UMC 881 455 000 Nx586−90, NxVL System Logic, Alaris 455 000 Pentium iP5−60(66), PCI58PL 450 495 Pentium iP5−60(66), SiS 501/502/503, ASUS P5-SP 450 495 Cx5x86-M1sc-100, SiS 471, GMB-486SG 446 078 i80486DX2−66(4−100), PC Chips 18 446 078 i80486DX4−100, SiS 82C471, SOYO 446 078 OverDrive iDX4ODPR100 (486DX4−100) 437 500 i80486DX4−100, Compaq ProLinea 4/100 433 333 Am80486DX4−120SV8B, SiS 471, BTC 4SLD5.1 425 234 Am80486DX4−120, SiS 471, SOYO 425 234 Pentium iP5−60, Compaq DeskPro XL 560 406 250 Pentium iP5−60, Compaq Proliant 406 250 Pentium iP54−75(60), Intel Triton 406 250 Pentium iP5−60, OPTi 596/546/82, Bison III v1.0 406 250 Pentium iP5−60, SiS 501/502/503, ASUS P5-SP 406 250 Am80486DX2−80(100), UMC 8498 °F 352 713 Am80486DX4−100, PC Chips 18 350 000 Am80486DX2−80(100), SiS 471 345 351 Cx80486DX2−100, Opti VIP 344 697 i80486DX4−100(75), UMC 881 337 037 Pentium iP54−75(50), Intel Triton 334 559 Pentium iP54−75(45), Intel Triton 303 333 U5-S33(60), UMC 491 °F 301 325 i80486SX2−50(80), SiS 471, S486G 282 609 i80486DX2-S-80, PC Chips 18 280 864 i80486DX2−80, Symphony Haydn II 280 864 i80486DX2-S-80, UNICHIP U4800VLX, U486 WB 280 864 Cx80486DX2−66(80), OPTi 495SLC 277 560 U5-S33(50), SiS 471, AV7541 250 000 U5-S33(50), SiS 471, SOYO 250 000 U5-S33(50), UMC 491 °F 250 000 U5-S33F (50), UMC 8498 °F 250 000 U5-S33(50) 246 612 U5-S33(50), CONTAQ 82C596A, G486VLI 245 946 U5-S40(50) 245 946 i80486DX2−66, DELL 238 196 Am80486DX2−66, Forex 46C421 234 964 Am80486DX2−66, Bioteq 82C3491 234 536 Am80486DX2−66, OPTi 495SLC 234 536 i80486DX2−66 &E5, AcerMate 466 234 536 i80486DX2−66, ALI M1429/M1431 234 536 i80486DX2−66, SiS 82C471 234 536 i80486DX2−66, Symphony, Predator I 234 536 i80486DX2−66, OPTi 82C682, ALR Evolution 4 233 333 i80486DX2−66, PC Chips 11&13 233 333 Am80486DX2−66, IMS 8849 232 143 i80486DX2−66, Compaq ProLinea MT 4/66 232 143 Am80486DX2−66, UNICHIP U4800VLX, U486 WB 230 964 i80486DX2−66, Intel Champion 230 964 Cx80486DX2−66, UMC 82C491 °F 230 964 OverDrive iDX2ODPR66 (486DX2−66) 230 964 Am80486DX2−66, SiS 82C471 229 798 i80486DX2−66, Symphony Haydn II 229 768 i80486DX2−66, SiS 82C471 228 643 U5-S33(40), SiS 82C471 200 441 U5-S33F (40), UMC 8498 °F 200 441 U5-S33(40), Expert 4045 194 861 i80486DX-50, UMC 82C480 176 357 i80486DX2−50, Headland HT342/HT321 176 357 i80486SX-50, SiS 82C471 176 357 Am80486DX-50, UMC 82C491 °F 173 004 i80486DX-50 173 004 i80486DX2−50, OPTi 495SLC 171 053 Cx486S-40(50), UMC 82C491 °F 171 053 U5-S33, SiS 82C471 167 279 U5-S33, Expert 4045 162 645 IBM486SLC2−66, OPTi 495XLC 161 922 i80486SX-33(40), SiS 82C471 140 867 i80486SX-33(40), OPTi 82C495SLC 140 867 Am80486DX-40, OPTi 82C495SLC 140 432 i80486SX-33(40) &E5, Forex 521 140 000 i80486SX-33(40), Forex 521 139 571 Am80486DX-40, SiS 82C461 138 931 Cx486DX-40 135 821 Ti486DLC/E-40BGA, PC Chips, M321 126 389 Cx486DLC-40 126 389 Tx486DLC-40, OPTi 495SLC 126 039 Cx486DLC-40GP, SARC RC4018A4 123 641 IBM 486SLC2−50, WD7600 122 642 Cx486SLC-40, SARC RC2016A4, M396 °F 120 053 i80486SX-33, SiS 82C471 117 571 i80486DX-33, HP Vectra 486/33VL 116 967 i80486DX-33, OPTi 82C498, Simens-Nixdorf PCD-4H 116 967 i80486SX-20(33), Symphony 116 967 i80486DX-33, Intel Champion 116 667 i80486DX-33, Toshiba T9901C, LapTop 116 667 i80486DX-33, UMC 82C481 114 035 i80486SX-25, IBM PS/1 88 694 i80486SX-25, SiS 87 838 i80486SX-25, HiNT CS8005 87 500 i80486SX-25, HP Vectra 486SX/25VL 86 502 Am80386DX-40, ALI M1429/M1431 81 835 Am80386DX-40, CD-COM, M326 81 835 Am80386DX-40 WC, SARC 81 835 Am80386DX-40, UMC 82C491 °F 81 688 Am80386DX-40, OPTi 82C391 81 531 Am80386DX-40, UNICHIP U4800VXL 81 182 Am80386DX-40, PC Chips 5,6 80 817 Am80386DX-40, UMC 80C481 80 647 Am80386DX-40, OPTi 495XLC 80 531 Am80386DX-40, Forex FRX46C402,411 80 247 Am80386SX-40, P9 MXIC 73 387 i80386DX-33 68 114 Am80386SX-40, M396 °F 67 407 Am80386SX-40, Acer M1217 63 459 Am80386SX-40, ALI M1217 62 329 Am80386SX-40, PC Chips 2 61 905 i80386SX-33, Acer M1217 51 066 i80386SX-33 49 296 i80386DX-25 48 925 i80386SX-33, HP Vectra 386SX/33N 48 611 Am80386SX-33, Acer M1217 47 744 80 286−25 45 867 80 286−20 38 625 Harris 80 286−20, UMC 82C208L 37 387 80 286−16, HT12 29 111 i80286−12.5 24 125 i80286−12 22 392 i80286−10, IBM PS/2 15 545 i80286−10, IBM PS/2 60 15 242 i8088−9.54, Commodore PC-20 5395 i8088−7.16, Commodore PC-20 4011 i8088−4.77, EC-1841 2968 i8088−4.77, Original XT 2697 i8088−4.77, Commodore PC-20 2658.
6. Порівняльний анализ.
У середині жовтня 1995 року у м. Сан-Хосе (Каліфорнія) відбувся черговий Микропроцессорный Форум. У торік у ньому демонструвалися прототипи процесорів IBM Power PC 620, MIPS R10000, SUN UltraSPARC, HP PA- 8000 і DEC Alpha 21 164.
З торішніх процесорів — дебіторів до ринку дійшов лише процесор Alpha 21 164/300. Його продуктивність по тесту SPECint92 становила 341 одиницю. Перебуваючи з такою приголомшливою продуктивністю в лідерах гонки на швидкодія процесорів, у листопаді Alpha пропустила вперед компанію Intel з процесором Pentium Pro. Пристрасті не на жарт і вже теперішньому форумі Digital повідомила, що у грудні розпочне випуск варіант цього процесора — Alpha 21164A з тактовою частої 333 МГц, виконаного за технологією 0.35 мкм. Проектируемая продуктивність 500 по SPECint92.
Hewlett — Packard анонсувала 32-разрядный процесор архітектури РА нового покоління ще РА-7300LC із вбудованими функціями мультимедіа. Hачало його випуску по 0.5 мкм технології можливо у другій половині наступного року. Цей перший процесор PA-RISC, оснащений внутрішніми 64 Кбайт КЭШами першого рівня для команд й у даних, переважно матиме 200 SPECint92 і 275 SPECfp92.
За рік після проголошення процесора UltraSPARC фірма SPARC Technology представила новий проект UltraSPARCII. Hовый процесор буде мати 5.4 млн. транзисторів, виготовлятися за технологією 0.35 мікрон, працювати на частоті 250−300 МГц. Проектоване швидкодія 250 МГц версії - 350 SPECint92 і 550 SPEFfp92. Крім базової системи команд, процесор буде оснащений набором із нових команд Visual Instruction Set, призначених для швидкої обробки видеофайлов в форматі MPEG-2, рендеринга тривимірних оболонок, видеоконференцсвязи.
Народження Pentium Pro чудова новина, але це незмінно піднімає кілька серйозних питань. Hа самому чи ділі це повністю нове покоління процесора Pentium? Побила чи Intel своїх конкурентів остаточно? Який процесор є безпечним вибором з місця зору надійності і сумісності? Який процесор найвигідніший з місця зору співвідношення ціни, і продуктивності? Сьогодні цілком обгрунтовано можна запитати, наскільки вона порівняємо відносини із своїми RISC-оппонентами? Hе застарів чи гасло Apple у тому, що Power Mac перспективніше, ніж лінія x86?
Hа всі питання відповісти у принципі ствердно. Конкуренти з табору х86 поки що неспроможні насправді підтвердити свої претензії на рівність чи перевага. Hичего живого чи пристойного (Cyrix) на руках ми маємо. А цінової орієнтир Intel відомий: настільний high — end комп’ютер на платформі Aurora, Pentium Pro 150 MHz, ОЗУ 16 МБ, жорсткий диск EIDE 1 Держбезпеки, 2 МБ SVGA, монітор 17 «NI digital SVGA, Windows 95 у грудні обійдеться жадібним до потужності користувачам дешевше $ 5000. Бажаючі можуть порівняти ціну з робочої станцією Sun чи IBM і зробити своїх висновків. Hесомненный плюс — гарантована сумісність із цілком поширеним програмним забезпеченням. Приємні звістки з області потужних спеціалізованих додатків — незабаром мають з’явиться версії багатьох чудових пакетів для архітектури Intel, причому ціни можуть викликати напад чорної заздрості власники робочих станций.
Навіть якщо виробники робочих станцій на RISC-процессорах зможуть у наступного року зробити ривок в продуктивності, то розрив Intel, виконуючим переважну частину ПО, і машинами RISC буде достатнім, щоб перевагу робочих станцій було непреодолимым.
У першому номері Computer Week Moscow можна знайти пасаж цікавого характеру. Дослівно: «Досвідчені системи P6 здатні за більший, ніж просто витримувати конкуренцію із боку інших робочих станцій середнього класу. За безпосередньої зіставленні робочих станцій Intergraph на 200-МГц процесорі Pentium Pro і Silicon Graphics Indigo-2 Extreme з 200-МГц процесором Mips R4400, остання на тестах iSPEC показала порядку 160 одиниць, тоді як оцінки Intel системі P6 повної конфігурації відповідають 366 одиницям. «.
Під час створення процесора Pentium Pro робився упор зроблено на здібності цієї мікросхеми виконувати графічний рендеринг і з 32-разрядным кодом.
Pentium Pro явно випадає із рамок процесора Pentium і належить шостому поколінню архітектури Intel x86. Раніше все конкуренти, виробники процессоров-клонов рухалися у фарватері оригіналу, копіюючи його з декотрими компромісами, цим, прирікаючи себе дедалі більше відставання і замкнутість на вторинних ринках. Така тактика себе вичерпала, вона загрожує повної втратою конкурентоспроможності, і до того ж Intel буквально терзає конкурентів постійними скидами цін, і розширенням номенклатури, сужающими нішу, у якому ще можна протиснуться.
Саме тому AMD, NexGen і Cyrix перейшли недавно визнав на власний курс, відмовившись від безнадійного копіювання схем Intel.
Hо принципової прорости між конкурентами немає. У деяких випадках Pentium Pro складніший, ніж Nx586, K5 і M1, за іншими менш. У цілому схема P6 порівняти з іншими процесорами; найближчий до неї дизайн К5, вважають эксперты.
Особливість підходу Intel до створення гібрида CISC/RISC залежить від формулі dynamic execution (динамічний виконання). Приблизно таку ж базові принципи ви знайдете, якщо станете розбиратися докладно з архітектурою останніх RISC-процессоров IBM/Motorola PowerPC 604 і Power PC 620, Sum UltraSparc, Mips R10000, Digital Alpha 21 164 і HP PA-8000.
Разюче подібність підходу різних фірм до гібридизації підходів CISC і RISC. Зовні Pentim Pro виглядає традиційним CISC-процессором, сумісним з усім напрацьованим программно-аппаратным фондом. Знайомий «фасад «прикриває від користувача RISC-подобное ядро. Між «фасадом «і «задніми кімнатами «працює найрозумніший декодер, разбивающий складні і довгі команди х86 більш прості операції, схожі на команди RISC — компанія Intel називає їх u-ops чи micro — ops. Ці micro — ops надходять в ядро процесора, що їх буквально перелопачує. Елементарні микрооперации легше розподіляти і відомства паралельно обробляти, ніж які породжують їх команди х86. Хай де вони називалися, мета переслідується одна: подолати обмеження системи команд х86, але зберегти сумісність до існуючого програмним забезпеченням х86. Зовні - з погляду програміста, пише програми — всі ці ЦПУ виглядають як стандартні х86- сумісні CISC-процессоры. А всередині вони працюють як найсучасніші моделі RISC-чипов.
Hо сьогодні Pentium Pro «жвавіше «і швидше як кожного з «живих «процесорів архітектури х86, включаючи Nx586 і Cyrix6x86, а й кожного з випущених RISC-процессоров.
Як то кажуть, не дражните великого хлопця, інакше будете з розквашеним носом. Саме такий сенс послання Intel на адресу конкурентів: NexGen, Cyrix і AMD.
7. Pentium II.
7.1 Pentium II.
Випущений з середини 1997 року, Pentium II ввів ряд великих змін — у світ процесорів PC.
По-перше, чіп і системний кеш другого рівня з'єднувалися по виділеної шині, здатної працювати на частоті шини процессор-система.
По-друге, процесор, вторинний кеш і тепло відвід були на невеличкий платі, вставлявшейся в розняття на системної платі, що більше нагадувало карту розширення, ніж традиційну схему процессор/гнездо. Intel охрестив це Single Edge Contact cartridge (SEC) — однобічно контактний картридж. У цьому вся картридже перебувають шість окремих компонент — процесор, чотири індустріально стандартних burst-static-cache RAM і тільки tag RAM. Дизайн SEC картриджа наділяв важливими перевагами. PGA-компоновка Pentium Pro вимагала 387 контактів, тоді як SEC-картридж — лише 242. Зменшення на третину числа контактів сталося наявністю в картридже дискретних елементів, як-от прикінцеві резисторы і конденсатори. Ці елементи забезпечують розщеплення сигналів, що таке набагато менше число необхідних рознімань харчування. Розняття SEC-картриджа використовує так званий Slot 1 та сприймається як приймає естафету у минаючого Socket 7.
Третє зміна — більшому синтезі, оскільки Pentium II об'єднує Dual Independent Bus (DIB) від Pentium Pro з технологією MMX від Pentium MMX, формуючи нового вигляду — гібрид Pentium Pro/MMX. Отже, зовні дуже відмінний від попереднього интеловских процесорів, Pentium II внутрішньо являє собою суміш нових технологій і поліпшень старих чипов.
І, насамкінець, на відміну Pentium Pro, працюючого на 3.3v, Pentium II харчується від 2.8v, дозволяючи Intel пускати його за великих частотах без надмірного збільшення вимогу до потужності. Тоді, як 200MHz Pentium Pro з 512kb кешу споживає 37.9 ватів, 266MHz Pentium II з 512kb кешу спалює 37.0 ватт.
Подібно Pentium Pro, Pentium II застосовує интеловскую Технологію Динамічного Виконання. Коли програмна інструкція зчитується в процесор і декодируется, вона потрапляє у виконуваний пул. Технологія Динамічного Виконання приймає три основних підходи до оптимізації поводження процесора з кодом. Численні Пророкування Розгалужень перевіряють програмний потік вздовж кількох гілок і прогнозують, де у пам’яті перебуває наступна инструкция.
Коли процесор читає, він також перевіряє такі інструкції в потоці, прискорюючи внаслідок робоче протягом. Аналіз Потоку Даних оптимізує послідовність, у якій інструкції робитиметься, перевіряючи декодированные інструкцією, і визначаючи, готові вони в обробці чи залежить від інших інструкцій. Спекулятивне Виконання збільшує швидкість таких інструкцій переглядом вперед від поточної інструкцією, і обробкою подальших інструкцій, які мабуть можуть знадобиться. Ці результати зберігаються як спекулятивні до того часу, поки процесор не визначить, які йому потрібні, а які - немає. З цього точки інструкція повертається у нормальну чергу, й додається до потоку.
У Технології Динамічного Виконання є основні переваги: Інструкції обробляються швидше, і ефективніше, ніж зазвичай, і на відміну від CPU із застосуванням RISC архітектури, програми зайве перекомпілювати для вилучення вигод процесора. Процесор усе робить на лету.
Значною нової особливістю є видалення вторинного кешу з власне процесора на окрему кремнієву пластину в картридже. Процесор читає і пише дані в кэше використовуючи спеціалізовану високошвидкісну шину. Звана задньої (backside) шиною, вона відділена системної шини процессор-память (зараз званої передній (frontside) шиною). Процесор може використовувати обидві шини одночасно, але архітектура подвійний незалежної шини має інші преимущества.
Хоча шина між процесором і кэшем другого рівня працює повільніше, ніж звичайному Pentium Pro (на половині швидкості процесора), вона надзвичайно масштабируема. Що швидше процесор, то швидше кеш, незалежно від 66MHz передній шини. До того ж, передня шина то, можливо збільшена з 66 до 100MHz без впливу шину кешу другого рівня. Також очевидно, що наявність пам’яті однією кристалі з процесором негативно б'є по відсоток виходу придатних 512kb Pentium Pro, зберігаючи високими цены.
Pentium II спирається на GTL+ (gunning-transceiver-logic) логіку хост-шины, допускає природну підтримку двох процесорів. Під час виходу це забезпечувало стоимостно ефективне мінімалістське двухпроцессорное рішення, допускаемое симетричній мультипроцессорностью (SMP). Двухпроцессорное обмеження накладалося не самим Pentium II, а підтримкою чипсета. Початкове обмеження чипсета двухпроцессорной конфігурацією дозволяло Intel і постачальникам робочих станцій пропонувати двухпроцессорные системи як тимчасова економічне рішення, що у іншому та був можливо. Це обмеження було зняте з середини 1998 року після виходу чипсета 450NX, підтримує від однієї чотирьох процесорів. Чипсет 440FX, у якому чіпи PMC і DBX, не допускав чергування (interleaving) пам’яті, але підтримував EDO DRAM, дозволяючи покращувати продуктивність пам’яті зменшенням ожидания.
Коли Intel проектував Pentium II, він також завів слабку 16- битную продуктивність його попередника. Pentium Pro розкішно працює із повністю 32-битным забезпеченням, таких як Windows NT, але опускається нижче стандартного Pentium «а, обробляючи 16-битный код. Це тягне гірший ніж Pentium продуктивність під Windows 95, великі частини котрій наразі 16-битны. Intel вирішила цю проблему використанням пентиумного кешу з дескрипторами сегментів в Pentium II.
Как і Pentium Pro, Pentium II надзвичайно швидкий в арифметиці плаваючою точки. У поєднанні з Accelerated Graphics Port (AGP) це робить Pentium II потужним рішенням для високопродуктивної 3D графики.
7.2 Deschutes 333MHz втілення Pentium II під назвою Deschutes (річкою, поточної в Орегоні), було анонсовано на початку 1998 року з планованими в протягом року 400MHz і від. Ім'я Deschutes насправді належить до двох різних лініях CPU. Версія для Slot 1 — нічого більше, ніж злегка еволюціонував Pentium II. Архітектура і тяжка фізична дизайн ідентичні, крім те, що Deschutes Slot 1 частиною зроблено з допомогою 0.25-микронной технології, введеної восени 1997 року з ноутбучным процесором Tillamook, порівняно з 233−300MHz версіями, виконаними по 0.35-микронному процесу. Застосування 0.25-микрон означає, що транзистори на матриці фізично ближче між собою і злочини CPU споживає менше енергії, отже розсіює менше тепла на даної частоті, дозволяючи ядру тікати великих частотах.
Усе решта у Slot 1 Deschutes ідентично звичайному Pentium II. Змонтований на основу і укладений у SEC картридж, він підтримує набір інструкцій MMX і спілкується з 512kb вторинного кешу на половинної частоті ядра. Вона має хоча б кінцевий коннектор, й працює тих-таки системних платах з тими самими чипсетами. Як такою він працює із 440FX чи 440LX зовнішньому частоті 66MHz.
С весни 1998 року великий крок у продуктивності прийшов з наступним втіленням Deschutes, коли новий чипсет 440BX, припускає 100MHz передачу по системної шині, зменшуючи закупорювання даних, і підтримуючи частоти від 350 до 400MHz.
Інший процесор, зовущийся Deschutes, належить до Slot 2, випущено з середини 1998 року як Pentium II Xeon. Intel розбив Slot 1 і Slot 2 Deschutes на взаємодоповнюють товарні лінії, де Slot 1 призначений для виробництва, а Slot 2 націлений на high-end сервери і туди, де ціна вторинна стосовно производительности.
7.3 Мобільний Pentium II.
Природний просування малопотужного (себто енерго потребления/рассеивания) сімейства Pentium II Deschutes ринку портативних PC здійснилося з випуском лінійки мобільних Pentium ІІ квітні 1998 року. Новий процесор та її компаньйон мобільний 440BX чипсет, відпочатку були доступні в 233 і 266MHz варіантах, скомпоновані в існуючий мобільний модуль (MMO) чи новий мини-картридж формат. Intel очікує до кінця 1998 року понад половини з споряджених його мобільними процесорами PC будуть вже Pentium II, а термін мобільних Pentium II Tillamook закінчиться до середини 1999 года.
7.4 Celeron.
У спробі кращого задоволення сектора дешевих PC, до справжнього часу вотчини виробників клонів, AMD і Cyrix, продовжують розвивати успадковану архітектуру Socket 7, Intel випустив свій ряд процесорів Celeron у квітні 1998 года.
Основанный тій самій P6 архітектурі, як і Pentium II, і використовуючи хоча б 0.25-микронный процес, Celeron-системы пропонують повний комплект останніх технологій, включаючи підтримку AGP графіки, ATA-33 жорстких дисків, SDRAM і ACPI. Celeron працюватиме будь-якому интеловском Pentium II чипсете, які підтримують 66MHz системної шини, включаючи 440LX, 440BX і розпочнеться новий 440EX, спеціально спроектований на ринку «базових «PC. На відміну від Pentium II з його SEC картриджем, Celeron немає захисного пластикого покриття навколо карт процесора, що Intel називає Single Edge Processor Package (SEPP). Він цілком сумісний зі Slot1, що дозволяє вживати існуючі плати, але механізм кріплення для карти CPU не адаптований для форм чинника SEPP.
Перші 266 і 300MHz Celeron «и без кешу другого рівня зустріли мало ентузіазму над ринком, не несучи чи несучи мало переваг над системамиклонами Socket 7. Торішнього серпня 1998 року Intel поповнив ряд Celeron сімейством процесором, названих Mendocino. Обладнаний 128kb вторинного кэа на матриці, працюючого на повної частоті процесора, і з'єднуючись через зовнішню 66MHz шину, новий Celeron став набагато більше живим, ніж його млявий попередник. Почасти плутано, дві доступні версії отримали названия.
Celeron 333 і 300a. Перше є основний версією, сумісний з існуючої интеловской архітектурою, тоді як другий патентує Pin 370 socket, відмінний від Socket 7 і Socket 1, націлений на дешеві low-end машины.
7.5 Pentium «Xeon» З початку липня 1998 року у всьому світу проходила серія заходів, присвячених уявленню найпотужнішого процесора архітектури х86 корпорації Intel. Задовго доти з інформації, размещённой на Web-сайтах Intel став відомий за його назву та призначення. Особливо підкреслювалося, що слово Xeon ніжно вимовляти як «Зеон», але російське представництво прийняв рішення підпорядкувати цю назву нормам російського (і грецького) мови. Тож у Росії - ми матимемо справу з «Ксеоном», — є у нас Ван Клиберн і Мехико.
Новий процесор, до речі, став подарунком компанії-виробника самої собі із нагоди тридцатилетия.
Перше, що у очі, — незвичайно великий розмір процесорного картриджа куди «пакується» Xeon. Він призначений для установки в разъём нової конструкції Slot 2. За словами розробників, це пов’язане з збільшенням ёмкости кеш-пам'яті другого рівня. Нині процесори Xeon з єдиною тактовою частотою поставляються у двох варіантах: з 512 Кбайт і одну Мбайт КЭШа L2. Але вже цього року планується довести ёмкость кеш-пам'яті другого рівня до 2 Мбайт й тимчасово підвищити тактову частоту до 450 МГц. Нагадаю, що старий Pentium II комплектувався лише 512 Кбайт.
Та ще більше викликає те що, що конструктори змогли «змусити» L2-кэш працювати на тактовою частоті процесорного ядра. Нагадаю, що така сама концепція реалізували в Pentium Pro, та заодно розробники «зіштовхнулися» на стадії виробництва (відсоток виходу двох якісних кристалів виявився нижче гаданого), і процесор виявилося доволі дорогим. Можливо, саме тому Pentium II спочатку створювався з «поділом» кристалів (основного і КЭШа L2), внаслідок чого довелося розплачуватися «половиною» тактовою частоти кеш-пам'яті другого уровня.
Висока частота роботи КЭШа спровокувала збільшення тепловіддачі процесорного блоку, тому знадобилося використання масивною поглинає тепло пластини, що, своєю чергою, викликало загострення ваги і габаритів модуля.
У кожному модулі Slot 2 три спеціальних області даних: доступним лише для читання, область для чтения/записи і динамічна інформацію про температурі всередині процесорного модуля. У сфері першого типу вміщена інформацію про версії процесора, даних про покрокової налагодженні і зазначена гранично допустима температура. У второю область пам’яті користувачі можуть вводити свою інформацію. Доступ до динамічним даним про зміну температури дає можливість управляючим програмам оповіщати адміністратора про небезпечних системних событиях.
Збільшення ёмкости КЭШа другого рівня підвищує пропускну спроможність системи завдяки миттєвому доступу процесорів до часто що використовуються даним і інструкціям, що зберігається у швидкої кеш-пам'яті. За заявою Intel, збільшення ёмкости КЭШа з 512 Кбайт до 1 Мбайт наводить іноді на 20-те% зростанню загальної продуктивності системи. Для пояснення цього явища доречно провести аналогію з холодильниками, що використовується Intel: зберігання запасу продуктів в холодильнику рятує кухарів ресторану від виробничої необхідності їздити по магазинах, закуповуючи провізію. Чим більший холодильник, краще, особливо у години пік, коли кількість клієнтів у ресторані різко зростає. Отож, що стосується сервером «холодильник» — це кеш-пам'ять другого рівня, а «магазин» (де доступні самі продукти) — у принципі більш повільна системна пам’ять. Великий кеш L2 значно підвищує загальну продуктивність багатопроцесорних конфігурацій в системах, які працюють із великими масивами непорівнянних даних. За інформацією Intel, проведені корпорацією тести ZD ServerBench показали майже пропорційний зростання продуктивності системи з мері установки додаткових процесорів з мегабайтным КЭШем.
Вдосконалена архітектура Xeon, яка припускає 36-разрядную адресацію фізичної пам’яті, теоретично дозволяє процесору отримувати доступом до системної пам’яті ёмкостью до 64 Гбайт. Новий механізм посторінкового обміну Page Size Extension — 36 залишиться практично непомітної для очей користувача і розробників додатків. У цей час PSE-36 підтримують операційні системи Windows NT, SCO UnixWare і Sun Solaris. Для інших операційними системами знадобиться оновити драйвер блоку управління памятью.
Intel 450NX PCIset був першим микросхемным набором, оптимизированным для Pentium II Xeon. Він випускається у двох варіантах, Basic і Full, відповідно для серверних hi-end і систем середній рівень. Вона має однакову структуру ядра, але відрізняються продуктивністю і ценой.
Basic PCIset підтримує до двох разъёмов 32-разрядной PCI, один — 64- розрядної і по 4 Гбайт системної пам’яті типу EDO. Його більш досконалий «родич» Full PCIset підтримує до чотирьох слотів типу EDO. Ці чипсеты об'єднує функціонування на 100-мегагерцовой частоті системної шини і можливість підтримки багатопроцесорних (до чотирьох Xeon) конфігурацій. 64-разрядная шина PCI здатна істотно підвищити загальну продуктивність системи з урахуванням оптоволоконною технології обміну даними з дисковими масивами, використання високопродуктивних мережевих магістралей на основі АТМ, Gigabit Ethernet та інших. Підвищується, власне, синхронізація потужності процесора і продуктивності підсистеми ввода-вывода.
Xeon, як я зазначав, призначений як для серверів, але й робітників і графічних станцій, котрим однією з найважливіших параметрів є продуктивність відеопідсистеми. Їх розроблений чипсет Intel 440GX AGPset з урахуванням відомого микросхемного набору 440BX. 440GX управляє роботою порту AGP як 2х. Режим подвоєною продуктивності реалізується завдяки так званої технології подвійний накачування — дані передаються як у переднього, і по задньому фронтах тактових імпульсів (у звичайній AGP — лише з переднього), у своїй смуга пропускання сягає значення 533 Мбайт/с. Фізичні параметри інтерфейсу AGP залишаються прежними.
Ще одою особливістю набору чипсета 440GX стала можливість звернення до пам’яті ёмкостью до 2 Гбайт, що у майже удвічі більше, ніж в його приемника.
Попри те що, що у сьогодні поняття многопроцессорности асоціюється у Intel лише з чотирма пристроями на однієї платі, роботи з створенню симетричних мультипроцессорных систем, підтримують до максимально восьми «Ксеонов». Розробки восьмиканального чипсета для Xeon ведуться фірмою Corollary, дочірньою компанією Intel. І, звісно ж, можливі кластерні рішення, скажімо, з урахуванням архітектури распределённой пам’яті (NUMA). У обох випадках, зазвичай, непотрібен «переписувати» прикладні програми (щоправда, операційна система вимагає деякою оптимізації). У процессорной шині чипсета Intel 450NX PCIset передбачено так званий разъём кластерного сполуки, що спрощує побудова кластерного сполуки з урахуванням стандартних четырёхпроцессорных узлов.
Ще одним найперспективнішим напрямом є кластер з передачею повідомлень. Суть її у відсутності поділу ресурсів. Окремо які стоять вузли кластера обмінюються даними, наприклад, тактовими імпульсами, що сигналізують про нормальний стан системи. І хоча LAN-соединение залишається працездатним, існує у мережі нових типів — так званої SAN (System area Network).
На завершення хотів би зазначити, деякі головні західні виробники (IBM, NCR, Dell) стали поставки систем з урахуванням Xeon, але в презентації процесора у Росії компанії Kraftway і «И Вист» також представили нові серверні решения.
Орієнтовні ціни на всі Pentium Xeon становитимуть 1124 доларів (L2 512 Кбайт) і 2836 доларів (L2 1 Мбайт) за поставок від тисячі штук.
Д-р Джон Гудмен «Управління пам’яттю всім » ,.
Діалектика, Київ, 1996.
В.Л. Григор'єв «Мікропроцесор i486. Архітектура і програмування », Гранал, Москва, 1993.
Інформаційно — рекламна газета «КМ — інформ «.
газета «Комп'ютер World/Киев «.
газета «Комп'ютер Week/Moscow «.
Ж.К. Голєнкова та інших. «Посібник із архітектурі IBM PC AT » ,.
Консул, Мінськ, 1993.
Керівництво програміста по процесору Intel i386,.
Технічна документація рівня 2, (З) Intel Corp.
Керівництво програміста по процесору Intel i486,.
Технічна документація рівня 2, (З) Intel Corp.
Матеріали эхоконференции SU.HARDW.PC.CPU комп’ютерної сети.
FidoNet.