Процессор AMD.
Історія развития
Теоретично, 3DNow! повинен замінити співпроцесор під час розрахунків тривимірної геометрії й суттєво прискорити виконання цих обчислень. Модуль 3DNow! може виконувати чотирьох SIMD (Single Instruction Multiple Data) інструкцій (зі свого 21-командного набору) паралельно, що з грамотному використанні може дати небувалий приріст продуктивності. Хорошою ілюстрацією цього тези може бути Quake2… Читати ще >
Процессор AMD. Історія развития (реферат, курсова, диплом, контрольна)
МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАИНЫ.
ЧЕРКАСЬКИЙ ДЕРЖАВНИЙ ТЕХНОЛОГІЧНИЙ УНИВЕРСИТЕТ.
КАФЕДРА КОМП’ЮТЕРНИХ СИСТЕМ.
РЕФЕРАТ.
По дисципліни Інформатика і їх комп’ютерна техника.
На тему: Процесор AMD. Історія развития.
Выполнил:
Студент 2-го курсу ФИТИС.
Група ЕК-08.
Кондратенко У. В.
ЧЕРКАССЫ.
Про AMD.
AMD — світової постачальник інтегральних мікросхем на ринку персональних і мережевих комп’ютерів, і комунікацій, чиї виробничі потужності перебувають у Сполучені Штати, Європі, Японії Азії. AMD виробляє мікропроцесори, устрою флеш-пам'яті й допоміжні мікросхеми для комунікаційних і мережевих додатків. Компанія AMD, заснована 1969 року із штаб-квартирою р. Саннивейл (прим. Каліфорнія), 2000 року мала оборот 4,6 млрд. дол. (NYSE: AMD).
Першим процесором, який AMD розробляла самостійно, був K5, випущений 1996 року. Нині про вже далеко не всі пам’ятає, щоправда й будемо пам’ятати там особливо нічого. Як завжди, запізнившись з випуском цього кристала, відстаючи по тактовою частоті і продуктивності, AMD окремо не змогла тоді завоювати розташування пользователей.
Після цього провалу AMD придбала забуту зараз фірму NexGen, ще одного незалежного розробника x86 процесорів, який мав передовий у період технологією та потроху випускав кристали без арифметичного співпроцесора. Використовуючи ці напрацювання, AMD спроектувала нове покоління своїх CPU — K6. По операцій із цілими числами ці процесори стали перевершувати аналоги від Intel, проте блок операцій із плаваючою точкою досі залишав бажати лучшего.
AMD не здавалася й у потреб ігор запропонувала використовувати не співпроцесор, а спеціально спроектований набір SIMD-инструкций 3DNow! Так з’явився процесор AMD K6−2, у якому до ядру K6 додався ще один блок операцій із числами одинарної точності з плаваючою точкою. Завдяки з того що міг виконувати однотипні обчислення з чотирма парами операндов одночасно, на спеціально оптимізовані під 3DNow! додатках K6−2 показував непогану производительность.
У швидше AMD до свого процесору K6−2 додала інтегрований в ядро кеші другого рівня, працюючий на частоті кристала. Це врятувало продуктивність — отриманий K6-III міг успішно конкурувати з аналогами.
Знаходячись у стані цінової війни, Intel і AMD прийшли до того, що найдешевші Intel Celeron продаються практично за собівартістю, а то й нижче, але в ринку дорогих процесорів влаштувався інший продукт від Intel — Pentium III. Єдиний що залишилося ймовірність виживання для измотанной і порастерявшей у боротьбі свої капітали AMD — вилізти ринку найдорожчих і престижних продуктивних процесорів. Причому, закріпитися на не з допомогою ціни — цим зброєю у досконало володіє Intel, котрі можуть скидати ціни значно сильніші за AMD, а й за рахунок швидкодії. Саме це спробувала зробити AMD, викинувши ринку процесор нової генерації - Athlon.
Розвиток сімейства K-6.
[pic].
AMD K6.
Clock speeds (MHz) 166, 200, 233 Level one (L1) cache 32K instruction, 32K data Level two (L2) cache Controlled by chip set L2 cache speed Same as bus Type of bus Socket 7 Bus speed (MHz) 66 Instructions per clock cycle 2 MMX units 1 Pipelined FPU N Out-of-order execution Y Process technology 0.35µ CMOS Die size 162 mm² Transistors 8.8 million.
AMD K6−2.
Цей процесор є логічним продовженням лінійки K6 і відрізняється від попередника лише добавленним в ядро нового модуля, обробного «3D-инструкции «і котрий має назву 3DNow! Власне — це іще одна співпроцесор на кшталт MMX, але вміє виконувати 21 нову інструкцію. Нові інструкції покликані, передусім, прискорити обробку даних, що з тривимірної графікою. Тож у набір інструкцій 3DNow! включені команди, хто з вещественночисленными аргументами одинарної точності. Саме тому, технологія ММХ не пішла у життя — ММХ працює із цілими числами, а при розрахунку тривимірних сцен оперувати доводиться з речовими. Як багато і ММХ, 3DNow! використовує самі регістри, як і співпроцесор, це пов’язано з тим, що операційні системи повинні удається зберігати й скидати все регістри процесора при переключенні задач.
Теоретично, 3DNow! повинен замінити співпроцесор під час розрахунків тривимірної геометрії й суттєво прискорити виконання цих обчислень. Модуль 3DNow! може виконувати чотирьох SIMD (Single Instruction Multiple Data) інструкцій (зі свого 21-командного набору) паралельно, що з грамотному використанні може дати небувалий приріст продуктивності. Хорошою ілюстрацією цього тези може бути Quake2, працюючий на процесорах K6 у півтора рази повільніша, ніж Pentium тієї ж частоти. Проте, лишень усупереч поширеному думці, це було пов’язано ні з тормознутостью AMD-шного співпроцесора, як тим що Intel реалізував своєму кристалі можливість паралельної роботи процесора з арифметичним співпроцесором. У Quake2, код оптимізовано з урахуванням цієї особливості, тож коли процессорные і сопроцессорные інструкції що неспроможні виконуватися одночасно (як у AMD K6), продуктивність виходить вкрай низька. K6−2 повинен розв’язати проблему, але іншим шляхом — з допомогою конвейеризации 3D обчислень в модулі 3DNow! Проте, питання розпаралелювання обчислень необхідно вирішувати програмістом, що викликає певні труднощі при реалізації алгоритмів, тим паче, що обчислення геометрії 3D-сцен далеко ще не лінійний. Тому, теоретична продуктивність К6−2, значно що перевищує швидкість всіх сучасних PII-процессоров, досягнуто не может.
Отже, щоб від 3DNow! був хоч якийсь ефект, необхідно, щоб додаток використало ті ж самі 21 інструкцію. Причому як-небудь, і з урахуванням конвеєрної структури цього модуля процессора.
AMD K6−2 3DNow!
AMD знову сподівається скоротити відрив Intel «але в цього разу з допомогою технологій високого рівня життя та заточених під процесор 3D драйверів. Названа «K6−2 3DNow! », цієї серії процесорів повинна розбити ілюзію, що користувачі повинні купувати процесори Intel Pentium II задля досягнення якомога більшої 3D быстродействия.
Вийшовши 300 і 333Мгц версіях, лінія K6−2 містить деякі поліпшення, проти вже знайомої користувачам лінії K6. Поліпшений співпроцесор, вищі швидкості роботи ядра, підтримка 100Мгц кешу 2 рівня, й створили набір інструкцій, відомого як 3Dnow!, — ось якості, вознесшие K6−2 на її вершину запропонованих AMD процессоров.
3DNow!, кажучи людською мовою, — це поліпшений процес обчислень, що прискорює обчислювання сцени для 3D графіки. Cyrellis вже раніше згадував, що з головних перешкод прискорювачів 3D графіки є конфлікт між повільним створенням сцени типовим процесором Intel/AMD та можливостей рідного процесора 3D карти. Відеокарта повинна дочекатися, поки CPU завершить своєї роботи, і тільки тоді ми її 3D-процессор у змозі вичавити необхідну нам кількість кадрів в секунду. 3DNow! обіцяє змінити таке стан справ, пролітаючи крізь генерацію сцени на максимальної швидкості, цим значно підвищуючи производительность.
Ось як і выглядит:
[pic].
Яким ви бачите, процесор завантажений роботою, навіть якщо 3D-ускоритель перебирає генерацію трикутників, як, наприклад це робить чипсет Voodoo2.
Технологія 3DNow!
Технологія 3DNow!, запропонована AMD у своїй новому процесорі K6−2 (кодове ім'я дане було K6 3D), є розвиток застосовуваної повсюдно технології MMX. MMX — це створює додаткові 57 інструкцій процесора і побачили 8-го додаткових регістрів, які мають збільшити продуктивність мультимедійних додатків. Якщо програма використовує ці можливості, це вносить чималий внесок у швидкість виконання. MMX була введена в процесорах фірми Intel, але справжньому моменту все x86- процесори, включаючи AMD, IDT і Cyrix, підтримують її. Проте, попри повсюдну підтримку, MMX використовується недостатнім числом додатків, тому переваги від наявності підтримки MMX поки невелики.
Після запровадження MMX, ініціатива для впровадження нових інструкцій несподівано перейшла до AMD. Щоправда, у відповідь цей крок, Intel анонсував набір команд MMX2, який з’явився процесорі Katmai. Додаткова система команд від AMD, названа 3DNow! (кодове ім'я дане було AMD-3D Technology), є набір інструкцій з прискорення операцій тривимірної графіки. Цей набір включає, зокрема, швидке розподіл речовинних чисел, яке виконує за 3 такту процесора, і обчислення зворотної величини до квадратному корені, яке виконує також 3 такту. По думці AMD, використання у 3D-играх технології 3DNow! дозволить 300- мегагерцовому K6−2 наздогнати продуктивністю Pentium II 400 МГц.
AMD K6-III.
Після виходом чергового процесора від Intel, Pentium III, з’явилася новинка і південь від AMD — процесор K6-III. Цей процесор мав дозволити AMD піднятися з ніші дешевих систем і почав конкуренцію з Intel з ринку понад дорогих машин, готуючи грунт нанесення вирішального удару за позиціями микропроцессорного гіганта блокбастером K7. Тривалий очікування, читання специфікацій і перші враження від AMD K6-III давали все підстави у тому, щоб на те, що позиції Intel похитнуться. Але, традиційно, AMD виступає у ролі наздоганяючого, а перемоги у цьому разі, відповідно до військової тактиці, потрібно чимале перевага у силі. Але, тим щонайменше, новий раунд бою AMD проти Intel, Socket7 проти Slot1, Давид проти Голіафа, начался.
Ось технічні дані процесора AMD K6-III:
. Чіп, вироблений за технологією 0.25 мкм;
. Ядро CXT, що було звичайне ядро K6−2 із можливістю пакетної записи;
. Працює в Socket-7-системных платах, але потребує ремонту BIOS;
. Кеш першого рівня — 64 Кбайта, по 32 Кбайта на код і данные;
. Має вмонтований кеш другого рівня обсягом 256 Кбайт;
. Кеш материнської плати працює як кеш третього уровня;
. Напруга харчування 2.3−2.5 В (є різні партии);
. Набір з 21 SIMD-команды 3DNow! Є 2 конвеєра, які оперують з цими двома парами речовинних чисел одинарної точности;
. Частоти — 350, 400, 450 і 475 МГц. Системна шина 100 МГц (для модели.
475 МГц — 95 МГц). Можлива роботу і на 66МГц системної шине;
. 3DNow! підтримується в DirectX 6.0 і выше.
Як очевидно з специфікації, AMD K6-III — це AMD K6−2 плюс 256 Кбайт кешу другого рівня, інтегрованого в ядро і працюючого з його частоті. Пам’ятаючи, які дива продуктивності показує Intel Celeron, від AMD K6- III очікується також чималий приріст быстродействии, тим паче, що шина пам’яті - головне вузьке місце у системі, хоча й дбає про частоті 100 МГц. До того ж L2 кеш e К6-III має розмір вдвічі більший, ніж в Celeron й у двічі швидший (хоч і удвічі менший), ніж в Pentium II. Не слід при цьому забувати і про кеш, встановлений на материнської платі - він працює кэшем третього рівня життя та додають ще кілька відсотків производительности.
Треба приділити увагу ще одному факту, саме буквах CXT в назві ядра. Це ядро з’явилося процесорах K6−2 зовсім і відрізняється від попереднього наявністю функції пакетної запис у пам’ять Write Allocate. Тобто, нове ядро дозволяє передавати дані про шині не абияк, а, по мері накопичення 8-місячного байтовыми пакетами, що дозволяє невеличкий виграш в продуктивності під час передачі даних із 64-битной шині. Щоправда, нової цю функцію кваліфікувати не можна, оскільки Write Allocate є й у интеловских процесорах ще від часів Pentium Pro.
Що ж до 3DNow!, з дохідними статтями порівняно K6−2 усе залишилося зовсім без змін. Проте, слід констатувати, що додатків використовують цю технологію на не багато, а підтримка 3DNow! в драйверах відеокарт і DirectX це не дає нічого. Так само як у разі з SSE, для отримання значимого приросту в быстродействии, необхідно використання SIMD-инструкций при розрахунку геометрії 3D-сцены, оскільки функції, оптимизированные в DirectX працюють недостатньо швидко і використовуються разработчиками.
Зазначимо те що, що з підтримки нових K6-III згодяться й старі Socket7 системні плати, котрим є BIOS із підтримкою ядра CXT і мають змогу виставляння напруги харчування ядра 2.3−2.5 В. Проте, тоді як керівництві до системної платі не зазначений спосіб виставляння цих напруг, впадати у відчай рано. Найчастіше існують недокументированные установки для такого напруги питания.
AMD K7.
К7 — перший із сімейства мікропроцесорів х86 7-го покоління, в якому присутні конструктивні рішення, досі не застосовували процесорах архітектури х86 і які обіцяють виграш в быстродействии навіть за однакових тактових частотах. Найбільш вражаючим є, звісно, 200-мегагерцовая системна шина, проте й інші, менш помітні здавалося б нововведення, ставлять К7 вище процесорів 6-го поколения.
. Нова архітектура вузла обчислень з плаваючою точкою (fpu). К7 містить 3 вузла обчислень з плаваючою точкою (fpu), кожній із яких здатний приймати на вхід інструкції кожен такт роботи процессора.
У цьому один вузол призначений лише заради виконання команды.
FSTORE! Призначення цього вузла — забезпечувати обмін між регістрами і пам’яттю тоді, як процесор виконує інші інструкції. Такий їхній підхід, хоча й підвищує пікову продуктивність, дозволяє досягти вищої середньої продуктивності, що в багатьох випадках важливіше. Інші два fpu складаються з блоком складання (adder) і лідером блоку множення (multiplier). Обидва блоки використовують конвеєри (fully pipelined). Архітектура кожного fpu така, що може приймати на вхід кожен такт одну інструкцію складання й одне множення, що дозволяє пікову продуктивність 1000MFLOPS при 500МГц. Найближчим аналогом з погляду архітектури є Pentium II, яка має також є adder і multiplier. Проте і дві основні відмінності. По-перше, у PII лише adder є цілком конвейеризованным (fully pipelined), multiplier ж можна приймати інструкцію на вхід лише другий такт. По-друге, кожен вузол fpu PII може приймати тільки одну інструкцію за такт, в такий спосіб, пікова продуктивність становить 500MFLOPS при 500МГц.
Вищесказане в жодному разі є нападками на гідну архітектуру сімейства Р6, яке досі залишається єдиним сімейством процесорів з конвеєрним fpu. Так, майже забув… Rise mP6, можливо, матиме архітектуру fpu, схожу на, що використовують у К7 (як в усьому, що пов’язані з компанією Rise, тут повно туману, але компанія впевнено заявляє, що fpu їх процесора здатний виконувати 2 інструкції х87 за такт), проте максимальна тактова частота в 200МГц Демшевського не дозволяє цьому процесору на місце у «вищому суспільстві «, а й навіть в «середній клас », тому порівнювати mP6 з К7 некорректно.
. Величезний кеш L1. Якщо пам’ятаєте, Pentium MMX-166 показував ті ж самі продуктивність на додатках, не використовують інструкції ММХ, як і класичний Pentium-200. У чому причини? А причина у цьому, що чип.
ММХ мав у 2 рази більше кешу L1 (32К проти 16К). І це пояснює, чому К6−200 приблизно дорівнює по производительности.
Pentium MMX-233 — вона має 64К кешу. До чого це? До того, що у К7 кеш L1 збільшився ще 2 разу — до 128К. Це ще гарантує ефективного зростання продуктивності процесора зі збільшенням тактовою частоти, але, по крайнього заходу, усуває небезпека простою, зза обміну з памятью.
. Модернизируемый кеш L2. У К7 кеш L2 буде розміщений, за прикладом PII, в картридже, а чи не інтегрований в кристал, як в К6−3. Результатом цього є можливість «модернізації «кешу. Спочатку його частота становитиме 1/3 частоти процесора. Надалі планується випуск версій з кэшем L2, працюючим на частоті процесора, і, можливо, на половинної частоті. Те ж саме з розміром. К7 може нести кеш L2 розміром від 512К в «нижніх «моделях до 8МВ в серверних моделях.
" high-end «(вражаюче, Xeon сьогодні має до 2МВ, але цена…).
AMD Duron 650.
Тоді, коли популярність Socket 7 платформ перебувала на піку, і обоє найбільших мікропроцесорних виробника і Intel, і AMD робили процесори під цю розняття, ми звикли до того що AMD пропонувала менш продуктивні, але й дешеві рішення. Проте, рік тому становище докорінно змінилося. Анонсувавши Athlon, який архітектурно перевершує Intel Pentium III, AMD вдалося що час захопити лідерство в продуктивності процесорів. І хоча Intel згодом вдалося вдосконалити ядро своїх процесорів, у якому було додано вмонтований кеші другого рівня, AMD міцно влаштувалася на ринку швидкісних CPU, що й по сьогодні продовжує зміцнювати свої позиции.
Нині AMD застосовує проти Intel два кошти. Перше — агресивна цінову політику, у яких процесори Athlon виявилися набагато дешевше своїх суперників, Intel Pentium III, працюючих на аналогічної частоті. І ще одне — завдяки їхній архітектурі AMD вдається підвищувати частоту своїх процесорів кілька легше, ніж Intel. У результаті, нинішній момент, наприклад, AMD вже серійно продає свої гигагерцовые CPU. Проте, є в AMD і проблеми. Найбільший головний біль з Athlon — це кеші другого рівня, виконаний у вигляді мікросхем SRAM, які донедавна часу розташовувалися на процессорной заробітній платі і проводилися сторонніми виробниками. Молодші моделі Athlon мали L2-кеш, працюючий на половинної частоті ядра процесора, проте за мері зростання частот виробники SRAM не встигали за AMD і могли забезпечити поставки мікросхем кеша, працівників ½ частоти процесора. Через війну, починаючи з частоти 750 МГц Athlon став постачатися кеш-памятью, яка працює 2/5 частоти процесора, а починаючи з частоти 900 МГц — взагалі яка працює 1/3 частоти. Отже, вийшла парадоксальна ситуація, коли самий швидкий L2-кеш опинився в 700-мегагерцового Athlon. AMD ж, природно, що ситуація влаштувати не могла, оскільки повільна кеш-память другого рівня початку стримувати зростання продуктивності процессоров.
Тому, рішення нарешті перемістити L2-кеш AMD Athlon із зовнішнього процессорной плати всередину ядра виглядає цілком логічно. Тим паче, що обидві заводу AMD й у Остині й у Дрездені успішно освоїли технологію 0.18 мкм, що дозволило під час переходу зі старою 0.25 мкм технології зменшити площа ядра Athlon на 82 кв.мм.
Через війну, лінійка AMD Athlon отримала продовження від імені процесорів на ядрі Thunderbird, мають кеші першого рівня розміром 128Кбайт і 256-килобайтный інтегрований в ядро кеші другого рівня, працюючий на повної частоті CPU. Це сімейство нових AMD Athlon із частотою 750 МГц і від було анонсовано понад два тижні назад.
Проте, цим AMD не обмежилася. Ще минулого року при поданні Athlon компанія намір різноманітних модифікацій свого CPU, розрахованих різні сектора ринку. І тепер, нарешті, тепер вона до початку здійснювати свої плани, представивши і сімейство процесорів AMD Duron орієнтоване на low-end і що є прямим конкурентом Intel Celeron.
[pic][pic].
Отже, подивимося, що саме представляють з себе процесори Duron з місця зору, їх основних характеристик:
. Чіп, вироблений за технологією 0.18 мкм з допомогою мідних соединений.
. Ядро Spitfire, заснований на архітектурі Athlon. Містить 25 млн. транзисторів і має площа 100 кв.мм.
. Працює у спеціальних материнських платах з 462-контактным процессорным розніманням Socket A.
. Використовує високопродуктивну 100 МГц DDR системну шину EV6.
. Кеш першого рівня 128 Кбайт — по 64 Кбайта на код і данные.
. Інтегрований кеші другого рівня 64 Кбайта. Працює на повної частоті ядра.
. Напруга харчування — 1.5 В.
. Набір SIMD-инструкций 3DNow!
. Випускаються версії з частотами 600, 650, 700 МГц.
Отже, з погляду архітектури, Duron нічим не відрізняється від звичайного Athlon, крім убудованого в ядро 64-Кбайтного кеша другого рівня. Якщо ж порівняти Duron з новими Athlon на ядрі Thunderbird, то відмінності з-поміж них укладатимуться у вигляді інтегрованого L2 кеша (у Thunderbird він 256 Кбайт проти 64 Кбайт у Duron) й у частотах (Thunderbird випускаються з частотами починаючи з 750МГц, а Duron — з частотами до 700 МГц). У іншому, архітектурно і давні й нові Athlon і Duron нічим не відрізняються. У цьому, потрібна пам’ятати, що таки нові процесори Duron і Thunderbird мають оновлене і технологічно вдосконалене ядро, яке випускається за технологією 0.18 мкм. Через війну, наприклад, навіть виходить, що ядро Duron з вбудованим L2-кешем площею навіть менше, ніж ядро K75 (0.18 мкм Athlon).
І окремо хочеться торкнутися нового форм-фактора і процесорного розняття, що тепер використовує AMD на свої CPU. Оскільки мікросхем SRAM, що використовуються зовнішнього L2-кеша у нових процесорів Duron і Thunderbird нині немає, AMD за Intel знову звернула увагу до процесорний розняття типу socket. Не лише трохи більше вигідно з економічних міркувань (не потрібно в процессорной платі, картридже тощо.), але й раціонально з погляду організації кращого охолодження. Як такого розняття AMD вирішила використовувати 462- контактний Socket A, що за своїми розмірам, та й по зовнішнім виглядом схожий як у Socket 7, і на Socket 370. Тому, з Socket A процесорами AMD можна використовувати старі Socket 7 і Socket 370 кулеры. Єдине, не слід у своїй забувати, що тепловиділення Duron кілька перевершує кількість тепла, отдаваемое Celeron, тому вони потребують кілька кращому охолодженні. Наприклад, Duron 650 виділяє тепла приблизно стільки ж, скільки і Intel Pentium III 733.
У AMD Duron з системної шиною усе гаразд. Оскільки це процесор, як й з сімейства Athlon використовує 100-мегагерцовую DDR шину EV6, пропускну здатність цієї ланки виявляється 1,6 Гбайт/с. Кеш першого рівня Duron з часів випуску перших Athlon не зазнав ніяких змін — її розмір становить 128 Кбайт. Кеш першого рівня Duron ділиться на частини — для кеширования даних, і для кеширования инструкций.
Що ж до кеша другого рівня, з дохідними статтями очікується невеличкий сюрприз. Цілком ймовірно, що з Duron він у двічі менш як L1 кеші. Зачам він тоді? Відповідь це питання у алгоритмі роботи L2 кеша Duron й до речі, Thunderbird. Кеш другого рівня цих процесорів є ексклюзивним, що означає, що ці, які у L1 кеше у ньому не дублюються. Такий метод роботи L2 кеша реалізований поки що тільки у нових процесорах AMD, все-таки интеловские процесори мають звичайний inclusive L2 кеші, дані з L1 кеша у якому дублюються. Тому загальний обсяг ефективної кеш-памяти у AMD Duron становить 128+64=192 Кбайта, тоді як в Celeron він лише 128 Кбайт (32 Кбайта L2 кеша зайнято копією даних, наявних у L1 кеше).
Щоб проілюструвати усе сказане вище наведу графіки, що дають швидкість запис у пам’ять блоків даних різного розміру для процесорів AMD Duron 650:
[pic].
Процесор AMD Duron вдався. Це можна сказати напевно. Його продуктивність перебуває в досить рівні, щоб обігнати конкуруючий Intel Celeron, а й не залишити йому ніяких шансів в штатному режимі. Продуктивність AMD Duron 650 всього на кілька відсотків менше швидкості AMD Athlon 650 і становлять приблизно відповідає продуктивності Intel Pentium III 600EB. Отже, вихід Duron, якщо Intel не вдасться до жодних дій підвищення продуктивності свого low-end процесора, означає смерть Celeron.
AMD Athlon.
Якщо підійти до архітектури AMD Athlon поверхово, то основні його параметри можна окреслити наступним образом:
. Чіп, вироблений за технологією 0.25 мкм.
. Ядро нової генерації під кодовою ім'ям Argon, що містить 22 млн. транзисторов.
. Працює у спеціальних материнських платах з процессорным розніманням Slot.
A.
. Використовує високопродуктивну системну шину Alpha EV6, ліцензований у DEC.
. Кеш першого рівня 128 Кбайт — по 64 Кбайта на код і данные.
. Кеш другого рівня 512 Кбайт. Розташоване поза процесорного ядра, але у процессорном картридже. Працює на половинної частоті ядра.
. Напруга харчування — 1.6 В.
. Набір SIMD-инструкций 3DNow!, розширений додатковими командами.
Усього 45 команд.
. Випускаються версії з частотами 500, 550, 600 і 650 МГц. Версія із частотою 700 МГц з’явиться до найближчого время.
Проте такою простою процесор AMD Athlon здається, лише тільки погляд. Насправді ж за цими кількома рядками ховаються численні архітектурні інновації, які ми розглянемо пізніше. Але й прості характеристики AMD Athlon вражають. Наприклад, як неважко помітити, Athlon перевершує Intel як по максимальної тактовою частоті (у Intel Pentium III вона 600 МГц, та й при цьому у своїй він дбає про підвищеному до 2.05 В напрузі ядра), а й у розміру кеша першого рівня, який в Intel Pentium III всього 32 Кбайта.
[pic].
[pic].
Перейдемо до докладнішої розгляду архітектури AMD Athlon.
Системная шина.
Перш ніж заглиблюватись у сам процесор, подивимося, що ж відрізняється системна шина EV6, застосована AMD, від звичної интеловской GTL+. Зовнішнє подібність буває оманливе. Хоча процесорний розняття Slot A на системних платах для процесора AMD Athlon виглядає як і Slot 1, перевернений на 180 градусів, шинні протоколи та призначення контактів у Intel Pentium III і AMD Athlon зовсім різні. Понад те, різна навіть число задіяних сигналів — Athlon використовує приблизно половині з 242 контактів, тоді як Pentium III всього чверть. Зовнішня схожість викликана тим, що AMD просто хотіла полегшити життя виробникам системних плат, якою доведеться купувати особливі рознімання для установки на Slot A системні плати. Тільки й всего.
Насправді ж, хоч EV6 й працює на частоті 100 МГц, передача даних із ній, на відміну GTL+ ведеться обох фронтах сигналу, тому фактична частота передачі становить 200 МГц. Коли ще врахувати факт, що ширина шини EV6 — 72 біта, 8 у тому числі використовується під ECC (контрольну суму), то отримуємо швидкість передачі 64бита x 200 МГц = 1,6 Гбайт/с. Нагадаю, що пропускну здатність GTL+, яка працює 100 МГц вдвічі менше — 800 Мбайт/с. Підвищення частоти GTL+ до 133 МГц дає збільшення пропускну здатність у своїй лише до 1,06 Гбайт/с. Здавалося б, як у з GTL+, і з EV6 виходять значні значення пропускну здатність. Проте, лише сучасна PC100 пам’ять може отожрать від нього до 800 Мбайт/с, а AGP, працював у режимі 2x — до 528 Мбайт/с. А про PCI та всякою іншою дріб'язку. Виходить, що GTL+ вже може не справлятися з переданими обсягами даних. У EV6 ж нинішнього цьому випадку всі гаразд, тож ця шина більш перспективна.
У цьому, як частота GTL+ може бути збільшена зі 100 до 133 МГц, планується, як і частота EV6 також згодом досягне значення 133 (266), та був і 200 (400) МГц. Проте плани ці можуть здійснитися — реалізувати роботу в материнської платі EV6, що вимагає великої кількості контактних доріжок, трохи складніше, особливо у великих частотах. Хоча якщо в AMD все вийде, пропускну здатність системної шини може досягти 2.1 і 3.2 Гбайта/с відповідно, що дозволить безперешкодно запровадити у Athlon-системах, наприклад, високопродуктивну 266- мегагерцовую DDR SDRAM.
Кеш.
Перш ніж переходити безпосередньо до функціонування AMD Athlon, хочеться торкнутися тему L1 і L2 кешей.
Що ж до кеша L1 в AMD Athlon, його розмір 128 Кбайт перевершує розмір L1 кеша в Intel Pentium III у самій 4 разу, як підкріплюючи високу продуктивність Athlon, а й забезпечуючи його роботу на високих частотах. Зокрема, одне з проблем використовуваної Intel архітектури Katmai, яка, схоже, не дозволяє нарощувати швидкодія простим збільшенням тактовою частоти, саме в малому обсязі L1 кеша, який починає захлинатися при частотах, майбутніх до гигагерцу. AMD Athlon позбавлений цього недостатка.
Що ж до кеша L2, те й тут AMD виявилося в розквіті. По-перше, інтегрований в ядро tag для L2-кеша підтримує розміри від 512 Кбайт до 16 Мбайт. Pentium III, як відомо, має зовнішню Tag-RAM, подерживающую лише 512-килобайтный кеші другого рівня. До того ж, Athlon може використовувати різні делители для швидкості L2-кеша: 1:1, 1:2, 2:3 і 1:3. Таке розмаїтість делителей дозволяє AMD не залежати від постачальників SRAM певної швидкості, особливо в випуску більш ніж швидких моделей.
Завдяки можливості варіювати розміри і швидкості кеша другого рівня AMD збирається випускати чотири сімейства процесорів Athlon, орієнтованих різні рынки.
[pic].
Архитектура. Загальні положения.
От і підійшли до розповіді у тому, чого ж, власне, працює Athlon. Як багато і процесори від Intel з ядром, успадкованим від Pentium Pro, процесори Athlon мають внутрішню RISC-архитектуру. Це означає, що це CISC-команды, оброблювані процесором, спочатку розкладаються на прості RISC-операции, і потім лише починають оброблятися в обчислювальних пристроях CPU. Здається, навіщо ускладнювати собі життя? Виявляється, є навіщо. Порівняно прості RISC-инструкции можуть виконуватися процесором за кількома штук це й набагато полегшують пророцтво переходів, цим дозволяючи нарощувати продуктивність з допомогою більшого паралелізму. Говорячи простіше, той виробник, який зробить більш «паралельний «процесор, має шанс домогтися перевазі продуктивності набагато меншими зусиллями. AMD під час проектування Athlon, очевидно, керувалася і вже цим принципом.
Проте тим, як розпочати роботу над паралельними потоками інструкцій, процесор мушу їх звідкись отримати. І тому в AMD Athlon, як утім і в Intel Pentium III, застосовується дешифратор команд (декодер), який перетворює що надходить на вхід процесора код. Дешифратор в AMD Athlon може розкладати на RISC-составляющие близько трьох вхідних CISC-команд одночасно. Сучасні интеловские процесори можуть також обробляти близько трьох команд, та якщо для Athlon цілком байдуже, які команди він розщеплює, Pentium III хоче, щоб дві із трьох інструкцій були простими й лише одне — складної. Це спричиняє з того що якщо Athlon за кожен процесорний такт може перетравити три інструкції ні від чого, те в Pentium III частини дешифратора можуть простоювати через неоптимизированного кода.
Перш ніж, як потрапити до відповідний обчислювальний блок, що надходить потік RISC-команд затримується у невеликому буфері (Instruction Control Unit), який, що вони не дивно, у AMD Athlon расчитан на 72 інструкції проти 20 у Pentium III. Збільшуючи цей буфер, AMD спробувала домогтися, щоб дешифратор команд не простоював через переповнення Instruction Control Unit.
Ще одне застереження, вартий уваги — вчетверо велика, ніж в Pentium III, таблиця передбачення переходів розміром 2048 осередків, у якій зберігаються попередні результати виконання логічних операцій. На підставі цих даних процесор прогнозує їх результати за її повторному виконанні. Завдяки цій техніці AMD Athlon правильно пророкує результати розгалужень разів у 95% випадків, що дуже непогано, якщо врахувати, що аналогічна характеристика у Intel Pentium III всього 90%.
Подивимося тепер, що відбувається в Athlon, коли безпосередньо до вычислений.
Целочисленные операции.
З целочисленными операціями у процесорів від AMD завжди усе було в порядку. Після AMD K6 процесори від Intel програвали саме у швидкості цілочислових обчислень. Проте, в Athlon AMD геть-чисто відмовилася від старого наследия.
Наявність трьох конвеєрних блоків виконання цілочислових команд (Integer Execution Unit) AMD Athlon може виконувати три целочисленные інструкції одночасно. Що ж до Pentium III, його можливості обмежуються одночасним виконанням лише двох команд.
Окремо хочеться порушити питання конвеєрів. Оптимальною глибиною конвеєра для процесорів з сучасними швидкостями вважається 9 стадій. Збільшення цього числа веде до прискорення процесу обробки команд, так як швидкість роботи конвеєра визначається роботою самої повільної його стадії. Проте, у разі надто великої конвеєра при помилках в пророкуванні переходів виявляється що більшість роботи з виконання команд, вже ввійшли на конвеєр виконано даремно. Його доводиться очищати та починати процес заново.
Тож у AMD Athlon глибина цілочислових конвеєрів становить 10 стадій, що близько до оптимуму. На жаль, шанувальники продукції Intel знову почують нічого втішного, оскільки конвеєр в Pentium III складається з 12−17 стадій залежно від типу виконуваної инструкции.
Вещественные операции.
З завмиранням серця звертаємо думку на блок FPU, вмонтований в Athlon. Як усе гаразд пам’ятаємо, для попередніх процесорів AMD операції з плаваючою точкою були справжньої ахіллесовою п’ятої. Головною проблемою було те, що блок FPU в K6, K6−2 і K6-III був неконвейеризированый. Це призводила до того, хоча операцій із плаваючою точкою в FPU від AMD виконувалися за менше тактів, ніж интеловских процесорах, загальна продуктивність була катастрофічно низькою, оскільки наступна речовинна операція почати виконуватися до завершення попередньої. А щось змінювати у своїй FPU AMD тоді не хотіла, закликаючи розробників до відмові його у користь 3DNow!
Але, схоже, минулий досвід навчив AMD. У Athlon арифметичний співпроцесор має конвеєр глибиною 15 стадій проти 25 у Pentium III. Не слід забувати, що, як зазначалося вище, довший конвеєр не завжди забезпечує кращу продуктивність. До того ж, істотним недоліком Intel Pentium III, що його Athlon, природно немає, є неконвейерезируемость операцій FMUL і FDIV.
FPU в Athlon об'єднує у собі три блоку: один до виконання простих операцій типу складання, другий — для складних операцій типу множення і третій — для операцій із даними. Завдяки такому поділу роботи Athlon може виконувати одночасно по дві вещественночисленные инструкциии. А адже такого бути не вміє навіть Intel Pentium III — він виконує інструкції лише последовательно!
Отож, хоч і дивно, FPU интеловских процесорів опинився дуже й чудовим, як це заведено було ранее.
MMX.
На погляд з виконанням MMX-операций у Athlon проти K6- III змін цього не сталося. Але це ні так. Але й MMX-инструкции використовують у вкрай невеличкому числі додатків, AMD додала в доти цей набір ще кілька інструкцій, які теж з’явилися торік у MMX-блоке процесора Pentium III. До числа ввійшли перебування середнього, максимуму і і витончені пересилки данных.
Якщо звернути увагу до архітектурні особливості, то AMD Athlon є дві блоку MMX, тому обох процесорах — і Athlon, і Pentium III — може виконуватися одночасно пара MMX-инструкций. Проте, MMX-блоки в AMD Athlon мають велику, ніж в Pentium III латентність, що теоретично має спричинить відставання цього CPU в MMX-приложениях.
3DNow!
Блоку 3DNow! в AMD Athlon торкнулися серйозних змін. Хоча його архітектура і залишилося незмінною — два конвеєра обробляють інструкції, хто з 64-битными регістрами, де лежать пари речовинних чисел одинарної точності, в сам набір команд було додано 24 новинки. Нові операції повинні як дозволити збільшити швидкість обробки даних, але й дозволити задіяти технологію 3DNow! в областях, як розпізнавання звуку і відео, і навіть інтернет :) Крім цього, за аналогією з SSE було додано та інструкції до роботи з цими, які у кеше. Підтримка оновленого набору 3DNow! вже її вмонтовано в Windows 98 SE й у DirectX 6.2.
Отже, в набір 3DNow! входить тепер 45 команд, проти 71 інструкції в SSE від Intel. Причому, судячи з усього, використання нових команд має надати ще більший ефект від участі 3DNow! Як доказ цього факту AMD поширила додатковий DLL для відомого тесту 3DMark 99 MAX, задействующий нові можливості процессора.
Спеціально для іноземних оцінки ефективності процесора в 3D-играх, 3DMark 99 MAX пропонує індекс CPU 3DМark, просчитывающий 3D-сцены, але з выводящий їх екран. Отже, виходить результат, залежить тільки від можливостей процесора з обробки 3D-графики і зажадав від пропускну здатність основний памяти.
Чипсеты.
Припинивши розробляти процесори під гніздо Super 7 і почавши просувати власний Slot A і системну шину EV6, AMD виявилася відрізана від усіх интеловских напрацювань у ролі чіпсетів і системних плат. Тепер AMD доведеться самої створювати необхідну інфраструктуру, аби ми могли придбати як процесор, а й системну плату, обладнану Slot A.
І, судячи з першим успіхам, їй це зробити. На спочатку компанія розробила власний набір логіки AMD 750, має кодове ім'я Irongate, і навіть власний дизайн системної плати — Fester, який був тиражовано поруч тайванських производителей.
Сам чипсет AMD 750 технічно нескладне собою нічого особливого — по можливостям він аналогічний i440BX. Але більшого, у принципі, не треба. AMD Athlon, як ми бачили, й дуже працює нормально і навіть обганяє по продуктивності конкуруючі продукты.
AMD 750 має традиционую архітектуру і складається з північного мосту AMD 751 і південного AMD 756. Північний міст забезпечує взаємодія у вигляді шини EV6 процесора з пам’яттю і шинами PCI і AGP, підтримуючи до 768 Мбайт оперативної пам’яті PC100 не більш як трьох модулях, AGP 2x і шість PCI bus maser пристроїв. Південний міст, здійснює інтерфейс з усією периферією, крім звичайних функцій, вміє працювати з UltraDMA/66 IDE-устройствами.
AMD Athlon (Thunderbird) 800.
Отже, зваживши усі плюси та «мінуси L2-кеша на ядрі, AMD, доходить висновку необхідність перенесення кеша на ядро. Тим паче, що обидві заводу AMD, перебувають у Дрездені і Остіні досить успішно освоїли технологію 0.18 мкм, через яку, до речі, кілька днів вже випускалися старші моделі звичайних AMD Athlon. Так з’явився новий старий AMD Athlon під кодовою ім'ям Thunderbird, архітектурно відрізняється від старого Athlon наявністю інтегрованої кеш-памяти другого рівня розміром 256 Кбайт замість зовнішнього 512-килобайтного L2-кеша. Подивимося з його спецификацию:
. Чіп, вироблений за технологією 0.18 мкм з допомогою алюмінієвих чи мідних соединений.
. Ядро Thunderbird, заснований на архітектурі Athlon. Містить 37 млн. транзисторів і має площа 120 кв.мм.
. Працює у спеціальних материнських платах з 462-контактным процессорным розніманням Socket A (Slot A версії доступні в обмежених кількостях лише OEM).
. Використовує високопродуктивну 100 МГц DDR системну шину EV6.
. Кеш першого рівня 128 Кбайт — по 64 Кбайта на код і данные.
. Інтегрований кеші другого рівня 256 Кбайт. Працює на повної частоті ядра.
. Напруга харчування за частоти до 850МГц — 1.7 В, на великих частотах.
— 1.75 В.
. Набір SIMD-инструкций 3DNow!
. Випускаються версії з частотами 750, 800, 850, 900, 950 і 1000 МГц.
Отже, з погляду архітектури, Thunderbird нічим не відрізняється від звичайного Athlon, крім вбудованого в ядро 256-Кбайтного кеша другого рівня. Попри скорочення розміру кеша вдвічі проти звичайним Athlon, швидкодія від надання цього впасти на повинен — бо новий кеші працює набагато швидше старого — на повної частоті ядра процесора. Та й при цьому завдяки ближчому його розташуванню до ядру латентність кеша у Thunderbird на 45% менше, ніж аналогічна характеристика у кеша старого Athlon. У іншому, архітектурно і давні й нові Athlon нічим не відрізняються, тому подробиці про будову ядра цих CPU можна знайти з огляду AMD Athlon 600. У цьому, потрібна пам’ятати, що це ж Thunderbird мають оновлене і технологічно вдосконалене ядро, яке випускається за технологією 0.18 мкм. Через війну, наприклад, навіть виходить, що ядро Thunderbird з умонтованим L2-кешем площею не набагато більше, ніж ядро K75 (0.18 мкм Athlon) і навіть значно менше, ніж старе ядро K7, виконане за технологією 0.25 мкм.
Другим і проінвестували щонайменше важливим відзнакою старих та нових Athlon і те, що позаяк потреба у процессорной платі відпала, вони використовують новий процесорний розняття типу socket, а чи не slot — Socket A. Хоча, звісно, кілька днів Slot A Thunderbird над ринком може бути будуть, основним форм-фактором тих CPU можна вважати 462-контактный Socket A.
AMD випускає Thunderbird двома заводах — в Остині й у Дрездені, по двом різним технологіям — з допомогою алюмінієвих сполук і мідних сполук. Проте, обидві ці модифікації, схоже, між собою ні перед чим немає, крім … кольору. Дрезденські Thunderbird мають синій колір кристала, тоді як Остинские — зеленый.
Що ж до видимих відмінностей старих та нових Athlon які вироблялися Slot A варіанті, з дохідними статтями знайти відмінність буде дуже просто, оскільки обидва мають однакову зовнішній вигляд картриджа І що більш забавно, однакову ціну. Проте відрізнити їх таки може бути як із маркування (старі Athlon маркуються як AMD-K7XXX, тоді як нові мають маркірування AMD-AXXXX) і зазирнувши всередину картриджа із боку процесорного розняття — у нових Athlon відсутні мікросхеми SRAM, розташовані на обидва боки ядра, в нас саме в старих Athlon вони есть.
До цього часу ми захоплювалися новими Thunderbird та його інтегрованим L2- кешем. Тепер прийшов час трохи засмутити фанатів AMD. Тим паче, що зробити це завжди буде неважко, якщо взяти кеші Thunderbird і Coppermine.
Єдиним перевагою L2-кеша Thunderbird з цим погляду може бути його ексклюзивність. Тобто, алгоритм роботи L2 кеша у Thunderbird такий, що ці, які у L1-кеше, в L2-кеше не дублюються. Це означає, що сумарний обсяг ефективної кеш-памяти нових Athlon дорівнює 128+256 = 384Кбайта. У разі з Coppermine 32Кбайта L2-кеша завжди зайнято копією вмісту кеш-памяти першого рівня життя та ефективний обсяг кешей від цього CPU не перевищує 256Кбайт.
Що ж до недоліків, то просто напросто кеші Thunderbird повільніше ніж кеші Coppermine. Спричинено це криються як і меншою латентності таких кеша Intel Pentium III і у тому, що інженери AMD полінувалися переробити шину з'єднуючу ядро і L2 кеші, коли перенесли останній всередину процесорного ядра. Через війну, так і залишилася 64- бітної, тоді як шина кеша Coppermine учетверо шире.
AMD Athlon XP 1800+ (1533 MHz).
От і дочекалися. Дочекалися процесора, який «Нам обіцяли досить тривалий час. Як-от — десктопного варіанта процесора AMD Athlon, побудованого на новому ядрі Palomino.
Насправді, саме ядро було присутнє над ринком уже давно, але політика компанії AMD з випуску процесорів його основі виглядала кілька оригінальної. Звичною стала схема, коли він на новому ядрі випускається спочатку высокоуровневый процесор, згодом виходить його по кілька урізаний тим чи іншим чином бюджетний варіант, а потім з’являється мобільний. Усі логічно й зрозуміло, спочатку знімається максимально можливу кількість вершків з high-end сегмента ринку, та був новинка просувається в массы.
У разі з Palomino все сталося дещо інакше, а то й сказати «з точністю до навпаки ». AMD початку, що називається, з кінця ланцюжка. Спочатку побачило світ мобільний варіант Palomino — Athlon 4, потім AMD Athlon MP, розрахований роботу у двухпроцессорных системах. Гаразд, поки що ситуація потішна, але з екстраординарна. І це потім AMD робить дуже оригінальний крок — всупереч усім очікуванням, ринку виходить не десктопный Palomino, а AMD Duron, заснований на ядрі Morgan. Тобто., low-end процесор! Причому виходить без особливої помпи, тихо й відкритості непомітно. Спочатку взагалі було незрозуміло, а Palomino це? Як виявилося — таки-так, Palomino, лише називається Morgan і кеш в нього поменьше.
І лише після цього сцені з’являється настільний Palomino, перейменований на той час в Athlon XP (реверанс убік Microsoft?), що замість звичної керамічної одягу пластикову (OPGA, Organic Pin Grid Array) і… реанимированный Pentium Rating.
Якщо упаковка нового процесора в пластиковий конструктив крок цілком логічний і обгрунтований (керамічний корпус набагато вища), то повернення PR, хоча й кілька зміненого — досить спірне решение.
Документ перший: QuantiSpeed™ Architecture.
Отже, яка з себе «нова архітектура «процесорів Athlon XP?
Nine-issue, superscalar, fully pipelined micro-architecture.
Основний упор описання свого ядра AMD робить те що, що його щаблів конвеєра в нього менше, ніж в Pentium 4 (як і зумовлює меншу частоту роботи ядра за однакової техпроцессе), зате кількість одночасно виконуваних (за такт) інструкцій — больше.
Superscalar, fully pipelined Floating Point Unit (FPU).
Ще одна плюс своїх процесорів, який AMD вирішила показати в описі QuantiSpeed Architecture — це їхнє знаменитий FPU. Він справді потужний — три незалежних конвеєра виспівати стандартних FPUінструкцій всього сімейства x86, плюс інструкції з фірмового набору AMD 3DNow!, плюс (починаючи з ядра Palomino) повна підтримка всього набору Intel SSE (на жаль, поки що тільки «першого «SSE). Фактично, нікого як відомо, що це справді найпотужніший x86 FPU — у Pentium 4 він слабше. Проте… знову «плюс на мінус «- усе це щоправда, але не всі це було навіть у ядрі K7 (крім підтримки SSE).
Hardware data prefetch.
У Athlon XP використовується механізм попередньої (випереджальної) завантаження інструкцій в L1 cache. Примітно таке: по-перше — саме інструкцій тобто. лише виконуваного коду, а чи не даних. По-друге — саме у кеш першого рівня тобто. — минаючи L2. У принципі так, враховуючи розмір L1 у Athlon XP (128 KB).
Exclusive and speculative Translation Look-aside Buffers (TLBs).
TLB мають майже всі «складні «сучасні процесори. Фактично, це іще одна підвид кешу, лише кэшируются у ньому не самі команди, і дані, які адреси. У Thunderbird дворівневий TLB мав ємність 24/32 (24 адреси інструкцій і 32 даних) і 256/256. Основне нововведення Palomino — розширений L1 TLB, що тепер може зберігати 40 адрес даних. До речі, зауважимо — якщо Hardware Prefetch оптимізує завантаження команд, то, при удосконаленні TLB AMD більшої уваги приділила саме даним. З іншого боку, «ексклюзивність «кешу (фірмова «фича «AMD, коли кеш другого рівня не в дублює у собі вміст кешу першого рівня) тепер поширюється і TLB. Загалом, нам важко судитиме наскільки великий внесок нового Translation Look-aside Buffer у загальну продуктивність Athlon XP т.к. немає можливості вичленувати що його внесок, але плюс ми всі ж поставимо — це щось справді новое.
Processor and Model Number Core Operating Frequency.
На яких частотах працює вся лінійка Athlon XP.
|AMD Athlon XP 1500+ |1.33 GHz | |AMD Athlon XP 1600+ |1.40 GHz | |AMD Athlon XP 1700+ |1.47 GHz | |AMD Athlon XP 1800+ |1.53 GHz |.
Інформаційні источники:
1. internet.
2. internet.