Чем phenom отличается от athlon. Процессоры. Энергопотребление и энергоэффективность

Насколько важен кэш L3 для процессоров AMD?

Действительно, имеет смысл оснащать многоядерные процессоры выделенной памятью, которая будет использоваться совместно всеми доступными ядрами. В данной роли быстрый кэш третьего уровня (L3) может существенно ускорить доступ к данным, которые запрашиваются чаще всего. Тогда ядрам, если существует такая возможность, не придётся обращаться к медленной основной памяти (ОЗУ, RAM).

По крайней мере, в теории. Недавно AMD анонсировала процессор Athlon II X4 , представляющий собой модель Phenom II X4 без кэша L3, намекая на то, что он не такой и необходимый. Мы решили напрямую сравнить два процессора (с кэшем L3 и без), чтобы проверить, как кэш влияет на производительность.


Как работает кэш?

Перед тем, как мы углубимся в тесты, важно понять некоторые основы. Принцип работы кэша довольно прост. Кэш буферизует данные как можно ближе к вычислительным ядрам процессора, чтобы снизить запросы CPU в более отдалённую и медленную память. У современных настольных платформ иерархия кэша включает целых три уровня, которые предваряют доступ к оперативной памяти. Причём кэши второго и, в частности, третьего уровней служат не только для буферизации данных. Их цель заключается в предотвращении перегрузки шины процессора, когда ядрам необходимо обменяться информацией.

Попадания и промахи

Эффективность архитектуры кэшей измеряется процентом попаданий. Запросы данных, которые могут быть удовлетворены кэшем, считаются попаданиями. Если данный кэш не содержит нужные данные, то запрос передаётся дальше по конвейеру памяти, и засчитывается промах. Конечно, промахи приводят к большему времени, которое требуется для получения информации. В результате в вычислительном конвейере появляются "пузырьки" (простои) и задержки. Попадания, напротив, позволяют поддержать максимальную производительность.

Запись в кэш, эксклюзивность, когерентность

Политики замещения диктуют, как в кэше освобождается место под новые записи. Поскольку данные, записываемые в кэш, рано или поздно должны появиться в основной памяти, системы могут делать это одновременно с записью в кэш (write-through) или могут маркировать данные области как "грязные" (write-back), а выполнять запись в память тогда, когда она будет вытесняться из кэша.

Данные в нескольких уровнях кэша могут храниться эксклюзивно, то есть без избыточности. Тогда вы не найдёте одинаковых строчек данных в двух разных иерархиях кэша. Либо кэши могут работать инклюзивно, то есть нижние уровни кэша гарантированно содержат данные, присутствующие в верхних уровнях кэша (ближе к процессорному ядру). У AMD Phenom используются эксклюзивный кэш L3, а Intel следует стратегии инклюзивного кэша. Протоколы когерентности следят за целостностью и актуальностью данных между разными ядрами, уровнями кэшей и даже процессорами.

Объём кэша

Больший по объёму кэш может содержать больше данных, но при этом наблюдается тенденция увеличения задержек. Кроме того, большой по объёму кэш потребляет немалое количество транзисторов процессора, поэтому важно находить баланс между "бюджетом" транзисторов, размером кристалла, энергопотреблением и производительностью/задержками.

Ассоциативность

Записи в оперативной памяти могут привязываться к кэшу напрямую (direct-mapped), то есть для копии данных из оперативной памяти существует только одна позиция в кэше, либо они могут быть ассоциативны в n-степени (n-way associative), то есть существует n возможных расположений в кэше, где могут храниться эти данные. Более высокая степень ассоциативности (вплоть до полностью ассоциативных кэшей) обеспечивает наилучшую гибкость кэширования, поскольку существующие данные в кэше не нужно переписывать. Другими словами, высокая n-степень ассоциативности гарантирует более высокий процент попаданий, но при этом увеличивается задержка, поскольку требуется больше времени на проверку всех этих ассоциаций для попадания. Как правило, наибольшая степень ассоциации разумна для последнего уровня кэширования, поскольку там доступна максимальная ёмкость, а поиск данных за пределами этого кэша приведёт к обращению процессора к медленной оперативной памяти.

Приведём несколько примеров: у Core i5 и i7 используется 32 кбайт кэша L1 с 8-way ассоциативностью для данных и 32 кбайт кэша L1 с 4-way для инструкций. Понятно желание Intel, чтобы инструкции были доступны быстрее, а у кэша L1 для данных был максимальный процент попаданий. Кэш L2 у процессоров Intel обладает 8-way ассоциативностью, а кэш L3 у Intel ещё "умнее", поскольку в нём реализована 16-way ассоциативность для максимизации попаданий.

Однако AMD следует другой стратегии с процессорами Phenom II X4, где используется кэш L1 с 2-way ассоциативностью для снижения задержек. Чтобы компенсировать возможные промахи ёмкость кэша была увеличена в два раза: 64 кбайт для данных и 64 кбайт для инструкций. Кэш L2 имеет 8-way ассоциативность, как и у дизайна Intel, но кэш L3 у AMD работает с 48-way ассоциативностью. Но решение выбора той или иной архитектуры кэша нельзя оценивать без рассмотрения всей архитектуры CPU. Вполне естественно, что практическое значение имеют результаты тестов, и нашей целью как раз была практическая проверка всей этой сложной многоуровневой структуры кэширования.

Каждый современный процессор имеет выделенный кэш, которых хранит инструкции и данные процессора, готовые к использованию практически мгновенно. Этот уровень обычно называют первым уровнем кэширования или L1, впервые такой кэш появился у процессоров 486DX. Недавно процессоры AMD стали стандартно использовать по 64 кбайт кэша L1 на ядро (для данных и инструкций), а процессоры Intel используют по 32 кбайт кэша L1 на ядро (тоже для данных и инструкций)


Кэш первого уровня впервые появился на процессорах 486DX, после чего он стал составной функцией всех современных CPU.

Кэш второго уровня (L2) появился на всех процессорах после выхода Pentium III, хотя первые его реализации на упаковке были в процессоре Pentium Pro (но не на кристалле). Современные процессоры оснащаются до 6 Мбайт кэш-памяти L2 на кристалле. Как правило, такой объём разделяется между двумя ядрами на процессоре Intel Core 2 Duo, например. Обычные же конфигурации L2 предусматривают 512 кбайт или 1 Мбайт кэша на ядро. Процессоры с меньшим объёмом кэша L2, как правило, относятся к нижнему ценовому уровню. Ниже представлена схема ранних реализаций кэша L2.


У Pentium Pro кэш L2 находился в упаковке процессора. У последовавших поколений Pentium III и Athlon кэш L2 был реализован через отдельные чипы SRAM, что было в то время очень распространено (1998, 1999).


Последовавшее объявление техпроцесса до 180 нм позволило производителям, наконец, интегрировать кэш L2 на кристалл процессора.



Первые двуядерные процессоры просто использовали существующие дизайны, когда в упаковку устанавливалось два кристалла. AMD представила двуядерный процессор на монолитном кристалле, добавила контроллер памяти и коммутатор, а Intel для своего первого двуядерного процессора просто собрала два одноядерных кристалла в одной упаковке.



Впервые кэш L2 стал использоваться совместно двумя вычислительными ядрами на процессорах Core 2 Duo. AMD пошла дальше и создала свой первый четырёхъядерный Phenom "с нуля", а Intel для своего первого четырёхъядерного процессора вновь использовала пару кристаллов, на этот раз уже два двуядерных кристалла Core 2, чтобы снизить расходы.

Кэш третьего уровня существовал ещё с первых дней процессора Alpha 21165 (96 кбайт, процессоры представлены в 1995) или IBM Power 4 (256 кбайт, 2001). Однако в архитектурах на основе x86 кэш L3 впервые появился вместе с моделями Intel Itanium 2, Pentium 4 Extreme (Gallatin, оба процессора в 2003 году) и Xeon MP (2006).

Первые реализации давали просто ещё один уровень в иерархии кэша, хотя современные архитектуры используют кэш L3 как большой и общий буфер для обмена данными между ядрами в многоядерных процессорах. Это подчёркивает и высокая n-степень ассоциативности. Лучше поискать данные чуть дольше в кэше, чем получить ситуацию, когда несколько ядер используют очень медленный доступ к основной оперативной памяти. AMD впервые представила кэш L3 на процессоре для настольных ПК вместе с уже упоминавшейся линейкой Phenom. 65-нм Phenom X4 содержал 2 Мбайт общего кэша L3, а современные 45-нм Phenom II X4 имеют уже 6 Мбайт общего кэша L3. У процессоров Intel Core i7 и i5 используется 8 Мбайт кэша L3.


Современные четырёхъядерные процессоры имеют выделенные кэши L1 и L2 для каждого ядра, а также большой кэш L3, являющийся общим для всех ядер. Общиё кэш L3 также позволяет обмениваться данными, над которыми ядра могут работать параллельно.

В нашем сравнении участвовали два разных процессора AMD, которые как раз и помогут сравнить преимущества от дополнительного кэша L3 у четырёхъядерного процессора.


Нажмите на картинку для увеличения.

С одной стороны у нас был новый AMD Athlon II X4 620 - четырёхъядерный процессор AMD начального уровня. Кстати Athlon II X4 620 стал первым четырёхъядерным процессором, который доступен по цене $100 (к сожалению, не в России), так что мы получаем за такую цену новый уровень производительности. Впрочем, не нужно забывать, что впечатляющая производительность 620 касается только серьёзных многопоточных приложений, да и то не всегда, поскольку Athlon II X4 лишён кэша L3 совсем. Для сравнения мы взяли процессор Phenom II X4 965.


Нажмите на картинку для увеличения.

Позиционирование двух продуктов совершенно разное. Phenom II является текущим лидером AMD в топовой линейке Black Edition, а "младший" Athlon II X4 нацелен на рынок начального уровня.

Впрочем, по архитектуре процессоры очень схожи. Ядра Athlon II X4, включая их кэш L1 и L2, идентичны ядрам Phenom. AMD даже не поменяла ассоциативность кэша. Единственным настоящим изменением является то, что AMD выключила кэш Athlon II X4 у процессоров, где с кэшем L3 возникали проблемы валидации. (Это верно только для ранних Athlon II X4. В будущем всё больше процессоров будут базироваться на совершенно другом и более экономически выгодном кристалле.)

Мы смогли сделать сравнение 1:1 путём снижения тактовой частоты Phenom II X4 с 3,4 ГГц до всего 2,6 ГГц - это как раз штатная тактовая частота Athlon II X4 620.

Тестовая конфигурация

Аппаратное обеспечение для тестов производительности
Материнская плата (Socket AM3) Gigabyte MA790FXT-UD5P (Rev. 1.0), чипсет: AMD 790GX, SB750, BIOS: 5c (04/01/2009)
Память DDR3 (два канала) 2 x 2 Гбайт DDR3-1600 (Corsair CM3X2G1600C9DHX)
2 x 1 Гбайт DDR3-1600 (Crucial BL12864BA1608.8SFB) в режиме DDR3-1066
Общее аппаратное обеспечение
CPU AMD I AMD Phenom II X4 965 (45 нм, 3,4 ГГц, 4 x 512 кбайт кэш L2 и 6 Мбайт кэш L3, TDP 140 Вт, Rev. C2)
CPU AMD II AMD Athlon II X4 620 (45 нм, 2,6 ГГц, 4 x 512 кбайт кэш L2, TDP 95 Вт, Rev. C2)
Видеокарта Zotac GeForce GTX 260², GPU: GeForce GTX 260 (576 МГц), видеопамять: 896 Мбайт DDR3 (1998 МГц), потоковые процессоры: 216, частота шейдеров: 1242 МГц
Жёсткий диск Western Digital VelociRaptor, 300 Гбайт (WD3000HLFS), 10 000 об/мин, SATA/300, кэш 16 Мбайт
Привод Blu-Ray LG GGW-H20L, SATA/150
Блок питания PC Power & Cooling, Silencer 750EPS12V 750 ВТ
Системное ПО и драйверы
Операционная система Windows Vista Enterprise Version 6.0 x64, Service Pack 2 (Build 6000)
Драйверы чипсета AMD Catalyst Control Center 9.4

Тесты и настройки

Far Cry 2 Version: 1.0.1
Far Cry 2 Benchmark Tool
Video Mode: 1280x800
Direct3D 9
Overall Quality: Medium
Bloom activated
HDR off
Demo: Ranch Small
GTA IV Version: 1.0.3
Video Mode: 1280x1024
- 1280x1024
- Aspect Ratio: Auto
- All options: Medium
- View Distance: 30
- Detail Distance: 100
- Vehicle Density: 100
- Shadow Density: 16
- Definition: On
- Vsync: Off
In-game Benchmark
Left 4 Dead Version: 1.0.0.5
Video Mode: 1280x800
Game Settings
- Anti Aliasing none
- Filtering Trilinear
- Wait for vertical sync disabled
- Shader Detail Medium
- Effect Detail Medium
- Model/Texture Detail Medium
Demo: THG Demo 1
Кодирование аудио и видео
iTunes Version: 8.1.0.52
Audio CD ("Terminator II" SE), 53 min.
Convert to AAC audio format
Lame MP3 Version 3.98
Audio CD "Terminator II SE", 53 min
convert WAV to MP3 audio format
Command: -b 160 --nores (160 Kbps)
TMPEG 4.6 Version: 4.6.3.268
Video: Terminator 2 SE DVD (720x576, 16:9) 5 Minutes
Audio: Dolby Digital, 48000 Hz, 6-Kanal, English
Advanced Acoustic Engine MP3 Encoder (160 Kbps, 44.1 kHz)
DivX 6.8.5 Version: 6.8.5
== Main Menu ==
default
== Codec Menu ==
Encoding mode: Insane Quality
Enhanced multithreading
Enabled using SSE4
Quarter-pixel search
== Video Menu ==
Quantization: MPEG-2
XviD 1.2.1 Version: 1.2.1
Other Options / Encoder Menu -
Display encoding status = off
Mainconcept Reference 1.6.1 Version: 1.6.1
MPEG2 to MPEG2 (H.264)
MainConcept H.264/AVC Codec
28 sec HDTV 1920x1080 (MPEG2)
Audio:
MPEG2 (44.1 kHz, 2 Channel, 16 Bit, 224 kbps)
Codec: H.264
Mode: PAL (25 FPS)
Profile: Settings for eight threads
Adobe Premiere pro CS4 Version: 4.0
WMV 1920x1080 (39 sec)
Export: Adobe Media Encoder
== Video ==
H.264 Blu-ray
1440x1080i 25 High Quality
Encoding Passes: one
Bitrate Mode: VBR
Frame: 1440x1080
Frame Rate: 25
== Audio ==
PCM Audio, 48 kHz, Stereo
Encoding Passes: one
Grisoft AVG Anti Virus 8 Version: 8.5.287
Virus base: 270.12.16/2094
Benchmark
Scan: some compressed ZIP and RAR archives
Winrar 3.9 Version 3.90 x64 BETA 1
Compression = Best
Benchmark: THG-Workload
Winzip 12 Version 12.0 (8252)
WinZIP Commandline Version 3
Compression = Best
Dictionary = 4096 KB
Benchmark: THG-Workload
Autodesk 3D Studio Max 2009 Version: 9 x64
Rendering Dragon Image
Resolution: 1920 x 1280 (frame 1-5)
Adobe Photoshop CS4 (64-Bit) Version: 11
Filtering a 16MB TIF (15000x7266)
Filters:
Radial Blur (Amount: 10; Method: zoom; Quality: good)
Shape Blur (Radius: 46 px; custom shape: Trademark symbol)
Median (Radius: 1px)
Polar Coordinates (Rectangular to Polar)
Adobe Acrobat 9 professional Version: 9.0.0 (Extended)
== Printing Preferenced Menu ==
Default Settings: Standard
== Adobe PDF Security - Edit Menu ==
Encrypt all documents (128 bit RC4)
Open Password: 123
Permissions Password: 321
Microsoft PowerPoint 2007 Version: 2007 SP2
PPT to PDF
Powerpoint Document (115 Pages)
Adobe PDF-Printer
Deep Fritz 11 Version: 11
Fritz Chess Benchmark Version 4.2
Синтетические тесты
Version: 1.02
Options: Performance
Graphics Test 1
Graphics Test 2
CPU Test 1
CPU Test 2
PCMark Vantage Version: 1.00
PCMark Benchmark
Memories Benchmark
SiSoftware Sandra 2009 Version: 2009 SP3
Processor Arithmetic, Cryptography, Memory Bandwith
Benchmark Results: Sandra 2009, PCMark Vantage

Замечания по эффективности

Обычно мы измеряем энергопотребление в режиме бездействия и под максимальной нагрузкой, после чего оцениваем эффективность системы, отслеживая энергию, которая требуется на выполнение определённой нагрузки (как правило, прогона PCMark Vantage). Это позволяет нам рассчитать эффективность как соотношение производительности на ватт. Однако в данном случае нам пришлось пойти на несколько шагов, которые не характерны для реальных условий. Мы снизили тактовую частоту Phenom, и нам пришлось отключить Cool’n’Quiet, чтобы Phenom II X4 965 смог работать на частоте 2,6 ГГц вместо штатной частоты 3,4 ГГц. Поскольку самый медленный Phenom II X4 начинается с частоты 3,0 ГГц, вряд ли кто-то будет работать с процессором на низких тактовых частотах. Кроме того, мы снизили частоту памяти Phenom II до DDR3-1066, чтобы соответствовать спецификациям AMD для Athlon II X4.

Затем мы получили заметное преимущество по энергопотреблению для процессора без кэша L3. Сам по себе кэш занимает около трети всех транзисторов процессора. Это становится очевидным и по данным энергопотребления. AMD заявляет для Phenom II тепловой пакет от 95 до 140 Вт, в то время как Athlon II X4 работает на 95 Вт. Пиковое энергопотребление нашей тестовой системы с процессором Phenom II X4 965 на 3,4 ГГц достигало 226 Вт, в то время как у 2,6-ГГц Athlon II X4 оно составило, максимум, 170 Вт.

В режиме бездействия мы наблюдаем очень близкие результаты. Мы получили 84 Вт для Athlon II X4 620 и 85 Вт для той же системы с процессором Phenom II X4 965. В данных случаях технология Cool’n’Quiet была активной, поэтому оба процессора снижали свою частоту до 800 МГц, а также понижали напряжение. Поскольку большая часть блоков процессоров не работает и выключается, то энергопотребление в режиме бездействия у двух наших процессоров очень близко.

Результаты тестов




Мы наблюдаем 5% преимущество в тесте 3DMark Vantage CPU, но по общему результату и по тесту GPU мы не видим выигрыша вообще. Давайте посмотрим, какова будет производительность в играх.


Частота кадров увеличилась на 8% в Far Cry со средними настройками детализации, когда мы заменили четырёхъядерный процессор Athlon II X4 начального уровня на Phenom II X4 с такой же тактовой частотой.

Преимущество в GTA IV 5,7% - тоже не очень много. Кэш L3 влияет на производительность довольно слабо.

В Left 4 Dead результаты совершенно иные, процессор с 6 Мбайт кэша L3 даёт почти на 20% большую частоту кадров.



Создание PDF с помощью Adobe Acrobat 9 из документа Microsoft PowerPoint не слишком выигрывает от кэша L3.


Архиватор WinRAR очень чувствителен к производительности памяти, поэтому ему требуется на 16% меньше времени для выполнения работы.

А вот WinZip не так критично отнёсся к отсутствию кэша L3. Работа с кэшем L3 выполнилась на 9,2% быстрее.


Скорость выполнения фильтров в Photoshop CS4 от наличия кэша L3 у Phenom II выигрывает мало. Разница в три секунды мизерная.


iTunes нужна более высокая тактовая частота для увеличения производительности перекодирования аудио. Поэтому мизерная разница между процессорами с кэшем L3 и без него не стала для нас сюрпризом.

Здесь результаты вообще одинаковые, что неудивительно.

DivX перекодирует фильм из формата MPEG-2 на Phenom II X4 лишь чуточку быстрее.

Кодирование Xvid выигрывает чуть больше, хотя данная операция выполняется существенно дольше, чем преобразование ролика MPEG-2 в формат DivX.

MainConcept получает производительность от числа ядер и их тактовой частоты. Мы не наблюдаем заметного преимущества от наличия кэша L3.

Мы решили создать индекс производительности, который учитывал бы результаты всех тестов. Поскольку приложения, интенсивно использующие CPU, требуют больше всего производительности, мы оценили их вес как 50%, игры мы учли как 25%, результаты PCMark Vantage и 3DMark Vantage получили вес по 12,5% каждый. В итоге мы получили 5,8% преимущество по производительности Phenom II X4 по сравнению с Athlon II X4 или 5,5% падение производительности, если вы возьмёте за основу Phenom II X4. Конечно, у вас могут быть другие приоритеты использования ПК, поэтому важно упомянуть минимальную и максимальную разницу. В некоторых тестах мы получили преимущество от наличия кэша L3 в 20%, а в некоторых тестах процессоры дают абсолютно идентичную производительность, несмотря на наличие/отсутствие кэша L3. В общем, как нам кажется, лучше ориентироваться на разницу в производительности от 5% до 6%, которую мы рассчитали по результатам всех тестов.

Заключение

Сравнение цен и производительности явно говорит о том, что "бюджетным" пользователям вообще не стоит смотреть в сторону Phenom II X4. Процессор Phenom II X4 945 (3,0 ГГц) продаётся по цене от $170 (), а новый процессор Athlon II X4 за $100 () даёт очень близкую производительность при прочих равных. Модели AM2+ процессоров Phenom II X4 могут продаваться дешевле, но они не дают поддержки памяти DDR3.

В целом, основная разница по производительности между Athlon II X4 и Phenom II X4 связана с тактовой частотой. Простое увеличение тактовой частоты Athlon II X4 на 200 МГц позволит ему сравняться по производительности с Phenom II X4, несмотря на наличие 6 Мбайт кэша L3 у последнего. Зная это, вы наверняка поймёте, почему на рынке не будет процессоров Athlon II, которые по частоте будут равняться (или даже превышать) модели Phenom II.

Конечно, нужно учитывать разные сегменты рынка, которые мы в нашей статье довольно сильно размыли. Phenom II - процессор для верхнего сегмента массового рынка, который продаётся по цене от $150 до $250, а Athlon II X4 нацеливается на "бюджетную" аудиторию, готовую выложить за CPU не больше $100. В любом случае, вполне очевидно, что Athlon II X4 обеспечивает прекрасное соотношение производительность/цена, особенно для тех пользователей, кто планирует разогнать процессор.

Наконец, следует отметить, что кэш-память L3 необходима для достижения высоких уровней производительности. На частоте CPU 2,6 ГГц это может быть и не так очевидно, но на 3 ГГц и выше мы наблюдаем, что производительность Phenom II масштабируется намного лучше, чем у Athlon II X4.

После прорыва начала «нулевых» AMD благополучно вернулась в своё обычное состояние вечно догоняющего и, несмотря на довольно интересные и, бесспорно, передовые технические решения, даже не пытается конкурировать с Intel по объёмам продаж.

По данным на середину 2009 года, на долю компании приходится порядка 14,5% рынка микропроцессоров.
При этом некогда фирменные «фишки» чипов AMD - например, 64-разрядные расширения инструкций или встроенный в процессор контроллер оперативной памяти - давно используются в чипах главного конкурента.

Продукция AMD сегодня занимает две весьма узкие ниши: ультрабюджетных процессоров для постройки компьютеров эконом-класса и производительных моделей, предлагаемых в три-пять раз дешевле сравнимых по возможностям чипов Intel.

Именно этим объясняется тот факт, что на прилавках магазинов можно обнаружить процессоры AMD самых разных семейств и поколений - от доисторических Sempron и Athlon на базе заслуженной архитектуры K8 для разъёма Socket 939 до ультрасовременных шестиядерных Phenom II X6.

Как бы то ни было, в AMD сейчас делают ставку на архитектуру K10, поэтому речь пойдёт именно о процессорах, сконструированных на её основе.
К ним относятся Phenom и Phenom II, а также их бюджетный вариант, застенчиво названый Athlon II.

Исторически первыми чипами на базе K10 были четырёхъядерные Phenom X4 (кодовое название Agena), выпущенные в ноябре 2007 года.
Чуть позже, в апреле 2008 года появились трёхъядерные Phenom X3 - первые в мире центральные процессоры для настольных компьютеров, в которых на одном кристалле расположено три ядра.

В декабре 2008 года с переходом на 45-нанометровый техпроцесс было представлено обновлённое семейство Phenom II, а в феврале чипы получили новый разъём Socket AM3.
Серийный выпуск четырёхъядерных Phenom II X4 начался в январе 2009 года, трёхъядерных Phenom II X3 - в феврале 2009 года, двухъядерных Phenom II X2 - в июне 2009 года, а шестиядерных Phenom II X2 - буквально только что, в апреле 2010 года.

Athlon II - современная замена Sempron - представляет собой Phenom II, лишённый одного из важнейших его достоинств - большой кэш-памяти третьего уровня (L3), общей для всех ядер.
Выпускается в двух-, трёх- и четырёхъядерных вариантах.
Athlon II X2 производится с июня 2009 года, X4 - c сентября 2009 года, а X3 - с ноября 2009 года.

Архитектура AMD K10

Каковы принципиальные отличия архитектуры K10 от K8 ?
Прежде всего, в процессорах K10 все ядра выполнены на одном кристалле и снабжены выделенной кэш-памятью L2.
В чипах Phenom/Phenom 2 и серверных Opteron также предусмотрена общая для всех ядер кэш-память L3, объём которой составляет от 2 до 6 Мб.

Второе важное преимущество K10 - новая системная шина HyperTransport 3.0 с пиковой пропускной способностью до 41,6 ГБайт/с в обоих направлениях в 32-битном режиме или до 10,4 ГБайт/с в одном направлении в 16-битном режиме и частотой до 2,6 ГГц.
Напомним, что максимальная рабочая частота предыдущей версии HyperTransport 2.0 составляет 1,4 ГГц, а пиковая пропускная способность - до 22,4 или 5,6 ГБайт/с.

Широкая шина особенно важна для многоядерных процессоров, при этом в HyperTransport 3.0 предусмотрена возможность конфигурации канала, что позволяет предоставить каждому ядру собственную независимую линию.
Кроме того, процессор K10 способен динамически изменять ширину и рабочую частоту шины пропорционально собственной частоте.

При этом нужно отметить, что в настоящее время в чипах AMD шина HyperTransport 3.0 работает с намного меньшей скоростью, чем максимально допустимая.
В зависимости от модели применяются три режима: 1,6 ГГц и 6,4 ГБайт/с, 1,8 ГГц и 7,2 ГБайт/с и 2 ГГц и 8,0 ГБайт/с.
В выпускаемых чипах пока не используются ещё два заложенных в стандарт режима - 2,4 ГГц и 9,6 ГБайт/с и 2,6 ГГц и 10,4 ГБайт/с.

В процессоры K10 встраиваются два независимых контроллера оперативной памяти, что ускоряет доступ к модулям в реальных условиях эксплуатации.
Контроллеры способны работать с памятью DDR2-1066 (модели для разъёма AM2+ и AM3) или DDR3 (чипы для разъёма AM3).

Поскольку интегрированный в Phenom II и Athlon II для Socket AM3 контроллер поддерживает оба типа оперативной памяти, а разъём AM3 обратно совместим с AM2+, новые ЦП могут устанавливаться на старые платы для AM2+ и работать с памятью DDR2.

Это означает, что при покупке Phenom II для апгрейда вам не придётся сразу же менять и системную плату, а также приобретать оперативную память другого типа - как, например, в случае с чипами Intel i3/i5/i7.

В микропроцессорах с архитектурой K10 реализован целый набор модернизированных технологий энергосбережения - AMD Cool’n’Quiet, CoolCore, Independent Dynamic Core и Dual Dynamic Power Management.

Эта сложная система позволяет автоматически снижать энергопотребление всего чипа в режиме простоя, обеспечивает независимое управление питанием контроллера памяти и ядер и способна отключать неиспользуемые элементы процессора.

Наконец, сами ядра также были существенно усовершенствованы.
Была переработана конструкция блоков выборки, предсказания переходов и ветвлений, диспетчеризации, что позволило оптимизировать загрузку ядра и, в конечном итоге, повысить производительность.

Разрядность блоков SSE была увеличена с 64 до 128 бит, появилась возможность выполнять 64-разрядные инструкции как одну, была добавлена поддержка двух дополнительных инструкций SSE4a (не путать с наборами инструкций SSE4.1 и 4.2 в процессорах Intel Core).

Здесь необходимо упомянуть о конструктивном дефекте, выявленном в серверных Opteron (кодовое название Barcelona) и в Phenom X4 и X3 первых выпусков - так называемой «ошибке TLB», которая в своё время привела к полному прекращению поставок всех Opteron ревизии B2.
В очень редких случаях при высокой загрузке из-за конструктивного недостатка блока TLD кэш-памяти L3 система могла вести себя нестабильно и непредсказуемо.

Дефект был признан критически важным для серверных систем, из-за чего и была приостановлена отгрузка всех выпущенных Opteron.
Для десктопных Phenom был выпущен специальный патч, отключающий средствами BIOS дефектный блок, но при этом производительность процессора заметно падала.
С переходом на ревизию B3 проблема была полностью устранена, и в продаже такие чипы уже давно не встречаются.

На сегодняшний день имеется очень много производителей компьютерной техники, к которым, прежде всего можно отнести и компанию AMD. Этак компания на протяжении многих лет занимается в области производства центральных процессоров и видеокарт.

На сегодняшний день много покупателей, которые хотят, купит центральный процессор, задумываются над тем, какую модель лучше всего выбрать. Сегодня будет рассмотрено несколько вариантов процессора — amd athlon x2 и amd phenom. Как правило, по своим техническим характеристикам оба эти процессоры являются очень качественными и производительными, но при этом каждый из них имеет собственное назначение.

Процессор phenom предназначен для выполнения огромного количества различных задач, которые имеют непосредственное значение к графики, то есть он имеет большую мощность и несколько ядер. Благодаря этому самые сложные графические задачи этот процессор, сможет выполнить без каких либо замедлений. Он имеет относиться к классификации профессиональных процессоров. Он изготовлен из высококачественных материалов, благодаря чему он практически не греется при выполнении различных сложных задач, таким образом обеспечивается тихая и надежная работа того или иного компьютера. Также он имеет до воли таки низкую энергопотребность, благодаря чему предотвращается возможность перегрева блока питания и материнской платы. Минусом этого изделия является то, что оно предназначено исключительно для профессионального уровня пользования, а то есть в мощные игры на таком компьютере не поиграешь.

Также по теме: Почему нет звука на компьютере?

Другое дело с центральным процессором amd athlon x2 . Данное изделие также разработано на основе двух ядер, благодаря чему количество выполняемых задач также может быть огромным. Это изделие в большей мере относится к количеству игровых процессов, так как он работает на до воли таки мощной частоте, и имеет большую производительность. Именно поэтому он способен потянуть самые новые игровые новинки от известных геймерских компаний. Этот процессор также имеет до воли таки большую энергопотребительность и как следствие этого он греется. В итоге этого требуется мощны йкуллер и радиатор, которые нужны для его охлаждения.

Каждый из выше перечисленных процессоров имеет огромное количество преимуществ и некоторые недостатки. К примеру, если покупать процессор для игр, то стоит обратить свое внимание на amd athlon x2, а в том случае если устройство приобретается для различного 3д проектирования, и отображения графики то необходимо купить amd phenom.

С выходом в продажу процессоров AMD Athlon II x4 по цене порядка 100$ поклонники продукции этой фирмы получили замечательную возможность собирать четырехъядерные системы за минимум средств. Новая линейка Athlon II x4 ставит рекорд по минимальной цене за 4 ядра. Ближайший аналог от INTEL, Core 2 Quad Q8200 стоит на 30% больше, нежели младшая модель линейки Athlon II x4 620. И если с ценой у новых процессоров от AMD все прекрасно, то как обстоят дела с производительностью? Сегодня мы постараемся ответить на этот вопрос.

В этом обзоре мы оценим производительность старшего процессора в линейке Athlon II x4 630 в сравнении с младшим представителем четырехъядерного семейства Phenom II: процессором Phenom II х4 810, а также оценим разгонный потенциал обоих процессоров.

Спецификации процессоров

Оба подопытных процессора изготовлены по 45-нм техпроцессу, обладают одинаковым тепловым пакетом TDP в 95 Вт, различаются лишь наличием кэша третьего уровня (у Phenom II) и чуть большей тактовой частотой (у Athlon II).

Несмотря на то, что процессоры Athlon II x4 существенно дешевле своих старших собратьев Phenom II x4, архитектура их отличается незначительно. На фото кристаллов ядер Deneb (слева) и Propus (справа) мы видим, что они очень похожи и ядро Propus представляет собой кристалл Deneb с отсутствующей памятью L3.

В связи с этим становится совершенно очевидно, что процессоры Athlon II на ядре Propus не имеют никакой скрытой возможности включения кэша L3, что можно было бы ожидать от «урезанной» версии топового продукта. Возможно, самые первые партии процессоров Athlon II строились на ядре Deneb с отключенным кэшем, что и породило массу слухов (опирающихся на немногих счастливчиков) о возможности задействовать его, включив функцию Advanced Clock Calibration (ACC) в БИОСе материнской платы.

Уменьшение площади кристалла на треть значительно снизило себестоимость процессора, что в итоге привело к выгодным для покупателей ценам на четырехъядерные процессоры AMD Athlon II x4.

Подробные спецификации процессоров приведены ниже:

Имя Athlon II X4 630 Phenom II X4 810
Количество ядер 4 4
Процессорный разъем AM3 AM3
Ядро Propus Deneb
Техпроцесс, нм 45 45
Кол-во транзисторов, млн. шт. 300 758
Тактовая частота, МГц 2800 2600
L1, Кбайт 4 x 128 4 x 128
L2, Кбайт 4 x 512 4 x 512
L3, Мбайт - 4
Размер кристалла, мм 2 169 258
TDP, Вт 95 95
Цена, руб. 3 770 4 280

Оба процессора работают на 2000 МГц шины Hyper Transport и поддерживают как DDR2, так и DDR3 модули памяти.


Конфигурация стенда, тестовые приложения

Тестовый стенд:

  • Материнская плата MSI 790FX-GD70, BIOS версии 1.6
  • Оперативная память 2 x 2 Гбайт DDR3-1600, Corsair TR3X6G1600C8D, 8-8-8-24
  • Блок питания Tuniq 950 Вт
  • Жесткий диск Western Digital WD15EADS 1,5 Тбайт
  • Видеокарта Sapphire AMD(ATi) Radeon HD 4890
  • Система охлаждения процессора: BOX Cooler

Программное обеспечение:

  • Операционная система Windows 7 Ultimate EN x64
  • Драйвера видеокарты ATI Catalyst™ 9.10

Тестовые приложения:

  • 3D Mark 06
  • Science Mark – тестовый пакет для научных вычислений.
  • LightWork - обсчет сцены в разрешении 300х200
  • POV-Ray Render - обсчет сцены в разрешении 1280х1024
  • PC Mark 05 - результат CPU Score, настройки по умолчанию
  • Crysis Warhead
  • WinRar 3.80 - встроенный тест производительности
  • Unreal Tournament 3 - максимальные настройки качества, 8xAF 4xAA
  • FarCry 2 - режим DX10, максимальные настройки качества, 8xAF 4xAA
  • DVD 2 AV I - однопроходное кодирование mpeg2 ролика кодеком xVid
  • CineBench R10 - многопоточный рендеринг, настройки по умолчанию
  • Call of Duty: World at War - максимальные настройки качества, 4xAF, 4xAA

Разгон

Как показывает опыт, процессоры линейки Phenom II обычно удается разогнать до частоты 3,7-4 ГГц. Так как процессоры Athlon II построены на похожем ядре, мы надеемся на то, что и разгонный потенциал их сравним с Phenom II. Поскольку подопытные процессоры не относятся к серии Black Edition, мы не сможем повысить их множитель свыше номинального, разгон приходится осуществлять только посредством увеличения частоты системной шины. К счастью, материнская плата MSI 790FX-GD70 обладает средствами для удобного изменения частоты FSB «на лету». С помощью аппаратной функции OS Clock Dial, мы сможем поднимать частоту системной шины непосредственно в Windows, попутно контролируя стабильность системы. В ряде экспериментов, когда разгон осуществлялся непосредственно из БИОСа никакой разницы с разгоном через OS Clock Dial нами замечено не было.

Для контроля температуры процессора и, отчасти - тестирования стабильности работы системы, мы использовали программу AMD Overdrive Utility и ее встроенный тест. Разгон мы начали с поднятия напряжения питания процессоров до 1.51 В (1.50 В под нагрузкой) и, уже при этом напряжении, стали повышать частоту FSB. Наш экземпляр Phenom II показал очень неплохой частотный потенциал. При напряжении питания 1,5 В максимальная частота составила 3848 МГц (296 МГц FSB, 2072 МГц Hyper Transport). Для достижения этого результата нам пришлось снизить множитель шины Hyper Transport до x7. С множителем HT х10 максимально стабильной частотой оказалась 3250 МГц (250 МГц FSB, 2500 МГц Hyper Transport). При повышении напряжения до 1.53 В нам удалось достичь частоты в 3900 МГц (300 МГц FSB, 1800 МГц Hyper Transport). Но при прохождении тестов в данном режиме температура процессора поднималась до 70 градусов Цельсия, вследствие чего система зависала от перегрева. Поэтому мы вернулись к стабильной частоте в 3848 МГц и все тесты проводили на ней. В этом режиме температура процессора не превышала 68 градусов Цельсия.

У Athlon II 630 максимальной стабильной оказалась частота в 3570 МГц. Для ее достижения нам пришлось поднять частоту FSB до 255 МГц и снизить множитель шины Hyper Transport до 8х. Температура процессора, в этом случае, под нагрузкой не превышала 52 градусов Цельсия. Дальнейшее повышение напряжения питания процессора (свыше 1.5 В) позволило разогнать процессор до 3640 МГц, но и на этой частоте система оказалась нестабильной.

К сожалению, стабильный предел разгона Athlon II x4 630 не оправдал наших ожиданий. Мы смогли, практически не напрягаясь, поднять частоту Phenom II x4 почти на 50%, и в то же время потерпели неудачу при попытках разогнать Athlon II x4 более чем на 27%. Пока нам неясны столь скромные результаты разгона – это особенность конкретного экземпляра Athlon II 630 или же свойство нового ядра Propus? На этот вопрос можно будет ответить, только набрав статистику по разгону достаточного числа процессоров на новом ядре.

Сначала мы приведём справочную информацию об основных технических характеристиках AMD Phenom II и Athlon II, а затем поговорим о том, какие из этих чипов представляют особый интерес.

Вторую часть нашей статьи о современных процессорах AMD мы построили так же, как и материал о чипах Intel Core i3/i5/i7: сначала мы приведём справочную информацию об основных технических характеристиках AMD Phenom II и Athlon II. Все данные об актуальных моделях процессоров мы свели в несложные таблицы, где, помимо прочего, указаны и российские розничные цены для модификаций в "боксовой" комплектации, то есть с фирменным кулером. Под конец же мы поговорим о том, какие из имеющихся в продаже моделей заслуживают особого внимания покупателей.

Athlon II

Athlon II - двух-, трёх или четырёхъядерный процессор для настольных компьютеров начального и среднего уровня. Впервые представлен в июне 2009 года. Кодовые названия: двухъядерный X2 – Regor, трёхъядерный X3 – Rana, четырёхъядерный X4 – Propus. Рассчитан на установку в разъём AM3. Производится по 45-нанометровой технологии.

Отличается от Phenom II отсутствием кэш-памяти третьего уровня (L3). В отличие от Phenom II X2, Athlon II X2 – чип с двумя ядрами на кристалле, а не с четырьмя, из которых два отключены. Этим объясняется меньшая себестоимость Athlon II и доступная конечная цена.

Оснащён двумя независимыми контроллерами оперативной памяти DDR3-1333/DDR2-1066. Обратно совместим с разъёмом AM2+ и способен с пониженной производительностью работать на платах с этим разъёмом.

Снабжён системной шиной нового поколения HyperTransport 3.0 с пиковой пропускной способностью до 10,4 Гбайт/с в одном направлении в 16-битном режиме и частотой до 2,6 ГГц. В выпускающихся чипах используется менее скоростной режим 8,0 Гбайт/с и 2 ГГц.

Модели с двузначным индексом и буквой B – модификации для корпоративных пользователей, доступность которых гарантируется в течение 24 месяцев со дня представления. Модели с буквой "e" после числового индекса – модификации с пониженным энергопотреблением. Модели с пометкой Black Edition – модификации с разблокированным множителем, что упрощает разгон.

Основные технические параметры Athlon II

  • Микроархитектура K10
  • Два, три или четыре ядра
  • Кэш-память L2 – 512 Кбайт или 1 Мбайт для каждого ядра

Модельный ряд

Phenom II

Phenom II – двух-, трёх-, четырёх- или шестиядерный процессор для производительных настольных компьютеров. Впервые представлен 8 января 2009 года. Кодовые названия: двухъядерный X2 – Callisto, трёхъядерный X3 – Heka, четырёхъядерный X4 – Deneb, шестиядерный X6 – Thuban. Рассчитан на установку в разъём AM3. Производится по 45-нм технологии.

Оснащён двумя независимыми контроллерами оперативной памяти DDR3-1333/DDR2-1066, за исключением моделей Phenom II X4 940 и 920, которые предназначены для установки в разъём AM2+ и работают только с оперативной памятью DDR2. Остальные модели обратно совместимы с разъёмом AM2+ и способны с пониженной производительностью работать на платах с этим разъёмом.

Снабжён системной шиной нового поколения HyperTransport 3.0 с пиковой пропускной способностью до 10,4 Гбайт/с в одном направлении в 16-битном режиме и частотой до 2,6 ГГц. В выпускающихся чипах используются менее скоростные режимы 7,2 Гбайт/с и 1,8 ГГц и 8,0 Гбайт/с и 2 ГГц.

Модели с двузначным индексом и буквой B – модификации для корпоративных пользователей, доступность которых гарантируется в течение 24 месяцев со дня представления. Модели с буквой "e" после числового индекса – модификации с пониженным энергопотреблением. Модели с пометкой Black Edition – модификации с разблокированным множителем, что упрощает "разгон".

Совместимые наборы системной логики: AMD 760G, 770, 780G/V, 785G и 790X/G/GX/FX.

Основные технические параметры Phenom II

  • Микроархитектура K10
  • Два, три, четыре или шесть ядер
  • Кэш-память L1 – 128 Кбайт для каждого ядра
  • Кэш-память L2 – 512 Кбайт для каждого ядра
  • Кэш-память L3 – 4 или 6 Мбайт, общая для всех ядер
  • Два встроенных контроллера оперативной памяти DDR3-1333/DDR2-1066
  • Системная шина HyperTransport 3.0
  • Поддержка технологии виртуализации AMD-V
  • Поддержка 64-битных инструкций AMD64
  • Наборы инструкций SSE3 и SSE4a
  • Антивирусная технология NX bit
  • Технологии энергосбережения Cool’n’Quiet, CoolCore, Independent Dynamic Core и Dual Dynamic Power Management
  • Автоматическая технология "разгона" в моделях X6

Модельный ряд

Что выбрать?

Процесcоры AMD Athlon традиционно прекрасно себя чувствуют в бюджетном сегменте, и двухъядерные Athlon II X2 – не исключение. Наилучший выбор в эконом-классе – модели X2 240 c тактовой частотой 2,8 ГГц и X2 245, работающий на частоте 2,9 ГГц. Разница в цене и производительности у этих чипов ничтожна, при этом они мало в чём уступают трёхъядерным X3 и даже четырёхъядерным X4, которые в полтора-два раза дороже.

Чрезвычайно привлекательное предложение – Athlon X4 620 (2,6 ГГц), самый дешёвый на сегодняшний день четырёхъядерный процессор, достаточно мощный для постройки недорогого домашнего мультимедийного компьютера. Ещё раз подчеркнём, что вcе эти чипы можно установить на старые платы с разъёмом AM2+ и оперативной памятью DDR2, что делает их самым доступным вариантом апгрейда системы.

Единственное достоинство "экономичных" моделей с индексом "е" – заметно меньшее энергопотребление. Во всех других отношениях это не лучший выбор: по производительности они значительно уступают аналогам с такой же тактовой частотой, а стоят примерно на треть дороже. Что характерно, ввиду отсутствия спроса, в российских магазинах они практически не представлены.

Если вы ограничены в бюджете, но вам необходимо собрать компьютер, справляющийся как с трёхмерными играми и обработкой видео, так и со сложными программными пакетами, оптимизированными для многопоточных вычислений, то нелишне присмотреться к чипам семейства Phenom II.

Лучшие представители четырёхъядерного семейства X4, модели 955 и 965, сравнимы по производительности с двухъядерными Intel Core i5 серии 6xx, но уже заметно отстают от четырёхъядерного i5-750. Цены на эти чипы вполне сопоставимы, хотя "феномы", в среднем, дешевле примерно на тысячу рублей. А если учесть, что и системные платы для Phenom II, как правило, дешевле аналогичных по функциональности "материнок" для Core на 1000-1500 рублей, то получается весьма ощутимая экономия – эту сумму можно вложить, например, в оперативную память.

Двух- и трёхъядерные Phenom II X2 и X3 привлекают очень доступными ценами, но их преимущества над аналогичными Athlon II проявляются, пожалуй, только в компьютерных играх – при условии установки достаточно мощного графического ускорителя. Во остальных задачах они выступают с переменным успехом, так что на них имеет смысл обращать внимание либо при сборке машины, ориентированной на игры, либо при апгрейде устаревшего десктопа.

Топовые шестиядерники интересны, пожалуй, лишь энтузиастам и стойким поклонникам платформы AMD. Несмотря на шесть ядер, по производительности они примерно соответствуют четырёхъядерным Intel Core i7 – младшим представителям серий 8xx и 9xx. При этом "феномы" дешевле примерно на четверть: ультрасовременный X6 1055T с автоматической системой "разгона", аналогичной интеловской Turbo Boost, стоит всего порядка 8600 рублей. А выбрав версию Black Edition с разблокированным множителем, можно уже всласть поэкспериментировать с разгоном.