Лучшая интегрированная графика против бюджетной дискретной. Железный эксперимент: играем в разрешении Full HD на встроенной в процессор графике

Здравствуйте, уважаемые пользователи и любители компьютерного железа. Сегодня порассуждаем на тему, что такое интегрированная графика в процессоре, зачем она вообще нужна и является ли такое решение альтернативой дискретным, то бишь внешним видеокартам.

Из этой статьи вы узнаете:

Если рассуждать с точки зрения инженерного замысла, то встроенное графическое ядро, повсеместно используемое в своих продуктах компаниями Intel и AMD, не является видеокартой как таковой. Это видеочип, который интегрировали в архитектуру ЦП для исполнения базовых обязанностей дискретного ускорителя. Но давайте разбираться со всем более подробно.

История появления

Впервые компании начали внедрять графику в собственные чипы в середине 2000-х. Интел начали разработку еще с Intel GMA, однако данная технология довольно слабо себя показывала, а потому для видеоигр была непригодной. В результате на свет появляется знаменитая технология HD Graphics (на данный момент самый свежий представитель линейки – HD graphics 630 в восьмом поколении чипов Coffee Lake). Дебютировало видеоядро на архитектуре Westmere, в составе мобильных чипов Arrandale и десктопных – Clarkdale (2010 год).

AMD пошла иным путем. Сначала компания выкупила ATI Electronics, некогда крутого производителя видеокарт. Затем начала корпеть над собственной технологией AMD Fusion, создавая собственные APU – центральный процессор со встроенным видеоядром (Accelerated Processing Unit). Дебютировали чипы первого поколения в составе архитектуры Liano, а затем и Trinity. Ну а графика Radeon r7 series на долгое время прописалась в составе ноутбуков и нетбуков среднего класса.

Преимущества встроенных решений в играх

Итак. Для чего же нужна интегрированная карта и в чем заключаются ее отличия от дискретной.

Постараемся сделать сравнение с пояснением каждой позиции, сделав все максимально аргументировано. Начнем, пожалуй, с такой характеристики как производительность. Рассматривать и сравнивать будем наиболее актуальные на данный момент решения от Intel (HD 630 c частотой графического ускорителя от 350 до 1200 МГц) и AMD (Vega 11 с частотой 300-1300 Мгц), а также преимущества, которые дают эти решения.
Начнем со стоимости системы. Встроенная графика позволяет неплохо сэкономить на покупке дискретного решения, вплоть до 150$, что критически важно при создании максимально экономного ПК для офисного и использования.

Частота графического ускорителя AMD заметно выше, да и производительность адаптера от красных существенно выше, что говорит о следующих показателях в тех же играх:

Игра Настройки Intel AMD
PUBG FullHD, низкие 8-14 fps 26-36 fps
GTA V FullHD, средние 15-22 fps 55-66 fps
Wolfenstein II HD, низкие 9-14 fps 85-99 fps
Fortnite FullHD, средние 9-13 fps 36-45 fps
Rocket League FullHD, высокие 15-27 fps 35-53 fps
CS:GO FullHD, максимальные 32-63 fps 105-164 fps
Overwatch FullHD, средние 15-22 fps 50-60 fps

Как видите, Vega 11 – лучший выбор для недорогих «игровых» систем, поскольку показатели адаптера в некоторых случаях доходят до уровня полноценной GeForce GT 1050. Да и в большинстве сетевых баталий она показывает себя прекрасно.

На данный момент с этой графикой поставляется только процессор AMD Ryzen 2400G, но он определенно стоит внимания.

Вариант для офисных задач и домашнего использования

Какие требования чаще всего вы выдвигаете к своему ПК? Если исключить игры, то получится следующий набор параметров:

  • просмотр фильмов в HD-качестве и роликов на Youtube (FullHD и в редких случаях 4К);
  • работа с браузером;
  • прослушивание музыки;
  • общение с друзьями или коллегами с помощью мессенджеров;
  • разработка приложений;
  • офисные задачи (Microsoft Office и похожие программы).

Все эти пункты прекрасно работают со встроенным графическим ядром на разрешениях вплоть до FullHD.
Единственный нюанс, который необходимо учитывать в обязательном порядке – поддержка видеовыходов той материнской платой, на которую вы собираетесь ставить процессор. Заранее уточните этот момент, чтобы не возникло проблем в дальнейшем.

Недостатки встроенной графики

Поскольку разобрались с плюсами, нужно проработать и недостатки решения.

  • Главный минус подобной затеи – производительность. Да, вы можете с чистой совестью играть в более-менее современные игрушки на низких и высоких настройках, однако любителям графики, такая затея точно не придется по вкусу. Ну а если вы работаете с графикой профессионально (обработка, рендеринг, монтаж видеороликов, постпродакшн), да еще и на 2-3 мониторах, то интегрированный тип видео вам точно не подойдет.

  • Момент номер 2: отсутствие собственной скоростной памяти (в современных картах это GDDR5, GDDR5X и HBM). Формально видеочип может использовать хоть до 64 ГБ памяти, однако вся она будет браться откуда? Правильно, из оперативной. А значит необходимо заранее построить систему таким образом, чтобы ОЗУ хватило и для работы, и для графических задач. Учитывайте, что скорость современных DDR4-модулей значительно ниже, нежели GDDR5, а потому времени на обработку данных будет тратиться больше.
  • Следующий недостаток – тепловыделение. Помимо собственных ядер на процессе появляется еще одно, которое, в теории, прогревается ничуть не меньше. Охлаждать все это великолепие боксовой (комплектной) вертушкой можно, но готовьтесь к периодическим занижениям частот в особо сложных расчетах. Покупка более мощного кулера решает проблему.
  • Ну и последний нюанс – невозможность апгрейда видео без замены процессора. Иными словами, чтобы улучшить встроенное видеоядро, вам придется в буквальном смысле покупать новый процессор. Сомнительная выгода, не так ли? В таком случае проще через некоторое время приобрести дискретный ускоритель. Производители вроде AMD и nVidia предлагают отличные решения на любой вкус.

Итоги

Встроенная графика – отличный вариант в 3 случаях:

  • вам необходима временная видеокарта, поскольку денег на внешнюю не хватило;
  • система изначально задумывалась как сверхбюджетная;
  • вы создаете домашнюю мультимедийную станцию (HTPC), в которой основной акцент делается именно на встроенное ядро.

Надеемся одной проблемой в вашей голове стало меньше, и теперь вы знаете, для чего производители создают свои APU.

В следующих статьях поговорим о таких терминах как виртуализация и не только. Следите за , чтобы быть в курсе всех актуальных тем, связанных с железом.

ВведениеВ развитии всей компьютерной техники в последние годы хорошо прослеживается курс на интеграцию и сопутствующую ей миниатюризацию. И речь тут идёт не столько про привычные настольные персоналки, сколько про огромный парк устройств «пользовательского уровня» – смартфонов, ноутбуков, плееров, планшетов и т.п. – которые перерождаются в новых форм-факторах, вбирая в себя всё новые и новые функции. Что же до десктопов, то их как раз это течение затрагивает в последнюю очередь. Конечно, в последние годы вектор пользовательского интереса слегка отклонился в сторону небольших по размеру вычислительных устройств, но назвать это глобальной тенденцией тяжело. Базовая архитектура x86-систем, предполагающая наличие отдельных процессора, памяти, видеокарты, материнской платы и дисковой подсистемы остаётся неизменной, и именно это ограничивает возможности по миниатюризации. Можно уменьшить каждый из перечисленных компонентов, но качественного изменения в габаритах получившейся системы в сумме не получится.

Впрочем, в течение последнего года, вроде как, наметился некоторый перелом и в среде «персоналок». По мере внедрения современных полупроводниковых технологических процессов с более «тонкими» нормами разработчикам x86-процессоров удаётся постепенно переносить в CPU функции некоторых, бывших ранее отдельными компонентами, устройств. Так, никого уже не удивляет, что контроллер памяти и, в некоторых случаях, контроллер шины PCI Express, давно стал принадлежностью центрального процессора, а чипсет материнской платы выродился в единственную микросхему – южный мост. Но в 2011 году случилось гораздо более значимое событие – в процессоры для производительных десктопов начал встраиваться графический контроллер. И речь идёт не о каких-то там хиленьких видеоядрах, способных лишь на обеспечение работы интерфейса операционной системы, а о вполне полноценных решениях, которые по своей производительности могут быть противопоставлены дискретным графическим ускорителям начального уровня и наверняка превосходят все те интегрированные видеоядра, которые встраивались в наборы системной логики ранее.

Первопроходцем выступила компания Intel, в самом начале года выпустившая для настольных компьютеров процессоры Sandy Bridge со встроенным графическим ядром семейства Intel HD Graphics. Правда, она посчитала, что хорошая встроенная графика будет интересна в первую очередь пользователям мобильных компьютеров, а для десктопных CPU была предложена лишь урезанная версия видеоядра. Неправильность такого подхода смогла позднее продемонстрировать AMD, выпустившая на рынок десктопных систем процессоры Fusion с полноценными графическими ядрами серии Radeon HD. Такие предложения сразу завоевали популярность не только в качестве решений для офиса, но и как основа для недорогих домашних компьютеров, что заставило Intel пересмотреть своё отношение к перспективам CPU с интегрированной графикой. Компания обновила линейку десктопных процессоров Sandy Bridge, добавив в число доступных предложений для настольных компьютеров модели с более быстрой версией Intel HD Graphics. В результате, теперь пользователи, желающие собрать компактную интегрированную систему, ставятся перед вопросом: платформу какого из производителей рациональнее предпочесть? Проведя всестороннее тестирование, мы постараемся дать рекомендации по выбору того или иного процессора со встроенным графическим ускорителем.

Вопрос терминологии: CPU или APU?

Если вы уже знакомы с теми процессорами с интегрированной графикой, которые предлагают для пользователей настольных компьютеров компании AMD и Intel, то знаете, что эти производители пытаются максимально дистанцировать свои продукты друг от друга, пытаясь внушить мысль о некорректности их прямого сравнения. Основную «смуту» вносит именно AMD, которая относит свои решения к новому классу APU, а не к обычным CPU. В чём же разница?

Аббревиатура APU расшифровывается как Accelerated Processing Unit (ускоренное процессорное устройство). Если обратиться к подробным разъяснениям, то оказывается, что с аппаратной точки зрения это – гибридное устройство, объединяющее на одном полупроводниковом кристалле традиционные вычислительные ядра общего назначения с графическим ядром. Иными словами, тот же CPU с интегрированной графикой. Однако разница всё-таки есть, и кроется она на программном уровне. Графическое ядро, входящее в APU, должно иметь универсальную архитектуру в виде массива потоковых процессоров, способных работать не только над синтезом трёхмерного изображения, но и над решением вычислительных задач.

То есть, APU предлагает более гибкую схему, чем простое объединение графических и вычислительных ресурсов внутри одного полупроводникового кристалла. Идея кроется в создании симбиоза этих разнородных частей, когда часть вычислений может выполняться средствами графического ядра. Правда, как и всегда в подобных случаях, для задействования этой многообещающей возможности необходима поддержка со стороны программного обеспечения.

Процессоры AMD Fusion с видеоядром, известные под кодовым именем Llano, полностью соответствуют этому определению, они – именно APU. В них встраиваются графические ядра семейства Radeon HD, которые, помимо всего прочего, поддерживают технологию ATI Stream и программный интерфейс OpenCL 1.1, посредством которых расчёты на графическом ядре действительно возможны. В теории, практическую пользу от исполнения на массиве потоковых процессоров Radeon HD способен получить целый ряд приложений, включая криптографические алгоритмы, рендеринг трёхмерных изображений или задачи пост-обработки фотографий, звука и видео. На практике, впрочем, всё гораздо сложнее. Трудности с реализацией и сомнительный реальный выигрыш в производительности пока что сдерживают широкую поддержку концепции. Поэтому в большинстве случаев APU может рассматриваться как не более чем простой CPU со встроенным графическим ядром.

Компания Intel, напротив, придерживается более консервативной терминологии. Она продолжает называть свои процессоры Sandy Bridge, содержащие интегрированное графическое ядро HD Graphics, традиционным термином CPU. Что, впрочем, имеет под собой некоторую почву, ведь программный интерфейс OpenCL 1.1 интеловской графикой не поддерживается (совместимость с ним будет обеспечена в продуктах следующего поколения Ivy Bridge). Так что никакая совместная работа разнородных частей процессора над одними и теми же вычислительными задачами у Intel пока не предусматривается.

За одним важным исключением. Дело в том, что в графических ядрах процессоров Intel заложен специализированный блок Quick Sync, ориентированный на аппаратное ускорение работы алгоритмов кодирования видеопотока. Конечно, как и в случае с OpenCL, для него требуется специальная программная поддержка, но зато он действительно способен улучшить быстродействие при перекодировании видео высокого разрешения чуть ли не на порядок. Так что в итоге можно сказать, что Sandy Bridge – это в какой-то мере тоже гибридный процессор.

Правомерно ли сравнивать APU компании AMD и CPU компании Intel? С теоретических позиций между APU и CPU со встроенным видеоускорителем нельзя поставить знак тождественного равенства, но в реальной жизни мы имеем два названия одного и того же. Процессоры AMD Llano могут ускорять параллельные вычисления, а Intel Sandy Bridge способны задействовать мощности графики лишь при перекодировании видео, но на деле и те, и другие возможности почти не используются. Так что с практической точки зрения любой из процессоров, о котором идёт речь в этой статье, представляет собой обычный CPU и видеокарту, собранные внутри одной микросхемы.

Процессоры - участники тестирования

На самом деле не стоит думать про процессоры со встроенной графикой, как о каком-то особенном предложении, нацеленном на определённую группу пользователей с нетипичными запросами. Всеобщая интеграция – глобальное течение, и такие процессоры стали стандартным предложением в нижнем и среднем ценовом диапазоне. Как AMD Fusion, так и Intel Sandy Bridge вытеснили из числа актуальных предложений CPU без графики, так что даже если вы не собираетесь делать ставку на встроенное видеоядро, ничего другого, кроме как ориентироваться на те же самые процессоры с графикой, мы предложить не можем. Благо, встроенное видеядро никто использовать не заставляет, и его можно отключить.

Таким образом, взявшись за сравнение CPU с интегрированным GPU, мы пришли к более общей задаче – сравнительному тестированию современных процессоров со стоимостью от 60 до 140 долларов. Давайте посмотрим, какие подходящие варианты в этом ценовом диапазоне нам могут предложить компании AMD и Intel, и какие конкретно модели процессоров нам удалось вовлечь в испытания.

AMD Fusion: A8, A6 и A4

Для использования десктопных процессоров с интегрированным графическим ядром компания AMD предлагает специализированную платформу Socket FM1, совместимую исключительно с процессорами семейства Llano – A8, A6 и A4. Эти процессоры имеют два, три или четыре ядра общего назначения Husky с микроархитектурой, аналогичной Athlon II, и графическое ядро Sumo, наследующее микроархитектуру младших представителей пятитысячной серии Radeon HD.



Линейка процессоров семейства Llano выглядит вполне самодостаточной, она включает разнородные по производительности вычислительной и графической части процессоры. Однако в модельном ряду имеет место одна закономерность – вычислительная производительность соотносится с производительностью графической, то есть, процессоры с наибольшим числом ядер и с максимальной тактовой частотой всегда снабжаются самыми скоростными видеоядрами.

Intel Core i3 и Pentium

Процессорам AMD Fusion компания Intel может противопоставить свои двухъядерные Core i3 и Pentium, которые не имеют собственного собирательного имени, но тоже оснащаются графическими ядрами и имеют сравнимую стоимость. Конечно, графические ядра есть и в более дорогих четырёхъядерных процессорах, но там они играют явно второстепенную роль, поэтому в настоящее тестирование Core i5 и Core i7 не попали.

Intel не стал создавать для недорогих интегрированных платформ собственную инфраструктуру, поэтому процессоры Core i3 и Pentium могут использоваться в тех же самых LGA1155-материнских платах, что и остальные Sandy Bridge. Для задействования же встроенного видеоядра потребуются материнки, основанные на специальных наборах логики H67, H61 или Z68.



Все процессоры Intel, которые можно рассматривать в качестве конкурентов для Llano, основываются на двухъядерном дизайне. При этом Intel не делает особенного упора на графическую производительность – в большинство CPU встроена слабая версия графики HD Graphics 2000 с шестью исполнительными устройствами. Исключение сделано лишь для Core i3-2125 – это процессор оснащён самым мощным в арсенале компании графическим ядром HD Graphics 3000 с двенадцатью исполнительными устройствами.

Как мы тестировали

После того, как мы познакомились с тем набором процессоров, который представлен в настоящем тестировании, самое время уделить внимание тестовым платформам. Ниже приводится список компонентов, из которых был сформирован состав тестовых систем.

Процессоры:

AMD A8-3850 (Llano, 4 ядра, 2.9 ГГц, 4 Мбайта L2, Radeon HD 6550D);
AMD A8-3800 (Llano, 4 ядра, 2.4/2.7 ГГц, 4 Мбайта L2, Radeon HD 6550D);
AMD A6-3650 (Llano, 4 ядра, 2.6 ГГц, 4 Мбайта L2, Radeon HD 6530D);
AMD A6-3500 (Llano, 3 ядра, 2.1/2.4 ГГц, 3 Мбайта L2, Radeon HD 6530D);
AMD A4-3400 (Llano, 2 ядра, 2.7 ГГц, 1 Мбайт L2, Radeon HD 6410D);
AMD A4-3300 (Llano, 2 ядра, 2.5 ГГц, 1 Мбайт L2, Radeon HD 6410D);
Intel Core i3-2130 (Sandy Bridge, 2 ядра + HT, 3.4 ГГц, 3 Мбайта L3, HD Graphics 2000);
Intel Core i3-2125 (Sandy Bridge, 2 ядра + HT, 3.3 ГГц, 3 Мбайта L3, HD Graphics 3000);
Intel Core i3-2120 (Sandy Bridge, 2 ядра + HT, 3.3 ГГц, 3 Мбайта L3, HD Graphics 2000);
Intel Pentium G860 (Sandy Bridge, 2 ядра, 3.0 ГГц, 3 Мбайта L3, HD Graphics);
Intel Pentium G840 (Sandy Bridge, 2 ядра, 2.8 ГГц, 3 Мбайта L3, HD Graphics);
Intel Pentium G620 (Sandy Bridge, 2 ядра, 2.6 ГГц, 3 Мбайта L3, HD Graphics).

Материнские платы:

ASUS P8Z68-V Pro (LGA1155, Intel Z68 Express);
Gigabyte GA-A75-UD4H (Socket FM1, AMD A75).

Память - 2 x 2 GB DDR3-1600 SDRAM 9-9-9-27-1T (Kingston KHX1600C8D3K2/4GX).
Жёсткий диск: Kingston SNVP325-S2/128GB.
Блок питания: Tagan TG880-U33II (880 Вт).
Операционная система: Microsoft Windows 7 SP1 Ultimate x64.
Драйверы:

AMD Catalyst Display Driver 11.9;
AMD Chipset Driver 8.863;
Intel Chipset Driver 9.2.0.1030;
Intel Graphics Media Accelerator Driver 15.22.50.64.2509;
Intel Management Engine Driver 7.1.10.1065;
Intel Rapid Storage Technology 10.5.0.1027.

Поскольку главной целью данного тестирования состояло изучение возможностей процессоров со встроенной графикой, все испытания проходили без использования внешней графической карты. За вывод же изображение на экран, 3D-функции и ускорение воспроизведения HD-видео отвечали встроенные видеоядра.

При этом необходимо заметить, что, ввиду отсутствия в графических ядрах Intel поддержки DirectX 11, тестирование во всех графических приложениях проводилось в режимах DirectX 9/DirectX 10.

Производительность в обычных задачах

Общая производительность

Для оценки производительности процессоров в общеупотребительных задачах мы традиционно используем тест Bapco SYSmark 2012, моделирующий работу пользователя в распространённых современных офисных программах и приложениях для создания и обработки цифрового контента. Идея теста очень проста: он выдаёт единственную метрику, характеризующую средневзвешенную скорость компьютера.



Как видим, в традиционных применениях процессоры серии AMD Fusion выглядят просто-таки позорно. Самый быстрый четырёхъядерный Socket FM1-процессор компании AMD, A8-3850, с большим трудом обгоняет двухъядерный Pentium G620 с вдвое меньшей стоимостью. Все же остальные представители серий AMD A8, A6 и A4 от интеловских конкурентов отстают безнадёжно. Это, в общем-то, вполне закономерный результат использования в основе процессоров Llano старой микроархитектуры, перекочевавшей туда из Phenom II и Athlon II. Пока AMD не внедрит процессорные ядра с более высокой удельной производительностью, даже четырёхъядерным APU этой компании будет очень тяжело бороться с актуальными и регулярно обновляемыми интеловскими решениями.

Более глубокое понимание результатов SYSmark 2012 способно дать знакомство с оценками производительности, получаемое в различных сценариях использования системы. Сценарий Office Productivity моделирует типичную офисную работу: подготовку текстов, обработку электронных таблиц, работу с электронной почтой и посещение Интернет-сайтов. Сценарий задействует следующий набор приложений: ABBYY FineReader Pro 10.0, Adobe Acrobat Pro 9, Adobe Flash Player 10.1, Microsoft Excel 2010, Microsoft Internet Explorer 9, Microsoft Outlook 2010, Microsoft PowerPoint 2010, Microsoft Word 2010 и WinZip Pro 14.5.



В сценарии Media Creation моделируется создание рекламного ролика с использованием предварительно отснятых цифровых изображений и видео. Для этой цели применяются популярные пакеты компании Adobe: Photoshop CS5 Extended, Premiere Pro CS5 и After Effects CS5.



Web Development - сценарий, в рамках которого моделируется создание web-сайта. Используются приложения: Adobe Photoshop CS5 Extended, Adobe Premiere Pro CS5, Adobe Dreamweaver CS5, Mozilla Firefox 3.6.8 и Microsoft Internet Explorer 9.



Сценарий Data/Financial Analysis посвящён статистическому анализу и прогнозированию рыночных тенденций, которые выполняются в Microsoft Excel 2010.



Сценарий 3D Modeling всецело посвящён созданию трёхмерных объектов и рендерингу статичных и динамических сцен с использованием Adobe Photoshop CS5 Extended, Autodesk 3ds Max 2011, Autodesk AutoCAD 2011 и Google SketchUp Pro 8.



В последнем сценарии, System Management, выполняется создание бэкапов и установка программного обеспечения и апдейтов. Здесь задействуются несколько различных версий Mozilla Firefox Installer и WinZip Pro 14.5.



Единственный тип приложений, в которых от процессоров AMD Fusion удаётся добиться приемлемой производительности – это трёхмерное моделирование и рендеринг. В таких задачах количество ядер – весомый аргумент, и четырёхъядерные A8 и A6 могут обеспечить более высокое быстродействие, чем, например, Intel Pentium. Но до уровня, задаваемого процессорами Core i3, в которых реализована поддержка технологии Hyper-Threading, предложения AMD не дотягивают даже в самом благоприятном для себя случае.

Производительность в приложениях

Для измерения быстродействия процессоров при компрессии информации мы пользуемся архиватором WinRAR , при помощи которого с максимальной степенью сжатия архивируем папку с различными файлами общим объёмом 1.4 Гбайт.



Измерение производительности в Adobe Photoshop мы проводим с использованием собственного теста, представляющего собой творчески переработанный Retouch Artists Photoshop Speed Test , включающий типичную обработку четырёх 10-мегапиксельных изображений, сделанных цифровой камерой.



При тестировании скорости перекодирования аудио используется утилита Apple iTunes , при помощи которой осуществляется преобразование содержимого CD-диска в AAC-формат. Заметим, что характерной особенностью этой программы является способность использования лишь пары процессорных ядер.



Для измерения скорости перекодирования видео в формат H.264 используется x264 HD тест , основанный на измерении времени обработки исходного видео в формате MPEG-2, записанного в разрешении 720p с потоком 4 Мбит/сек. Следует отметить, что результаты этого теста имеют огромное практическое значение, так как используемый в нём кодек x264 лежит в основе многочисленных популярных утилит для перекодирования, например, HandBrake, MeGUI, VirtualDub и проч.



Тестирование скорости финального рендеринга в Maxon Cinema 4D выполняется путём использования специализированного теста Cinebench .



Также, мы воспользовались и бенчмарком Fritz Chess Benchmark, который оценивает скорость работы популярного шахматного алгоритма, используемого в основе программ семейства Deep Fritz.



Глядя на приведённые диаграммы, можно ещё раз повторить всё то, что уже было сказано применительно к результатам SYSmark 2011. Процессоры AMD, которые компания предлагает для использования в интегрированных системах, могут похвастать сколь-нибудь приемлемой производительностью лишь в тех вычислительных задачах, где нагрузка хорошо распараллеливается. Например, при 3D-рендеринге, перекодировании видео или при переборе и оценке шахматных позиций. И то, конкурентный уровень быстродействия в этом случае наблюдается лишь у старшего четырёхъядерного AMD A8-3850 с тактовой частотой, которая повышена в ущерб энергопотреблению и тепловыделению. Все же процессоры AMD с 65-ваттным тепловым пакетом пасуют перед любым из Core i3 даже в самом благоприятном для них случае. Соответственно, на фоне Fusion весьма достойно выглядят и представители семейства Intel Pentium: эти двухъядерники выступают примерно также как и трёхъядерный A6-3500 при хорошо распараллеливаемой нагрузке, и превосходят старшие A8 в программах типа WinRAR, iTunes или Photoshop.

В дополнение к проведённым тестам, для проверки того, с каким эффектом для решения повседневных вычислительных задач могут привлекаться мощности графических ядер, мы провели исследование скорости перекодирования видео в Cyberlink MediaEspresso 6.5. Эта утилита обладает поддержкой вычислений на графических ядрах – она поддерживает и Intel Quick Sync и ATI Stream. Наш тест состоял в измерении времени, необходимого для перекодирования полуторагигабайтного 1080p-ролика в формате H.264 (который представлял собой 20-минутную серию популярного телесериала) с уменьшением разрешения для просмотра на iPhone 4.



Результаты разделяются на две группы. В первую попадают процессоры Intel Core i3, которые обладают поддержкой технологии Quick Sync. Числа говорят лучше всяких слов: Quick Sync позволяет перекодировать HD-видеоконтент в несколько раз быстрее, чем при использовании любого другого инструментария. Вторая большая группа объединяет все остальные процессоры, среди которых на первые места попадают CPU с большим количеством ядер. Продвигаемая AMD технология Stream, как видим, никак себя не проявляет, и APU серии Fusion с двумя ядрами показывают ничуть не лучший результат, чем процессоры Pentium, которые перекодируют видео исключительно силами вычислительных ядер.

Производительность графических ядер

Группа игровых 3D тестов открывается результатами бенчмарка 3DMark Vantage, который использовался с профилем Performance.









Изменение характера нагрузки тут же приводит к смене лидеров. Графическое ядро любых процессоров AMD Fusion на практике превосходит любые варианты Intel HD Graphics. Даже Core i3-2125, укомплектованный видеоядром HD Graphics 3000 c двенадцатью исполнительными устройствами, оказывается способным достичь только лишь уровня производительности, демонстрируемого AMD A4-3300 с самым слабым среди всех представленных в тесте Fusion встроенным графическим ускорителем Radeon HD 6410D. Все же остальные процессоры Intel по уровню 3D-быстродействия проигрывают предложениям AMD в два-четыре раза.

Некоторой компенсацией за провал в графической производительности могут выступить результаты теста CPU, однако следует понимать, что скорость CPU и GPU – это не взаимозаменяемые параметры. Стремиться следует к сбалансированности этих характеристик, и как обстоит дело в случае со сравниваемыми процессорами, мы увидим далее, анализируя их игровую производительность, которая зависит от мощности как GPU, так и вычислительной составляющей гибридных процессоров.

Для исследования скорости работы в реальных играх нами были отобраны Far Cry 2, Dirt 3, Crysis 2, бета-версия World of Planes и Civilization V. Тестирование проводилось в разрешении 1280x800, а уровень настроек качества устанавливался в положение Medium.















В игровых тестах складывается весьма позитивная для предложений компании AMD картина. Несмотря на то, что они отличаются довольно-таки посредственной вычислительной производительностью, мощная графика позволяет им показывать хорошие (для интегрированных решений) результаты. Почти всегда представители серии Fusion позволяют получить более высокое число кадров в секунду, чем выдаёт интеловская платформа с процессорами семейств Core i3 и Pentium.

Не спасло положение процессоров Core i3 даже то, что Intel стал встраивать в них производительную версию графического ядра HD Graphics 3000. Укомплектованный им Core i3-2125 оказался быстрее своего собрата Core i3-2120 с HD Graphics 2000 примерно на 50%, но графика, встраиваемая в Llano, ещё быстрее. В результате, даже Core i3-2125 может соперничать разве только с дешёвеньким A4-3300, остальные же носители микроархитектуры Sandy Bridge выглядят и того хуже. А если к показанным на диаграммах результатам присовокупить отсутствие у видеоядер интеловских процессоров поддержки DirectX 11, то ситуация для текущих решений этого производителя представляется ещё более безнадёжной. Исправить её сможет разве только следующее поколение микроархитектуры Ivy Bridge, где графическое ядро получит и гораздо более высокое быстродействие, и современную функциональность.

Даже если отрешиться от конкретных цифр, и посмотреть на ситуацию качественно, то предложения AMD выглядят куда более привлекательным вариантом для игровой системы начального уровня. Старшие процессоры Fusion серии A8 при определённых компромиссах в части экранного разрешения и настроек качества изображения позволяют играть практически в любые современные игры, не прибегая к услугам внешней видеокарты. Никакие же процессоры Intel для дешёвых игровых систем мы порекомендовать не можем – различные варианты HD Graphics пока ещё для использования в этой среде не доросли.

Энергопотребление

Системы, основанные на процессорах с интегрированными графическими ядрами, завоёвывают всё более широкую популярность не только благодаря открывающимся возможностям по миниатюризации систем. Во многих случаях потребители останавливают свой выбор именно на них, руководствуясь открывающимся возможностям по удешевлению компьютеров. Такие процессоры позволяют не только сэкономить на видеокарте, они позволяют собрать и более экономичную в эксплуатации систему, так как её суммарное энергопотребление окажется заведомо ниже потребления платформы с дискретной графикой. Сопутствующий бонус – более тихие режимы работы, так как уменьшение потребления выливается в снижение тепловыделения и возможность использования более простых систем охлаждения.

Именно поэтому разработчики процессоров со встроенными графическими ядрами стараются минимизировать энергопотребление своих продуктов. Большинство рассмотренных в этой статье CPU и APU имеют расчётное типичное тепловыделение, лежащее в пределах 65 Вт – и это негласный стандарт. Однако, как мы знаем, AMD и Intel подходят к параметру TDP несколько по-разному, а потому оценить практическое потребление систем с различными процессорами будет небезынтересно.

На следующих ниже графиках приводится по две величины энергопотребления. Первая – это полное потребление систем (без монитора), представляющее собой сумму энергопотребления всех задействованных в системе компонентов. Вторая – потребление одного только процессора по выделенной для этой цели 12-вольтовой линии питания. В обоих случаях КПД блока питания не учитывается, так как наша измерительная аппаратура устанавливается после блока питания и фиксирует напряжения и токи, поступающие в систему по 12-, 5- и 3.3-вольтовым линиям. Во время измерений нагрузка на процессоры создавалась 64-битной версией утилиты LinX 0.6.4 . Для нагрузки графических ядер использовалась утилита FurMark 1.9.1 . Кроме того, для правильной оценки энергопотребления в простое мы активировали все имеющиеся энергосберегающие технологии, а также технологию Turbo Core (в тех случаях, где она поддерживается).



В состоянии покоя все системы показали суммарное энергопотребление, находящееся примерно на одном и том же уровне. При этом, как мы видим, процессоры Intel практически не нагружают процессорную линию питания в простое, а конкурирующие решения AMD, напротив, потребляют по 12-вольтовой выделенной на CPU линии до 8 Вт. Но это вовсе не свидетельствует о том, что представители семейства Fusion не умеют впадать в глубокие энергосберегающие состояния. Различия обуславливаются разной реализацией схемы питания: в Socket FM1-системах от процессорной линии питается как вычислительные и графическое ядра процессора, так и встроенный в процессор северный мост, а в интеловских системах северный мост процессора берёт питание от материнской платы.



Максимальная вычислительная нагрузка обнаруживает, что проблемы процессоров AMD с энергетической эффективностью, присущие Phenom II и Athlon II, никуда не делись и с внедрением 32-нм технологического процесса. Llano используют ту же микроархитектуру и точно также с треском проигрывают Sandy Bridge с точки зрения соотношения производительности на каждый затраченный ватт электроэнергии. Старшие Socket FM1-системы потребляют примерно вдвое больше, чем системы с LGA1155-процессорами Core i3 при том, что вычислительная производительность последних явно выше. Разрыв в энергопотреблении Pentium и младших A4 и A6 не такой огромный, но тем не менее, качественно ситуация не меняется.



При графической нагрузке картина почти такая же – процессоры Intel существенно экономичнее. Но в данном случае неплохим оправданием для AMD Fusion может выступать их существенно более высокая 3D-производительность. Заметьте, в игровых тестах Core i3-2125 и A4-3300 «выжимали» одинаковое количество кадров в секунду, и по потреблению при нагрузке на графическое ядро они тоже ушли друг от друга совсем недалеко.



Одновременная нагрузка на все блоки гибридных процессоров позволяет получить результат, который можно образно представить как сумму двух предшествующих графиков. Процессоры A8-3850 и A6-3650, обладающие 100-ваттным тепловым пакетом, серьёзно отрываются от всей остальной массы 65-ваттных предложений AMD и Intel. Впрочем, даже и без них процессоры Fusion менее экономичны, чем решения Intel того же ценового диапазона.



При использовании процессоров в роли основы медиацентра, занятого проигрыванием видео высокого разрешения, складывается нетипичная ситуация. Вычислительные ядра здесь по большей части простаивают, а декодирование видеопотока возлагается на специализированные встроенные в графические ядра блоки. Поэтому платформам на базе процессоров AMD удаётся добиться неплохой энергоэффективности, в целом их потребление не сильно превосходит потребление систем с процессорами Pentium или Core i3. Более того, самый низкочастотный из AMD Fusion, A6-3500 при таком сценарии использования вообще предлагает наилучшую экономичность.

Выводы

На первый взгляд, подвести итог результатам тестов проще простого. Процессоры AMD и Intel со встроенными графическими ядрами проявили совершенно разнородные преимущества, что позволяет рекомендовать либо тот, либо иной вариант в зависимости от планируемой модели использования компьютера.

Так, сильной стороной процессоров семейства AMD Fusion оказалось встроенное в них графическое ядро со сравнительно высокой производительностью и совместимостью с программными интерфейсами DirectX 11 и Open CL 1.1. Таким образом, эти процессоры можно рекомендовать для тех систем, где качество и скорость 3D-графики имеет не самое последнее значение. В то же время входящие в серию Fusion процессоры используют ядра общего назначения, базирующиеся на старой и медленной микроархитектуре K10, что выливается в их невысокое быстродействие в вычислительных задачах. Поэтому, если вас интересуют варианты, обеспечивающие лучшую производительность в обычных неигровых приложениях, смотреть следует в сторону интеловских Core i3 и Pentium даже несмотря на то, что такие CPU снабжаются меньшим количеством вычислительных ядер, нежели конкурирующие предложения AMD.

Конечно, в целом, подход AMD к дизайну процессоров со встроенным видеоускорителем кажется более рациональным. Предлагаемые компанией модели APU хорошо сбалансированы в том плане, что скорость вычислительной части вполне адекватна скорости графики и наоборот. В результате, старшие процессоры линейки A8 вполне можно рассматривать как возможную основу для игровых систем начального уровня. Даже в современных играх такие процессоры и интегрированные в них видеоускорители Radeon HD 6550D могут обеспечить приемлемую играбельность. С младшими же сериями A6 и A4 с более слабыми вариантами графического ядра ситуация сложнее. Для универсальных игровых систем младшего уровня их производительности уже не хватает, поэтому делать ставку на такие решения можно лишь в тех случаях, когда речь идёт о создании мультимедийных компьютеров, на которых будут запускаться исключительно простые в графическом плане казуальные игры или сетевые ролевые игры прошлых поколений.

Однако что бы там ни говорилось про сбалансированность, для ресурсоёмких вычислительных приложений серии A4 и A6 подходят плохо. Находящиеся в рамках того же бюджета представители линейки Intel Pentium могут предложить существенно более высокое быстродействие в счётных задачах. Говоря по правде, на фоне Sandy Bridge лишь о A8-3850 можно говорить как о процессоре с приемлемой скоростью в общеупотребительных программах. Да и то, его неплохие результаты проявляются далеко не везде и к тому же обеспечиваются увеличенным тепловыделением, что понравится далеко не каждому хозяину компьютера без дискретной видеокарты.

Иными словами, очень жаль, что Intel до сих пор не может предложить достойное по производительности графическое ядро. Даже Core i3-2125, оснащённый самой быстрой в арсенале компании графикой Intel HD Graphics 3000, в играх работает на уровне AMD A4-3300, так как скорость в этом случае упирается в производительность встроенного видеоускорителя. Все же остальные интеловские процессоры и вовсе комплектуются в полтора раза более медленным видеоядром, и в 3D-играх выступают очень блекло, зачастую показывая совершенно неприемлемое число кадров в секунду. Поэтому, думать о процессорах Intel, как о возможной основе системы, способной работать с 3D-графикой, мы бы вообще не рекомендовали. Видеоядро Core i3 и Pentium прекрасно справляется с выводом интерфейса операционной системы и с воспроизведением видео высокого разрешения, но на большее оно не способно. Так что наиболее подходящим применением для процессоров Core i3 и Pentium видится использование в системах, где важна вычислительная мощность ядер общего назначения при неплохой энергоэффективности – по этим параметрам никакие предложения AMD с Sandy Bridge конкурировать не могут.

Ну и в заключение следует напомнить о том, что интеловская платформа LGA1155 гораздо перспективнее, чем AMD Socket FM1. Приобретая процессор серии AMD Fusion, вы должны быть морально готовы к тому, что усовершенствовать компьютер на его основе можно будет в очень ограниченных пределах. AMD планирует выпустить ещё лишь несколько моделей Socket FM1 представителей серий A8 и A6 с немного увеличенной тактовой частотой, а выходящие в следующем году их последователи, известные под кодовым именем Trinitу, совместимостью с этой платформой обладать не будут. У Intel же платформа LGA1155 куда более перспективна. Мало того, что гораздо более производительные в вычислительном плане Core i5 и Core i7 можно установить в неё уже сегодня, но и запланированные на следующий год процессоры Ivy Bridge в купленных сегодня материнских платах работать должны.

Процессоры с интегрированной графикой достаточно давно и с переменным успехом борются за место под солнцем. Однако изначально никто и не предполагал, что графические ядра, размещённые на одном полупроводниковом кристалле с CPU, смогут составить конкуренцию дискретным графическим картам. Тем не менее по мере того, как совершенствовались полупроводниковые технологии, производители научились встраивать в процессоры вполне полноценные графические акселераторы, способные ускорять и 3D-графику, и проигрывание видео высокого разрешения, и перекодирование видео. Всё это стало вполне естественным и своевременным ответом на изменения той типичной среды, в которой обитают среднестатистические пользователи компьютеров. Трёхмерная графика сегодня используется повсеместно, даже в Интернете, а уж пройти мимо видеоконтента невозможно при всём желании.

К тому же серьёзное значение приобрели игры, которые стали полноправным и популярным видом массового досуга. Сегмент компьютерных развлечений продолжает расти быстрыми темпами, но серьёзные требования к мощности графических ускорителей предъявляют далеко не все популярные игры. Широким распространением могут похвастать в том числе и сетевые многопользовательские проекты, нужды которых при современном уровне развития технологий вполне могут удовлетворить не только традиционные графические карты, но и интегрированные 3D-ускорители. Поэтому не вызывает удивления вот такая статистика: почти треть продаваемых сейчас персональных компьютеров вообще не имеет дискретного графического ускорителя. Причем существенную долю таких систем составляют и домашние компьютеры, приобретаемые для развлечений.

Мощность графического ядра, которое можно встроить в процессор, ограничивается двумя факторами: размером полупроводникового кристалла GPU и его тепловыделением. Однако с освоением новых производственных технологий и внедрением современных графических архитектур рамки возможностей постепенно расширяются. Сейчас, с повсеместным внедрением техпроцессов с 14-нм нормами, стало возможно совмещать с центральным процессором графический ускоритель, занимающий на кристалле порядка 100 мм 2 . Это сравнимо с площадью, которую занимают GPU актуальных дискретных видеокарт ценовой категории «до $100». Таким образом, всё сводится к тому, что современные процессоры с интегрированной графикой должны быть способны дотянуться как минимум до уровня производительности GeForce GT 1030.

И эти выкладки не врут. Старший представитель семейства Raven Ridge (именно таким кодовым именем компания AMD назвала свой новый проект - процессор Ryzen со встроенным графическим ядром поколения Vega) обещает теоретическую пиковую производительность на уровне 1,76 Тфлопс, что сопоставимо с показателями не только GeForce GTX 1030, но и GeForce GTX 1050! Однако нужно понимать, что на практике графическое быстродействие Raven Ridge, как и любого другого процессора со встроенной графикой, существенно сдерживается пропускной способностью памяти. В то время как бюджетные дискретные графические карты получают собственную специальную память с полосой пропускания свыше 50-100 Гбайт/с, интегрированная графика вынуждена довольствоваться разделяемым с процессором общим двухканальным контроллером памяти, который обычно предлагает в разы худшую пропускную способность, приправленную более высокими задержками.

В некоторых ситуациях данную проблему разработчики решают добавлением в процессор с интегрированной графикой дополнительной буферной памяти. Например, нашумевшие Kaby Lake-G с графикой Radeon RX Vega M будут содержать собственную HBM2-видеопамять объёмом 4 Гбайт. Или другой пример: самые мощные интеловские процессоры со встроенным видеоядром, которые были выпущены до нынешнего момента, Skylake-R, оборудуются 128-мегабайтным виктимным кешем четвертого уровня на основе eDRAM.

Однако в случае Raven Ridge такой подход не годится. Дополнительная буферная память влечёт за собой удорожание конечного продукта, а стратегия AMD заключается в том, чтобы при помощи своих новых предложений предпринять атаку на нижний рыночный сегмент, предложив хороший вариант тем пользователям, которые собирают системы из недорогих CPU и бюджетных GPU. Поэтому в Raven Ridge ставка сделана на интенсификацию возможностей системной памяти. Для нового процессора со встроенным видеоядром инженеры AMD оптимизировали имеющийся контроллер DDR4-памяти, добавили ему поддержку более скоростных частотных режимов и снизили задержки. В результате у компании получился весьма любопытный продукт, который в своей рыночной нише не имеет близких аналогов.

Запуском новых интегрированных процессоров Raven Ridge компания AMD продолжает начатое в прошлом году уверенное возвращение на рынок CPU в роли его полноправного участника. Микроархитектура Zen уже доказала свою жизнеспособность в роли фундамента для производительных чипов, теперь же она должна послужить основой для недорогих массовых интегрированных процессоров, в которые AMD смогла упаковать и свою лучшую на данный момент графическую архитектуру Vega. Как ожидает сама AMD, таким шагом она сможет легко «пересадить» на свои устройства тех пользователей, которые до сих пор довольствовались дискретными графическими картами с ценой менее $100. Цель несколько амбициозная, но, если учесть, какие шаги предприняты для её достижения, вполне реальная.

К тому же очень удачно сложилось, что Raven Ridge пришёл на выручку в очень сложное время. На рынке бушует спровоцированный криптоэнтузиастами дефицит дискретных графических ускорителей, в результате чего купить видеокарту даже начального уровня сегодня можно только по заметно завышенной цене. И это значит, что Raven Ridge могут стать своего рода «палочкой-выручалочкой» для тех пользователей, которые не хотят втридорога переплачивать за видеокарту и либо готовы довольствоваться интегрированными решениями, либо могут позволить себе переждать с их помощью смутные времена. В общем, интерес к Raven Ridge огромен по многим причинам.

Формула Raven Ridge: Zen + Vega

Для того, чтобы понять, что есть Raven Ridge, как компания AMD смогла собрать воедино две свои передовые наработки и почему это потребовало почти года дополнительных инженерных усилий, достаточно посмотреть на то, как выглядит полупроводниковый кристалл новых гибридных процессоров. Вот он:

Вы наверняка помните, что в основе всех процессоров Ryzen, выпущенных до настоящего времени, лежит полупроводниковый кристалл Zeppelin, который собран из двух модулей CCX (Core Complex) и необходимой обвязки. В каждом таком модуле CCX имеется по четыре вычислительных ядра с микроархитектурой Zen и разделяемый кеш третьего уровня объёмом 8 Мбайт. Модули соединяются между собой и с «внеядерными» контроллерами посредством специальной шины Infinity Fabric, представляющей собой улучшенную версию HyperTransport. Таким образом, все Ryzen без встроенной графики, вне зависимости от того, сколько вычислительных ядер в них доступно для пользователя, основываются на едином восьмиядерном кристалле площадью порядка 218 мм 2 , включающем в себя около 4,8 млрд транзисторов.

Понятно, что дополнительно расширять столь крупный кристалл ещё и графическим ядром трудно с производственной точки зрения. Поэтому для того, чтобы выпустить Raven Ridge, инженерам компании AMD пришлось на базе ядер с микроархитектурой Zen спроектировать иной кристалл. В нём графическое ядро заняло место второго четырёхъядерного модуля CCX. В результате площадь кристалла Raven Ridge осталась почти такой же - она составляет 210 мм 2 , а число транзисторов немного подросло — до 4,94 млрд.

«Загнать» Raven Ridge в такие рамки удалось отнюдь не малой кровью. Инженеры AMD были намерены совместить с вычислительными ядрами Zen достаточно производительный вариант графического ядра Vega. Прошлые APU компании, известные под кодовым именем Bristol Ridge, оснащались интегрированным графическим ядром с архитектурой GCN 1.3 (она, например, также использовалась в графических картах R9 Fury) и в максимальных версиях располагали набором из 512 потоковых процессоров. В Raven Ridge, которые изначально позиционировались AMD как продукты принципиально иного уровня, мощность должна была увеличиться на заметную величину, поэтому в новый полупроводниковый кристалл был вписан весьма крупный GPU с 11 вычислительными блоками (CU), что в общей сложности соответствует массиву из 704 потоковых процессоров (SP).

В итоге оставить в Raven Ridge один позаимствованный из Zeppelin старый CCX нетронутым, обеспечив интегрированный процессор четырьмя вычислительными ядрами и 8-мегабайтным L3-кешем, не получилось. В погоне за снижением себестоимости инженерам пришлось несколько урезать и его. В результате объём размещённой в CCX-модуле Raven Ridge кеш-памяти третьего уровня сократился вдвое - до 4 Мбайт. Правда, её ассоциативность при этом не поменялась, а значит, на серьёзное изменение скоростных характеристик L3-кеша рассчитывать не следует.

Тем не менее четырёхкратное по сравнению с «большими Ryzen» сокращение суммарного объёма кеш-памяти третьего уровня на его быстродействии всё-таки сказалось: латентности немного уменьшились. Ниже всё это продемонстрировано на графиках, на которых приведены практически измеренные задержки подсистемы памяти четырёхъядерного Raven Ridge и четырёхъядерного процессора Ryzen 5 1500X, приведённых к единой тактовой частоте 3,8 ГГц.

Латентность L3-кеша в Raven Ridge снизилась примерно на 5 тактов. Они оказались отыграны благодаря упрощению алгоритмов работы, которые теперь обходятся без поддержки когерентности частей кеш-памяти, расположенных в различных CCX.

Попутно обнаруживается и ещё одна любопытная деталь: заметное ускорение в Raven Ridge получил и кеш второго уровня. Его латентность упала с 17 до 13 тактов, хотя это изменение производитель нигде не афишировал.

Указывая на изменение подсистемы кеш-памяти, AMD обещает, что уменьшение объёма L3-кеша в новых процессорах не должно отрицательно сказаться на производительности. Компенсирует негативный вектор не только снижение латентностей, но и тот факт, что Raven Ridge не приходится страдать от сравнительно медленных межъядерных соединений между CCX, выполненных за счет работающей на одной частоте с контролером памяти шины Infinity Fabric. Действительно, в новом процессорном дизайне CCX-модуль только один, и данная внутренняя шина связывает его с графическим ядром и другими «внеядерными» компонентами, но обмена данными между вычислительными ядрами никоим образом не касается.

Это хорошо прослеживается, если сравнить практически измеренные задержки при межъядерном обмене данными у Raven Ridge и Ryzen 5 1500X. Здесь Raven Ridge заметно выигрывает — для четырёхъядерного процессора конструкция с одним CCX выглядит более оптимальной.

В дополнение к улучшениям в системе кеширования в Raven Ridge был оптимизирован и контроллер памяти. Во-первых, в нём добавилась официальная совместимость с модулями DDR4-2933, благодаря чему Raven Ridge стал первым процессором на рынке, поддерживающим столь быструю спецификацию JEDEC. Во-вторых, при прочих равных Raven Ridge работает с памятью эффективнее, чем предшествующие Ryzen. Тесты указывают на не слишком кардинальное, но всё же наблюдаемое невооружённым глазом снижение латентности.

Правда, здесь можно усмотреть и снижение практической пропускной способности, однако этот эффект скорее следует списать на «сырость» BIOS материнских плат. После выхода Raven Ridge производители материнских плат вновь активно обновляют прошивки, и новые версии BIOS действительно привносят в производительность контроллера памяти Raven Ridge дополнительные улучшения.

Таким образом, суммарно изменения в подсистеме памяти Raven Ridge разноплановы, и уменьшившийся L3-кеш вряд ли станет серьёзным недостатком этих процессоров. Но резекции в Raven Ridge подвергся не только он. Был серьёзно урезан и ещё один блок - встроенный в процессор контроллер графической шины PCI Express. Для подключения внешней графической карты в процессорах Raven Ridge полноценный интерфейс PCI Express 3.0 x16 не поддерживается: вместо него предлагается пользоваться усечённой шиной PCI Express 3.0 x8. Впрочем, в случае графических карт не самого верхнего уровня данное ограничение вряд ли способно как-то повлиять на производительность, и единственный момент, который стоит иметь в виду, - это отсутствие совместимости Raven Ridge с мульти-GPU-конфигурациями.

Не работает Raven Ridge и с технологией Dual Graphics, которая поддерживалась в прошлых поколениях APU компании AMD. «Спарить» встроенное графическое ядро Vega с внешней видеокартой с той же архитектурой в единый мульти-GPU-массив напрямую средствами графического драйвера невозможно. Однако совместная работа встроенной графики и внешней видеокарты всё-таки возможна через технологию mGPU, которая является частью DirectX 12. Иными словами, «помочь» внешнему ускорителю встроенная Vega всё же может, при этом совершенно не важно, какая используется дискретная видеокарта, но работать такая связка будет исключительно в DirectX 12.

Семейство Ryzen 2000G: Ryzen 5 2400G и Ryzen 3 2200G

Компания AMD выпустила два варианта Raver Ridge для настольных систем. Оба они основываются на одном и том же дизайне и производятся на предприятиях GlobalFoundries по 14-нм (14LPP) техпроцессу, который применяется и в случае хорошо знакомых нам процессоров Ryzen без встроенной графики. Это значит, что, хотя гибридные новинки и получили модельные номера из двухтысячной серии, более совершенный 12-нм техпроцесс для их выпуска не используется и ничего общего с перспективными процессорами поколения Zen+, выход которых запланирован на апрель, они не имеют.

Старший десктопный Raven Ridge - это четырёхъядерный процессор Ryzen 5 2400G стоимостью $169 с поддержкой технологии SMT и встроенным графическим ядром Vega 11. Его младший собрат, Ryzen 3 2200G, - тоже четырёхъядерник, но без поддержки SMT и с более слабым графическим ядром Vega 8. Подробнее с характеристиками новых процессоров можно ознакомиться в таблице, где мы их поместили рядом с «классическими» четырёхъядерными Ryzen 5 и Ryzen 3.

Ryzen 5 2400G Ryzen 5 1500X Ryzen 5 1400 Ryzen 3 2200G Ryzen 3 1300X Ryzen 3 1200
Кодовое имя Raven Ridge Summit Ridge Summit Ridge Raven Ridge Summit Ridge Summit Ridge
Технология производства, нм 14 14 14 14 14 14
Ядра/потоки 4/8 4/8 4/8 4/4 4/4 4/4
Базовая частота, ГГц 3,6 3,5 3,2 3,5 3,5 3,1
Частота в турборежиме, ГГц 3,9 3,7 3,4 3,7 3,7 3,4
Частота XFR, ГГц - 3,9 3,45 - 3,9 3,45
Разгон Есть Есть Есть Есть Есть Есть
L3-кеш, Мбайт 4 2 × 8 2 × 4 4 2 × 4 2 × 4
Поддержка памяти DDR4-2933 DDR4-2666 DDR4-2666 DDR4-2933 DDR4-2666 DDR4-2666
Интегрированная графика Vega 11 Нет Нет Vega 8 Нет Нет
Число потоковых процессоров 704 - - 512 - -
Частота графического ядра, ГГц 1,25 - - 1,1 - -
Линии PCI Express 8 16 16 8 16 16
TDP, Вт 65 65 65 65 65 65
Сокет Socket AM4 Socket AM4 Socket AM4 Socket AM4 Socket AM4 Socket AM4
Официальная цена $169 $174 $169 $99 $129 $109

Если вспомнить о том, что Raven Ridge основывается на полупроводниковом кристалле с одним CCX-модулем, то совершенно понятно, что более мощных моделей APU от AMD в обозримом будущем ждать не приходится. Никакие Ryzen 7 с интегрированной графикой попросту невозможны. Ryzen 5 2400G полностью раскрывает возможности, которые заложены в разработанный дизайн. Этот процессор использует все четыре процессорных ядра и технологию многопоточности SMT, а также полный набор из 11 вычислительных блоков (CU), имеющиеся во встроенной реализации ускорителя Vega. Стоит отметить, что в результате Ryzen 5 2400G получился даже мощнее мобильного Ryzen 7 2700U, в котором графическое ядро эксплуатирует лишь 10 из 11 вычислительных блоков.

Имеющийся в Ryzen 5 2400G набор из 11 CU транслируется в 704 потоковых процессора, что в количественном выражении на 38 процентов превосходит арсенал, которым обладали решения поколений Kaveri, Carrizo и Bristol Ridge. К этому прикладывается примерно 13-процентный рост частоты графики, увеличенное число блоков текстурирования (с 32 до 44) и растеризации (с 8 до 16), а также новое поколение архитектуры. Vega относится к самому свежему, пятому поколению GCN, в то время как встраиваемые ранее видеоядра имели архитектуру третьего поколения. Всё это в сумме должно обеспечить весомое превосходство старшей новинки над предшественниками по производительности.

Впрочем, здесь уместно будет снова вспомнить о существовании Kaby Lake-G с графикой Radeon RX Vega M. С ними, очевидно, Raven Ridge ни в каких своих проявлениях тягаться не сможет. Благодаря тому, что в интеловском варианте процессоров с графикой Vega видеоядро располагается на отдельном полупроводниковом кристалле, оно значительно мощнее - в нём размещено 24 вычислительных блока и 1536 потоковых процессоров. Кроме того, не стоит забывать и про отдельную HBM2-память объёмом 4 Гбайт, которую Intel также сумела вместить в процессорную упаковку. Поэтому сфера применения у Ryzen и у Kaby Lake-G с графикой Vega будет различаться. Интеловский вариант - это премиальный и дорогой продукт для ноутбуков и ультракомпактных настольных систем класса NUC, AMD же метит в массовый сегмент.

Именно поэтому примечательно, что Ryzen 5 2400G получил рекомендованную стоимость на уровне $169: это позволяет данному процессору стать прямой и улучшенной альтернативой для Ryzen 5 1400. Очевидно, что старый вариант без графики теперь постепенно уйдёт с прилавков, ведь Ryzen 5 2400G превосходит Ryzen 5 1400 по многим базовым параметрам. Помимо наличия встроенного GPU у него выше тактовая частота (3,6 ГГц против 3,2 ГГц - базовая и 3,9 ГГц против 3,4 ГГц - турбо), есть поддержка более скоростной памяти DDR4-2933 и значительно лучше обстоит дело с межъядерным взаимодействием. Фактически Ryzen 5 1400 может быть интереснее только за счёт более вместительного L3-кеша, но стоит напомнить, что в этой модели он тоже урезан с 16 до 8 Мбайт. Таким образом, в подавляющем большинстве сценариев Ryzen 5 2400G будет быстрее и при эксплуатации со внешней графической картой.

Не хуже, чем 169-долларовый Ryzen 5 2400G, смотрится в своей нише и Ryzen 3 2200G. С точки зрения базовых характеристик этот процессор - типичный Ryzen 3: он располагает четырьмя вычислительными ядрами без SMT и имеет номинальную частоту 3,5 ГГц с возможностью авторазгона до 3,7 ГГц. Но ко всему этому добавлено сравнительно производительное графическое ядро Vega 8, а стоимость установлена на уровне $99, что делает данное предложение не только привлекательным гибридным APU, но и самым дешёвым Ryzen вообще. То есть даже если забыть о наличии в Ryzen 3 2200G неплохой графики, он уникален уже тем, что предлагает четыре производительных x86-ядра по цене ниже $100. Других подобных по щедрости предложений на данный момент попросту не существует.

Что же касается встроенного в Ryzen 3 2200G ускорителя Vega 8, то этот вариант GPU предлагает 512 потоковых процессоров, то есть он как минимум не уступает графике из APU прошлых поколений, которые AMD реализовывала под именами A10 и A12 по цене, существенно выходящей за 100-долларовый уровень.

Несмотря на то, что процессоры Ryzen с графикой Vega получили достаточно высокие тактовые частоты, AMD удалось удержать их тепловыделение в разумных рамках. Типичное тепловыделение Ryzen 5 2400G и Ryzen 3 2200G составляет 65 Вт — это большое достижение на фоне того, что наиболее быстрые десктопные APU компании ранее могли иметь расчётное тепловыделение на уровне 95 Вт. И даже больше того, в Raven Ridge при одновременной нагрузке на вычислительную и графическую части процессора частота ядер обоих типов не сбрасывается ниже номинальных значений, как это было принято в APU прошлых поколений. В рамках заявленного теплового пакета без каких-либо ухищрений способен оставаться даже старший Ryzen 5 2400G.

Отдельно следует упомянуть о том, что управлением тактовыми частотами в Raven Ridge занимается обновлённая технология Precision Boost 2. В ней реализован усовершенствованный и более агрессивный алгоритм, благодаря которому турборежим в новых процессорах с интегрированным графическим ядром включается чаще, чем раньше. Кроме того, при неполной нагрузке на часть ядер активнее задействуются промежуточные частоты между базовым и максимальным значением. Иными словами, подстройка под конкретную нагрузку в Ryzen 5 2400G и Ryzen 3 2200G стала чувствительнее, чем была ранее.

Однако технология XFR, которая позволяла дополнительно накинуть частоту в том случае, когда процессор эксплуатировался в благоприятном температурном режиме, в Raven Ridge отсутствует.

Установить новые процессоры семейства Raven Ridge можно в те же Socket AM4-материнские платы, в которых работают прочие Ryzen. Единственное ограничение - в совместимых платах должен использоваться обновлённый BIOS: для Raven Ridge требуются версии, собранные на основе библиотек AGESA 1.0.7.1 или более поздних. Иными словами, никаких дополнительных расходов новые CPU с интегрированной графикой не требуют. Они приходят в уже имеющуюся и широко распространённую платформу.

Говоря о том, насколько привлекательное сочетание цены и производительности получили новые десктопные Raven Ridge, нельзя обойти вниманием и тот факт, что коробочные версии Ryzen 5 2400G и Ryzen 3 2200G поставляются с комплектным кулером Wraith Stealth, стоимость которого тоже входит в озвученные 169 и 99 долларов.

Конечно, такой кулер не имеет отношения к высокоэффективным решениям для охлаждения, но с отводом тепла от 65-ваттных процессоров он точно справится и позволит при построении системы на Raven Ridge сэкономить дополнительную пару десятков долларов. И даже более того, возможностей этого кулера наверняка хватит и для умеренного разгона.

19.04.2014 0 25889

Бывали времена, когда ПК не мог запустить ни одну приличную игру, если не обладал дискретной видеокартой . Сегодня большинство готовых к продаже компьютеров и почти все ноутбуки полагаться на интегрированные в центральные процессоры графические решения . И всё же рынок дискретной графики продолжает процветать. Если вы не играете в тяжёлые игры класса ААА, является ли видеокарта стоящим апгрейдом? Чтобы узнать ответ, давайте сравним производительность интегрированных и дискретных графических процессоров.

AMD и Intel значительно улучшили качество интегрированной графики . APU Kaveri от AMD используют то же мощное графическое ядро GCN, что и в своих лучших дискретных видеокартах серии Radeon.

Intel также обновила функции и возможности своих графических систем HD-серии, которые встроены в процессоры Core четвёртого поколения (кодовое название Haswell). В настоящее время они обеспечивают более широкую поддержку Microsoft DirectX 11.1, могут поддерживать несколько дисплеев (включая с разрешением 4K), и совместимы с большинством игр.

Чтобы определить преимущества дискретной видеокарты, были собраны два компьютера. Один работает на A8-7800 Kaveri с интегрированным графическим процессором серии Radeon R7, а другой на процессоре Intel Core i7- 4670 Haswell с интегрированным Intel HD 4600. Затем были проведены тесты с и без дискретной видеокарты на борту каждой системы.

Аргумент в пользу дискретной графики

За дискретную графику говорит её производительность. Все, кроме видеокарт начального класса, имеют гораздо более мощный GPU, чем интегрированные в процессоры. Более того, отдельная видеокарта обеспечит GPU выделенным пулом высокоскоростной памяти . Интегрированный же GPU должен довольствоваться совместным использованием системной памяти и шины данных. Обычно с дискретной картой можно выставить настройки графики в играх выше, чем с интегрированными решениями.

Есть и другие преимущества от использования дискретных видеокарт. На видеокартах Nvidia текущего поколения пользователи могут задействовать фирменные технологии Shadowplay и PhysX . ShadowPlay оптимизирует использование движков видеокодирования, встроенных в графические процессоры NVIDIA, для записи и потокового вещания игр в режиме реального времени, с незначительным воздействием на частоту кадров. Это ключевая особенность портативного игрового устройства Nvidia Shield.

PhysX является фирменной технологией моделирования физики, которая заставляет объекты в играх вести себя более приближённо к реальности. PhysX поддерживается далеко не всеми играми, но может иметь огромное визуальное воздействие на поддерживаемые.

Игры - не единственные приложения, которые извлекают пользу от производительности дискретного GPU. Графические процессоры от AMD и Nvidia состоят из тысяч процессоров, которые могут выполнять несколько операций одновременно. Любое приложение может получить прирост скорости от такой параллельной обработки, будь то программы редактирования изображений, как Photoshop, шифрования данных или проекты распределённых вычислений, как Folding @ Home или SETI @ Home.

Дискретные видеокарты могут ускорить добычу криптографической валюты Bitcoins, Litecoins и прочих. Майнеры скупили последние видеокарты от AMD, поскольку архитектура Radeon здесь оказалась более эффективной, чем процессоры Intel и видеокарты Nvidia. Где процессор Intel Haswell Core i7-4770K способен переработать около 93 тыс. хэшей в секунду, AMD Radeon R9 290X делает около 880 тыс. хэшей в секунду.

Аргумент против дискретной графики

Есть недостатки и у дискретных видеокарт, и главный - цена. Покупка видеокарты обойдется от пары тысяч рублей до 30 тысяч и больше. AMD недавно анонсировала самую производительную видеокарту. Radeon R9 295X2 имеет два графических процессора Tahiti XT на одной карте и стоит она $1500.

AMD и Intel почти полностью отказались от процессоров без интегрированной графики (только серия FX от AMD и чипы Ivy Bridge-E Intel не обладают ей), и материнские платы, которые поддерживают эти процессоры, имеют встроенный видеовыход.

Дискретная видеокарта также добавляет системе сложности. Материнская плата должна иметь свободный слот PCIe x16 для установки видеокарты. Обычно в системном блоке он имеется, хотя у некоторых уже готовых небольших компьютеров его может и не оказаться, или карта может не поместиться внутри корпуса. Или блок питания не сможет поддерживать требования карты. Всё это потому, что производители ПК не предполагали, или просто не позаботились о том, чтобы конечный пользователь смог сделать апгрейд.

Установка дискретной видеокарты с процессорами Intel может усложнить использование таких технологий, как движок видеокодирования Quick Sync. Quick Sync связан с интегрированным графическим ядром Intel, и установка дискретной карты может отключить его. К счастью, его можно снова активировать.

Но за всё приходится платить. Внешняя видеокарта повысит уровень энергопотребления, будет генерировать тепло, для отвода которого потребуется вентилятор (на некоторых картах даже три вентилятора), а это повысит уровень шума системы в целом. Существуют и пассивные системы охлаждения, но они подойдут только для карт начального уровня и стоят дороже.

Переходим к числам

Были собраны два компьютера: на APU AMD A8-7600 с Radeon R7 iGPU на материнской плате Asus A88X-Pro, и на Intel Core i5-4670 с Intel HD 4600 на плате Gigabyte Z87X-UD5 TH. Обе системы были оснащены 16 Гб памяти, твердотельным накопителем Samsung 840 Pro SSD и 1000-ваттным блоком питания Silverstone, операционная система - 64-разрядная ОС Windows 8.1 Pro.

Была проведена серия тестов, включая игры и приложения для создания контента, с применением только интегрированных GPU. После в системы установили видеокарту Radeon R9 280Х производства от XFX и тесты были проведены повторно.

Как видно из графиков, наличие дискретной видеокарты улучшает производительность почти по всем направлениям, и не только в играх. В PCMark 8, например, были запущены версии Home и Work с поддержкой OpenGL. Этот интерфейс использует все доступные вычислительные ресурсы компьютера, и центральный процессор, и графический. Добавление дискретной видеокарты увеличило производительность системы в этом бенчмарке на 3-19% (рисунок 1).

В многопоточном тесте Cinebench видеокарта оказала мало влияния, зато с OpenGL в системе с процессором Intel видеокарта дала прирост производительности на 79%, в системе AMD - 42% (рисунок 2).

Многие считают, что люди, играющие в простенькие игры - Farmville, Angry Birds и т.п. - не получат от дискретной графики никакой пользы. Но добавление видеокарты дало значительный прирост производительности в ориентированном на работу с HTML5 бенчмарке Fishbowl. Данный тест ограничен частотой в 60 кадров в секунду (частота обновления большинства мониторов), и эта величина была достигнута в трёх из четырёх тестов с дискретной картой (рисунок 3). «Казуальные» игры становятся всё сложнее, соответственно растут их требования к видеокартам.

Говоря о сложных играх, видеокарты дали заметный прирост в BioShock Infinite на разрешении 1920 х 1080 пикселей (рисунок 4) и синтетическом игровом тесте 3DMark Fire Strike.

Есть область, где добавление дискретного видеоадаптера не имело значительного влияния: воспроизведение видео. Было заметно крайне малое влияние на центральный процессор при запуске как видео с YouTube (HTML5), так и файлов с кодеком H.264 в контейнере MKV.

Вывод: почти каждый пользователь настольного ПК может извлечь выгоду из видеокарты. Пригодятся они не только геймерам, хотя, естественно, они получают основную пользу.

P.S. Если у вас возникли проблемы с техникой, обращайтесь в наш компьютерный сервис , либо закажите выезд

Проблемы при регистрации на сайте? НАЖМИТЕ СЮДА ! Не проходите мимо весьма интересного раздела нашего сайта - проекты посетителей . Там вы всегда найдете свежие новости, анекдоты, прогноз погоды (в ADSL-газете), телепрограмму эфирных и ADSL-TV каналов , самые свежие и интересные новости из мира высоких технологий , самые оригинальные и удивительные картинки из интернета , большой архив журналов за последние годы, аппетитные рецепты в картинках , информативные . Раздел обновляется ежедневно. Всегда свежие версии самых лучших бесплатных программ для повседневного использования в разделе Необходимые программы . Там практически все, что требуется для повседневной работы. Начните постепенно отказываться от пиратских версий в пользу более удобных и функциональных бесплатных аналогов. Если Вы все еще не пользуетесь нашим чатом , весьма советуем с ним познакомиться. Там Вы найдете много новых друзей. Кроме того, это наиболее быстрый и действенный способ связаться с администраторами проекта. Продолжает работать раздел Обновления антивирусов - всегда актуальные бесплатные обновления для Dr Web и NOD. Не успели что-то прочитать? Полное содержание бегущей строки можно найти по этой ссылке .

AMD Trinity для десктопа. Часть 1. Графическое ядро

Анонс: На APU Llano возлагались большие надежды, но оправдались они лишь частично – в сегменте ноутбуков. AMD не теряет надежды: новые APU Trinity уже вышли для мобильных платформ, а теперь появились и для десктопов. Мы протестировали второе поколение десктопных APU и в этом обзоре расскажем как об их архитектуре, так и о графической производительности

Ни у кого не возникает сомнений в том, что наиболее быстродействующие процессоры для персональных компьютеров поставляет на сегодняшний день отнюдь не компания AMD. И такая ситуация сложилась далеко не вчера. С тех пор как Intel перешла от Pentuim 4 к выпуску различных процессоров рода Core, предложения AMD скатились на вторые позиции. Фактически вся сегодняшняя процессорная продукция этой компании представляет собой либо бюджетные, либо какие-то узкоспециализированные решения, малоинтересные для широкого круга пользователей, ставящих высокую производительность во главу угла. Однако невысокие показатели быстродействия выпускаемых процессоров, так же как и сокращение рыночной доли, - это совсем не повод поставить крест на результатах работы процессорного подразделения AMD.

Инженеры этой фирмы славятся тем, что способны время от времени выдавать какие-то оригинальные идеи, позволяющие AMD не просто поддержать своё рыночное положение, но и оказать немалое влияние на всю индустрию в целом. За примерами таких идей далеко ходить не надо: 64-битные расширения микроархитектуры x86, многоядерный дизайн CPU, интеграция в процессор контроллера памяти и северного моста чипсета - все эти решения первой разработала и внедрила именно AMD, а не текущий лидер процессоростроения.

Именно поэтому мы продолжаем пристально следить за тем, какие нововведения вызревают в недрах AMD. И похоже, к настоящему моменту компания вновь нащупала плодотворный вектор развития, который способен придать положительный импульс не только ей самой, но и всему процессорному рынку в целом. Вектор этот - APU (Accelerated Processing Unit, «ускоренное процессорное устройство») - идеология, предусматривающая объединение на одном полупроводниковом кристалле традиционных вычислительных ядер с производительным графическим ядром. Причём не простое соседство, а симбиоз - возможность объединения их ресурсов для решения общих задач.

К классу APU можно отнести несколько разнообразных предложений AMD, выпущенных ещё в 2011 году. Наибольший интерес среди них представляют гибридные процессоры A-серии с кодовым именем Llano, служащие базисом платформ Lynx и Sabine и ориентированные на применение в широком спектре настольных и мобильных систем. Несмотря на то, что эти процессоры и платформы служат лишь «пробным шаром», так как на них происходит только обкатка принципов APU, они были достаточно тепло приняты рынком. Особенно востребованными Llano оказались в мобильном сегменте, что тут же отразилось в увеличении присутствия продукции AMD в современных ноутбуках. И это действительно видно невооружённым глазом. Если ещё пару лет назад мобильные платформы AMD встречались в составе очень немногочисленных предложений, то сегодня купить ноутбук, основанный на процессоре этого производителя, не составляет никакого труда. В любом компьютерном магазине вы с лёгкостью найдёте огромное число предложений, оснащённых APU разработки AMD.

Впрочем, повышенный интерес к процессорам AMD, наблюдаемый на рынке мобильных компьютеров, возник вовсе не из-за их гибридности. Его, скорее, следует понимать как побочный эффект. В реальности же дело в том, что достаточно мощное графическое ядро, скомпонованное с приемлемыми по меркам мобильных решений вычислительными ядрами, - это как раз то, чего не хватает в ассортименте Intel. А если принять во внимание очень демократичные цены, установленные компанией AMD на свои APU, то совершенно неудивительно, что в недорогие ноутбуки они вписались идеально, дав тем самым производителям оных возможность собирать компьютеры современного уровня без установки в них дискретных видеоускорителей и сопряженных с этим дополнительных затрат.

В результате в народ пошла и сама концепция APU. Её проповедники от AMD, общаясь с разработчиками программного обеспечения, получили возможность опираться на актуальность и распространённость, и в конце концов в распоряжении пользователей появились и реальные программы, рассчитанные на полноценное использование ресурсов гибридных процессоров. Майское же обновление A-серии мобильных процессоров AMD дизайном Trinity, в рамках которого была увеличена производительность как вычислительной, так и графической частей APU, стало дополнительным аргументом в пользу жизнеспособности и привлекательности концепции. Так что в дальнейшем доля ноутбуков с логотипом AMD Vision будет только увеличиваться.

С десктопными же процессорами AMD класса APU случилась совсем иная история. Требования пользователей настольных систем существенно отличаются от запросов владельцев ноутбуков, и тема APU их особо не заинтересовала с самого начала. Движущей силой проникновения первых поколений гибридных процессоров в ноутбуки выступала достаточно мощная графика, однако при её использовании в настольных компьютерах от этого эпитета нужно отказаться. Дело в том, что для десктопов характерны гораздо более высокие разрешения экрана, в которых процессоры AMD A-серии приемлемого уровня 3D-производительности не развивают. Иными словами, с точки зрения пользователей десктопов графическое ядро процессоров Llano качественно мало отличается от встроенной графики интеловских предложений: оба варианта для геймерской системы начального уровня подходят почти одинаково плохо. Мощность же вычислительных ядер, которыми располагают гибридные процессоры AMD, существенно ниже, чем у процессоров Intel, и это закрывает Llano путь в целый ряд домашних или офисных систем. Даже в роли сердца медиацентров у APU компании AMD не слишком много шансов перед конкурирующими предложениями. В этом случае их подводит слишком высокое тепловыделение и отсутствие средств, позволяющих ускорять кодирование видеоконтента высокого разрешения.

Однако самым грандиозным препятствием на пути Llano в настольные компьютеры стала специально разработанная для них платформа Socket FM1 с совершенно неясными перспективами. Никакие иные процессоры, кроме Llano, установить в неё невозможно, и это делает её «вещью в себе», с одной стороны, не склонной к последующему апгрейду, а с другой - с очень ограниченным сроком жизни. Вполне закономерно, что заинтересовать решением с таким сочетанием характеристик пользователей настольных систем практически невозможно, ведь рынок наводнён конкурирующими LGA1155-предложениями на любой вкус и кошелёк с куда более продолжительным жизненным циклом.

Но отдавать рынок интегрированных настольных процессоров во власть конкурента, который, видя перспективность концепции APU, в спешном порядке наращивает мощности собственных графических ядер, в планы AMD явно не входит. Поэтому, спустя примерно год с появления Llano, компания готова предложить второе поколение десктопных процессоров A-серии, исправленное и переработанное. Дизайн новых десктопных APU не является специализированным и утилитарным. Это - Trinity, и он уже обкатан на мобильных системах, где успешно применяется с начала лета. Однако для настольных систем серьёзно увеличены частоты вычислительной и графической составляющих, что позволяет производителю уверять общественность в том, что свежие APU, в отличие от их предшественников, должны понравиться многим пользователям десктопов, в том числе и энтузиастам.

В целом мы почти готовы поверить в слова AMD: по крайней мере, по дизайну Trinity однозначно лучше Llano. Как мы уже видели на примере мобильных APU , используемые в Trinity вычислительные ядра, которые основаны на микроархитектуре Piledriver, работают побыстрее ядер Husky из Llano, корни микроархитектуры которых уходят в далёкое прошлое. Существенно поднялась и производительность графического ядра, строение которого коренным образом переработано. И самое главное, для десктопных процессоров Trinity теперь предлагается новая платформа Socket FM2, которая должна быть лишена всех старых недостатков. AMD готова гарантировать её устойчивость в течение нескольких последующих лет, а модельный рад процессоров в совместимом с ней исполнении будет включать широкий диапазон предложений разного уровня.

Иными словами, если сравнивать Trinity и Llano, то новые процессоры очевидно лучше. Однако достаточно ли они хороши для того, чтобы результативно продвинуть концепцию APU в настольные системы, пользователи которых пока что относятся к подобным решениям очень скептически? В нашем материале мы попробуем частично дать ответ на этот вопрос, для чего подробно протестируем графическую составляющую настольных гибридных процессоров нового поколения и попробуем понять, хватает ли её мощности для применения в игровых системах начального уровня.

К сожалению, подробное рассмотрение второй части Trinity - вычислительных ядер - мы вынуждены отложить на некоторое время. Однако в этом нет нашей вины. Дело в том, что компания AMD пока официально не анонсировала свои новые процессоры A-серии для настольных систем. Поэтому наши руки частично связаны обязательствами о неразглашении, так что за этой статьей последует и вторая, включающая тесты другого плана. Впрочем, никто не запрещает нам оперировать имеющейся информацией о микроархитектуре Trinity, поэтому для начала давайте проанализируем, какую работу проделали инженеры AMD для того, чтобы новоиспечённые APU стали реальностью.

Дизайн Trinity

В соответствии с оригинальной концепцией любой APU состоит из трёх основных частей. В этом плане Trinity не привносит никаких изменений: гибридные процессоры нового поколения включают процессорные ядра, интегрированный графический ускоритель и небольшой, но очень важный компонент - объединённый северный мост. Именно он превращает сумму разнородных ядер в единую систему и, включая контроллер DDR3 SDRAM, отвечает за взаимодействие вычислительных и графических ядер между собой и с системной памятью, обеспечивая возможность их совместной работы с одними и теми же данными.

В целом общая структура Trinity осталась точно такой же, как и у Llano, но вот на более низком уровне все составляющие переработаны. При этом все изменения сделаны таким образом, чтобы не раздувать полупроводниковый кристалл: производственная технология у AMD не обновилась, компания продолжает использовать 32-нм процесс Globalfoundries с SOI, а поднимать себестоимость APU, позиционируемых в качестве достаточно доступных предложений, производитель не собирается. В результате площадь кристалла Trinity по сравнению с Llano возросла лишь на 8 процентов - до 246 мм 2 . Количество транзисторов изменилось также весьма незначительно и достигло 1,303 млрд штук (было - 1,178 млрд). Более того, не сильно трансформировалось даже деление транзисторного бюджета между вычислительными и графическими ресурсами: они занимают на кристалле примерно одинаковую площадь и в том и в другом случае.

Тем не менее на этом разговоры о похожести Llano и Trinity можно и закончить. Вычислительные ядра, например, с выходом нового поколения APU изменены кардинально. Теперь в основе гибридных процессоров используется (и будет использоваться в дальнейшем) микроархитектура Bulldozer, а конкретнее, её второе поколение - Piledriver. Двухъядерники и четырёхъядерники Trinity включают в себя один или два условно называемых двухъядерными модуля, которые, напомним, содержат по два набора исполнительных устройств и могут обрабатывать по два потока одновременно, но при этом имеют общие на модуль кеш-память, блок выборки инструкций, их декодер и блок операций с плавающей точкой. При этом в Trinity по сравнению с основанными на микроархитектуре Bulldozer процессорами класса FX без встроенной графики не только уменьшено количество ядер, но и отсутствует кеш третьего уровня.

Зато используемое в новых APU второе поколение микроархитектуры Bulldozer, пока что не представленное ни в одном другом семействе процессоров, предлагает целый ряд небольших усовершенствований, направленных на увеличение производительности, уменьшение токов утечки и обеспечение стабильности на высоких тактовых частотах. Фронтальная часть конвейера получила более точный предсказатель ветвлений, а также окно инструкций увеличенного размера. Исполнительные устройства обрели улучшенный планировщик, а сами они научились немного быстрее выполнять отдельные инструкции, например целочисленное и вещественночисленное деление. Кроме того, разработчики говорят об увеличении ёмкости L1 TLB и о совершенствовании алгоритмов арбитража и предварительной выборки данных L2-кеша. Всё это оценено в примерно 25-процентное превосходство (по расчётам AMD) процессоров Trinity над Llano в вычислительной производительности.

Кардинальные изменения затронули и объединённый северный мост. В первую очередь инженеры пересмотрели систему приоритетов доступа к разделяемой памяти, отдав первенство вычислительным ядрам, которые, как показывает практика, генерируют относительно небольшую часть запросов. Помимо этого, AMD позаботилась и о поддержке новых типов памяти, включая DDR3-1866 в штатном режиме или DDR3-2400 при разгоне. Внутренние шины данных были расширены, в частности, графическое ядро получило возможность работать с контроллером памяти по 256-битной специализированной шине Radeon Memory Bus, а вне чипа все соединения теперь используют протокол PCI Express, пришедший на смену Hyper-Transport.

Однако наибольший интерес вызывают изменения, произошедшие с графическим ядром. Дело в том, что без существенного увеличения транзисторного бюджета и без коренной переработки архитектуры у AMD получилось заметно поднять его быстродействие, то есть фактически нарастить плотность полезных блоков в GPU за счёт упразднения каких-то излишков. Эта находка, пожалуй, заслуживает отдельного разговора, тем более что именно интегрированная в Trinity графика сегодня находится в фокусе нашего внимания.

Графическое ядро Devastator

Самый интригующий факт, касающийся дизайна Devastator, - а именно такое кодовое имя получил GPU, встроенный в процессоры Trinity, - это то, что он основывается на архитектуре VLIW4. Если учесть, что графическое ядро Llano базировалось на архитектуре VLIW5, такой ход AMD кажется несколько странным, и мы бы скорее ожидали увидеть в Trinity архитектуру CGN, характерную для последних версий дискретных ускорителей. Однако на самом деле именно VLIW4 позволяет увеличить удельную эффективность графического ядра, искусственно ограниченного числом транзисторов. Такой трюк AMD уже проворачивала с собственными видеокартами серии Radeon HD 6900, и тогда его результаты были более чем удовлетворительными.

Суть в том, что предусмотренная VLIW5 группировка ALU по пять штук на потоковый VLIW-процессор оказывается не очень эффективной, и один из ALU в большом числе случаев просто простаивает. Поэтому VLIW4-компоновка Devastator, предполагающая наличие четырёх ALU в потоковом VLIW-процессоре, влечёт за собой более рациональное задействование имеющихся ресурсов. Конечно, обратной стороной выступает уменьшение суммарного числа исполнительных устройств и снижение теоретической пиковой производительности ядра, однако практическая удельная производительность в пересчёте на квадратный миллиметр растёт. А для кристалла гибридного процессора, на котором, помимо графического ядра, находятся вычислительные ядра, это - наиболее правильный путь оптимизации.

В общей сложности в графическом ядре Trinity предусмотрено шесть SIMD-движков, каждый из которых состоит из четырёх текстурных блоков и шестнадцати потоковых VLIW-процессоров. В сумме это даёт наличие в ядре 384 ALU, и это - на 16 штук меньше, чем имелось в распоряжении графического ядра Sumo процессоров Llano. Однако простая арифметика здесь не вполне уместна, ALU-блоки Devastator обычно загружены работой сильнее, чем их предшественники, а, кроме того, относительная простота потоковых VLIW-процессоров позволяет выставлять графическому ядру более высокие тактовые частоты. Например, в то время как в старшей версии Llano графика работала на частоте 600 МГц, у Trinity скорость видеоядра может достигать 800 МГц.

Если учесть, что в распоряжении Devastator есть 24 блока текстурирования (по 4 TMU на каждый SIMD-движок) и 8 блоков растровых операций (ROP), то можно заключить, что это графическое ядро фактически представляет собой примерно одну четверть GPU класса Radeon HD 6970. Что даже с учетом поправки на немного более низкую рабочую частоту и на отсутствие выделенной шины памяти с высокой пропускной способностью - очень неплохо. Иными словами, говоря, что процессоры Trinity оснащены интегрированной графикой «дискретного» класса, AMD совсем не лукавит. От гибридных процессоров нового поколения действительно можно ожидать очень неплохой 3D-производительности.

Вряд ли кого-то удивит то, что графическое ядро Trinity совместимо с современными программными интерфейсами DirectX 11, OpenCL 11 и DirectCompute 11. Эти возможности были и у видеокарт Radeon HD 6900, основанных на той же архитектуре, и у предшественников Trinity - процессоров Llano. Но при этом в новой встроенной графике унаследованы и некоторые черты совсем современных решений, в которых нашла своё место архитектура CGN. В частности, в Devastator имеется усовершенствованный блок тесселяции, а также поддержка всех актуальных типов полноэкранного сглаживания: SSAA, EQAA и MLAA.

Отдельное внимание в графике Trinity уделено актуальным для гибридных процессоров медийным возможностям. Графическое ядро располагает позаимствованным из свежих версий GPU специализированным блоком AMD HD Media Accelerator, который включает в себя движки для аппаратного декодирования видео (UVD3) и аппаратного кодирования видеоконтента в формат H.264 (VCE). Последняя возможность очень важна для успешной конкуренции Trinity с интеловскими гибридными процессорами, давно получившими технологию Quick Sync для высокоскоростного транскодирования видео высокого разрешения. Теперь нечто подобное есть и в процессорах AMD, однако на данный момент мы так и не смогли убедиться в работоспособности движка VCE по причине проблем с его поддержкой в драйверах и в существующем программном обеспечении.

Выводя на рынок настольных систем свой новый гибридный процессор, в AMD задумались и над тем, чтобы его пользователи не чувствовали себя обделёнными по сравнению с владельцами дискретных видеокарт в части возможностей подключения мониторов. Выражается это в том, что к интегрированной системе с процессором Trinity можно подключить до четырёх независимых дисплеев одновременно, при этом поддерживаются все типы соединений: аналоговый — VGA — и цифровые — DVI, HDMI и Display Port 1.2, а также четыре независимых аудиопотока. Правда, при этом количество физических выводов ограничено тремя, а для подключения четырёх дисплеев потребуется соединение пары мониторов «цепочкой» через Display Port.

Что впечатляет ещё сильнее, графика Trinity поддерживает и технологию Eyefinity. Конечно, для того чтобы найти какую-нибудь игру, способную работать с приемлемым уровнем FPS на подключенных к Devastator трёх-четырёх мониторах, придётся потрудиться, но само наличие такой возможности говорит о том внимании, с которым разработчики AMD подошли к оснащению APU второго поколения перед его выводом на массовый рынок.

Модельный ряд Trinity

Говоря о графическом ядре десктопных процессоров Trinity, необходимо коснуться и состава их модельного ряда. Дело в том, что различные представители A-серии с дизайном Trinity могут быть снабжены различающимися вариантами ядра Devastator. Их различия образуются стандартно: пытаясь ввести сегментирование своих продуктов по различным ценовым категориям, производитель в младших модификациях отключает один или несколько SIMD-движков. В результате подробно описанным в предыдущем разделе набором ресурсов, включающим 384 исполнительных устройства, обладают лишь старшие модификации APU.

Номенклатура моделей Trinity при этом выглядит следующим образом. Наиболее скоростные модели с полноценным ядром Devastator, которое имеет маркетинговое название Radeon HD 7660D, относятся исключительно к новой флагманской серии A10. Все же остальные модификации с графическими ядрами с урезанным количеством потоковых процессоров и с пониженными частотами принадлежат к более «простым» сериям A8, A6 и A4, заменяя в них процессоры со старым дизайном Llano.

Полный состав линейки APU, основанной на дизайне Trinity, приводится в таблице:

Спецификации APU Trinity
Модельный номер A10-5800K A10-5700 A8-5600K A8-5500 A6-5400K A4-5300
Встроенная графика HD 7660D HD 7660D HD 7560D HD 7560D HD 7540D HD 7480D
TDP, Вт 100 65 100 65 65 65
Число унифицированных шейдерных процессоров 384 384 256 256 192 128
Частота GPU, МГц 800 800 760 760 760 723
Количество ядер 4 4 4 4 2 2
Частота CPU, ГГц (базовая/турбо) 3,8 / 4,2 3,4 / 4,0 3,6 / 3,9 3,2 / 3,7 3,6 / 3,8 3,4 / 3,6
L2-кеш, Мбайт 4 4 4 4 1 1
Максимальная частота памяти DDR3-1866 DDR3-1866 DDR3-1866 DDR3-1866 DDR3-1866 DDR3-1600

Даже версия графического ядра, устанавливаемая в процессоры класса A8, чисто теоретически медленнее полноценного Devastator более чем на 35 процентов. Что уж говорить о ещё более медлительных A6 и A4. А это значит, что для использования в качестве игрового решения интерес представляют в первую очередь процессоры A10-5800K и A10-5700. Именно их можно пытаться представить себе в геймерских системах начального уровня, лишённых дискретной видеокарты. Процессоры же младших серий, пожалуй, для универсальных игровых компьютеров подходят совсем плохо, поэтому их рекомендуется применять в мультимедийных центрах или в домашних развлекательных системах, не нацеленных на запуск ресурсоёмких игровых 3D-приложений.

Именно поэтому в данном материале мы сосредоточились на тестировании самого старшего гибридного процессора — A10-5800K, со встроенным в него графическим ядром Radeon HD 7660D. Этот процессор имеет в своём распоряжении два модуля Piledriver, благодаря чему распознаётся диагностическими утилитами и операционной системой как четырёхъядерный. Однако отметим и существование альтернативного мнения, согласно которому этот процессор - двухъядерный, но с возможностью выполнения четырёх потоков. Собственно, это мнение, хотя и противоречит заявлениям самой AMD, как раз более точно отражает позиционирование A10-5800K. По своей стоимости этот APU попадает в ту же ценовую категорию, что и интеловские Core i3, которые, как известно, двухъядерники, но с поддержкой технологии Hyper-Threading.

Рабочая частота рассматриваемого процессора, с учетом поддержки им технологии Turbo Core 3.0, должна колебаться в пределах от 3,8 до 4,2 ГГц. Однако на практике мы видели, что под нагрузкой большую часть времени A10-5800K проводит в промежуточном состоянии - при частоте 4,0 ГГц.

Встроенное в A10-5800K графическое ядро Radeon HD 7660D работает на частоте 800 МГц, причём в моменты отсутствия 3D-нагрузки она снижается до 300 МГц. Несмотря на то, что AMD обещала функционирование турборежима и для графического ядра, в реальности выше заложенных в спецификациях 800 МГц его частота не поднимается.

Как мы тестировали

В рамках этого материала мы поставили перед собой цель исследовать производительность графического ядра новых гибридных процессоров AMD и, опираясь на полученные результаты, ответить на вопрос: могут ли самые современные процессоры с интегрированной графикой использоваться в составе игровых систем начального уровня без добавления дискретных видеокарт.

В тестировании процессору AMD A10-5800K c графическим ядром Radeon HD 7660D противопоставлялись другие присутствующие на рынке интегрированные чипы, обладающие 3D-графикой с приемлемым уровнем производительности. Во-первых, это – хоть и устаревающие с появлением Trinity, но всё ещё актуальные AMD Llano, представленные в наших тестах старшим процессором этого семейства, AMD A8-3870K с видеоядром Radeon HD 6550D. Во-вторых – представители семейства Intel Ivy Bridge, максимальная версия графического ядра которых, HD Graphics 4000, обладает многообещающей (по мнению его разработчиков) 3D-производительностью. Честь интеловской графики отстаивал двухъядерный процессор Core i3-3225. Мы выбрали именно его, а не четырёхъядерник семейства Core i5, так как APU компании AMD позиционируются в качестве альтернативы интеловским двухъядерным процессорам самим производителем. В частности, по предварительным данным, стоимость AMD A10-5800K будет примерно такой же, как и у младших представителей семейства Core i3.

Кроме того, не следует забывать и о выводах наших прошлых исследований, показывающих более высокую удельную эффективность ядер процессоров Intel. Четырёхъядерники с микроархитектурой Sandy Bridge вполне успешно противостояли восьмиядерным процессорам Bulldozer, и маловероятно, что с выходом новых поколений микроархитектур Ivy Bridge и Piledriver эта ситуация как-то поменялась. Это можно подтвердить и относительными результатами теста SYSmark 2012, показывающими общеупотребительную производительность процессоров.

Хотя AMD A10-5800K и получил заметно более высокое, нежели AMD A8-3870K, быстродействие, от процессоров Core i3-3225 и Core i3-2125 он отстаёт, не говоря уже об его солидном проигрыше в вычислительной производительности четырёхъядернику Core i5-3330. Так что противопоставление четырёхъядерных APU компании AMD в графических тестах двухъядерному Core i3 вполне оправданно. К тому же различия в графической производительности самого мощного Intel Core i7 и выбранного нами Core i3 сводятся к 100-МГц разнице в частоте встроенного видеоядра: 1,05 ГГц у нашего подопытного против 1,15 ГГц у флагманского процессора под Socket LGA1155. Так что принципиально лучший результат, чем Core i3-3225, никакой другой интеловский процессор в графических тестах показать не сможет.

Чтобы мы имели возможность судить об уровне быстродействия интегрированных графических ядер современных процессоров относительно дискретных видеокарт, в число протестированных конфигураций был добавлен и вариант, снабжённый внешней графикой. Ориентиром была выбрана видеокарта Radeon HD 6570, стоимость которой на сегодняшний день в используемой нами версии с GDDR5-памятью составляет порядка $70. Её тестирование проводилось в системе с процессором A10-5800.

В результате в тестах были задействованы следующие аппаратные и программные компоненты:

  • Процессоры:
    • AMD A10-5800K (Trinity, 4 ядра, 3,8-4,2 ГГц, 4 Мбайт L2, Radeon HD 7660D);
    • AMD A8-3870K (Llano, 4 ядра, 3,0 ГГц, 4 Мбайт L2, Radeon HD 6550D);
    • Intel Core i3-3225 (Ivy Bridge, 2 ядра + HT, 3,3 ГГц, 3 Мбайт L3, HD Graphics 4000).
  • Материнские платы:
    • ASUS P8Z77-V Deluxe (LGA1155, Intel Z77 Express);
    • ASUS F2A85-V Pro (Socket FM2, AMD A85);
    • Gigabyte GA-A75-UD4H (Socket FM1, AMD A75).
  • Видеокарта: AMD Radeon HD 6570 1 Гбайт GDDR5 128-бит.
  • Память: 2 x 4 Гбайт, DDR3-1866 SDRAM, 9-11-9-27 (Kingston KHX1866C9D3K2/8GX).
  • Дисковая подсистема: Crucial m4 256 Гбайт (CT256M4SSD2).
  • Блок питания: Corsair AX1200i (80 Plus Platinum, 1200 Вт).
  • Операционная система: Microsoft Windows 7 SP1 Ultimate x64.
  • Драйверы:
    • AMD Catalyst 12.8 Driver;
    • AMD Chipset Driver 12.8;
    • Intel Chipset Driver 9.3.0.1019;
    • Intel Graphics Media Accelerator Driver 15.26.12.2761;
    • Intel Management Engine Driver 8.1.0.1248;
    • Intel Rapid Storage Technology 11.2.0.1006.

При тестировании платформы, основанной на процессоре AMD A10-5800K, были установлены патчи операционной системы KB2645594 и KB2646060, адаптирующие поведение планировщика под микроархитектуру Bulldozer.

Основной акцент в настоящем тестировании был вполне закономерно сделан на игровые применения встроенной процессорной графики. Поэтому основная масса использованных нами бенчмарков – это игры или специализированные геймерские тесты. Причём, если учесть поставленные цели, нас в первую очередь интересовала производительность различных графических решений в ставшем де-факто стандартом для настольных систем Full HD-разрешении 1980x1080. Поэтому большинство тестов проводилось именно в нём при установке низкого или среднего уровня качества изображения.

3D-производительность

Результаты тестов семейства 3DMark очень популярны для оценки средневзвешенной игровой производительности видеокарт. Поэтому к 3DMark мы обратились в первую очередь. Для начала давайте посмотрим на производительность в версии Vantage, которая использует DirectX десятой версии.

В глаза сразу же бросается тот немалый прогресс, который произошёл с APU компании AMD при переходе от графического ядра Sumo к новому дизайну Devastator. Преимущество процессора Trinity перед флагманом семейства Llano составляет порядка 40 процентов. В результате система, построенная на базе A10-5800K, приближается по графическому быстродействию к платформе с дискретной видеокартой AMD Radeon HD 6570.

Более свежая версия 3DMark ориентирована на измерение DirectX 11-производительности. Ранее в подобных тестах не могли принимать участие процессоры Intel, оставляя APU компании AMD в одиночестве, однако реализованное в Ivy Bridge графическое ядро Intel HD Graphics 4000 наконец-то получило поддержку всех современных программных интерфейсов, так что процессор Core i3-3225 присутствует и на этой диаграмме.

3DMark 11 выдал чрезвычайно интересный результат. По данным этого бенчмарка, графическое ядро, встроенное в A10-5800K, смогло обойти дискретную видеокарту Radeon HD 6570. Это выступает прекрасной иллюстрацией высокой эффективности использованной в Devastator архитектуры VLIW4. Напомним, видеокарта Radeon HD 6570 основывается на 800-мегагерцевом графическом процессоре Turks c VLIW5-архитектурой и при этом обладает 480 потоковыми процессорами против 384 в Devastator. Однако большее количество исполнительных устройств, как мы видим, не всегда выливается в лучшие практические показатели, из чего можно сделать вывод о том, что выбор для Trinity VLIW4-дизайна – это очень правильное решение.

Aliens vs. Predator (2010)

Несмотря на то, что в синтетическом бенчмарке 3DMark 11 графическое ядро процессора A10-5800K смогло обогнать дискретную видеокарту Radeon HD 6570, в реальном игровом приложении - Aliens vs. Predator – ситуация складывается совершенно иным образом. Тут дискретный видеоускоритель серьёзно опережает любой вариант интегрированной графики, включая и Radeon HD 7660D. Очевидно, что слабым местом любых процессорных видеоускорителей остаётся шина памяти, которая обладает явно недостаточной пропускной способностью. При этом следует отметить, что мы здесь сравниваем Radeon HD 7660D с видеокартой Radeon HD 6570, оборудованной GDDR5-памятью с высокой пропускной способностью. Но если бы в тестах использовалась более «простая» дискретная видеокарта с DDR3 SDRAM, то она наверняка бы оказалась поверженной ядром Devastator.

Batman: Arkham City

Разница в производительности старого и нового графического ядра, используемых в составе APU компании AMD, в Batman: Arkham City составляет около 30 процентов. Так что с точки зрения быстродействия графики переход от дизайна Llano к дизайну Trinity – вполне оправданное решение, приносящее ощутимые дивиденды. При этом сделан такой шаг отнюдь не из-за обострения конкуренции с Intel: даже самый новый и самый быстрый GPU микропроцессорного гиганта выглядит на фоне предложений AMD очень блекло. Очевидно, AMD прицеливается на подписание смертного приговора бюджетным видеокартам с DDR3-памятью, например Radeon HD 6570 или GeForce GT 630.

Battlefield 3

Конечно, Radeon HD 7660D – это совсем не то же самое, что дискретная видеокарта верхнего или среднего уровня. Производительность этого решения существенно ниже. Однако, как мы видим, новое интегрированное графическое ядро компании AMD позволяет вполне пристойно играть в самые современные игры в Full HD-разрешении, в том числе и в Battlefield 3. Порой для этого требуется выставлять низкие настройки качества, но зато среднее количество кадров в секунду находится на приемлемом уровне. Не демонстрирует Radeon HD 7660D и явных «просадок». Например, при тестировании в Battlefield 3 минимальная мгновенная производительность с низкими настройками качества составила вполне приличные, пусть и не совсем играбельные 18 кадров в секунду.

Borderlands 2

Без особых проблем идёт на A10-5800K даже новейший шутер от первого лица Borderlands 2. О «красивостях», конечно, придётся забыть, но зато свежий APU компании AMD, в отличие от интеловских процессоров с интегрированной графикой, даёт возможность поиграть в Borderlands 2 в разрешении 1920x1080 без установки дискретного видеоускорителя.

Игры в жанре симуляторов автогонок обычно не слишком требовательны к графическим ресурсам. Типично в этом плане и поведение F1 2012 - эта игра идёт на интегрированных системах с хорошей производительностью даже при выборе Full HD-разрешения и высокого качества изображения. При этом, хотя преимущество Radeon HD 7660D над графикой из процессора Llano приближается к 35 процентам, дискретная видеокарта Radeon HD 6570 всё же показывает слегка более высокий результат. Впрочем, по сравнению с графическим ядром конкурирующих процессоров, Intel HD Graphics 4000, любые интегрированные предложения AMD выглядят превосходно. В F1 2012 процессор A10-5800K обгоняет Core i3-3225 примерно на 60 процентов.

Far Cry 2

Мы совершенно осознанно не выкидываем Far Cry 2 из тестового набора. Присутствие этого шутера четырёхлетней давности позволяет воочию увидеть то, что в играх прошлого поколения современный APU класса Trinity работает с просто-таки выдающейся производительностью. Например, в том же Far Cry 2 мы смогли выставить разрешение 1920x1080 с максимально доступным качеством изображения и при этом получили в среднем более 30 кадров в секунду. При этом зафиксированный в тестировании минимальный FPS составил вполне приемлемые 23 кадра в секунду.

Sleeping Dogs

К сожалению, в самой современной из выбранных нами игр графическое ядро процессора A10-5800K вновь демонстрирует свою неспособность противостоять полноценной видеокарте Radeon HD 6570, отставая от неё примерно на 10-15 процентов. Источник проблемы APU понятен – ему бы не помешала память с более высокой пропускной способностью. Именно поэтому распространение решений, подобных Trinity, может сильно оживить рынок DDR3 SDRAM. В общеупотребительных приложениях скорость работы зависит от частоты памяти совсем малозаметно, но вот для систем с интегрированной графикой быстрая подсистема памяти может оказаться принципиально важной. Впрочем, этому вопросу мы ещё уделим подробное внимание.

Sniper Elite V2

Среди всех имеющихся на рынке встроенных GPU ядро Devastator в версии Radeon HD 7660D – это самое быстрое решение. Результаты, полученные в бенчмарке Sniper Elite V2, подтверждают это ещё раз. Новая версия интегрированного графического ядра, разработанная компанией AMD, обгоняет прошлую модификацию Sumo на 26 и 43 процента в зависимости от установок качества изображения. В результате превосходство Radeon HD 7660D над Intel HD Graphics 4000 достигает двукратной величины. Иными словами, в части встроенных в процессор GPU компания AMD продолжает значительно обгонять своего конкурента. Причём на произошедший у Intel с выходом микроархитектуры Ivy Bridge прогресс у AMD нашёлся не менее впечатляющий ответ – Trinity. Так что актуальные APU обеих компаний вновь попадают в совершенно различные весовые категории.

Cinebench R11.5

Все игры, в которых мы провели тестирование, относятся к приложениям, использующим программный интерфейс DirectX. Однако нам хотелось посмотреть и на то, как справятся ускорители с работой в OpenGL. Поэтому к чисто игровым тестам мы добавили и небольшое исследование производительности при работе в профессиональном графическом пакете Cinema 4D.

Расклад сил совершенно типичен. Уровень производительности Trinity в OpenGL-приложении качественно не отличается от его скорости в игровых DirectX-задачах. Встроенный в процессор AMD A10-5800K ускоритель Radeon HD 7660D опережает своего предшественника и интеловского конкурента, но отстаёт от дискретной видеокарты Radeon HD 6570. При этом, если принять во внимание достигнутый уровень OpenGL-быстродействия, идея использования встроенной графики в профессиональных приложениях начинает казаться не такой уж и абсурдной. Более того, в ассортименте компании AMD даже имеются и соответствующие предложения – «профессиональные» процессоры Trinity, продаваемые под торговой маркой FirePro.

Производительность GPGPU

Компания AMD неустанно акцентирует внимание на том, что её процессоры Llano, а теперь и Trinity, относятся к классу APU. Это означает, что их архитектура оптимизирована под решение задач различного класса силами не только традиционных x86-ядер, но и потоковых процессоров графического ядра - они должны трудиться совместно. Для успешного функционирования такого содружества принципиально различных вычислительных ресурсов, естественно, требуется специализированное программное обеспечение. И если ещё год назад это звучало как приговор концепции APU, то теперь ситуация начала активно меняться. Разработчики целого ряда популярных программных продуктов стали предпринимать конкретные попытки использования преимуществ гибридных решений. На сегодня существует информация о том, что вычислительные возможности графического ядра могут вовлекать в работу текущие или перспективные версии таких программ, как Adobe Flash 11.2, Adobe Photoshop CS6, GIMP, ArcSoft MediaConverter 7.5, CyberLink MediaEspresso 6.5, Handbrake и WinZip 16.5.

В рамках данного материала мы пока не имеем права прибегать к тестированию процессора Trinity в подобном программном обеспечении, тем не менее мы можем оценить практическое быстродействие графического ядра Devastator на GPGPU-нагрузке, создаваемой через программные интерфейсы OpenCL и Microsoft DirectCompute. Для этого мы использовали тестовый пакет SiSoftware Sandra 2012.10.18.74.

Вычислительная производительность графического ядра Devastator выглядит очень неплохо. Применение в его основе VLIW4-архитектуры позволяет достичь высокой эффективности вычислений общего назначения, в результате чего Radeon HD 7660D заметно обгоняет не только предшествующую версию графического ускорителя из Llano и интеловское графическое ядро Intel HD Graphics 4000, но и дискретную видеокарту Radeon HD 6570. В итоге в приложениях, поддерживающих OpenCL, от Trinity можно ожидать высокого уровня производительности.

Похожим образом складывается ситуация и в криптографическом тесте. Иными словами, поместив в новые гибридные процессоры производительную графику с VLIW4-архитектурой, AMD стремилась решить вполне конкретную задачу – наглядно показать полезность и перспективность совмещения x86-ядер общего назначения и потоковых графических ядер. Если учесть, что производители программного обеспечения начинают пробовать использование гибридных процессоров в деле, это очень своевременный ход. На данном этапе AMD должна не просто продемонстрировать потенциальную возможность новых подходов, но и на деле доказать их преимущество.

Выводы

Времена, когда к интегрированной графике нужно было подходить с позиции «лишь бы работало», давно прошли. С тех пор как графические ядра обосновались в центральных процессорах, AMD и Intel стали активно наращивать их мощность, вытесняя с рынка бюджетные видеокарты и придавая своим процессорам новые модели использования. В этой гонке встроенных GPU лидером выступает компания AMD: самые быстрые графические ядра из процессоров Ivy Bridge пока что не превзошли даже графику Llano, не говоря уже о новом Trinity. Однако такое положение дел не стало для AMD поводом, чтобы замедлить темпы введения инноваций. Эта компания борется не с конкретным продуктом конкурента, а за то, чтобы отношение к гибридным процессорам изменилось в принципе. Для этого нужно не простое превосходство над альтернативными продуктами в бенчмарках, а иное его качество.

Очень похоже, что новые десктопные процессоры Trinity, с которыми мы познакомились сегодня, это и есть тот самый необходимый качественный скачок. AMD A10-5800K не просто оказался гибридным процессором с самым быстродействующим на данный момент графическим ядром. Важно то, что скорости этого ядра уже хватает на обеспечение приемлемой производительности практически в любых современных 3D-играх в Full HD-разрешении. Конечно, при этом приходится выставлять не самые максимальные настройки качества, однако факт остаётся фактом: Trinity вполне достойно смотрится в одном ряду с дискретными 3D-акселераторами нижнего уровня, стоимостью порядка $60-70, которые новый гибридный процессор может с лёгкостью заменить. Фактически сегодня можно говорить о том, что ускорители типа Radeon HD 6570 и GeForce GT 630 с распространением Trinity могут отправляться на свалку, по крайней мере это относится к их DDR3-модификациям.

Сегодня мы познакомились лишь с графической составляющей нового многообещающего проекта AMD. И эта составляющая – его сильная сторона. С точки же зрения общеупотребительной производительности Trinity, скорее всего, не сможет стать таким же впечатляющим предложением. Даже обещанного самой AMD 25-процентного роста скорости будят явно недостаточно для того, чтобы A10-5800K, как и другие продукты семейства, смог бы выступать на равных с интеловскими процессорами поколения Ivy Bridge. Конечно, можно рассчитывать на то, что AMD сможет продавить концепцию APU, и гибридные предложения этого производителя получат заметный прирост быстродействия за счёт вычислительных ресурсов графического ядра. Однако если это и произойдет, то явно не очень скоро. Поэтому пока в виду придётся иметь то, что у Trinity есть и слабая сторона.

Что же в итоге? Задумайтесь, большинству покупателей десктопных процессоров Intel, по большому счёту, на их графическую производительность наплевать. Они готовы мириться с любым её уровнем, так как их привлекает высокая скорость x86-ядер. Trinity же вполне может добиться расположения потребителей, зайдя с другой стороны. Если этот APU предлагает заманчивый уровень 3D-производительности, стоит ли так сильно переживать из-за более низкой, чем у конкурента, скорости x86-ядер? Ответ на этот вопрос, судя по имеющимся данным, вполне может быть отрицательным: для большинства типичных задач имеющегося быстродействия Trinity наверняка вполне хватает.

Впрочем, давайте не будем торопиться с окончательными выводами и дождёмся-таки снятия эмбарго на публикацию полных результатов тестов. В то время как вы читаете эти строки, работа над продолжением материала уже ведётся.