Интернет магазин китайских планшетных компьютеров



Компьютеры - Radeon R600

03 июля 2011


Оглавление:
1. Radeon R600
2. Продукты для настольных компьютеров
3. Мобильные версии продуктов
4. Поддержка в драйверах
5. Продвижение на рынке



Графический процессор под кодовым названием Radeon R600, лежащий в основе серий видеокарт Radeon HD 2000/3000 и FireGL 2007, разработан корпорацией ATI Technologies. Видеокарты серии HD 2000 были выпущены для конкуренции с видеокартами серии GeForce 8000 от компании nVidia, а карты линейки HD 3000 стали cоперниками картам серии GeForce 9000.


Архитектура

Унифицированные шейдеры

«R600» стал первым графическим процессором для домашних компьютеров производства ATI, основывающимся на архитектуре унифицированных шейдеров. Это уже второе поколение унифицированных шейдеров ATI и базируется на графическом процессоре «Xenos», использующимся в игровых приставках Xbox 360, в которых впервые в мире была применена подобная шейдерная архитектура. В предыдущих архитектурах GPU использовались отдельные процессоры для каждого типа графических функций. Унифицированная архитектура использует множество гибко настраиваемых процессоров, которые могут быть запрограммированы на исполнение шейдеров различных типов, что значительно увеличивает пропускную способность ГП. Ядро R600 обрабатывает вершинные, геометрические и пиксельные шейдеры как описано в спецификации Direct3D 10.0 для Shader Model 4.0 помимо полной поддержки OpenGL 3.0.

Новая функциональность унифицированных шейдеров основывается на VLIW-архитектуре, согласно которой ядро должно выполнять операции параллельно.

Каждый шейдерный кластер состоит из 5 потоковых процессоров. Каждый потоковый процессор может обрабатывать законченную MAD- инструкцию с плавающей запятой одинарной точности за такт, скалярное произведение и целочисленную ADD-инструкцию. Пятый процессор по своему устройству более сложен и может дополнительно обрабатывать специальные трансцендентные функции, такие как sine и cosine. Каждый шейдерный кластер может исполнять 6 инструкций за такт, то есть 5 шейдерных инструкций и 1 ветвления .

Необходимо отметить, что VLIW-архитектура принесла с собой и свои классические проблемы, унаследовав их от дизайна VLIW, и в первую очередь проблему поддержки оптимального выполнения потока инструкций. Кроме того, чип не может одновременно выполнять инструкции в случае, когда выполнение одной зависит от результатов второй. Производительность ГП сильно зависит от смеси инструкций, используемых приложением, и того, насколько хорошо компилятор реального режима в драйвере может упорядочивать вызываемые инструкции.

Ядро R600 включает в себя 64 шейдерных кластера, в то время как ядра RV610 и RV630 обладают лишь 8 и 24 шейдерными кластерами соответственно.

Аппаратная тесселяция

ГП оснащен дополнительными возможностями, не являющихся частью текущей спецификации DirectX 10.0. К ним относятся программируемые блоки тесселяции, схожие с теми, что присутствовали в ГП Xenos, также разработанными ATI. Такой блок позволяет разработчику взять простой набор полигонов и разбить его согласно функции вычисления кривой поверхности, причем с различными формами тесселяции в виде поверхностей Безье с N-патчами, B-сплайнами и NURBS, а также некоторыми техниками разбития поверхности, которые обычно применяются в картах смещениях текстур. Это позволяет у простой низкополигональной модели значительно усложнить плотность полигонов в реальном времени с минимальными потерями производительности. Скотт Воссон из Tech Report во время демонстрации AMD технологии заметил, что результирующая модель была настолько плотно обтянута миллионами полигонов, что выглядела сплошной.

Данный модуль напоминает предыдущую технологию «TruForm» самой же ATI, впервые примененной в Radeon 8500, и демонстрировавшей аналогичную функциональность, реализованную аппаратно. Пока подобная аппаратная тесселяция не является частью нынешних требований OpenGL или Direct3D, а конкуренты, как например GeForce 8, не имеют подобных аппаратных реализаций, но Microsoft уже включила тесселяцию в свои планы, касающиеся D3D10.1. Старая технология «TruForm» мало привлекла внимание разработчиков ПО и была задействована лишь в нескольких довольно дорогих играх, так как данная возможность не поддерживалась графическими процессорами производства NVIDIA, у которой было собственное конкурирующее решение, связанное с обработкой тесселяции, использующее Quintic-RT патчи, причем эта технология получила ещё меньшую поддержку разработчиков. Так как Xenos использует аналогичное аппаратное обеспечение, а Microsoft рассматривает аппаратную тесселяцию поверхности как главную возможность ГП с соответствующей реализацией поддержки аппаратной тесселяции в будущих выпусках DirectX, выделенные аппаратные процессоры тесселяции могут обеспечить рост интереса со стороны разработчиков для использования в будущих играх. Под вопросом остается совместимость реализации от ATI с окончательным стандартом DirectX.

Диспетчер потоков

Хотя R600 является значительным отходом от предыдущих архитектур, у неё все ещё много общих черт с её предшественниками. Диспетчер потоков — главный архитектурный компонент ядра R600, точно так же как это было в ГП серии Radeon X1000. Этот процессор управляет большим числом динамических потоков трех различных типов и по мере необходимости переключается между ними. Благодаря большому числу одновременно управляемых потоков становится возможным переопределять поток для оптимального использования шейдеров. Иначе говоря, диспетчер вычисляет что именно происходит в различных частях R600 и пытается поддержать эффективность процесса обработки данных на максимально возможном уровне. Кроме того, существуют нижние уровни «управления»; каждый SIMD-массив из 80 потоковых процессоров имеет собственный обработчик последовательности и арбитр. Арбитр определяет, какой из потоков должен обрабатываться следующим, тогда как обработчик последовательности пытается переупорядочить инструкции для достижения максимальной возможной производительности для каждого из потоков.

Текстуризация и антиалиасинг

Текстуризация и финальный вывод, реализованный в ядре R600, одновременно схож и отличается от R580. R600 укомплектован 4 текстурными блоками, работающими независимо от шейдерного ядра, как это было сделано в процессорах R520 и R580.

Блоки растеризации в процессорах серии Radeon HD 2000 теперь выполняют задачу мультисемплового сглаживания с программируемыми сетками семплов и максимумом из 8 семпловых значений, вместо использования пиксельных шейдеров как в серии Radeon X1000. Также нововведением является полноскоростная возможность фильтрации FP16-текстур, популярная благодаря HDR-освещению. ROP также может выполнять трилинейную и анизотопную фильтрацию на всех текстурных форматах. В чипе R600 это означает 16 пикселей за такт для FP16-текстур, тогда как FP32-текстуры с более высокой точностью фильтруются на половинной скорости.

Возможности сглаживания в R600 превосходят таковые в серии R520. В дополнение к возможности выполнения 8x MSAA, в отличие от 6x MSAA на R300 и вплоть до R580, R600 обладает новым режимом «заказного фильтра сглаживания»). CFAA означает реализацию неблоковых фильтров, которые отслеживают соседние пиксели вокруг нужного пикселя, которые обрабатываются для вычисления результирующего цвета и сглаживания картинки. CFAA выполняется шейдером, а не в ROP-блоках. Это значительно улучшает программируемость, так как фильтры могут настраиваться, но может также повлечь потенциальные проблемы с производительностью из-за использования ресурсов шейдера. При запуске в продажу R600, CFAA использовал фильтры режимов «wide tent» и «narrow tent». В этих режимах семплы извне обрабатываемого пикселя линейно обрабатываются исходя из расстояния от них до центроида нужного пикселя, причем линейная функция зависит от того, выбран ли широкий или узкий фильтр.

Контроллеры памяти

Контроллеры памяти соединены через внутреннюю двунаправленную кольцевую шину, опоясывающую процессор. В ГП Radeon HD 2900 это 1024-битная двунаправленная кольцевая шина с 8 64-битными каналами памяти для совокупной пропускной способности шины в 512 бит на 2900 XT.; в Radeon HD 3800 это 512-битная кольцевая шина; в Radeon HD 2600 и HD 3600 это 256-битная кольцевая шина; в Radeon HD 2400 и HD 3400 подобная кольцевая шина отсутствует.

Обработка видео, вывод на экран и дополнительные возможности

Все видеокарты, за исключением карт серии Radeon HD 2900, включают в себя выделенный Unified Video Decoder от ATI для аппаратного декодирования видеопотоков MPEG4, VC-1, H.264, который сами по себе являются ключевой частью технологии AVIVO HD. С точки зрения функциональности, технология PureVideo 2 от NVIDIA предлагает схожее решение аппаратного видеоускорения с UVD, включающим большую разгрузку VC-1.

Поддержка кодирования HDTV реализована за счет встроенного кодировщика AMD Xilleon; сопутствующий чип «Rage Theater», используемый на картах серии Radeon X1000, был замещен цифровым чипом «Theater 200», обеспечивающим поддержку VIVO.

Для вывода на дисплей все варианты включают в себя два двуканальных TMDS-передатчика, за исключением HD 2400 и HD 3400, которые включают один одинарный и один двуканальный TMDS-передатчики. Каждый DVI-выход оснащен двуканальным HDCP-кодером со встроенным ключом раскодирования. Был представлен HDMI-интерфейс, поддерживающий экранное разрешение вплоть до 1920×1080, со встроенным HD-аудиоконтроллером с поддержкой кодирования 5.1-канального LPCM и AC3 форматов. Аудио передается через DVI-разъем при помощи специально спроектированного переходника DVI-в-HDMI для HDMI-выхода, передающего как аудио, так и видео.

Все варианты поддерживают технологию CrossFireX. Эффективность CrossFire была значительно улучшена и демонстрирует производительность, близкую к теоретическому максимуму двукратной производительности одиночной карты.

Несмотря на то, что весьма ощутимая часть архитектуры семейства Radeon HD 2000 довольно схожа с Xenos, семейство Radeon HD 2000 не имеет встроенного кадрового буфера DRAM. eDRAM у Xenos был разработан исходя из ограничений разрешений, с которыми работает Xbox 360. Персональные компьютеры работают с максимальной эффективностью при гораздо большем диапазоне разрешений, которые требуют значительно большее количество eDRAM-памяти для эффективной работы.

Обновление поколения

Серия была обновлена за счет вариантов с уменьшенным техпроцессом: RV670, RV635 и RV620. Все варианты поддерживают PCI Express 2.0, DirectX 10.1 с поддержкой шейдерной модели 4.1, выделенным ATI Unified Video Decoder для всех моделей и технологией PowerPlay для десктопных видеокарт.

За исключением серии Radeon HD 3800, все варианты поддерживают 2 встроенных разъема DisplayPort с поддержкой 24- и 30-битных дисплеев с разрешением вплоть до 2560×1600. Каждый разъем обладает 1, 2 или 4 линиями на выход с передачей данных вплоть до 2.7 Гб/сек на линию.

ATI заявила, что поддержка DirectX 10.1 может улучшить производительность и эффективность вычислений при снижении ошибок округления, улучшенная детализация и качество изображения, глобальное освещение



Просмотров: 2560


<<< Radeon HD 6970
Radeon R700 >>>