Интернет магазин китайских планшетных компьютеров



Компьютеры - Intel Larrabee - Сравнения с конкурирующими продуктами

11 мая 2011


Оглавление:
1. Intel Larrabee
2. Описание
3. Сравнения с конкурирующими продуктами
4. Спецификации
5. Прошлое графических чипов Intel



Intel Larrabee может рассматриваться как гибрид между многоядерными центральными процессорами и графическими процессорами, так как имеет отличительные особенности от обеих архитектур. Иерархия его когерентного кэша и совместимость с x86-микроархитектурой делают его похожим на CPU, в то время, как широкий набор векторных SIMD блоков и блоков текстурной выборки делают его похожим на GPU.

Как и графический процессор, Larrabee будет поддерживать рендеринг трёхмерной графики с помощью классической технологии растеризации в играх с использованием Direct3D и OpenGL. Вместе с тем Larrabee будет подходить для вычислений по концепции GPGPU или для задач по потоковой обработке данных. К примеру, Larrabee сможет исполнять трассировку лучей или физические вычисления, как в реальном времени, так и в офф-лайне.

DreamWorks Animation установила партнёрство с Intel и планирует использовать Larrabee в создании кинофильмов. Генеральный директор DreamWorks Animation Джэффри Кэтзенберг заявил, что: «мы далеко продвинулись в модернизации наших программ, чтобы действительно воспользоваться преимуществами Larrabee; и с точки зрения оперативности, гибкости и емкости он просто поднимает планку того, что мы можем сделать, не в два или три раза, а в двадцать раз».

Ранние презентации Larrabee подвергались некоторой критике от конкурирующий производителей GPU. На NVISION 08 сотрудник nVidia назвал документ Intel, описывающий Larrabee на SIGGRAPH , «маркетинговым дымом», и процитировал блогера Питера Гласковского, который заявил, что архитектура Larrabee похожа на «GPU 2006-го года». На июнь 2009 года утверждалось, что прототипы Larrabee имеют паритет с Nvidia GeForce GTX 285.

Различия с современными GPU

Larrabee будет отличаться от многих других современных ему GPU благодаря трём основным отличиям:

  • Larrabee будет использовать набор x86-инструкций наряду со своим специфичным набором инструкций.
  • Larrabee будет содержать кэш-память, когерентную со всеми его ядрами.
  • Larrabee будет иметь очень небольшое количество специализированных компонентов по рендерингу графики. Вместо Z-буферизации, обрезания и смешивания, он будет использовать подход, основанный на тайлах.

Данные особенности делают Larrabee более гибким, чем современные графические процессоры. Документ Intel, представленный на SIGGRAPH 2008, описывает некоторые задачи, которые может исполнять Larrabee, но которые затруднительны для исполнения посредством GPU: считывание цели рендеринга, Order-independent transparency, Irregular Z-buffer и трассировка лучей в реальном времени.

Хотя Larrabee значительно более гибкий, чем текущие GPU, самое новое поколение графических процессоров с поддержкой Direct3D 11 DirectCompute и OpenCL имеют очень широкие способности в области вычислений общего назначения. Сюда также относится технология CUDA от nVidia.

Различия с современными CPU

x86-совместимые процессорные ядра Larrabee будут отличаться от процессорных ядер современных ему микропроцессоров от Intel, таких, как Core 2 Duo или Core i7, следующими особенностями:

  • x86-совместимые процессорные ядра Larrabee будут базироваться на намного более простой микропроцессорной архитектуре Pentium P54C, которая всё ещё поддерживается для использования во встраиваемых приложениях. P54C-подобное ядро является суперскалярным, но не поддерживает внеочередное исполнение команд. Вместе с тем ядра Larrabee будут обновлены некоторыми современными архитектурными решениями, такими, как поддержка x86-64. Очередное исполнение команд означает снижение производительности для отдельных ядер, но благодаря этому физический размер ядра существенно снижается. Поэтому на одном кристалле может быть размещено намного больше процессорных ядер, чем на стандартном CPU, что приводит к увеличению общей пропускной способности. Исполнение команд становится более детерминированным, поэтому планирование инструкций и задач могут быть сделаны самим компилятором.
  • Каждое ядро Larrabee содержит блок векторного процессора, способный одновременно обработать 16 чисел одинарной точности с плавающей запятой. Это аналогично, но в четыре раза больше, чем могут обработать блоки SSE на наиболее распространённых процессорах x86. Также будут присутствовать дополнительные инструкции Scatter/gather и маска регистров, спроектированная для того, чтобы использование векторного блока было проще и более эффективнее. Мощь Larrabee в работе с числами вытекает как раз с этих векторных блоков.
  • Larrabee включает одну важную с точки зрения компьютерной графики функцию: блоки выборки текстур. Они производят трилинейную и анизотропную фильтрацию и разжатие текстур.
  • Larrabee имеет 1024-битную кольцевую шину для связи между процессорными ядрами и памятью. Эта шина может быть сконфигурирована в двух режимах в зависимости от конкретной конфигурации чипа: для поддержки чипа с менее чем 16-ю ядрами и больше 16-ти ядер.
  • Larrabee содержит явные инструкции по контролю кэш-памяти, предназначенные для уменьшения процесса «замусоривания» кэша во время потоковых операций, которые записывают и считывают данные только единожды. Явная предвыборка в кэши L2 или L1 также поддерживается.
  • Каждое ядро поддерживает 4-направленный одновременный мультитрединг с четырьмя копиями каждого регистра процессора.

Теоретически x86-совместимые процессорные ядра Larrabee будут способны исполнять код существующих компьютерных программ для ПК и даже код операционных систем. Однако видеокарта, на которой будет установлен чип Larrabee, не будет содержать все компоненты ПК-совместимых материнских плат; таким образом, операционные системы и программное обеспечение для ПК не смогут работать на Larrabee без модификаций. Различные версии Larrabee могут быть установленными в процессорные сокеты материнских плат с использованием стандарта Intel QuickPath Interconnect, но Intel пока не огласила свои планы касательно этого.

Сравнение с Cell

Идея «Larrabee» состоит в предоставлении массива простых и небольших ядер, что аналогично идее микропроцессора Cell. Кроме того, есть и другие общие особенности, такие, как использование широкополосной кольцевой шины для обеспечения коммуникаций между ядрами. Однако есть множество существенных различий в реализации, которые делают программирование на «Larrabee» проще, чем на «Cell».

  • «Cell» состоит из одного центрального ядра, которое контролирует восемь меньших ядер. Кроме того, центральное ядро способно исполнять код операционной системы. В «Larrabee» все ядра процессора одинаковы и равнозначащие, и операционная система не способна работать на нём.
  • Каждое ядро в «Cell» имеет локальную память, для которой используются явные операции для обеспечения всего доступа к оперативной памяти. Обычные циклы записи/чтения оперативной памяти не доступны. В «Larrabee» вся память находится под автоматическим управлением последовательной иерархии кэша, таким образом, все ядра получают одинаковый стандартный доступ ко всей памяти через стандартные инструкции загрузки и сохранения. Однако каждое ядро «Larrabee» имеет 256К локального кэша второго уровня, и другой сегмент кэша имеет более медленный доступ, что чем-то напоминает принципы Cell SPU.

Сравнение с Intel GMA



Просмотров: 4553


<<< Intel I740
MCGA >>>