Интернет магазин китайских планшетных компьютеров



Компьютеры - Цифровой сигнальный процессор - Классификация ЦСП по архитектуре

22 января 2011


Оглавление:
1. Цифровой сигнальный процессор
2. Области применения
3. Основные параметры ЦСП
4. Устройство
5. Классификация ЦСП по архитектуре
6. ЦСП с архитектурой VLIW
7. Суперскалярные ЦСП
8. Гибридные ЦСП
9. Программирование ЦСП



Следует отметить, что приведенная ниже классификация достаточно условна, так как разнообразие технических решений зачастую не позволяет однозначно отнести каждое конкретное устройство к одному из указанных типов. Поэтому нижесказанное следует скорее использовать как материал для понимания особенностей архитектуры ЦСП, чем для реальной классификации каких-либо изделий.

Особенности архитектуры ЦСП удобно рассматривать на примере конкретного алгоритма цифровой обработки данных, например, КИХ-фильтра, выходной сигнал которого можно записать как:

y \left = \sum_{i=0}^{P} b_i x \left, где

  • x \left — отсчеты входного сигнала;
  • bi — коэффициенты фильтра.

Как можно легко заметить, вычисление результата является классическим примером использования операции «умножение с накоплением» — MAC .

Стандартные ЦСП

Два варианта исполнения команды MAC на ЦСП Texas Instruments

На рисунке показано два варианта выполнения команды MAC на стандартном ЦСП. В первом варианте оба операнда хранятся в памяти данных, поэтому на их выборку требуется два такта, то есть время выполнения n сложений равно 2n. Во втором случае один из операндов хранится в памяти программ, поэтому команда исполняется за один такт, и общее время выполнения цикла будет равно n тактов. Здесь видно, что эффективная реализация алгоритма требует использования памяти программ для хранения данных, а максимальное быстродействие достигается только в однокомандном цикле.

Одним из вариантов, позволяющим отказаться от использования памяти программ для хранения данных, является применение т. н. «двухпортовой памяти», то есть памяти, имеющей два комплекта входных шин — двух шин адреса и данных. Такая архитектура позволяет произвести одновременное обращение по двум адресам. Данное решение применяется в ЦСП компаний Motorola и Lucent.

При указанной архитектуре повысить производительность можно только увеличением тактовой частоты.

Улучшенные стандартные ЦСП

«Улучшенные стандартные ЦСП» для повышения производительности системы, по сравнению со стандартными ЦСП, используют следующие методы повышения параллелизма:

  • Увеличение количества операционных и вычислительных устройств;
  • Введение специализированных сопроцессоров;
  • Расширение шин для увеличения количества передаваемых данных;
  • Использование памяти с многократным доступом;
  • Усложнение системы команд;

Многие из этих способов применялись уже начиная с самых первых процессоров, поэтому зачастую их невозможно однозначно классифицировать как «стандартные» или «улучшенные».

Исполнение двух операций MAC на ЦСП Texas Instruments TMS320C55x

На рисунке показан пример реализации вычисления двух параллельных команд MAC. Для этого в ЦСП присутствуют два модуля MAC и два аккумулятора. Блоки MAC получают данные по трём шинам одновременно, причём одно из значений является для них общим. Таким образом, происходит одновременное исполнение двух команд:

  • АК1 := АК1 + D1 × D2
  • АК2 := АК2 + D1 × D3

Особенность показанного решения состоит в том, что к выполнению двух параллельных команд с одним общим сомножителем можно свести многие алгоритмы ЦОС, например:

  • КИХ-фильтр с симметричными коэффициентами. В качестве одинаковых сомножителей используются коэффициенты фильтра, а на раздельные шины подаются два разных набора отсчётов сигнала, то есть параллельно рассчитываются две половины фильтра, которые затем суммируются.
  • Двухканальная обработка. На общую шину подаются отсчёты сигнала, а на раздельные — наборы коэффициентов.

В некоторых процессорах используются два одинаковых ядра, каждый со своей памятью, то есть одна команда исполняется одновременно в двух ядрах с различными данными. Это позволяет обойти ограничение на использование полностью независимых данных.

Характерным недостатком таких процессоров можно считать необходимость в высокой квалификации разработчика, так как эффективное использование указанных особенностей требует программирования на языке ассемблера, хорошего знания архитектуры и системы команд, то есть эти устройства считаются «недружественными» к языкам высокого уровня.



Просмотров: 11999


<<< Мультикор
Эльбрус 2000 >>>