Интернет магазин китайских планшетных компьютеров



Компьютеры - Нейронная сеть Кохонена - Упругие карты

23 января 2011


Оглавление:
1. Нейронная сеть Кохонена
2. Сети векторного квантования
3. Самоорганизующиеся карты Кохонена
4. Упругие карты
5. Сети векторного квантования, обучаемые с учителем



Визуализация набора данных по экспрессии генов в раке молочной железы с использованием упругих карт и метода главных компонент. Классы точек показаны с использованием размера, формы и цвета. На панели показана конфигурация узлов двумерной упругой карты в проекции на первые три главные компоненты. Сравнивая и, можно заметить, что базальный тип опухоли как кластер лучше отделен на нелинейной проекции.

Метод аппроксимации многомерных данных, основанный на минимизации «энергии упругой деформации» карты, погружённой в пространство данных, был предложен А. Н. Горбанём в 1996 году, и впоследствии развит им совместно с А. Ю. Зиновьевым, А. А. Россиевым и А. А. Питенко. Метод основан на аналогии между главным многообразием и эластичной мембраной и упругой пластиной. В этом смысле он является развитием классической идеи сплайна.

Пусть задана совокупность входных векторов S. Так же, как и сети векторного квантования и самоорганизующиеся карты, упругая карта представлена как совокупность кодовых векторов Wj в пространстве сигналов. Множество данных S разделено на классы Kj, состоящие из тех точек x \in S, которые ближе к Wj, чем к другим Wl. Искажение кодирования D

D=\sum_{j=1}^k \sum_{x \in K_j}\|x-W_j\|^2,

может трактоваться как суммарная энергия пружин единичной жёсткости, связывающих векторы данных с соответствующими кодовыми векторами.

На множестве узлов задана дополнительная структура: некоторые пары связаны «упругими связями», а некоторые тройки объединены в «рёбра жёсткости». Обозначим множество пар, связанных упругими связями, через E, а множество троек, составляющих рёбра жёсткости, через G. Например, в квадратной решётке ближайшие узлы связываются упругими связями, а ребра жёсткости образуются вертикальными и горизонтальными тройками ближайших узлов. Энергия деформации карты состоит из двух слагаемых:

энергия растяжения U_{E}=\lambda \sum_{ \in E} \|W_i -W_j\|^2 ;
энергия изгиба U_{G}=\mu \sum_{ \in G} \|W_i -2W_j+W_l\|^2 ;

где λ,μ — соответствующие модули упругости.

Задача построения упругой карты состоит в минимизации функционала

U = D + UE + UG;

Если разбиение совокупности входных векторов S на классы Kj фиксировано, то минимизация U — линейная задача с разреженной матрицей коэффициентов. Поэтому, как и для сетей векторного квантования, применяется метод расщепления: фиксируем {Wj} — ищем {Kj} — для данных {Kj} ищем {Wj} — для данных {Wj} ищем {Kj} — … Алгоритм сходится к минимуму U.

Метод упругих карт позволяет решать все задачи, которые решают самоорганизующиеся карты Кохонена, однако обладает большей регулярностью и предсказуемостью. При увеличении модуля изгиба μ упругие карты приближаются к линейным главным компонентам. При уменьшении обоих модулей упругости они превращаются в Кохоненовские сети векторного квантования. В настоящее время упругие карты интенсивно используются для анализа многомерных данных в биоинформатике. Соответствующее программное обеспечение опубликовано и свободно доступно на сайте Института Кюри.

На рисунке представлены результаты визуализации данных по раку молочной железы. Эти данные содержат 286 примеров с указанием уровня экспрессии 17816 генов. Они доступны онлайн как ставший классическим тестовый пример для визуализации и картографии данных.



Просмотров: 6567


<<< Метод главных компонент
Проекция максимальной интенсивности >>>