Интернет магазин китайских планшетных компьютеров



Компьютеры - Метод главных компонент - Оценка числа главных компонент по правилу сломанной трости

22 января 2011


Оглавление:
1. Метод главных компонент
2. Формальная постановка задачи
3. Диагонализация ковариационной матрицы
4. Сингулярное разложение матрицы данных
5. Матрица преобразования к главным компонентам
6. Отбор главных компонент по правилу Кайзера
7. Оценка числа главных компонент по правилу сломанной трости
8. Нормировка
9. Механическая аналогия и метод главных компонент для взвешенных данных
10. Специальная терминология
11. Примеры использования



Пример: оценка числа главных компонент по правилу сломанной трости в размерности 5.

Одним из наиболее популярных эвристических подходов к оценке числа необходимых главных компонент является правило сломанной трости. Набор нормированных на единичную сумму собственных чисел сравнивается с распределением длин обломков трости единичной длины, сломанной в n − 1-й случайно выбранной точке. Пусть Li — длины полученных кусков трости, занумерованные в порядке убывания длины: L_1 \geq L_2 \geq... L_n. Нетрудно найти математическое ожидание Li:

l_i=\operatorname{E}=\frac{1}{n}\sum_{j=i}^{n} \frac{1}{j}.

По правилу сломанной трости k-й собственный вектор сохраняется в списке главных компонент, если

\frac{\lambda_1}{\operatorname{tr} C}>l_1 \; and \; \frac{\lambda_2}{\operatorname{tr} C}>l_2  \; and \; ... \frac{\lambda_k}{\operatorname{tr} C}>l_k .

На Рис. приведён пример для 5-мерного случая:

l1=/5; l2=/5; l3=/5; l4=/5; l5=/5.

Для примера выбрано

\frac{\lambda_1}{\operatorname{tr} C}=0.5; \frac{\lambda_2}{\operatorname{tr} C}=0.3; \frac{\lambda_3}{\operatorname{tr} C}=0.1; \frac{\lambda_4}{\operatorname{tr} C}=0.06; \frac{\lambda_5}{\operatorname{tr} C}=0.04.

По правилу сломанной трости в этом примере следует оставлять 2 главных компоненты:

\frac{\lambda_1}{\operatorname{tr} C}>l_1 \;; \; \frac{\lambda_2}{\operatorname{tr} C}>l_2 \;; \;\frac{\lambda_3}{\operatorname{tr} C}<l_3\;.

По оценкам пользователей, правило сломанной трости имеет тенденцию занижать количество значимых главных компонент.



Просмотров: 23160


<<< Инфографика
Нейронная сеть Кохонена >>>