Интернет магазин китайских планшетных компьютеров



Компьютеры - Задача классификации - Математическая постановка задачи

23 января 2011


Оглавление:
1. Задача классификации
2. Математическая постановка задачи
3. Типология задач классификации



Пусть X~ — множество описаний объектов, Y~ — множество номеров классов. Существует неизвестная целевая зависимость — отображение y^{*}\colon X\to Y, значения которой известны только на объектах конечной обучающей выборки X^m = \{,\dots,\}. Требуется построить алгоритм a\colon X\to Y, способный классифицировать произвольный объект x \in X.

Вероятностная постановка задачи

Более общей считается вероятностная постановка задачи. Предполагается, что множество пар «объект, класс» X \times Y является вероятностным пространством с неизвестной вероятностной мерой \mathsf P. Имеется конечная обучающая выборка наблюдений X^m = \{,\dots,\}, сгенерированная согласно вероятностной мере \mathsf P. Требуется построить алгоритм a\colon X\to Y, способный классифицировать произвольный объект x \in X.

Признаковое пространство

Признаком называется отображение f\colon X\to D_f~, где D_f~ — множество допустимых значений признака. Если заданы признаки f_1,\dots,f_n~, то вектор {\mathbf x} =,\dots,f_n) называется признаковым описанием объекта x\in X. Признаковые описания допустимо отождествлять с самими объектами. При этом множество X = D_{f_1}\times\dots\times D_{f_n} называют признаковым пространством.

В зависимости от множества Df признаки делятся на следующие типы:

  • бинарный признак: Df = {0,1};
  • номинальный признак: Df — конечное множество;
  • порядковый признак: Df — конечное упорядоченное множество;
  • количественный признак: Df — множество действительных чисел.

Часто встречаются прикладные задачи с разнотипными признаками, для их решения подходят далеко не все методы.



Просмотров: 3568


<<< Система компьютерной алгебры
Классификация документов >>>