Интернет магазин китайских планшетных компьютеров



Компьютеры - Гистограмма (статистика)

24 февраля 2011





Гистограмма в математической статистике - это функция, приближающая плотность вероятности некоторого распределения, построенная на основе выборки из него.

Определение

Пусть X_1,\ldots,X_n,\ldots - выборка из некоторого распределения. Определим разбиение числовой прямой -\infty < a_0<a_1< \cdots <a_{k-1}<a_k<\infty. Пусть

n_i = \sum\limits_{j=1}^n \mathbf{1}_{\{X_j \in (a_{i-1},a_i]\}},\; \quad i=1,\ldots,k

- число элементов выборки, попавших в i-й интервал. Тогда кусочно-постоянная функция \tilde{h}:\mathbb{R}\to \mathbb{R}, имеющая вид:

\tilde{h} = n_i,\quad x \in (a_{i-1},a_i],\; i=1,\ldots, k,

называется гистограммой выборки X_1,\ldots,X_n. Функция h:\mathbb{R} \to \mathbb{R}, задаваемая равенством

h = \frac{n_i}{n \, \Delta a_i} \quad x \in (a_{i-1},a_i],\; i=1,\ldots, k,

где \Delta a_i \equiv a_i - a_{i-1},\; i=1,\ldots, k, - называется нормализованной гистограммой.

Гистограмма абсолютно непрерывного распределения

Пусть распределение случайных величин Xi абсолютно непрерывно, и задаётся плотностью вероятности f. Тогда

\forall x \in \, \Delta a_i \equiv \frac{n_i}{n} \to \mathbb{P}\, dx,\quad i = 1,\ldots, k по вероятности при n \to \infty.

Замечание

Таким образом площадь фигуры под нормализованной гистограммой, ограниченной интервалом (ai − 1,ai], приближается к вероятности принятия значений внутри этого интервала любой из случайных величин Xj. Однако, нормализованная гистограмма не сходится поточечно к теоретической плотности распределения этих случайных величин.



Просмотров: 2015


<<< АФЧХ
Граф-схема алгоритма >>>