|
|
Компьютеры - Структуры хранения в базе данных - Структурирование файлов22 января 2011
Оглавление: 1. Структуры хранения в базе данных 2. Структурирование файлов
«Кучи»
- Простейший и самый основной метод
- Делает эффективным добавление новых записей. Записи добавляются в конце файла — 'хронологический' порядок
- Неэффективный поиск так как поиск должен быть линейным
- Удаление — чтобы удалить помеченные записи, требуется периодическая реорганизация, если файл очень неустойчивый
- Преимущества
- хорош для загрузки больших объёмов данных
- хорош для относительно небольших отношений, так как избегаются излишние расходы при индексации
- Подходит, когда извлечение привлекает большую часть записей
- Недостатки
- Не эффективен для селективного поиска с помощью ключевых слов
- Сортировка может вызывать затруднения
- Не подходит для ‘временных’ таблиц
Hash корзины
- Хэш-функции вычисляют адрес страницы, на которой будет храниться запись, на основе одного или более полей в записи
- Функции хэширования, выбираются для того, чтобы обеспечить равномерное распределение адресов через адресное пространство
- ‘размещение’ как правило, 40 % — 60 % от общего размера файла
- уникальный адрес не гарантируется этим методом, поэтому необходимы механизмы определения столкновений и механизмы исправления столкновений
- открытая адресация
- цепное/ нецепное переполнение
- плюсы и минусы
- эффективен для точных соответствий по ключевым полям
- не подходит для диапазона поиска, который требует последовательного хранения
- вычисляет, где хранятся записи, на основе полей в записи
- хэш-функции обеспечивают равномерное распределение данных
- Возможны столкновения, поэтому требуются обнаружение столкновений и восстановление
B+ деревья
Наиболее часто используются на практике.
- время доступа к любому из кортежей одинаково, так как в поиске одно и то же количество узлов
- индекс — полный индекс, поэтому файлы данных не нужно упорядочивать
- Плюсы и минусы
- универсальная структура данных — как последовательный, так и произвольный доступ
- быстрый доступ
- поддерживает точный диапазон
- Проблема 'летучих' файлов решаются эффективно, потому что индексы динамические — расширяются и сжимаются, когда таблица растёт и уменьшается
- хуже подходит для относительно стабильных файлов — в этом случае, ISAM является более эффективным
Связать
Просмотров: 1732
|