Интернет магазин китайских планшетных компьютеров



Компьютеры - Структуры хранения в базе данных - Структурирование файлов

22 января 2011


Оглавление:
1. Структуры хранения в базе данных
2. Структурирование файлов



«Кучи»

  • Простейший и самый основной метод
    • Делает эффективным добавление новых записей. Записи добавляются в конце файла — 'хронологический' порядок
    • Неэффективный поиск так как поиск должен быть линейным
    • Удаление — чтобы удалить помеченные записи, требуется периодическая реорганизация, если файл очень неустойчивый
  • Преимущества
    • хорош для загрузки больших объёмов данных
    • хорош для относительно небольших отношений, так как избегаются излишние расходы при индексации
    • Подходит, когда извлечение привлекает большую часть записей
  • Недостатки
    • Не эффективен для селективного поиска с помощью ключевых слов
    • Сортировка может вызывать затруднения
  • Не подходит для ‘временных’ таблиц

Hash корзины

  • Хэш-функции вычисляют адрес страницы, на которой будет храниться запись, на основе одного или более полей в записи
    • Функции хэширования, выбираются для того, чтобы обеспечить равномерное распределение адресов через адресное пространство
    • ‘размещение’ как правило, 40 % — 60 % от общего размера файла
    • уникальный адрес не гарантируется этим методом, поэтому необходимы механизмы определения столкновений и механизмы исправления столкновений
  • открытая адресация
  • цепное/ нецепное переполнение
  • плюсы и минусы
    • эффективен для точных соответствий по ключевым полям
    • не подходит для диапазона поиска, который требует последовательного хранения
    • вычисляет, где хранятся записи, на основе полей в записи
    • хэш-функции обеспечивают равномерное распределение данных
    • Возможны столкновения, поэтому требуются обнаружение столкновений и восстановление

B+ деревья

Наиболее часто используются на практике.

  • время доступа к любому из кортежей одинаково, так как в поиске одно и то же количество узлов
  • индекс — полный индекс, поэтому файлы данных не нужно упорядочивать
  • Плюсы и минусы
    • универсальная структура данных — как последовательный, так и произвольный доступ
    • быстрый доступ
    • поддерживает точный диапазон
    • Проблема 'летучих' файлов решаются эффективно, потому что индексы динамические — расширяются и сжимаются, когда таблица растёт и уменьшается
    • хуже подходит для относительно стабильных файлов — в этом случае, ISAM является более эффективным


Просмотров: 1670


<<< Ссылочная целостность