Основы современных баз данных
Предисловие
Предметом курса являются системы управления базами данных (СУБД). Это очень важная тема, без основательного знакомства с которой в наше время невозможно быть не только квалифицированным программистом, но даже и грамотным пользователем компьютеров.
Заметим, что литературы на русском языке, посвященной тематике СУБД, очень мало. Невозможно порекомендовать одну или несколько книг, содержание которых покрывало бы материал данного курса. К числу лучших относятся книги К. Дейта "Введение в системы баз данных" (Наука, 1980) и "Руководство по реляционной СУБД DB2" (Финансы и статистика, 1988), а также книга Дж. Ульмана "Основы систем баз данных" (Финансы и статистика, 1983). Хотя эти книги несколько устарели (на английском языке вышло уже несколько дополненных изданий), их стоит читать.
Основное назначение данного курса - систематическое введение в идеи и методы, используемые в современных реляционных системах управления базами данных. В курсе не рассматривается какая-либо одна популярная СУБД; излагаемый материал в равной степени относится к любой современной системе. Как показывает опыт, без знания основ баз данных трудно на серьезном уровне работать с конкретными системами, как бы хорошо они не были документированы.
В вводной части курса рассматриваются основные различия между файловыми системами и системами управления базами данных. На основе анализа возможностей современных файловых систем выделяются области приложений, в которых достаточно использовать файлы, а также те, для которых необходимы базы данных. В этой же части курса обсуждаются базовые функции и приводится типовая организация СУБД. В заключении вводной части кратко рассматриваются основные характеристики ранних, дореляционных систем.
Вторая часть курса содержит необходимый теоретический базис, на котором основывается дальнейшее изложение. Вводятся основные понятия реляционной модели данных, обсуждаются основные свойства отношений, рассматриваются два базовых механизма манипулирования данными: реляционная алгебра и реляционное исчисление. Далее излагаются принципы нормализации, на которых основан классический подход к проектированию реляционных баз данных. Наконец, описывается более современный подход к проектированию баз данных, основанный на использовании семантических моделей данных.
В третьей части курса обсуждаются два классических примера экспериментальных проектов реляционных СУБД, которые, фактически, служат основой всех современных коммерческих СУБД. Рассматриваются проекты System R и Ingres. Идея состоит в том, чтобы продемонстрировать сбалансированные наборы решений, примененных в этих двух существенно различающихся системах.
Четвертая часть курса посвящается внутренней организации современных многопользовательских реляционных СУБД. Рассматриваются методы организации внешней памяти баз данных и применяемые структуры данных. Вводится понятие транзакции и анализируются известные способы управления асинхронно выполняемыми транзакциями. Обсуждаются потребности в журнализации изменений баз данных и связь алгоритмов журнализации с политикой управления буферами оперативной памяти. Наконец, рассматриваются способы применения журнальной и архивной информации для восстановления баз данных после различных сбоев.
В пятой части курса подробно рассматривается язык реляционных баз данных SQL. Исходные понятия SQL обсуждаются на основе версии языка, разработанной в рамках проекта System R. Затем кратко описывается история SQL после System R и, в частности, международная деятельность по его стандартизации. После этого систематически излагается наиболее распространенный стандарт языка - SQL-89. Обсуждаются способы использования SQL при программировании прикладных систем. Пятая часть курса завершается рассмотрением наиболее важных свойств, появившихся в последнем стандарте языка SQL-92.
Шестая часть курса посвящена проблемам, которые решаются в компиляторах языка SQL. Эти проблемы концентрируются вокруг необходимости получения эффективных программ, выполняющих операторы, которые изначально формулируются на декларативном языке SQL. Для решения проблем в компиляторах SQL приходится применять разнообразные оптимизирующие приемы, знание которых помогает понять работу любой конкретной системы.
В седьмой части курса рассматривается применение архитектуры "клиент-сервер" в современных СУБД. Рассматриваются принципы взаимодействия между клиентскими и серверными частями системы, и, в частности, важность применения протоколов удаленного вызова процедур для обеспечения организации неоднородных организаций "клиент-сервер". Обсуждаются типичное разделение функций между клиентами и серверами и следующие из этого требования к аппаратным возможностям.
В восьмой части рассматриваются специфические проблемы распределенных баз данных. Анализируются категории распределенных систем, вопросы именования, администрирования, поддержания надежности и доступности данных, особенности управления транзакциями и компиляции запросов.
Наконец, завершающая курс девятая часть посвящена направлениям и состоянию исследовательских работ в области баз данных. Рассматриваются проекты и исследования, относящиеся к так называемым системам баз данных следующего поколения; основные принципы организации систем объектно-ориентированных баз данных; системы баз данных, основанные на правилах, включая активные и дедуктивные базы данных.
Содержание
- Введение
- Лекция 1. Базы данных и файловые системы
- Лекция 2. Функции СУБД. Типовая организация СУБД. Примеры
- Лекция 3. Ранние подходы к организации БД. Системы, основанные на инвертированных списках, иерархические и сетевые СУБД. Примеры. Сильные места и недостатки ранних систем
- Теоретические
основы
- Лекция 4. Общие понятия реляционного подхода к организации БД. Основные концепции и термины
- Лекция 5. Базисные средства манипулирования реляционными данными
- Лекция 6. Проектирование реляционных БД
- Две классические
экспериментальные системы
- Лекция 7. System R: общая организация системы, основы языка SQL
- Лекция 8.
Ingres: общая организация
системы, основы языка Quel
- 8.1. История СУБД Ingres
- 8.2. Ingres как UNIX-ориентированная СУБД. Динамическая структура системы: набор процессов
- 8.3. Структуры данных, методы доступа, интерфейсы доступа к данным
- 8.4. Общая характеристика языка QUEL. Язык программирования EQUEL
- 8.5. Общий подход к организации представлений, ограничениям целостности и контролю доступа
- Внутренняя организация реляционных СУБД
- Язык реляционных
баз данных SQL
- Лекция 13.
Язык SQL. Функции и основные
возможности
- 13.1.
SEQUEL/SQL СУБД System R
- 13.1.1. Запросы и операторы манипулирования данными
- 13.1.2. Операторы определения и манипулирования схемой БД
- 13.1.3. Определения ограничений целостности и триггеров
- 13.1.4. Представления базы данных
- 13.1.5. Определение управляющих структур
- 13.1.6. Авторизация доступа к отношениям и их полям
- 13.1.7. Точки сохранения и откаты транзакции
- 13.1.8. Встроенный SQL
- 13.1.9. Динамический SQL
- 13.2. Язык SQL в коммерческих реализациях
- 13.3. Стандартизация SQL
- 13.1.
SEQUEL/SQL СУБД System R
- Лекция 14. Стандартный язык баз данных SQL
- Лекция 15. Язык SQL. Средства манипулирования данными
- Лекция 16. Использование SQL при прикладном программировании
- Лекция 17.
Некоторые черты SQL/92 и SQL-3
- 17.1. Оператор выделения памяти под дескриптор
- 17.2. Оператор освобождения памяти из-под дескриптора
- 17.3. Оператор получения информации из области дескриптора SQL
- 17.4. Оператор установки дескриптора
- 17.5. Оператор подготовки
- 17.6. Оператор отказа от подготовленного оператора
- 17.7. Оператор запроса описания подготовленного оператора
- 17.8. Оператор выполнения подготовленного оператора
- 17.9. Оператор подготовки с немедленным выполнением
- 17.10. Оператор объявления курсора над динамически подготовленным оператором выборки
- 17.11. Оператор определения курсора над динамически подготовленным оператором выборки
- 17.12. Оператор открытия курсора, связанного с динамически подготовленным оператором выборки
- 17.13. Оператор чтения строки по курсору, связанному с динамически подготовленным оператором выборки
- 17.14. Оператор закрытия курсора, связанного с динамически подготовленным оператором выборки
- 17.15. Оператор позиционного удаления по курсору, связанному с динамически подготовленным оператором выборки
- 17.16. Оператор позиционной модификации по курсору, связанному с динамически подготовленным оператором выборки
- 17.17. Подготавливаемый оператор позиционного удаления
- 17.18. Подготавливаемый оператор позиционной модификации
- 17.19. Сводка новых возможностей SQL-3
- Лекция 13.
Язык SQL. Функции и основные
возможности
- Компиляторы языка SQL
- СУБД в архитектуре "клиент-сервер"
- Распределенные базы данных
- Современные
направления исследований и
разработок
- Лекция 21. Системы управления базами данных следующего поколения
- Лекция 22.
Объектно-ориентированные
СУБД
- 22.1. Связь объектно-ориентированных СУБД с общими понятиями объектно-ориентированного подхода
- 22.2. Объектно-ориентированные модели данных
- 22.3. Языки программирования объектно-ориентированных баз данных
- 22.4. Языки запросов объектно-ориентированных баз данных
- 22.5. Примеры объектно-ориентированных СУБД
- Лекция 23. Системы баз данных, основанные на правилах