Словарь данных - Data dictionary

Словарь данных или метаданные хранилище , как это определенно в IBM Словаре Computing , является «централизованным хранилищем информации о таких данных, как это означает, отношения к другим данным, происхождению, использованию и формату». Oracle определяет его как набор таблиц с метаданными. Термин может иметь одно из нескольких тесно связанных значений, относящихся к базам данных и системам управления базами данных (СУБД):

Документация

Словарь терминов и репозиторий данных указывают на более общую программную утилиту, чем каталог. Каталог тесно связан с программным обеспечением СУБД. Он предоставляет информацию, хранящуюся в нем, пользователю и администратору баз данных, но в основном к нему обращаются различные программные модули самой СУБД, такие как компиляторы DDL и DML , оптимизатор запросов, процессор транзакций, генераторы отчетов и ограничение силовик. С другой стороны, словарь данных - это структура данных, в которой хранятся метаданные , то есть (структурированные) данные об информации. Программный пакет для автономного словаря данных или репозитория данных может взаимодействовать с программными модулями СУБД, но он в основном используется разработчиками, пользователями и администраторами компьютерной системы для управления информационными ресурсами. Эти системы содержат информацию о системном аппаратном и программном обеспечении, конфигурации, документации, приложениях и пользователях, а также другую информацию, относящуюся к системному администрированию.

Если система словарей данных используется только разработчиками, пользователями и администраторами, а не программным обеспечением СУБД, она называется пассивным словарем данных. В противном случае он называется активным словарем данных или словарем данных. Когда пассивный словарь данных обновляется, это делается вручную и независимо от любых изменений в структуре СУБД (базы данных). При активном словаре данных словарь обновляется первым, и в результате изменения происходят в СУБД автоматически.

Пользователи баз данных и разработчики приложений могут извлечь выгоду из авторитетного документа словаря данных, который каталогизирует организацию, содержание и условные обозначения одной или нескольких баз данных. Обычно сюда входят имена и описания различных таблиц (записей или сущностей) и их содержимого ( полей ), а также дополнительные сведения, такие как тип и длина каждого элемента данных . Еще одна важная информация, которую может предоставить словарь данных, - это отношения между таблицами. Это иногда упоминается в диаграммах сущность-связь или, если используются дескрипторы Set, определяющие, в каких наборах участвуют таблицы базы данных.

В активном словаре данных ограничения могут накладываться на базовые данные. Например, диапазон может быть наложен на значение числовых данных в элементе данных (поле), или запись в таблице может быть ПРИНУЖДЕНА для участия в установленной взаимосвязи с другим типом записи. Кроме того, распределенная СУБД может иметь определенные особенности местоположения, описанные в ее активном словаре данных (например, где физически расположены таблицы).

Словарь данных состоит из типов записей (таблиц), созданных в базе данных с помощью командных файлов, созданных системой, адаптированных для каждой поддерживаемой серверной СУБД. В Oracle есть список конкретных представлений для пользователя «sys». Это позволяет пользователям искать точную информацию, которая им необходима. Командные файлы содержат операторы SQL для CREATE TABLE, CREATE UNIQUE INDEX, ALTER TABLE (для ссылочной целостности) и т. Д. С использованием специального оператора, необходимого для этого типа базы данных.

Универсального стандарта в отношении уровня детализации в таком документе не существует.

ПО промежуточного слоя

При создании приложений баз данных может быть полезно ввести дополнительный уровень программного обеспечения словаря данных, то есть промежуточное программное обеспечение , которое взаимодействует с базовым словарем данных СУБД. Такой «высокоуровневый» словарь данных может предлагать дополнительные функции и степень гибкости, выходящую за рамки ограничений собственного «низкоуровневого» словаря данных, основной целью которого является поддержка основных функций СУБД, а не требований. типичного приложения. Например, словарь данных высокого уровня может предоставлять альтернативные модели отношений сущностей, адаптированные для различных приложений, использующих общую базу данных. Расширения словаря данных также могут помочь в оптимизации запросов к распределенным базам данных . Кроме того, функции администратора баз данных часто автоматизируются с использованием инструментов реструктуризации, которые тесно связаны с активным словарем данных.

Программные среды, нацеленные на быструю разработку приложений, иногда включают средства словаря данных высокого уровня, которые могут существенно сократить объем программирования, необходимый для создания меню , форм , отчетов и других компонентов приложения базы данных, включая саму базу данных. Например, PHPLens включает библиотеку классов PHP для автоматизации создания таблиц, индексов и ограничений внешнего ключа переносимо для нескольких баз данных. Другой словарь данных на основе PHP, входящий в состав инструментария RADICORE, автоматически генерирует программные объекты , сценарии и код SQL для меню и форм с проверкой данных и сложными соединениями . Для среды ASP.NET словарь данных Base One предоставляет средства кросс-СУБД для автоматического создания базы данных, проверки данных, повышения производительности ( кэширование и использование индексов), безопасности приложений и расширенных типов данных . Возможности Visual DataFlex предоставляют возможность использовать DataDictionaries в качестве файлов классов для формирования промежуточного уровня между пользовательским интерфейсом и базовой базой данных. Цель состоит в том, чтобы создать стандартизированные правила для поддержания целостности данных и обеспечения соблюдения бизнес-правил в одном или нескольких связанных приложениях.

Некоторые отрасли используют словари обобщенных данных в качестве технических стандартов для обеспечения взаимодействия между системами. Отрасль недвижимости, например, соблюдает Словарь данных РЕСО, которому Национальная ассоциация РИЭЛТОРОВ требует соблюдения своих MLS в своем справочнике по политике. Этот промежуточный слой отображения для собственных баз данных MLS поддерживается компаниями-разработчиками программного обеспечения, которые предоставляют услуги API для организаций MLS.

Примеры для конкретных платформ

Разработчики используют спецификацию описания данных ( DDS ) для описания атрибутов данных в описаниях файлов, которые являются внешними по отношению к прикладной программе, обрабатывающей данные, в контексте IBM i . Таблица sys.ts $ в Oracle хранит информацию о каждой таблице в базе данных. Это часть словаря данных, который создается при создании базы данных Oracle .

Типичные атрибуты

Вот неполный список типичных элементов словаря данных для столбцов или полей:

  • Название организации или формы или их идентификатор (EntityID или FormID). Группа, к которой принадлежит это поле.
  • Имя поля, например имя поля СУБД
  • Отображаемый заголовок поля. По умолчанию может использоваться имя поля, если оно пусто.
  • Тип поля (строка, целое число, дата и т. Д.)
  • Размеры, такие как минимальное и максимальное значения, ширина отображения или количество десятичных знаков. Различные типы полей могут интерпретировать это по-разному. Альтернативный вариант - иметь разные атрибуты в зависимости от типа поля.
  • Порядок отображения полей или порядок табуляции
  • Координаты на экране (если пользовательский интерфейс позиционный или основанный на сетке)
  • Значение по умолчанию
  • Тип подсказки, например раскрывающийся список, поле со списком, флажки, диапазон и т. Д.
  • Требуется (логическое значение) - если «истина», значение не может быть пустым, нулевым или только пробелами.
  • Только для чтения (логическое значение)
  • Имя справочной таблицы, если это внешний ключ. Может использоваться для списков проверки или выбора.
  • Различные обработчики событий или ссылки на. Пример: «при щелчке», «при проверке» и т. Д. См. Программирование, управляемое событиями .
  • Код формата, например регулярное выражение или операторы PIC в стиле COBOL.
  • Описание или синопсис
  • Характеристики или спецификация индекса базы данных

Смотрите также

Рекомендации

Внешние ссылки