Данные и организация баз данных » Буквы.Ру Научно-популярный портал<script async custom-element="amp-auto-ads" src="https://cdn.ampproject.org/v0/amp-auto-ads-0.1.js"> </script>

Данные и организация баз данных

<

110313 0449 1 Данные и организация баз данных2.3.Данные. Напомним некоторые факты:

  • Информация об объекте или отношениях объектов, выраженная в знаковой форме, образует данные;
  • Данные можно переводить из одной знаковой системы в другую (перекодировка) без потери информации.

    Последний факт – это существенное свойство знакового отображения – позволяет описывать реальную предметную ситуацию в различных системах знаков, ориентированных на воспринимающего (См. рис. 4).

    110313 0449 2 Данные и организация баз данных

    2.4. Создавая БД, необходимо упорядочивать информацию по различным признакам (атрибутам) и быстро извлекать выборку с произвольным сочетанием признаков (свойств). Сделать это можно только, если данные структурированы. Структурирование – это введение соглашений о способах представления данных.

    В информатике совокупность взаимосвязанных данных называется информационной структурой, или структурой данных.

    Рассмотрим пример: Пусть имеется следующая информация о группе студентов:

  • ФИО;
  • Номер зачетной книжки;
  • Дата рождения.

    Отобразим эту информацию неструктурированными данными:

  • Сергей Петрович Иванов, зачетная книжка № 15, родился в1962 года 1 мая;
  • Сидоров Петр Иванович, номер зачетной книжки 48, дата рождения 18 сентября 1965 г.;
  • Антонов А. Б., зачетка № 71, родился 16.05.62.

    Выполним структурирование этих данных и получим, например следующую таблицу:

     

     

    Фамилия

     

     

    Имя

     

     

    Отчество

     

    Номер зачетной книжки 

    Дата рождения 

    Иванов 

    Сергей 

    Петрович 

    15 

    01.05.62 

    Сидоров 

    Петр 

    Иванович 

    48 

    18.09.65 

    Антонов 

    Алексей 

    Борисович 

    71 

    16.05.62 

     

    Заметим, что каждая из трех строчек таблицы представляет собой набор (запись из трех полей) свойств объекта «студент». Теперь воспринимать и использовать информацию стало гораздо удобнее. Представленная таблица является информационной моделью.

    2.5. Рассмотрим схематично основные понятия структурных элементов базы данных: поле, запись, файл. Изобразим схематично взаимоотношения между ними:

     

    110313 0449 3 Данные и организация баз данныхИмя поля 1

    Имя поля 2 

     

    Имя поля n

           

    110313 0449 4 Данные и организация баз данных110313 0449 5 Данные и организация баз данных

         
           
           

    110313 0449 6 Данные и организация баз данных110313 0449 7 Данные и организация баз данных

     

     

    Поле – элементарная единица логической организации данных, которая соответствует неделимой единице информации – реквизиту. Для описания поля используют следующие характеристики: имя, тип (данных), длина, точность (для числовых данных) и т.д.

    Запись – совокупность логически связанных полей. Экземпляр записи – отдельная реализация записи, содержащая конкретные значения полей.

    Файл (таблица, очередь)
    – совокупность экземпляров записей одной структуры.

    Описание логической структуры записи файла содержит последовательность расположения полей и их основные характеристики. Схематично это можно изобразить следующим образом:

     

    Имя файла 

    Поле 

    Признак ключа 

    Формат поля 

    Имя 

    Наименование 

    Тип 

    Длина 

    Точность(для чисел) 

    Имя 1 

             

     

     

     

     

     

     

    Имя n

             

     

    Записи логического файла идентифицируются с помощью уникальной группы символов – ключа. Обычно ключом является поле или совокупность полей фиксированной длины. Каждому значению ключа может соответствовать одна или несколько записей файла.

    2.6. Введенные понятия структурных элементов информации (базы данных) в рамках выделенных аспектов, позволяют перейти к изучению уровней представления данных.

    Впервые идея многоуровневого представления данных БД была предложена группой сотрудников Национального института стандартов США. Суть предложения заключается в рассмотрении БД на трех уровнях: внутреннем, концептуальном, внешнем. Внутренний уровень связан с фактическим хранением данных в памяти ЭВМ. Внешний уровень характеризует представление пользователей о данных и их взаимосвязях. Концептуальный уровень выступает в качестве промежуточного между внутренним и внешним уровнями и отражает интегрированное представление данных с позиций ПрО.

    Т.к. данные на концептуальном уровне связаны со спецификой конкретной СУБД, при проектировании (разработке) БД вводят так называемый инфологический (информационно-логический) уровень, отражающий только структуру данных ПрО, не содержащую требований (ограничений) конкретной СУБД.

    Приведем укрупненную схему взаимодействия перечисленных уровней в процессе отображения информации.

    110313 0449 8 Данные и организация баз данных

    <

     

    Рассмотрим подробнее данные на каждом уровне. Начнем с концептуального уровня.

    Концептуальный уровень БД описывает представление информационного содержание БД в более абстрактном виде по сравнению с физическим представлением. Концептуальной моделью является совокупность экземпляров концептуальных записей. Концептуальную модель определяют с помощью концептуальной схемы – множества типов концептуальных записей вместе с существующими между ними отношениями. Таким образом, концептуальная схема – это совокупность имен объектов и атрибутов вместе со связями между ними.

    Внутренний уровень
    отображает требуемую организацию данных в среде хранения и соответствует физическому аспекту представления данных. Внутренняя модель состоит из отдельных экземпляров записей, физически хранимых на внешних носителях.

    Внешний уровень поддерживает частные представления данных, требуемые конкретным пользователем. Внешняя модель является подмножеством концептуальной модели и определяется внешней схемой, т.е. множеством типов внешних записей с их взаимодействиями. Возможно пересечение внешних моделей по данным. Частная логическая структура данных для отдельного приложения (задачи) или пользователя соответствует внешней модели или подсхеме БД. С помощью внешних моделей поддерживается санкционированный доступ приложений к данным БД. Это означает, что ограничен состав и структура данных концептуальной модели БД, доступных в приложениях, а также заданы допустимые режимы обработки этих данных: ввод, редактирование, удаление, поиск.

    Изобразим схематично функциональную структуру процесса преобразования моделей данных при взаимодействии пользователей с СУБД.

    110313 0449 9 Данные и организация баз данных

    2.7. Исследуем природу связей между элементами данных концептуальной и внешней схем. Эти связи могут быть следующих видов.

    Связь»один к одному» (простая связь 1:1) означает, что в любой момент времени каждому значению (экземпляру) элемента данных D соответствует одно и только одно значение связанного с ним элемента данных E. Это значит, что D идентифицирует E. Например, между элементами данных «зачетная книжка» и «фамилия студента» имеется связь «один к одному».

     

    110313 0449 10 Данные и организация баз данных

     

     

    Связь «один ко многим» (сложная связь, 1:М) между элементами данных D и Е означает, что любому элементу данных D соответствует более одного значения связанного с ним элемента данных Е. Например, между элементами данных «экзамен по информатике» и «студент» связь «один ко многим».

    110313 0449 11 Данные и организация баз данных

     

    Связь «многие ко многим» (М:М) показывает, что одному значению элемента данных множества D, может соответствовать несколько значений элемента данных множества Е, и наоборот. Например, между элементами данных «студент (фамилия, № зачетной книжки, факультет)» и «предмет (название, количество учебных часов)»

    110313 0449 12 Данные и организация баз данных

    Помимо вида, связи могут подразделяться на условные и безусловные. Условная связь между элементами данных имеет такой смысл: любому значению элемента данных множества D может соответствовать одно или ни одного значения связанного с ним элемента данных из Е.

    Анализ связей между элементами в схеме БД позволяет не только установить наличие связи, но и определить ее смысл. Это обуславливает создание эффективных средств диалога некомпетентного (конечного) пользователя.

    2.8. Проектирование БД состоит в построении комплекса взаимосвязанных моделей данных. Процесс проектирования БД можно разбить на следующие этапы:

     

    110313 0449 13 Данные и организация баз данных

    Важнейшим этапом проектирования БД является разработка инфологической модели ПрО, не ориентированный на конкретную СУБД. В инфологической модели средствами структур данных в интегрированном виде отражают состав и структуру данных, а также информационные потребности приложений (задач и запросов).

    Инфологическая модель ПрО отражает ПрО в виде совокупности информационных объектов и их структурных связей.

    Инфологическая модель ПрО строится первой. Предварительная инфологическая модель строится еще на предпроектной стадии и затем уточняется на более поздних стадиях проектирования БД. Затем на ее основе строится концептуальная (логическая), внутренняя (физическая) и внешняя модели.

    Более подробно о проектировании БД на инфологическом уровне рассмотрим ниже.

    2.9. Ядром любой БД является модель данных. Модель данных представляет собой множество структур данных, ограничений целостности и операций манипулирования данными. С помощью модели данных могут быть представлены объекты ПрО и взаимосвязи между ними.

    Модель данных – это совокупность структур данных и операций их обработки.

    Соответственно организации данных различают и БД: иерархическая, сетевая или реляционная. СУБД основывается на использовании одной модели или на комбинации этих моделей. Однако иерархические и сетевые БД являются менее распространенные, чем реляционные и не могут быть реализованы с помощью наиболее популярных СУБД, входящих в состав программного обеспечения ЭВМ. Рассмотрим подробнее указанные модели.

    Иерархическая модель данных. Иерархические структуры представляют собой совокупность элементов, связанных между собой по определенным правилам. Объекты, связанные иерархическими отношениями, образуют неориентированный граф (перевернутое дерево), изобразить который можно так:

     

    110313 0449 14 Данные и организация баз данных

     

    К основным понятиям иерархической структуры относятся: уровень, элемент(узел), связь. Узел – это совокупность атрибутов данных, описывающих некоторый объект. На схеме узлы представляются вершинами графа.


    Сетевая модель данных. В сетевой структуре при тех же основных понятиях (уровень, узел, связь) каждый элемент может быть связан с любым другим элементом. Это можно изобразить в виде графа:

    110313 0449 15 Данные и организация баз данных

    Реляционная модель данных. Понятие реляционной (англ. Relation — отношение) связано с разработками американского специалиста в области БД Е. Кодда. Эти модели характеризуются простотой структуры данных, удобным для пользователя табличным представлением и возможностью использования формального аппарата алгебры отношений и реляционного исчисления для обработки данных.

    2.10. Реляционная модель ориентирована на организацию данных в виде двумерных таблиц — отношений. Каждая реляционная таблица представляет собой двумерный массив и обладает следующими свойствами:

    • Каждый элемент таблицы – один элемент данных;
    • Все столбцы в таблице однородные (по типу данных и размеру);
    • Каждый столбец имеет уникальное имя;
    • Одинаковые строки в таблице отсутствуют;
    • Порядок следования строк и столбцов произвольный.

    Отношения представлены в виде таблицы, строки которых соответствуют кортежам или записям, а столбцы со значениями соответствующего атрибута называются доменом (поле).

    Каждая запись должна однозначно идентифицироваться уникальным ключом записи. Существуют ключи двух типов: первичный (уникальный) и вторичный.

    Первичный ключ – одно или несколько полей, однозначно определяющих запись. При этом, если ключ состоит только из одного поля, то он называется простым, в противном случае – составным.

    Вторичный ключ – это поле, значение которого может повторяться в нескольких записях, т.е. по вторичному ключу определяется несколько записей.

    Чтобы связать две реляционные таблицы необходимо ключ первой таблицы ввести в состав ключа второй таблицы (возможно совпадение ключей); в противном случае нужно ввести в структуру первой таблицы внешний ключ – ключ второй таблицы.

    Понятие нормализации отношений

    Как мы уже отмечали, с математической (реляционной алгебры) точки зрения реляционная база данных – набор взаимосвязанных отношений (таблиц). Каждое отношение представляется в виде файла. Между ними существует следующие соответствия:

     

    Таблица 

    Отношение 

    Файл 

    строка 

    кортеж 

    запись 

    столбец 

    атрибут 

    поле 

     

    Отношение определяется схемой – списком атрибутов. В указанном разделе математики определены и операции над отношениями, позволяющие преобразовывать одни отношения в другие. Задача группировки атрибутов в отношения при условии, что набор возможных отношений заранее не фиксирован, допускает большое количество различных вариантов и приводит к проблеме выбора рационального варианта из множество альтернативных вариантов схемы отношения.

    Рациональные варианты группировки атрибутов в отношения должны отвечать следующим требованиям:

  1. Выбранные для отношений первичные ключи должны быть минимальными;
  2. Выбранный состав отношений базы должен быть минимальным (отличаться минимальной избыточностью атрибутов);
  3. При выполнении операций включения, удаления и модификации данных в базе не должно быть трудностей;
  4. Перестройка набора отношений при введении новых типов данных должна быть минимальной;
  1. Разброс времени ответа на различные запросы к БД должен быть небольшим.
  2. Удовлетворение этих требований достигается нормализацией отношений.
  3. Нормализация отношений – многошаговый процесс разложения исходных отношений Бд на более мелкие и простые.
  4. К основным задачам СУБД относятся:
  • Создание БД (описание данных, их подготовка, загрузка в БД, контроль, запоминание и структуризация);
  • Обеспечение независимости ПП от организации данных в базе;
  • Поддержание актуальности данных (добавление, исключение, изменение данных в базе);
  • Модернизация и расширение БД, реорганизация структур данных;
  • Обеспечение сохранности данных, защита и восстановление при машинных и программных сбоях, ошибках персонала и пользователей;
  • Реализация защиты данных от несанкционированного доступа, соблюдение секретности данных;
  • Сохранение целостности данных;
  • Осуществление диагностики работ системы и выдача необходимых сообщений;
  • Создание для широкого круга пользователей доступа к данным, в том числе в диалоговом режиме;
  • Поиск данных в базе по запросам пользователей, их отображение во внешних устройствах системы.

    Общение пользователя с СУБД происходит посредством имеющихся языковых возможностей системы с учетом соответствующей модели данных. Язык взаимодействия пользователей с СУБД состоит из языка описания данных (ЯОД) и зыка манипулирования данными (ЯМД). ЯОД является средством объявления СУБД структур, которые будут использоваться. ЯОД должен выполнять следующие функции:

  • Идентифицировать типы подразделений данных (элемент данных, сегмент, запись, файл), которые различны в разных языках;
  • Присваивать уникальное имя каждому типу элемента данных, записи, файлу БД;
  • Перечислять для типов агрегатов данных, записей, файлов типы входящих в них элементов данных, указывать их порядок и повторяющиеся группы;
  • Указывать, какие типы элементов или их комбинации используются в качестве ключей;
  • Перечислять способы установления отношений между типами сегментов или записей, определяющие древовидные, сетевые или реляционные структуры;
  • Обеспечивать именование отношений между типами сегментов или записей;
  • Специфицировать:
  1. длину и диапазон значений элементов данных;
  2. количество элементов данных, составляющих вектор;
  3. размер и число измерений массива;
  4. количество агрегатов данных в повторяющейся группе;
  5. порядок записей в файле или БД.

    Обобщенная технология работы.

    В качестве основных этапов технологии работы в СУБД можно выделить следующие:

  • создание структур таблиц БД;
  • ввод и редактирование данных в таблицах (с использованием форм и без них);
  • обработка данных, содержащихся в таблицах (на основе запросов, программ);
  • вывод информации из БД (с использованием отчетов и без них).

    Широкое распространение имеют СУБД для персональных компьютеров типа DBASE (DBASE III, IV, FoxPro, Paradox), Clipper, Clarion. Эти СУБД ориентированы на однопользовательский режим работы с БД имеют очень ограниченные возможности. В связи с развитием компьютерных сетей новые версии СУБД включают в себя возможности языка манипулирования данными SQL ( от английских слов Structured Query Language –структурированный язык запросов). В последнее время наибольшее коммерческое распространение получила СУБД ACCESS (от английского «доступ»). MS Access одна из самых мощных, гибких и простых в использовании. В ней можно создавать много приложений, в том числе с использованием языка программирования Visual Basic Aplication.

    Популярность СУБД Microsoft Access обусловлена следующим:

  • Access одна из самых легкодоступных и понятных систем как для профессионалов, так и для начинающих пользователей, позволяющая быстро освоить основные принципы работы с БД;
  • система имеет полностью русифицированную версию;
  • полная интеграция с пакетами Microsoft Office: Word, Excel, Power Point, Mail;
  • идеология Windows позволяет представлять информацию красочно и наглядно;
  • возможность использования OLE технологии позволяет установить связь с объектами других приложений или внедрить какие-либо объекты в базу данных Access;
  • технология WYSIWIG позволяет пользователю постоянно видеть все результаты своих действий;
  • широко и наглядно представлена справочная система;
  • существует набор «мастеров» и конструкторов по разработке и созданию объектов: таблиц, форм и отчетов.

    4. Проектирование базы данных можно рассматривать на разных уровнях……. Остановимся подробно на инфологическом уровне. Информационное моделирование предметной области имеет решающее значение для разработки алгоритмов и программ, работающих с БД. В основе данного подхода лежит положение об определяющей роли и независимости данных при проектировании алгоритмов и программ. Подход, сложившийся в условиях появления концепции БД, имеет следующие составляющие:

    – информационный анализ предметных областей;

    – построение взаимосвязанных моделей данных;

    – системное проектирование функций обработки данных;

    – детальное конструирование процедур обработки данных.

    Различают информационные модели разных уровней представления: инфологическая и датологическая модели соответственно двум понятиям – «информация» и «данные». Инфологическая модель, предшествующая всем остальным, опирается на семантические (смысловые) модели, отражающие информационное содержание предметной области в виде, независимом от конкретной используемой системы управления базами данных (СУБД). С этой моделью работают пользователи всех уровней, и поэтому она должна опираться на их знания и использование естественного языка.

    На этапе инфологического проектирования информационной системы должны быть решены вопросы:

  1. о каких объектах или явлениях реального мира требуется накапливать и обрабатывать информацию в системе;
  2. какие их основные характеристики и взаимосвязи между собой будут учитываться;
  3. уточнение вводимых в информационную систему понятий об объектах и явлениях, их характеристиках и взаимосвязях.

    Датологическое моделирование решает вопросы представления данных в памяти информационной системы. При датологическом проектировании системы исходят из возможностей имеющихся средств восприятия, хранения и обработки информации; разрабатываются соответствующие формы представления информации в системе посредством данных, а также приводятся модели и методы представления и преобразования данных, формулируются правила смысловой интерпретации данных.

    Технологии, ориентированные на информационное моделирование, сначала специфицируют данные (ЯОД), а затем описывают процессы (ЯМД), использующие эти данные. Средствами структур данных моделируются функции предметной области и их взаимосвязи. Алгоритм обработки данных приложений рассматривается в виде совокупности процедур преобразований данных. Выбор СУБД определяет вид датологических моделей и, следовательно, влияет на алгоритмы преобразования данных. В большинстве случаев используется реляционное представление данных и реляционные СУБД, на которые в дальнейшем и будем ориентироваться.

<

Комментирование закрыто.

WordPress: 23.29MB | MySQL:121 | 1,287sec