МЕТАДАННЫЕ [metadata]

Метаданные - это, Что такое метаданные, Определение термина метаданные, Dublin Core, Title, Creator, Subject, Description, Publisher, Contributor, Date, Туре, Format, Identifier, Source, Language, Relation, Coverage, Rights, CDIF, CSDGM, DIF, GILS, Global Map, HL7, IAFA, ISAD, ISO 11179, ISO 13250, ISO 17113, LOM, HATER, METS, NGDF, OAIS, Object ID, OGIS, OIL, OIM, PDM, PRISM, RDF, RKMS, SCORM, TEI, Warwick, Z39.87

Этот термин принято толковать, как "данные о данных", однако его значение распространяется помимо описания состава данных, их структуры (формата) представления, места хранения и других признаков описания также на поддерживающие их информационные системы, технологии, пользователей, методы доступа и т.д. Особенно широко термин стал использоваться в последние годы в связи с развитием электронных библиотек, поскольку метаданные стали важнейшим средством обеспечения навигации, поиска и возможности информационного обмена в Интернете. Однако до настоящего времени значение этого термина до конца четко не определено. Наиболее размыты границы между метаданными и коммуникативными (обменными) форматами.
Существуют различные категории метаданных, например: описательные метаданные [descriptive metadata] (в том числе библиографические); метаданные о структурах и форматах [structural metadata]; административные метаданные [administrative metadata], содержащие данные для управления доступом; идентификационные метаданные [identifier metadata], которые однозначно идентифицируют объекты внешнего мира и т. п. Помимо сказанного, метаданные подразделяются на машиночитаемые метаданные [Machine-Readable Metadata], предназначеных для автоматического решения задач определенного класса, и человекочитаемые метаданные [Human-Readable Metadata], предназначенных для задач, которые решаются с участием человека.
Схемы организации метаданных могут рассматриваться в трех взаимосвязанных аспектах: семантическом, синтаксическом и структурном. Различие между данными и метаданными часто условно и зависит от контекста. Например, реферат с точки зрения терминологии электронных библиотек относится к метаданным, хотя в электронном каталоге или реферативной БД его содержание рассматривается как данные. Существуют различные концепции, стандарты и системы представления метаданных. С 1999 г. работает международная организация стандартизации метаданных—"Форум разработчиков схем метаданных" — SCHEMAS .
Основные стандарты и системы метаданных
 - Dublin Core, DC [The Dublin Core Metadata for Simple Resource Discovery] — Дублинское ядро (ДЯ), полное наименование системы: "Метаданные
Дублинского ядра для простого открытия ресурса". Разработка ведется с 1995 г. рабочей группой с одноименным названием. Ею предложена простая структура описания документов, которая, по мнению разработчиков, должна заменить сложные системы существующей каталогизации документов. Текущая версия спецификации ДЯ (DC 1.1) принята в июле 1999 г. Она предназначена для записи базовых структурных значений описания документов — DCSV (Dublin Core Structured Values) на языках разметки HTML и XML. Их состав включает в себя пятнадцать элементов, семантика которых была совместно определена международными группами профессионалов в области библиотечного дела, вычислительной техники, кодирования текстов, специалистов музейного дела и других смежных областей наук:
Title — "Заголовок": название, присвоенное ресурсу его создателем;
Creator — "Создатель": лицо, организация или служба, ответственная за подготовку ресурса,— автор, исполнитель, фотограф;
Subject — "Предмет": тема ресурса, выраженная ключевыми словами или короткой фразой;
Description — "Описание": текстовое описание ресурса;
Publisher — "Издатель": лицо, организация, или служба, обеспечивающая доступ к ресурсу;
Contributor — "Участник создания материала": человек или организация, которые не являются авторами, однако внесли в создание ресурса значительный интеллектуальный вклад помимо указанного в разделе "Создатель"]
Date — "Дата": дата, указывающая на создание или появление ресурса в доступном для использования виде;
Туре — "Тип": жанр, категория ресурса, например домашняя страница, роман, статья и т. п.;
Format — "Формат": способ представления ресурса, например, тип программного обеспечения и ПК, необходимых для отображения ресурса;
Identifier — "Идентификатор": например URL,
Source — "Источник": сведения о первичном источнике, из которого был продуцирован данный ресурс;
Language — "Язык": язык представления ресурса;
Relation — "Связь ": ссылка на ресурс, связанный с данным; идентификатор вторичного ресурса и его связь с настоящим ресурсом, например, издание книги и глава книги;
Coverage — "Охват": области времени, пространства и т. п., к которым относится содержание ресурса;
Rights — "Права": права интеллектуальной собственности на ресурс.
В декабре 2000 г. в Лондоне на очередной ежегодной выставке "Online Information" представители США, Англии, Франции, Германии и Японии назвали ДЯ наиболее перспективным стандартом метаданных для описания электронных ресурсов. Ряд национальных систем (например, Австралии и Швеции) уже объявили о принятии ДЯ в качестве национального стандарта.
В настоящее время ведется разработка версии DC 2.0. Рабочая группа Dublin Core работает в контакте с разработчиками RDF.  - ABC (The ABC Ontology and Model) —"Онтология и модель ABC": концептуальная модель, предназначенная для облегчения интероперабельности между онтологиями4 метаданных в различных доменах. Модель разработана в 2002 г. в рамках проекта международной электронной библиотеки "Harmony", финансируемого DSTC (Австралия), JISC (Великобритания) и NSF (США). Суть ABC —в способности моделировать создание, эволюцию и переходы объектов во времени. Традиционная библиографическая каталогизация предполагает, что объект описывается один раз, а затем его атрибуты остаются относительно стабильными. Этого недостаточно для многих приложений, включая музейное дело, архивы, электронные ресурсы и управление правами. ABC использует нотацию "временности" (temporality) в качестве базовой онтологической категории, предоставляя пользователям возможности ассоциировать с объектом состояния, события и действия. Имеются версии для XML-разметки и RDF.
 - CDIF [CASE Data Interchange Format] — система стандартов, разрабатываемая и развиваемая организациями —членами Ассоциации EIA (Electronics Industries Standard). Их общая цель: стандартизация представления и обмена метаданными, описывающими различные информационные ресурсы, которые были созданы и поддерживаются с использованием различных технологий. Стандарты CDIF открывают возможности для повторного использования ресурсов метаданных в информационных системах для решения разнородных задач, в том числе для интеграции информационных ресурсов, полученных из различных источников. В настоящее время эти стандарты имеют для Ассоциации EIA статус внутренних, однако для придания им международного статуса они переданы на рассмотрение в ISO.
 - CSDGM (Content Standards for Digital Geospatial Metadata) — стандарт, разработанный Федеральным комитетом США по географической информации FGDC (US Federal Geographic Data Committee), предназначен для обеспечения обмена документами и данными о географическом пространстве5. Устанавливает имена элементов данных и их групп, используемых при обмене информационными ресурсами по этой тематике, а также сведения о значениях, которые должны присваиваться элементам данных разного рода. Проведено разграничение между обязательными, ограниченно обязательными и необязательными терминами.
Стандарт CSDGM определяет элементы данных по следующим признакам:
1. Идентификационная информация: базовые сведения о наборе данных (заголовок, географическая область, правила обращения и использования данных);
улицы или код страны), а также число географических объектов в наборе данных;
2. Информация о качестве данных: сведения о точности позиционирования, полноте, согласованности данных, источнике информации и методах, использованных при получении данных;
3. Информация об организациях, работающих с географическими данными и механизме представления информации в наборе данных —примеры включают метод, использованный для представления географических координат напрямую (растровый или векторный) или косвенно (название улицы или код страны), а также число географических объектов в наборе данных;
4. Информация о географических ссылках (Spatial Reference Information): описание способа отсылок, способа кодирования, системы координат в наборе данных;
5. Информация о сущностях и атрибутах: сведения о содержании набора данных, включая типы сущностей и их атрибуты, а также домены, из которых могут браться значения атрибутов. Примеры включают имена и определения объектов, атрибутов и их значений;
6. Информация о распространении: сведения о том, как найти набор данных (адрес дистрибутора, доступные форматы, тип носителя и расценки) и т. п.);
7. Информация о качестве метаданных (Metadata Reference Information): сведения об актуальности метаданных и стороне, ответственной за метаданные.
Документ "Encoding Standard for Digital Geospatial Metadata" демонстрирует способ кодирования данных CSDGM с использованием XML.
 - DIF (Directory Interchange Format) — "Формат обмена директориями": стандарт, разработанный NASA в конце 1980-х гг. и поддерживаемый в США межведомственной рабочей группой по управлению данными для глобального обмена спутниковой и другой телеметрической информацией, а также для построения справочников геопространственных данных. Позже он начал использоваться для любых геопространственных данных и стал стандартом де-факто в международных глобальных информационных системах. DIF позволяет пользователю определить, содержит ли тот или иной набор данных релевантную запросу информацию. Стандарт вводит элементы метаданных, определяет их содержание и структуру. Файл DIF состоит из подмножества полей, содержащих детальные сведения о данных. Базовыми являются шесть полей: "Entry_!D", "Entry_Title", "Parameters", "Originating_Centef, "Data_Center and Summary". Остальные поля опциональны, поскольку носят пояснительный характер. Считаются критически важными для поиска поля: "Tempora\_Coverage", "Spatial_Coverage and Location", поскольку они содержат поисковые термины.
 - GILS (Government Information Locator Service) — "Правительственная служба указателей (поиска) информации" является частью Национальной информационной инфраструктуры США. GILS обеспечивает доступ частным лицам и организациям к федеральным информационным ресурсам через общедоступный каталог этих ресурсов, базируется на международных стандартах информационного поиска с применением протокола доступа Z39.50 и использует систему метаданных в рамках этого протокола. Развитие системы GILS предполагает создание системы взаимосвязанных каталогов для поиска метаданных, возможно, различных типов. Поскольку GILS создается с целью интеграции библиотечных и сетевых ресурсов на основе сочетания библиотечной практики библиографических описаний с сетевыми и компьютерными технологиями. Идеологи GILS ставят широкомасштабные цели реализации права на информацию и доступа к ней в рамках создания глобального информационного сообщества. Так, например, 15 элементов DC отображаются в системе метаданных GILS с помощью специальных средств. С другой стороны, GILS наследует семантику MARC для элементов, используемых для поиска. Взаимно однозначное соответствие между элементами GILS и MARC описано в GILS Profile. На этом же сайте можно ознакомиться и с составом базовых элементов структуры метаданных GILS (GILS Core Elements).
 - Global Map (Specification for a data descriptive file for information interchange) — "Спецификация описательного файла цифровых географических данных для информационного обмена" представляет собой транспортный протокол OSI для структурированного обмена географическими данными. Разработана Международным координационным комитетом глобального картографирования — ISCGM (International Steering Committee for Global Happing). Global Map позволяет создавать карты с разрешением в один км, что эквивалентно обычному масштабу карты 1:1000 000. Спецификация предусматривает восемь видов ("уровней") географических данных: границы, перевозки (транспорт), дренаж, населенные пункты, возвышенности, растительность, почва и использование земель. Карты создаются в сотрудничестве с национальными картографическими организациями. В проекте участвуют 83 страны и региона, более 30 рассматривают такую возможность. Проектом охвачено 60% поверхности Земли. Данные свободно доступны для правительственных учреждений и исследовательских целей, но не используются в коммерческих целях.
 - HL7 (Health Level Seven) — "Здоровье уровня семь": стандарт метаданных для обмена информацией в области здравоохранения. Его разработчиком является рабочая группа с одноименным названием при ANSI. Стандарт HL7 формализует интерфейсы между различными системами, обменивающимися сведениями о пациентах, включая результаты анализов, назначения, результаты лечения, его оплату и пр. Версия 2.3 предусматривает также возможность обмена информацией об уходе за пациентом, медицинских записях и автоматизированных инструментах. В соответствии с правилами кодирования HL7 формат сообщений, состоит из полей данных переменной длины, выделенных специальным разделителем. Поля данных логически группируются в сегменты, также разделенные определенными знаками. Все данные представлены знаками из выбранного набора (по умолчанию —ASCII). Версия 3.0 использует формализованную методику составления сообщений, описанную в HL7. Стандарт широко используется в госпиталях США, а также в Австралии, Германии, Японии, Голландии и Новой Зеландии. Он является также основой стандарта ISO 17113 (Method for Development of Messages).
 - IAFA (Internet Anonymous FTP Archives) —шаблонно ориентированные метаданные для описания сетевых ресурсов, первоначально использовавшиеся для описания списков электронной почтовой рассылки, других ftp-архивов, а позднее распространенные на другие ресурсы. Наиболее широкое применение наблюдалось в рамках ранних проектов британской программы по электронным библиотекам eLib (ROADS и т.д.). В настоящее время эта схема метаданных одна из самых используемых.
 - INDECS (INteroperability of Data in E-Commerce Systems) —"Интероперабельность данных в системах электронной коммерции": набор метаданных, который создан для потребностей электронной коммерции в сфере шоу-бизнеса (музыка, зрелища и др.). Представляет собой наиболее сложный набор метаданных, ориентированных на управление правами на цифровой объект (вид интеллектуальной собственности, лицензионные сборы, перечисление средств правообладателям и т.п.). Работает в связке с одной из наиболее известных систем идентификации цифровых объектов DOI (Digital Object Identification).
 - ISAD (International Standard Archival Description) — "Международный стандарт архивного описания" содержит общие правила описания архивных документов. Разработан ICA (International Council on Archives). Вторая редакция документа, одобренная в 1999 г., содержит правила записи 26-ти элементов описания единиц хранения, которые, как предполагается, могут использоваться в любых архивах. Каждое правило включает:
1. Имя элемента описания, управляемого данным правилом;
2. Утверждение о цели включения данного элемента в описание;
3. Утверждение об общем правиле или правилах действующих для данного элемента.
 - ISO 11179 (Specification and Standardization of Data Elements) —"Спецификация и стандартизация элементов данных": стандарт описания элементов данных в базах данных и документах. Разработан ISO/IEC JTC1/SC32 (публиковался по частям с 1994 по 2000 гг., последняя редакция опубликована в 2001 г.). Стандарт определяет базовые аспекты состава элемента данных (включая и метаданные) и предназначен для использования, как человеком, так и машиной, однако он не затрагивает проблем физического представления данных в виде последовательности битов на машинном уровне. Содержит шесть разделов.
Раздел 1 — общие правила спецификации и стандартизации элементов данных. Наиболее важные определения:
Элемент данных [data element], согласно ISO 11179, состоит из трех частей:
а) класс объекта [object class] —абстрактное представление места объекта в реальном мире, позволяющее идентифицировать его с учетом явных связей и сущностей, основные свойства и особенности которых соответствуют одинаковым признакам;
б) свойство объекта [object property] — особенность, присущая всем членам данного класса;
в) представление объекта [object representation] — описание того, как данные представляются (сочетанием значения домена), типа данных, вида кодировки, единиц измерения и пр.).
Концепция элемента данных [data element concept, DEC] — комбинация класса объекта и его свойства.
Значение домена [value domain] —набор разрешенных для элемента данных значений.
Раздел 2 — "Классификация элементов данных" — процедуры и методы ассоциирования концепций элементов данных и элементов данных с классификационными схемами классов объектов, свойств и представлений.
Раздел 3 —"Базовые атрибуты элементов данных"; с 2001 г. он включает полную формальную мета модель для регистра метаданных на языке UML.
Раздел 4 —"Правила и указания для формулирования определений данных" — правила создания однозначных определений элементов данных.
Раздел 5 —"Принципы присвоения наименования и идентификации элементов данных" — указания по идентификации элементов данных, включая присвоение цифровых идентификаторов, графических символов и осмысленных имен.
Раздел 6 —"Регистрация элементов данных" содержит инструкции по порядку регистрации элементов данных в центральном уполномоченном регистраторе.
 - ISO 13250 (Topic Haps) —"Карты темы": стандарт, обеспечивающий ассоциативные связи семантики с сетевыми ресурсами. Разработан в 2000 г. организацией ISO/IEC JTC1/SC34 . В соответствии с этим стандартом связь некоторой семантики с частью или всем сетевым ресурсом осуществляется приложением — HyTime. Тема (topic) создается путем связывания отдельного имени темы (topic паше) или набора тем с одним или более вхождениями (occurrences) —ссылок на эту тему. Ссылки могут связываться с различными способами вхождения (occurrence roles) так, что вхождения могут группироваться по определенному типу. И имена, и вхождения могут связываться с областью применения (scope) — доменом, служащим для их различения от похожих по имени или местоположению тем.
Ассоциирующая гиперссылка может использоваться для связывания тем в сеть, в которой возможна навигация. Набор ссылок на тему и ассоциированные с данной темой отдельные ресурсы образуют карту темы. Аспект [facet] может быть связан с темой. Он позволяет различать представления данной темы различными пользователями в конкретных обстоятельствах.
 - ISO 17113 (Method for Development of Messages)-"Метод создания сообщений": стандарт вводит определение Стандартной модели имплементации — RIM (Reference Implementation Model), характеризующей типы данных и домены словаря; описывает модели взаимодействия (Interaction Models) для записи событий, обмена приложениями, ролями и ответственностью, а также стратегию создания сообщений —MDS (Message Development Strategy) для развития информационной модели уточненных сообщений —R-MIM (Refined Message Information Models). Иерархические дескрипторы сообщений R-MIM — HMD (Hierarchical Message Descriptions) и общие компоненты сообщений — CMC (Common Message Components) могут использоваться для создания различных типов (видов) сообщений — Message Types. Стандарт используется в ряде других стандартов, в частности связанных со здравоохранением, например — стандартах "Информатики в области здравоохранения" — ISO ТС215 (Health Informatics standards). Он также лег в основу стандарта РФ СТО МОСЗ 91500.16.0003-2004 "ИС в здравоохранении. Общие требования к форматам обмена информацией".
 - LOM (Learning Object Metadata) — "Метаданные учебного объекта": стандарт, разработанный под эгидой IEEE Рабочей группой Компьютерного сообщества стандартизации — CSSAB (Computer Society Standards Activity Board) и Комитетом по стандартизации учебных технологий — LTSC (Learning Technology Standards Committee), для описания учебных ресурсов. Цель стандарта: облегчить поиск, рассмотрение и совместное использование учебных объектов учителями, инструкторами или автоматическими процессами в ходе выполнения учебных программ, а также обеспечить создание каталогов и хранилищ. Предлагает базовую схему, которая может использоваться для создания практических разработок. Является составной частью стандарта SCORM. Последняя спецификация стандарт IEEE LOM 1484.12 опубликована в июле 2002 г. Стандарт LOM 484.12 является составным. Его части, связанные с ISO 11404 (1484.12.2), XML (1484.12.3) и RDF (1484.12.4), находятся на стадии рассмотрения.
Учебные объекты в стандарте описываются элементами данных, сгруппированными по категориям. Базовая схема LOM версии 1.0 определяет 9 таких категорий:
1. Общая категория —объединяет информацию об учебном объекте в целом;
2. Категория жизненного цикла —группирует элементы об истории и текущем состоянии учебного объекта и тех, кто влиял на него в ходе эволюции;
3. Категория метаданных —содержит информацию о метаданных;
4. Техническая категория —группирует технические требования и характеристики учебного объекта;
5. Образовательная категория —объединяет образовательные и педагогические характеристики;
6. Категория прав —содержит данные об интеллектуальной собственности и условиях использования;
7. Категория связей (реляций) —раскрывает понятия, определяющие взаимосвязи между разными данным и иными учебными объектами;
8. Категория аннотации —представляет комментарии к учебному использованию объекта и данные о создателях этих комментариев;
9. Классификационная категория —устанавливает место данного объекта в пространстве той или иной классификационной схемы.
Категории группируют элементы данных. Модель данных LOM имеет иерархическую структуру и включает как агрегаты элементов данных, так и простые элементы данных ("листья на иерархическом дереве"). В базовой схеме версии 1.0 только простые элементы имеют индивидуальные значения, определенные путем ассоциации с пространством значений и типом данных. Агрегаты индивидуальных значений не имеют. Для каждого элемента данных базовая схема определяет: имя; определение элемента данных; размер (число разрешенных значений); порядок (если порядок значений является важным); пример.
Для простого элемента также определены:
1. Набор разрешенных значений (обычно в форме словаря или ссылки на другой стандарт);
2. Тип данных.
Все элементы данных не являются обязательными. Это означает, что любые значения элементов данных, соответствующие базовой схеме будут считаться соответствующими формату LOM. В октябре 2004 г. в России Государственным научно-исследовательским институтом информационных технологий и телекоммуникаций "Информатика" (ГНИИ ИТТ "Информатика") разработан стандарт метаданных информационных образовательных ресурсов для Интернет-каталогов, в основу которого положен LOM.
 - HATERсистема метаданных, описывающая словари, классификаторы и другие лексикографические данные. Поддерживается стандартами ISO. Имеется российская версия под названием ФОЛИЯ (Формат обмена лексикой информационных языков).
 - METS (Metadata Encoding and Transmission Standard) — "Стандарт кодирования и передачи метаданных": предназначен для обеспечения обмена метаданными между библиотеками. Разработан в 2001 г., дорабатывался и дополнялся в 2002 и 2003 гг. Федерацией электронных библиотек (Digital Library Federation) в рамках проекта Библиотеки Конгресса США —Making of America.
Пакет записей, соответствующих данному стандарту ("документ METS"), состоит из четырех частей:
1. "Описательные метаданные" — включает наименования используемых описательных метаданных: как внешних по отношению к данному документу (например—запись MARC или EAD на Web-сервере), так и внутренних;
2. "Административные метаданные" — сведения о том, как файл создавался и хранился, об интеллектуальных правах, о свойствах исходного объекта и пр.;
3. "Группы файлов" (File Groups) —перечень всех файлов, содержащих электронные версии цифрового объекта. Элементы "группы файла" могут наследоваться, предоставляя возможность для отслеживания различных версий объекта;
4. "Структурные карты" [Structural Haps] —отражает иерархическую структуру объекта и связывает элементы этой структуры с содержанием файлов или метаданными, соответствующими каждому элементу.
В зависимости от способа использования, документ METS может выступать в роли модуля передаваемой информации (Submission Information Package, SIP), модуля архивной информации (Archival Information Package, AIP) или модуля распространяемой информации (Dissemination Information Package, DIP) в рамках модели Open Archival Information System (OAIS) Reference Model.
 - NGDF (National Geospatial Data Framework Discovery Metadata Guidelines)—"Общие указания по национальным географическим данным и по открытию метаданных!’ разработаны в Великобритании Управлением (Management Board) по NGDF в 1998 г. Целью разработки являлось создание простого метода документирования любых источников данных, имеющих отношение к земной поверхности или географическим координатам и идентификаторам (адреса, административные территории и пр.). Спецификация основывается на стандарте метаданных географической информации ISO 19115. Метаданные NGDF можно разделить на следующие категории: идентификация, описание субъектов, происхождение, правила доступа, географические характеристики, поставщик данных. Рекомендовано использовать электронный тезаурус по гуманитарным наукам (HASSET). Набор метаданных снабжен диаграммой классов на языке UML; приведено соответствие стандартам ISO 19115 и Dublin Core.
 - OAIS (Reference Model for an Open Archival Information System) — "Образцовая модель для открытых архивных информационных систем": модель метаданных, разработанная в 2002 г. Консультативным комитетом по космическим информационным системам CCSDS (Consultative Committee for Space Data Systems) и ISO TC20/SC13 для архивирования данных, связанных с космосом. Информационный блок OAIS содержит два вида данных: собственно контент (документы, базы данных и т. п.) и описание хранения PDI (Preservation Description Information). В свою очередь PDI содержит:
1. Сведения о происхождении контента, описывающие источник, владельцев и историю его создания (включая этапы обработки);
2. Сведения о контенте, описывающие его связь с другими источниками;
3. Идентификационные данные (один или несколько идентификаторов или система идентификаторов), позволяющие однозначно идентифицировать содержимое контента;
4. Контрольный блок (например контрольная сумма), предназначенный для защиты контента от непреднамеренных изменений.
 - Object ID (Protecting Cultural Objects in the Global Information Society) — "Защита культурных объектов в глобальном информационном обществе": стандарт описания произведений искусства и антиквариата; создан в сотрудничестве музеев, организаций культурного наследия, правоохранительных органов, торговцев произведениями искусства и страховщиков — СоРАТ (Council for the Protection of Art Theft). Идентификация объектов ориентирована на то, чтобы они были найдены и восстановлены в случае кражи. Список полей Object ID помогает пользователям снабдить произведение искусства полным описанием, необходимым для его надежной идентификации.
 - OGIS, OpenGIS (Open Geodata Interoperability Specification) — "Открытая спецификация по интероперабельности географических данных!", разработанная Консорциумом открытых географических информационных систем —OGC (Open Geospatial Consortium, Inc.) для обеспечения открытого доступа к географическим данным и средствам их обработки. OGIS создает возможность:
1. Создать единую "универсальную" модель географических и временных данных и процессов, покрывающую потребности всех имеющихся и перспективных приложений;
2. Предоставить спецификацию для каждого основного языка баз данных для имплементации6 модели данных OGIS;
3. Представить спецификацию для каждой основной среды распределенных вычислений для имплементации модели данных OGIS.
Упрощенный вариант спецификации доступен в версиях для CORBA, SQL и OLE/COM. Спецификация имплементации интерфейса каталога (Catalog Interface Implementation Specification) использует XML- представление запросов Z39.50 для поиска данных с использованием НИР.
 - OIL (Ontology Inference Layer) — "Взаимодействие уровней онтологии": стандарт, описывающий онтологии, их ограничения и взаимосвязи. Стандартный язык для определения онтологий построен по многоуровневому принципу, при котором каждый следующий слой несет в себе дополнительные функции. При этом агенты (люди или машины), которые поддерживают только нижние уровни модели, сохраняют возможность частичного понимания онтологии. Стандартный OIL содержит примитивы для определения семантики онтологий и их взаимосвязей, что вполне достаточно для практического использования и легко доступно для понимания. В своей основе OIL в значительной степени совпадает со спецификацией RDF Schema. Это означает, что агенты RDF Schema смогут оперировать и с онтологиями, описанными в OIL. Расширенный (Instance) OIL добавляет возможности для работы с базами данных. Предполагается создание Heavy OIL с дополнительными функциями. Часть этой спецификации адаптирована в качестве части языка разметки Агентства DARPA (DAML) и называется DAHL + OIL.
 - OIM (Open Information Model) — "Открытая информационная модель" (версия 1.0) разработана объединением The Meta Data Coalition с целью обеспечения задач моделирования метаданных. Типы метаданных структурированы в подтипы по доменному принципу. Основные составные части описания содержания версии OIM V.0.1:
1. Анализ и создание моделей (Unifier Modeling Language, UML Extensions, Common Data Types and Generic Elements);
2. Модель объекта и компонентов (Component Description Model);
3. Модель базы данных и хранилища (Database Schema, OLAP Schema, Data Transformations and Record Oriented Database Schema);
4. Модель управления знанием (Semantic Definitions).
Для определения и представления типов метаданных в OIM используется язык UML, который является стандартным для моделирования. В сентябре 2000 г. объявлено о предполагаемом слиянии данной спецификации со спецификацией CWM (Common Warehouse Metadata).
 - PDM (Project Description Metadata) —"Метаданные описания проектов" как информационных объектов в перспективных информационных системах. Разработчик —специально созданная рабочая группа (Joint DELOS/DG Working Group on Project Description). Цель разработки 2002 г.— создание формата метаданных, расширяющего возможности совместного использования информации о проектах. Предполагается, что это позволит увеличить прозрачность, координацию действий и облегчить обучение. В дальнейшем планируется разработка общих правил создания локальных стандартов, позволяющих совместно использовать разнородную информацию.
 - PRISM (Publishing Requirements for Industry Standard Metadata) —"Требования к публикации для индустриального стандарта метаданных": стандарт на метаданные, разработанный в 1999 г. некоммерческой организацией IDEAIIiance PRISM Working Group. Его назначение: представление контента и описание формата, повторного и многоцелевого использования прав и ограничений на электронные ресурсы. PRISM разработан для использования в Интернете. Стандарт поддерживает ряд приложений, не содержит ограничений на формат данных описываемых ресурсов и построен на синтаксисе XML. Разработчики подчеркивают, что ключевым является механизм имплементации —например, элементы для описания авторских прав не являются полнофункциональным языком, который позволил бы любым анонимным участникам строить бизнес. Эти элементы охватывают только наиболее общие случаи, когда один издатель хочет использовать материалы, опубликованные другим. При этом достигается снижение издержек и адаптация к условиям существующих соглашений между договаривающимися сторонами. Стандарт формулирует общие требования для обмена и хранения контента и метаданных (в виде коллекции элементов, описывающих контент), а также представляет набор контролируемых словарей, содержащих исчерпывающий перечень необходимых статей.
Спецификация PRISM определяет словарь метаданных на основе XML для синдицирования, агрегирования и обработки метаданных применительно к журналам, новостям, каталогам, книгам и пр. Несмотря на то, что спецификация содержит большое число элементов и терминов из контролируемых словарей, почти все они не являются обязательными. Описание, вполне соответствующее требованиям стандарта, может быть очень коротким и простым. В принципе нет необходимости тратить много усилий на создание подробных метаданных на уровне отдельных объектов, хотя есть возможность создавать очень пространные описания ресурсов, которые оцениваются как критически важные.
PRISM состоит из набора модулей, учитывающих дескрипторы ресурса, про-венанс, временные параметры и интервалы, описание субъекта, связи ресурса, права и разрешения, контактную информацию и описание контролируемого словаря в виде "authority files". Стандарт адаптирован к Dublin Core и использует общую схему метаданных на основе упрощенного профиля RDF.
 - RDF (Resource Definition Framework)^структурная модель для выражения синтаксиса обмена метаданными, разработанная консорциумом W3C. Последняя версия — RDF-Primer рекомендована к использованию в феврале 2004 г. Для описания схемы метаданных и для обмена данными между различными вычислительными системами используется язык XML. RDF предлагает базовую систему типов, предназначенную для представления как данных, так и метаданных: "объект-атрибут-значение". Структурная модель состоит из "Ресурсов", "Типов свойства" и "Значений". Предоставляется возможность производить связь метаданных с различными информационными ресурсами и обмениваться метаданными между различными системами, которые их используют.
 - RKMS (Recordkeeping Metadata Standard for Commonwealth Agencies)^ "Стандарт записей метаданных для агентств Содружества", используемый в Австралии и некоторых других странах Содружества. Он определяет базовый набор из 20-ти элементов метаданных (8 из них образуют обязательный набор) и 65-ти вспомогательных элементов. Для каждого из них стандарт устанавливает индикаторы обязательности, условий использования, разрешенных значений, рекомендуемых схем и пр. Элементы можно разделить на 6 категорий (уровней), отражающих их роль в аутентификации и долгосрочном управлении записями (регистрация, термины и условия, структурные, контекстные, содержательные, а также история использования).
 - SCORM (Sharable Content Object Reference Model) ^"Модель ссылок на контент объекта для совместного использования" впервые разработана в 1999 г. Министерством обороны США в рамках проекта ADL (Advanced Distributed Learning) с целью использования в системе дистанционного обучения. Основная цель разработки: интеграция различных стандартов и спецификаций (например LOM, IMS СР) в единую модель представления контента в распределенной обучающей среде. Предполагается, что в результате развития SCORM будет обеспечена возможность осуществлять динамическое обучение, причем контент будет составляться под конкретного ученика и доставляться в персонифицированной форме. В 2000-2004 гг. производилась доработка проекта и выпущен ряд его версий. В этот период к процессу разработки присоединился ряд других организаций и проект принял более универсальный характер (включая, например, использование компакт-дисков, интерактивного мультимедиа и пр.). Версия 1.2 SCORM, опубликованная в 2004 г., вводит концепцию упаковки контента и содержит обновленные метаданные для описания учебного контента на основе спецификаций, созданных организациями IMS Global Learning Consortium и IEEE LTSC.
 - TEI —инициатива по кодированию текстов; разработана в Центре электронных текстов Вирджинии в 1989 г. как инструмент процесса оцифровки, который идентифицирует электронный ресурс и его печатный источник посредством метаданных, размещаемых внутри самого электронного ресурса.
 - Warwick — концепция организации метаданных Warwick ведет свое происхождение от некоторых идей, высказанных на рабочей встрече в университете Warwick (Великобритания) в 1996 г. Огромный массив метаданных, включая такие описательные метаданные, как каталоги MARC, метаданные управления доступом, структурные метаданные, а также идентификаторы, может прилагаться к одному цифровому объекту. Участники рабочей встречи предложили организовать метаданные в "пакеты" (package), например, один пакет для Dublin Core, другой —для географических данных и т.п. Такая специализация облегчает достижение интероперабельности: если клиент и хранилище могут обрабатывать пакеты метаданных одного типа, они способны успешно взаимодействовать, даже если другие пакеты у них разные.
 - Z39.87 (Data Dictionary —Technical Metadata for Digital Still Images) —"Технические метаданные для неподвижных цифровых изображений": проект стандарта (находится на стадии утверждения) разработан Организацией по национальным информационным стандартам США (NISO) и AIIM International в 2002 г. Содержит полный список элементов технических терминов, необходимых для описания и управления техническим качеством цифровых неподвижных изображений (в том числе для поддержания их качества и обработки). Технические метаданные связываются с определенными атрибутами ("якорями") качества изображения, которые могут быть объективно оценены: разрешение, тон, цвет, размер и т. п.