Главная arrow Термины arrow Основы информационной технологии arrow КООРДИНАТНОЕ ИНДЕКСИРОВАНИЕ [coordinate (post-coordinate) indexing]

КООРДИНАТНОЕ ИНДЕКСИРОВАНИЕ [coordinate (post-coordinate) indexing]

Координатное индексирование - это, Что такое координатное индексирование, Определение термина координатное индексирование, Контролируемое индексирование, Свободное индексирование, Избыточное индексирование, Восходящее индексирование, Восходящее индексирование, Нисходящее индексирование, Одноаспектное индексирование, Многоаспектное индексирование, Фактографическое индексирование, Автоматизированное индексирование, Автоиндексирование, Ассоциативное индексирование, Дериватное индексирование

Индексирование документов и фактов на естественном языке с использованием дескрипторов и/или ключевых слов, отражающих в семантическом (понятийном) плане следующие лексикографические категории:
1) термин, выражающий конкретное научно-техническое понятие или объект описания;
2) имя собственное, идентификатор;
3) наименование параметра;
4) значение параметра (выраженное текстом или именованной величиной);
5) числовое выражение;
6) обозначение единицы величины.
В соответствии с ГОСТ 7.66-92 цель координатного индексирования "состоит во всестороннем отражении содержания документа или запроса путем включения в поисковый образ всех необходимых для этого терминов индексирования". При координатном индексировании документов и фактов дескрипторы и/или ключевые слова связываются или комбинируются для указания любых отношений, необходимых для организации наиболее полного и точного поиска.
Координатное индексирование предполагает деление длинных словосочетаний на короткие, содержащие, как правило, не более 2-3 слов. Допускается использование общепринятой или утвержденной (в соответствующей АС) аббревиатуры. При свободном индексировании ключевыми словами, взятыми из текста документа, последние должны быть приведены к канонической форме по ГОСТ 7.25. Количество лексических единиц, используемых в ПОДе, должно соответствовать требованию полного отображения важных для пользователей аспектов содержания индексируемого документа.
По разным признакам различают также следующие виды индексирования:
 - контролируемое индексирование [controlled indexing] — индексирование, контролируемое машинными словарями системы;
 - свободное индексирование [free indexing]:
1) индексирование, технология которого не предусматривает замену ключевых слов текста в соответствии с рекомендациями специального словаря;
2) координатное индексирование текста документа ключевыми словами, выбираемыми непосредственно из самого текста или добавляемые в ПОД без использования какого-либо нормативного словаря;
 - избыточное индексирование [redundant indexing] — дополнение ПОДа и/или ПОЗа лексическими единицами ИПЯ, связанными сильными парадигматическими отношениями с лексическими единицами исходного ПОДа, в том числе индексами других уровней при использовании системы многоуровневой индексации. Избыточное индексирование служит средством обеспечения повышения полноты поиска. Различают два вида избыточного индексирования — восходящее и нисходящее.
 - восходящее индексирование [ascending indexing] — разновидность избыточного индексирования, которое характеризуется тем, что ПОД дополняется лексическими единицами словаря или рубрикатора, подчиняющими индексы, используемые в исходным ПОДе. В словарных средствах с иерархической организацией такими индексами являются лексические единицы, находящиеся на более высоких уровнях иерархического дерева;
 - нисходящее индексирование [descending indexing] — разновидность избыточного индексирования, связанного с дополнением исходных индексов подчиненными им индексами. Нисходящее индексирование применяется для поисковых предписаний и поисковых образов запросов.
 - одноаспектное индексирование [single-aspect indexing] —метод индексирования, при котором в поисковый образ документа включаются лексические единицы, характеризующие только один определенный тематический аспект содержания индексируемого документа.
Так, в индексируемом документе может присутствовать некоторое множество существенно различных аспектов описания предметной области, например "флора", "фауна" и "общественные отношения"] описание разнородных видов технических средств, технологий и т.п. При одноаспектном индексировании в ПОД включаются только лексические единицы ИПЯ, связанные с некоторым отдельным тематическим аспектом описания документа. В развитых информационных системах обработки документов одноаспектное индексирование может использоваться в качестве технологического приема для реализации более точного и полного многоаспектного индексирования путем привлечения к этому процессу специалистов, имеющих различные профили профессиональной подготовки;
 - многоаспектное индексирование [multiple-aspect indexing] —метод индексирования, при котором в поисковый образ документа включаются лексические единицы, характеризующие несколько (более одного) тематических аспектов содержания индексируемого документа;
 - фактографическое индексирование [factual indexing] — разновидность координатного индексирования, предусматривающее использование в виде дескрипторов или ключевых слов обозначение отдельных фактов, наименований объектов, образцов техники и т.п. ГОСТ 7.66-92 предполагает формальное различие двух категорий терминов фактографического индексирования:
1) темы и объекты сообщения;
2) приписанные этим объектам свойства, являющиеся смыслом сообщения;
 - автоматизированное индексирование [computer-aided indexing, automated indexing] — индексирование с использованием формальных процедур, выполняемых вычислительной техникой, и интеллектуальных процедур, выполняемых человеком при формировании ПОД;
 - автоматическое индексирование, автоиндексирование [automatic indexing]—индексирование, выполняемое полностью программно-техническими средствами (ЭВМ);
 - ассоциативное индексирование [associative indexing] — индексирование ("ручное" или "автоматическое") основанное на использовании ассоциативных связей между ключевыми словами, полученными путем анализа частоты повторений их сочетаний в текстах:
 - дериватное (свободное) индексирование [derivative indexing] —метод автоматического индексирования, при котором система анализирует лексический состав текстов и выбирает из них лексические единицы, удовлетворяющие заданным критериям. При этом лексический контроль отсутствует.