Главная arrow Термины arrow Автоматизация информационных процессов arrow ЛИНГВИСТИЧЕСКОЕ ОБЕСПЕЧЕНИЕ АИС, ЛО [linguistic support]

ЛИНГВИСТИЧЕСКОЕ ОБЕСПЕЧЕНИЕ АИС, ЛО [linguistic support]

Лингвистическое обеспечение АИС - это, Что такое лингвистическое обеспечение АИС, Определение термина лингвистическое обеспечение АИС, ЛО, Алфавит и микросинтаксис, Язык библиографических данных, Классификационные языки, Дескрипторные, Объектно-признаковые языки, Языки запросов и манипулирования данными, Лингвистические процессоры, Лингвистический банк данных, Словари, Синтаксис, Графические средства представления данных, Микросинтаксис, Общесистемные языковые средства, Локальные языковые средства, Внешние языковые средства

В процессе развития средств автоматизации информационных процессов излагались различные взгляды на содержание лингвистического обеспечения АИС:
 - комплекс информационно-поисковых языков, прежде всего — классификационных и вербальных (дескрипторных);
 - комплекс средств, предназначенных для автоматической обработки текстов на естественном языке (включая обработку запросов и поиск), т. е. прежде всего—языковых процессоров;
 - по отношению к электронным библиотекам: комплекс языковых средств и процессоров, предназначенных для обработки, представления и поиска письменных текстов на естественном языке, в основном на семантическом уровне и др.
В АИС выделение ЛО из состава информационного обеспечения и оформление его в качестве самостоятельной подсистемы службы или направления деятельности фактически завершилось к 1976 г. и получило юридическое закрепление Постановлением от 30.09.81 "Об утверждении единого порядка разработки и развития автоматизированных систем НТИ". В настоящее время этот документ считается утратившим силу. ЛО достаточно развитой АИС должно включать следующие компоненты:
I. Языковые средства АИС:
 - алфавит и микросинтаксис [alphabet and microsyntax] — графические средства представления данных;
 - язык библиографических данных, Я БД [bibliographical data language] — ИПЯ, предназначенный для представления библиографической информации;
 - классификационные языки [classification languages] — ИПЯ, предназначенные для индексирования документов (частей документов) и информационных запросов посредством понятий и кодов какой-либо классификационной системы;
 - дескрипторные [descriptor languages] и другие посткоординатные языки [postcoordinate languages] — ИПЯ, предназначенные для координатного и более детального, чем на классификационном уровне представления информации;
 - объектно-признаковые языки [object-sign languages] — ИПЯ, предназначенные для фактографического уровня представления информации;
 - языки запросов и манипулирования данными [inquiry and data manipulations languages] — языки общения пользователей с АИС, представляющие собой средства описания запросов на поиск и вывод информации. Относятся к средствам операционного уровня.
II. Средства поддержки ЛО:
 - лингвистические процессоры [linguistic processors] — алгоритмы и программы автоматической обработки текстовой информации, а также создания и ведения языковых средств;
 - лингвистический банк данных [linguistic data bank] —содержит базы данных машинных словарей [machine dictionaries] и авторитетных записей [authority records], а также программно-аппаратные средства управления ими;
 - нормативная, конструкторская и технологическая документация, регламентирующая процессы создания, ведения и использования языковых средств, а также средств поддержки;
 - служба ведения (поддержки) языковых средств [supporting languages facility service] как организационно оформленный компонент системы.
Каждый тип языковых средств включает:
 - словари [dictionaries], т. е. лексику [vocabulary] и парадигматику [paradigmatic, context-free relations];
 - синтаксис [syntax], в частности, представленный в виде набора форматов. Особенность ЛО сети по сравнению с автономно работающими системами заключается в том, что ЛО сети делится еще по одному основанию — области применения;
 - графические средства представления данных [graphic(al) language resources] — средства естественного языка (план выражения письменного текста) включают в себя алфавиты и микросинтаксис;
 - алфавит [alphabet]— упорядоченный набор букв, цифр (арабских, римских и др.), специальные знаки (препинания, математические символы и др.) и средства представления текстовых особенностей. Алфавиты, используемые в АИС, включают в себя ограниченные наборы символов, представленные в таблицах двоичных кодов (например ASCII, KOI8-R, UNICODE, Win 1251, ISO8859-5 и др.);
 - микросинтаксис [microsyntax] — средства представления расширенного кириллического, латинского, греческого или других алфавитов, представляющие собой дополнительные таблицы, содержащие соответствующие символы.
В текстах на естественном языке используются следующие алфавиты:
 - кириллический (сокращенный или полный, включающий в себя символы — диакриты);
 - латинский (сокращенный или полный, т. е. включающий в себя символы — диакриты);
 - греческий;
 - готический и др.
Под текстовыми особенностями в текстам на естественном языке понимают:
 - размер символа;
 - начертание символа (например, курсив);
 - жирность шрифта;
 - положение символа в строке (на основной линии, выше или ниже ее).
Представление графической информации в АИС сопряжено с рядом трудностей, вызванных, с одной стороны, ограниченностью набора символов, с другой — необходимостью строгой линейности записи без полиграфических особенностей. Поэтому графические средства АИС обычно беднее, чем соответствующие средства естественных языков. Однако АИС, в которых формируются информационные издания, вынуждены использовать специальные средства для представления разнообразной текстовой информации.
По области применения выделяют.
 - общесистемные языковые средства [general language resources], применяемые всеми звеньями системы (типовые ЛО) либо используемые для взаимодействия между звеньями в качестве языка-посредника, входящего в состав "обменных средств ЛО";
 - локальные языковые средства [local language resources], применяемые только в рамках отдельно взятого звена;
 - внешние языковые средства [external language resources], не применяемые для решения задачи внутри системы и используемые только при взаимодействии с внешними по отношению к АИС системами;
 - коммуникативные (обменные) ИПЯ, предназначенные для обеспечения взаимодействия между различными (информационными, библиотечными и др.) системами (в том числе распределенными по государственной, ведомственной или территориальной принадлежности).