Терминология является инструментом поиска текстов. Поэтому центром работы информационной службы являются особые словари, которые составляет служба информатики. Благодаря этим словарям предметно-логическое содержание источника определяет адрес текста. Словари составляются и используются постоянно. Это объясняется динамикой терминологии в оригинальных текстах.
В отличие от энциклопедий, толковых или отраслевых словарей служба информатики ведет учет всех встретившихся употреблений терминов (каждый текст расписывается с точки зрения содержащихся в нем терминов). Основная трудность здесь сводится к следующему: необходимо установить границы терминов и отличить термины в данном тексте от нетерминов. Во всяком или почти во всяком научном тексте есть новые термины, нередко создаются термины-синонимы, а сложные термины подвергаются метонимическим сокращениям. Сокращенные варианты терминов могут отличаться от общенаучной лексики только характером значения, иногда трудно уловимым. В техническом тексте всегда присутствует много дублетных терминов, что затрудняет их разграничение.
Словник словаря, составленного по текстам, редактируется с точки зрения различения терминов-омонимов и метонимических сокращений и дублетов терминов и пополнения новыми терминами. Каждому термину приписывается индекс, обозначающий текст, где этот термин употреблен. Такой словник является уже инструментом поиска оригинальных текстов. Если термин отражает определенную предметную область знания или деятельности и известен абоненту, то по терминологическому словарю можно найти тексты, в которых употреблен данный термин, включая оригинальные тексты, их рефераты или заголовки. В результате такого поиска будет получен перечень текстов, включающих в себя термин, а значит, описана область знаний, связанная с этим термином.
Если необходимый термин неизвестен абоненту, то вести поиск по словарю, построенному по алфавитному принципу, невозможно. В этом случае необходим словарь, построенный по семантическому принципу. Таким словарем является информационно-поисковый тезаурус, который предназначен для отыскания нужного раздела знания через смысловые характеристики терминов. Термины выстраиваются в тезаурусе по принципу родо-видовой подчиненности и/или ассоциативных смысловых связей.
Например, в "Тезаурусе по теоретической и прикладной лингвистике" (сост. С.Е. Никитина. М., 1978) верхней иерархией являются такие разделы грамматики, как морфология и синтаксис. Далее в каждом разделе термины следуют по алфавиту. Статья может содержать следующие части: 1) заглавное слово-термин, которое далее комментируется; 2) синонимический термин; 3) коррелят (обычно термин-антоним); 4) родовое понятие; 5) видовое понятие; 6) целое, частью которого выступает явление, называемое термином; 7) компоненты, т.е. части, из которых состоят явления, называемые термином...* 11) уровень языка, к которому относится явление, тип единицы, к которой относится явление... 28) ассоциативная связь с другими терминами. Малый объем данного тезауруса дает и малую иерархичность слов и понятий.
*(Перечисляем наиболее важные признаки.)
Как правило, тезаурусы обладают довольно большим числом родо-видовых иерархий. Например, в "Классификаторе промышленной, сельскохозяйственной продукции" (М., 1972) дано пять иерархий: 1) продукция энергетической и нефтяной промышленности; 2) электроэнергия или продукция нефтяной промышленности; 3) электроэнергия, произведенная электростанциями общего пользования и блокстанциями (или то же локального пользования); 4) электроэнергия, произведенная электростанциями общего пользования или блок-станциями общего пользования; 5) электроэнергия, произведенная КЭС, или ТЭЦ, или ГТЭС, или ДЭС, или АЭС, или ГЭС, или нетиповыми электростанциями общего пользования. В каждой иерархии своя рубрикация.
Как видим, та или иная область науки или техники благодаря своей терминологии охватывается тезаурусом, имеющим свои особенности. Например, информационно-поисковый тезаурус по языкознанию имеет следующий тематический охват: "Персоналии языковедов. Общее языкознание. Методы лингвистических исследований. Структурные и математические методы. Классификация языков. Образование и развитие языков. Социолингвистика, психолингвистика. Письменность, фонология, грамматика, лексикология, семантика, стилистика. Прикладное языкознание. Теория сообщений и кодирования в применении к языку. Лингвистические вопросы преподавания языка. Семиотика"*.
*(Аннотированная библиография информационно-поисковых тезаурусов. ГАСНТИ. М., 1980. С 12.)
Различие тезаурусов по их построению достаточно велико. Это связано как с составом терминологии отрасли, так и с подходом к составлению словаря. В любом случае для построения тезауруса необходимо выделить минимум слов, с помощью которых описывается значение терминов и устанавливаются иерархия и ассоциативные отношения. Такие слова называют дескрипторами. Установление дескрипторов зависит от особенностей терминологии и характера тезауруса. Дескрипторы являются основой тезауруса: из них выводится значение основных терминов, они же позволяют определить ассоциативные отношения. Во многих случаях дескрипторы принадлежат к общенаучной лексике.
Построение информационных словарей предполагает достаточно полный учет терминов в их реальном функционировании. Термины в информационно-поисковых словарях отличаются от терминов в отраслевых словарях тем, что лишь отражают текущее состояние терминологии, но не распространяют знания по терминологии. От терминологических стандартов информационно-поисковые словари отличаются тем, что не нормируют терминологию.