Тезаурус
(от греч. thesaurós — сокровище, сокровищница), множество смысловыражающих единиц некоторого
языка с заданной на нём системой семантических (см.
Семантика)
отношений. Т. фактически определяет семантику языка (национального
языка, языка конкретной науки или формализованного языка для
автоматизированной системы управления). Первоначально Т. рассматривали
как одноязычный словарь, в котором семантические отношения определяются
группировкой слов по тематическим рубрикам. Например, английский Т.
(автор П. М. Роджет), изданный в 1962 (1-е издание 1852), содержит 1040
рубрик, по которым распределено около 240 000 слов. Указатель (ключ) к
этому Т. содержит алфавитный перечень слов с указанием рубрик и
подрубрик, к которым относится каждое слово. Существуют традиционные
общеязыковые Т. (описания семантических систем отдельных языков) для
английского, французского, испанского языков. К Т. весьма близки
одноязычные словари, задающие выражения основных семантических
параметров каждого слова, например словарь русского языка С. И. Ожегова.
В 70-х гг. 20 в. получили распространение информационно-поисковые Т. В этих Т. выделены специальные лексические единицы — дескрипторы,
по которым можно осуществлять автоматический поиск документальной
информации. С каждым словом такого Т. сопоставляется синонимичный
дескриптор (см. Синонимия),
и для дескрипторов явным образом указываются семантические отношения:
род — вид, часть — целое, цель — средство и т. д. Обычно принято
разделять родо-видовые (иерархические) и ассоциативные отношения. Так,
"Информационно-поисковый тезаурус
по информатике", изданный в СССР в 1973, для каждого дескриптора
предусматривает словарную статью, где отдельно указаны синонимичные
ключевые слова, родовые, видовые и ассоциативные дескрипторы. Для
лучшей ориентации в ассоциативных связях между дескрипторами к этому Т.
приложены семантические карты тематических классов. При
автоматизированном информационном поиске
ищутся документы, у которых индекс содержит не только дескрипторы
запроса, но и те дескрипторы, которые находятся с ними в определённых
семантических отношениях. Иногда бывает полезно выделять в Т.
конкретные ассоциативные отношения, специфичные для данной тематической
области: болезнь — возбудитель, прибор — назначение (или измеряемая
величина) и т. п. Положение лексической единицы (слова, словосочетания)
в Т. характеризует его смысл в языке; знание системы семантических
отношений, в которые вступает данное слово (в том числе и рубрик, куда
оно входит), позволяет судить о смысле этого слова.
В широком
смысле Т. интерпретируют как описание системы знаний о
действительности, которыми располагает индивидуальный носитель
информации или группа носителей. Этот носитель может выполнять функции
приёмника дополнительной информации, вследствие чего изменяется и его
Т. Исходный Т. определяет при этом возможности приёмника при получении
им семантической информации.
В психологии и при изучении систем с искусственным интеллектом
рассматривают свойства Т. индивидуумов, проявляющиеся при восприятии и
понимании информации. В социологии и теории коммуникаций изучают
свойства Т. индивидуумов и коллективов, обеспечивающие возможность
взаимопонимания на основе общности Т. В этих ситуациях в Т. приходится
включать сложные высказывания и их семантические связи, определяющие
запас сведении, которыми располагает сложная система.
Т. фактически содержит не только информацию о действительности, но и
метаинформацию (сведения об информации), обеспечивающую возможность
приёма новых сообщений.
Лит.: Черный А. И., Общая методика построения тезаурусов, "Научно-техническая информация. Сер. 2", 1968, №5; Варга Д., Методика подготовки информационных тезаурусов, пер. [с венг.], М., 1970; Шрейдер Ю. А., Тезаурусы в информатике и теоретической семантике, "Научно-техническая информация. Сер. 2", 1971, № З.