Что такое тезаурус?
(обзор терминологии)
Тезаурус относится к специальному типу словаря нормативной лексики с точно определенными связями между терминами. Нам необходим многоязычный тезаурус для использования в области культуры, который можно было бы применять как поисковый информационный аппарат в режиме online на веб-сайте по культуре. Неопубликованные, одноязычные или не имеющие онлайновой версии тезаурусы не учитываются.
1.1. Словарь нормативной лексики представляет собой список
терминов, который контролируется и ведется центром регистрации нормативной лексики. Термины такого словаря должны иметь четкие (недвусмысленные) и краткие дефиниции. Однако достичь этого на практике не всегда легко. Все зависит от того, насколько строго центр регистрации нормативной лексики относится к занесению терминов в словарь. Как минимум, должны выполняться следующие два правила:В словаре нормативной лексики
могут отсутствовать термины со специальными значениями (например, принятый всеми набор терминов, значения которых понятны и без толкований); однако, он может и содержаться подробные дефиниции для каждого термина.1.2. Тезаурус есть совокупность
словарей нормативной лексики, термины которых связаны сетевой структурой. Это значит, что, помимо родовидовых отношений, в тезаурусе используются ассоциативные связи, которые могут обозначаться по-разному: или “связан с термином”, или, более сложно, “термин A связан с термином B”.В тезаурусе существует два типа связей:
По существу, вышеназванные тезаурусные связи типа “выше/ниже” не отличаются от связей в словарях-классификаторах. Однако тезаурус имеет и такой тип связей, который, хотя и может быть назван иерархическим, не является типично иерархическим. Подобная связь может
вообще не иметь никакого другого эксплицитного значения, кроме того, что существует некая связь между двумя терминами.1.3. Дополнительная информация о тезаурусах:
Все контролируемые словари, классификаторы, тезаурусы, онтологии и метамодели имеют следующие общие особенности
:1.4. Главные различия в подходах при использовании контролируемых словарей определяются следующими вопросами:
2. Словарь нормативной лексики и свободный текст
При поиске в электронной базе данных информации по определенной тематике необходимо помнить о тех плюсах и минусах, которые существуют как при получении единичных ответов высокой точности, так и при получении большого количества ответов. Поиск, заканчивающийся ответами высокой точности и содержащий записи, относящиеся только к определенной тематике, называется “узким”. Такой вид поиска, в силу своей слишком большой направленности, может привести к определенной потере релевантной информации. Поиск же, заканчивающийся большим количеством ответов, будет шире (и грубее) и будет отличаться большим охватом информации; однако, его результаты могут содержать нерелевантную информацию, которую в дальнейшем придется отбросить.
2.1. Словарь нормативной лексики
Большинство электронных баз данных позволяют вести поиск с помощью контролируемого словаря. Часто это является наилучшим способом установить соотношение между точностью ответа и широтой охвата информации в ответах. Словарь нормативной лексики – это набор заранее определенных терминов, постоянно используемых для описания некоторых понятий. Эксперты определенной области анализируют статью и выбирают
необходимые термины из контролируемого словаря, которые точнее всего передают содержание статьи. Все статьи, которые имеют отсылку к одному и тому же понятию, будут индексироваться одним и тем же термином или комбинацией терминов.Пример
: Желтые страницы используют контролируемые словари для перечня всех служб и товаров, имеющихся в Калгари. Вы можете пройтись по всем желтым страницам, задавая разные термины при поиске интересующего вас товара. Однако это часто оказывается бесполезным занятием и требует много времени. Например, вы ищете, где можно заново отполировать пол из твердой древесины. Ваш поиск может вестись по терминам полы из твердой древесины, строительные материалы и т.д. Другой путь - вы ищете товары на красных страницах, располагающихся перед желтыми. Эти страницы предоставят вам термин из словаря нормативной лексики, который используется для поиска требуемого товара или службы. Все мастера по отделке полов из твердой древесины будут найдены под термином нормативной лексики: ремонт полов.Тезаурус:
Термины нормативной лексики обычно могут быть найдены в предметных указателях
Преимущества:
Используя словарь нормативной лексики, вы можете быть уверены, что вы получите все записи по интересующей вас теме, независимо от того, какие слова автор использовал в своем описании. Все синонимы индексируются одним и тем же термином словаря нормативной лексики; благодаря этому, лицо, осуществляющее поиск, может не заботиться и не разыскивать каждый термин, участвующий в описании определенной темы. Словарь нормативной лексики помогает также избежать проблем, связанных с вариантами написания.
Недостатки:
Однако использование нормативного словаря не всегда дает желаемый результат. Новые тематические разделы часто плохо представлены в нормативном словаре. Также и достаточно специальный тематический раздел может не попасть в словарь нормативной лексики из-за общего характера предметного указателя.
2.2. Свободный текст
Почти все электронные базы данных позволяют вести полнотекстовый поиск или поиск по ключевым словам. При данном типе поиска система обычно ищет запрашиваемый вами термин в каждом поле записи (а не только в предметном указателе или полях дескриптора) и ищет она по тем терминам, которые точно совпадают с напечатанными вами в строке поиска, не преобразуя или переводя их в термины нормативного словаря.
Преимущества:
Полнотекстовый поиск часто выдает больше результатов и в кратчайшее время, поскольку вам не приходится просматривать тезаурус по нормативному предметному указателю. Такой поиск предназначен для очень специфических запросов или для случаев, когда интересующая вас тема, является достаточно новой.
Недостатки:
В результате полнотекстового поиска часто происходит потеря важных записей по интересующей вас теме. Вы должны посвятить много времени разработке стратегии поиска, чтобы быть уверенным в том, что поиск охватит весь синонимический ряд запрашиваемого вами термина. Успех, в силу вышесказанного, часто зависит от уровня вашей компетенции по интересующей вас тематике и от вашего умения распознавать необходимые ключевые слова и их синонимы.
***
Информация подготовлена Шауной Рутерфорд (Shauna Rutherford), Университет библиотеки Калгари: Barclay, Donald (ed). 1995. Teaching Electronic Information Literacy: A How-To-Do-It Manual. New York: Neil Schuman. (p. 63-64).
Перевод Е.С. Кузминой