Словари, справочники, энциклопедии

2009\LSW.RU\000

СЛОВаРЬ РуССКИХ СЛОВАРеЙ =

1) Матрично-словарная система кластерно-пертинентного поиска лексико-семантических вариантов /ЛСВ/ вокабул русского языка в интерактивном режиме.
Начнем с дефиниций:
Кластер - скопление, объединение нескольких однородных элементов, которое может рассматриваться как самостоятельная единица, обладающая определёнными свойствами; напр., в нашем случае - это проекция, выборка всех значений какого-либо словоупотребления/словосочетания из самых разных словарей, справочников и энциклопедий.
Пертинентность - соответствие полученной информации информационной потребности пользователя.
Вокабула - основная (исконная, начальная) форма, заголовок словарной статьи.
Лемма - основа слова, «черное слово», Лемматизация (канонизация, нормализация, стемминг) - процесс нахождения исходной формы слова (т.е. вокабулы).
Релевантность - применительно к результатам работы поисковой системы - степень соответствия запроса и найденного, т.е. уместность результата.
Эксцерпция - выписка, извлечение из писем, произведений, выборка фрагментов из текста; выдержка, цитата; конкретный пример употребления вокабулы в тексте.

ЛСВ - лексико-семантический вариант вокабулы, элементарная лексическая единица = кортеж грамматических форм слова, соотнесенных с одним из значений данного слова.
Поиск ЛСВ вокабул - это процесс отбора соответствующих запросу словарных статей по некоторым признакам из базы словарей, которые соответствуют теме и/или предмету реляционного запроса.
Пилотная версия информационно-поисковой системы ЛСВ вокабул русского языка доступна в Интернете на портале
http://lsw.ru 
( http://vault.syktsu.ru/cgi-bin/slovar.pl,  
http://umk.lsw.ru/cgi-bin/slovar.pl
http://cfrl.lsw.ru/cgi-bin/slovar.pl). 
25 июля 2008 года в лексическую базу загружено 1255 словарей, словников, справочников и энциклопедий русского языка. Общий объем этой базы = 3 282 036 словарных статей.
Программы поиска, создания, загрузки и параметризации лексической базы данных написаны на PERL (Practical Extraction and Report Language - практический язык для извлечения данных и составления отчётов) и PHP (Preprocessor of Home Pages - препроцессор гипертекста - язык программирования, созданный для генерации HTML-страниц на веб-сервере и работы с базами данных) c использованием SQL (Structured Query Language - язык структурированных запросов - универсальный компьютерный язык, применяемый для создания, модификации и управления данными в реляционных базах данных).

А) Первая программа searcher_word
( http://cfrl.lsw.ru/cgi-bin/searcher_word.pl/ )
позволяет искать искомую лексему в загруженных словарях (словниках, справочниках, глоссариях и энциклопедиях) разными способами: а) «целиком слово» (заголовок словарной статьи, черное слово, лемма, вокабула), б) как «часть слова» (фрагмент словоформы, однако с учетом - где будет осуществляться поиск – только по заголовкам словарных статей и/или и в зоне толкования), и в) в «области значения ЛСВ вокабул» (толкование - т.е. в правой части словарной статьи, определение, дефиниция). Сузить объем результатов поиска помогает выбор группы лексических источников: 1) словники; 2) толковые; 3) синонимы; 4) говоры; 5) жаргоны; 6) энциклопедии; 7) ГИЗАУРУС (гипертекстовый тезаурус)-термины; 8) разные.

Б). Программа searcher_synonym
( http://cfrl.lsw.ru/cgi-bin/searcher_synonym.pl/ )
позволяет искать синонимы для введенной лексемы в словарях синонимов русского языка, загруженных в словарную базу данных (информация о количестве словарных статей отображается на экране). При этом также, как и в программе searcher_word, можно выбрать уточняющие параметры поиска: а) «целиком слово», б) как «часть слова». Параметр «толкование» и выбор одной из групп словарей не доступны. Каждый найденный синоним в свою очередь фактически является контекстной ссылкой (т.е. выделенная лексема и будет очередным уже заданным запросом при активизации гиперссылки) на программу searcher_word, при помощи которой и возможно узнать значение соответствующего синонима. Причем в этом случае "по умолчанию" значение синонима ищется во всех словарях как «часть слова».

В) Программа searcher_index
( http://cfrl.lsw.ru/cgi-bin/searcher_index.pl/
не содержит параметров поиска (переключателей и меню выбора) и позволяет осуществить глобальный поиск по генеральному словнику русского языка. В генеральный словник включены вокабулы (заголовки словарных статей) с указанием, в каких словарях можно найти информацию о том или ином слове. В генеральный словник включена информация не столько по электронным версиям (которые загружены в словарную базу данных, т.к. такие вокабулы и так найдутся по запросу а) «целиком слово»), а, прежде всего, словники книжных (бумажных) словарей и словники с других словарных порталов. По числовому коду словаря выдается библиография к исходному словарю и гиперссылки соответствующих источников.
25 июля 2008 в Генеральный словник РЯ содержал 1584362 словарных статей с соответствующими ссылками на 535 словаря.

2) Бесплатная рассылка (с марта 2000 года):
http://subscribe.ru/catalog/science.humanity.hypervault 
В рассылке осуществляется анализ энциклопедий, справочников и словарей русского языка с целью объединения таких лексикографических источников в виде гипертекстовой системы.

3) Монография: Лесников С.В. Словарь русских словарей:
более 3500 источников / Предисловие проф. В. В. Дубичинского. М., Азбуковник, 2002. 334с. ISBN 5-88744-047-3.

4) Свод электронных версий словарей, справочников и энциклопедий




001 СРС Каталог
002 СРС БАС+МАС
003 СРС Библиотека словарей
004 СРС СРНГ+диалектные
005 СРС Старо- Церковно- Славянский
006 СРС Толковые СРЯ
007 СРС Иностранные языки
008 СРС Иностранные языки Анг
009 СРС Иностранные языки Лат Нем Укр
010 СРС Знак Символ
011 СРС Фразеологические словари
012 СРС Большая советская энциклопедия
013 СРС Энциклопедии
014 СРС Этимологические словари
015 СРС гуманитарий филолог Лингвистика
016 СРС гуманитарий филолог Литературоведение
017 СРС гуманитарий филолог СМИ
018 СРС гуманитарий Демография Этнология
019 СРС гуманитарий Живопись
020 СРС гуманитарий Искусство
021 СРС гуманитарий История
022 СРС гуманитарий Космогония Теология
023 СРС гуманитарий Культурология
024 СРС гуманитарий Музыка
025 СРС гуманитарий Педагогика
026 СРС гуманитарий Политология
027 СРС гуманитарий Правоведение
028 СРС гуманитарий Психология
029 СРС гуманитарий Социология
030 СРС гуманитарий Философия
031 СРС гуманитарий Экономика
032 СРС естественник Биология
033 СРС естественник Военное дело
034 СРС естественник География Геология
035 СРС естественник Информатика+Кибернетика
036 СРС естественник Концепции современного естествознания
037 СРС естественник Лесное и сельское хозяйство
038 СРС естественник Математика
039 СРС естественник Радио Телевидение Микросхемы
040 СРС естественник Техника
041 СРС естественник Техническая энциклопедия
042 СРС естественник Транспорт Машиностроение
043 СРС естественник Строительство Архитектура
044 СРС естественник Физика Астрономия
045 СРС естественник Химия
046 СРС естественник Экология
047 СРС Биографии
048 СРС Физкультура и спорт Массаж
049 СРС Коллекционер
050 СРС Быт Досуг
051 СРС Медицина Большая и малая энциклопедии
052 СРС Медицина
053 Энциклопедия Язык&Знание 1
054 Энциклопедия Язык&Знание 2
055 Энциклопедия Язык&Знание 3