Тематические и семантические словари. Русский семантический словарь

Русский семантический словарь является шеститомным изданием, в котором в многоступенчатых классах слов представлена система современной русской общеупотребительной лексики. Первичной единицей описания в Словаре является значение слова; такие значения сгруппированы по частям речи и далее - по лексико-семантическим классам слов и их отдельным участкам.
Издание обращено к специалистам-языковедам, лексикографам, преподавателям, а также к широкому кругу людей, изучающих русский язык или пользующихся словарём в поисках сведений о целом классе слов, а также об отдельном слове, его значении. Словарь в целом охватывает около 300 000 лексических единиц - значений слов и фразеологизмов Каждый том Словаря представляет собой отдельное законченное произведение и может быть использован как самостоятельное лексикографическое исследование.

Слова указующие (местоимения).
Раздел «Русского семантического словаря» «Слова указующие (местоимения)» содержит описание лексической системы русских местоименных слов. Пользование предлагаемым Словарем предполагает предварительное ознакомление с настоящим комментарием к данному разделу и прилагаемыми далее схемами.

Проблема семантической классификации слов указующих, анализа и описания их множеств является значительно более сложной, чем задача соответствующего описания слов именующих - имен, наречий и глаголов. Это объясняется прежде всего высокой степенью абстракции местоименных значений, а также, в ряде случаев, отсутствием более или менее определенных, уловимых границ между отдельными значениями многозначного слова. Трудности, которые здесь встают перед лексикографом, те же, что и при семантическом анализе предлогов, союзов или частиц: их расчленение на значения непривычно и может показаться искусственным. Составитель собственно семантического словаря оказывается перед выбором: либо принять традиционное и достаточно часто повторяющееся во всех грамматиках и толковых словарях описание, либо, ожидая упреков за непривычность и сложность классификации, постараться вникнуть в структуру местоименного слова и выявить те смыслы, которые объединяют отдельные значения разных местоимений в единые ветви лексического древа. Именно эта вторая задача и должна стоять перед исследователем семантической структуры местоимения.

Бесплатно скачать электронную книгу в удобном формате, смотреть и читать:
Скачать книгу Русский семантический словарь, Толковый словарь, систематизированный по классам слов и значений, Шведова Н.Ю., 2002 - fileskachat.com, быстрое и бесплатное скачивание.

  • Толковый словарь русского языка с включением сведений о происхождении слов, Шведова Н.Ю., 2011
  • Топонимический словарь Центральной России, Смолицкая Г.П., 2002
  • Словарь трудных случаев употребления созвучных слов в русском языке, Сурова Н.В., Тюменцев-Хвыля М.В., Хвыля-Тюменцева Т.М., 1999

Семантический словарь русского языка - словарь, составленный проф. В. А. Тузовым из СПбГУ для решения проблемы семантического анализа текстов на русском языке. Суть решения заключается в том, что семантический анализатор, используя морфологический и семантический словари, снимает с исходного текста оболочку русского языка и строит эквивалентный текст на семантическом языке. В книге описываются семантический язык, семантический словарь русского языка и приводится алгоритм семантического анализа.

Доступность

Словарь Тузова можно скачать на сайте Санкт-Петербургского экономико-математический института РАН. По состоянию на 2007 год словарь содержал 164 тысячи слов, распределенных по 1638 классам. К большому сожалению, лицензионные ограничения не позволяют опубликовать работу на NLPub в открытом виде. Для получения полного словаря и классификатора с декабря 2012 года можно обратиться к представителям .

Структура

Словарь базисных понятий русского языка содержит слова, которые нельзя выразить через другие более простые понятия. Он содержит около 18000 существительных, называющих физические и абстрактные объекты, более тысячи базисных прилагательных и около тысячи базисных глаголов, которые, в конечном счёте, были заменены отглагольными существительными. Остальные слова – более 90000 слов – являются производными, то есть их смысл выражается в виде суперпозиции, построенной из базисных функций и базисных понятий. Все множество понятий разбито на иерархическую систему классов.

Словарная статья компьютерного семантического словаря содержит заголовочное слово и его толкование на семантическом языке. Многие слова – а это, как правило, часто используемые слова – содержат более одного толкования. Наиболее многозначны предлоги, описание некоторых из них содержит более сотни альтернатив.

Пример

Типовая словарная статья продемонстрирована в статье «О пользе случайностей», опубликованной в журнале «Компьютерра».

Слово «адресовать» в толковом словаре С. И. Ожегова определяется как послать по какому-нибудь адресу, хотя для анализа желательно, конечно, определить его точнее, а именно выполнить действие перемещения чего-либо куда-либо используя чей-то адрес; формула этого высказывания на разработанном семантическом языке будет иметь вид:

N%~АДРЕС$12/0171(PerfCaus(Uzor (!Им,АДРЕС$12/0171(!Дат),#), Mov(!Вин, !Откуда, !Через,!Дат\!кДат\!Куда)))

В этой формуле слова «адресовать» написано:

  • слово входит в смысловой кластер «адрес» (АДРЕС$12/0171);
  • его толкование: выполнять действие (PerfCaus) , используя (Uzor) адрес (АДРЕС$12/0171) для перемещения (Mov) чего-то (!Вин) куда-то (!Дат\!кДат\!Куда);
  • слово может находиться в отношениях с существительными в именительном (!Им) в роли деятеля, дательным (!Дат) в роли владельца адреса (АДРЕС$12/0171(!Дат)), иметь связь с существительным в винительном падеже, обозначающем объект перемещения (первый аргумент Mov) и указаниями места в разных видах, в том числе в сложно-производном (!Откуда).

СЕМАНТИКА, -и, ж. 1. То же, что семасиология. 2. В языкознании: значение, смысл (языковой единицы). С. слова. С. предложения. || прил. семантический, -ая, -ое.


Смотреть значение СЕМАНТИКА в других словарях

Семантика — семантики, мн. нет, ж. (от греч. semantikos - обозначающий) (лингв.). 1. То же, что семасиология. 2. Значение (слова, оборота речи и т. п.).
Толковый словарь Ушакова

Семантика Ж. — 1. Значение, смысл языковой единицы (морфемы, слова, словосочетания и т.п.). 2. Раздел языкознания, изучающий смысловую сторону языка. 3. Раздел семиотики, изучающий знаковые........
Толковый словарь Ефремовой

Семантика — -и; ж. [от греч. sēmantikos - обозначающий] Лингв.
1. Значение, смысл (слова, оборота речи, грамматической формы). С. слова "творение" связана с глаголом творить.
2. = Семасиоло́гия.........
Толковый словарь Кузнецова

Семантика — - изучение способа использования слов и передаваемых ими значений.
Экономический словарь

Логическая Семантика — теория, изучающая вопросы интерпретациилогарифмических исчислений: отношения между языком исчисления иописываемой им реальностью - моделью теории, условия существования........

Семантика — (от греч. semantikos - обозначающий) -1) значения единицязыка.2) То же, что семасиология, раздел языкознания, изучающий значениеединиц языка, прежде всего слов.3) Один из основных разделов семиотики.
Большой энциклопедический словарь

Конструктивная Семантика — - совокупность способов понимания суждений в конструктивной математике. Необходимость в особой семантике вызвана различием общих принципов, лежащих в основе традиционной........
Математическая энциклопедия

Семантика — в математической логике - исследование интерпретаций логического исчисления, формальной аксиоматич. теории; изучение смысла и значения конструкций формализованного........
Математическая энциклопедия

Общая Семантика — - метод, развитый Альфредом Корцибским (1933), с целью преодоления аристотелевской бинарной системы мышления (объект существует или не существует = третье принципиально........
Психологическая энциклопедия

Порождающая Семантика — См. семантика, порождающая.
Психологическая энциклопедия

Семантика — (от греч. semantikos - обозначающий). Различают несколько видов С.1. Лингвистическая С. - раздел языкознания, изучающий лексические значения слов и выражений, изменения их значений........
Психологическая энциклопедия

Семантика, Генеративная — Подход к изучению языка, который сосредоточивается на развитии грамматики, порождающей основные значения предложений и преобразующей значения в реальные предложения.
Психологическая энциклопедия

Семантика — (от греч. semantikos - обозначающий, знак) - англ. semantics; нем. Semantik. 1. Раздел языкознания и логики, исследующий проблемы, связанные со смыслом, значением и интерпретацией........
Социологический словарь

Культурная Семантика — - специфич. проблемная область науки о культуре, занимающаяся изучением культурных объектов с т.зр. выражаемого ими смысла, значения. Культурные объекты любого рода........
Философский словарь

Логическая Семантика — - отдел логики, изучающий значение выражений языка; в более точном смысле раздел металогики. изучающий интерпретации (Интерпретация и модель) логических исчислений........
Философский словарь

Русский семантический словарь

Русский семанти́ческий слова́рь - шеститомное издание (издано 4 тома, 1998-2007), в котором в многоступенчатых классах слов представлена система современной русской общеупотребительной лексики.

Первичной единицей описания в словаре является значение слова; такие значения сгруппированы по частям речи и далее - по лексико-семантическим классам слов и их отдельным участкам. Словарь в целом охватывает около 300 000 лексических единиц - значений слов и фразеологизмов. Каждый том словаря представляет собой отдельное законченное произведение и может быть использован как самостоятельное лексикографическое исследование.

Библиография

  • Караулов Ю. Н., Молчанов В. И., Афанасьев В. А., Михалев Н. В. Русский семантический словарь: Опыт автомат. построения тезауруса: от понятия к слову / Отв. ред. С. Г. Бархударов. М.: Наука, 1983. 566с. доп. тираж 5000 экз. 1600 тем-понятий, ок. 10000 лекс. ед.
  • Русский семантический словарь. Толковый словарь, систематизированный по классам слов и значений / Ин-т рус. яз. им. В. В. Виноградова РАН . Под общ. ред. Н. Ю. Шведовой.
    • Т. 1: Слова указующие (местоимения). Слова именующие: имена существительные (Всё живое. Земля. Космос). Белоусова А. С., Юношева В. К., Каминская Ю. А. М.: Азбуковник, . XXV, 807с. 3000 экз. 39000 слов и фразеологических выражений. Слово-указ..635-714.
    • Т. 2: Имена существительные с конкретным значением. Всё создаваемое руками и умом человека (населённые места, обрабатываемые участки дороги; вещественные продукты труда); организации и учреждения. Названия предметов по форме, состоянию, составу, местонахождению, употреблению. Шведова Н. Ю. , Дмитренко С. Н., Копорская Е. С., Ляпон М. В., Агафонова Л. Л., Белоусова А. С., Габучан К. В., Михайлова М. С., Плотникова В. А., Сафонова Ю. А., Ходакова Е. П., Каминская Ю. А., Рогова М. В., Юношева В. К. М.: Азбуковник. . ХХХII, 762с. 3000 экз. 40000 слов и фраз. Словоуказ..611-674.
    • Т. 3: Имена существительные с абстрактным значением: Бытие. Материя, пространство, время. Связи, отношения, зависимости. Духовный мир. Состояние природы, человека. Общество. М.: Азбуковник, . 720 с.
    • Т. 4: Глагол. Глаголы с ослабленной знаменательностью: глаголы-связки и полузнаменательные глаголы, глаголы фазовые, глаголы модальные, глаголы связей, отношений и именования. Дейктические глаголы. Бытийные глаголы. Глаголы со значением собственно активного действия, деятельности, деятельностного состояния. М.: РАН ИРЯ, 2007. 952 с.

Ссылки


Wikimedia Foundation . 2010 .

Смотреть что такое "Русский семантический словарь" в других словарях:

    Идеографический (семантический) словарь словарь, в котором статьи упорядочены не по алфавиту, как обычно, а по смыслу (лексическому значению заглавного слова или фразы). Если алфавитный словарь служит для того, чтобы узнать что то о данном… … Википедия

    Список понятий, содержащих слово «русский» Содержание 1 Классические понятия 2 Зарубежные понятия 3 Новые понятия … Википедия

    - (от греч. θησαυρός сокровище), в общем смысле специальная терминология, более строго и предметно словарь, собрание сведений, корпус или свод, полномерно охватывающие понятия, определения и термины специальной области знаний или сферы… … Википедия

    Тезаурус (от греч. θησαυρός сокровище) в современной лингвистике особая разновидность словарей общей или специальной лексики, в которых указаны семантические отношения (синонимы, антонимы, паронимы, гипонимы, гиперонимы и т. п.) между… … Википедия

    Термин, характеризующий особую стадию коррупции, когда способы передачи информации и средства связи теряют своё первоначальное предназначение, и начинают самостоятельное существование как государственно правовые институты, одновременно… … Википедия

    Наталия Юльевна Шведова Дата рождения: 25 декабря 1916(1916 12 25) Место рождения: Москва Дата смерти … Википедия

    Шведова, Наталия Юльевна Дата рождения: 25 декабря 1916 Место рождения: Москва, Российская империя Наталия Юльевна Шведова (р. 25 дека … Википедия

    Шведова, Наталия Юльевна Дата рождения: 25 декабря 1916 Место рождения: Москва, Российская империя Наталия Юльевна Шведова (р. 25 дека … Википедия

    Шведова, Наталия Юльевна Дата рождения: 25 декабря 1916 Место рождения: Москва, Российская империя Наталия Юльевна Шведова (р. 25 дека … Википедия

Книги

  • Русский семантический словарь. В 6 томах. Том 4. Глагол , Клара Габучан,М. Михайлова,В. Плотникова,В. Юношева,Елена Копорская. Четвертый том `Русского семантического словаря` содержит описание лексической системы глаголов (слов и значений), группирующихся в иерархически организованные лексико-семантические множества,…
  • Русский семантический словарь , . В словаре 1600 темам-понятиям, охватывающим все сферы жизни и репрезентирующим содержательно русскую лексику, поставлены в соответствие слова современного русскоголитературного языка из…
  • Русский семантический словарь. Том 3. Имена существительные с абстрактным значением. Бытие. Материя, пространство, время. Связи, отношения, зависимости. Духовный мир. Состояние природы, человека. Общество , . Третий том "Русского семантического словаря" содержит описание абстрактных имен существительных (слов и значений), группирующихся в иерархически организованные лексико-семантические…

Основополагающим семантическим понятием в используемом нами аппарате считается семантическое отношение. Семантическое отношение - это некая универсальная связь, усматриваемая носителем языка в тексте. Эта связь бинарна, т.е. она идет от одного семантического узла к другому узлу .

Формат записи семантического отношения следующий:

R(А,B), где R – название семантического отношения, А – зависимый член отношения, B – управляющий член отношения.

Для конкретных А,B и отношения R направление выбирается таким образом, чтобы формула R(А,B) была эквивалентна утверждению, что "А является R для B". Соответственно, формула R(B,А) должна быть эквивалентна утверждению "B является R для А". Например, для фразы роман Толстого будет построена формула АВТОР(Толстой, роман), а не наоборот, потому что верно утверждение "Толстой является АВТОРом романа", а не наоборот. Вследствие этого в формуле R(А,B) будем иногда отождествлять R с А.

Семантическое отношение формирует и организует текст. По замыслу создателей этого набора семантических отношений, практически любые связи между частями текста, которые необходимо выявить при машинном анализе текста, можно выразить каким-нибудь семантическим отношением или их композицией, например, во фразе взрыв произошел в два часа ночи выявляется семантическое отношение между ситуацией "взрыв " и параметром "два часа ночи", которое называется ВРЕМЯ. Это записывается следующим образом: ВРЕМЯ("в два часа ночи", "взрыв ").

Среди семантических отношений достаточно много таких, которые сейчас уже повсеместно считаются универсальными. Ниже будут перечислены семантические отношения, используемые в системе ДИАЛИНГ:

Название Примеры Структура
АВТОР Роман Толстого
Указ Президента
АВТОР (ТОЛСТОЙ,РОМАН)
АВТОР (ПРЕЗИДЕНТ,УКАЗ)
АГЕНТ Мы сократили отставание АГЕНТ (МЫ, СОКРАТИТЬ)
АДР Я отдал стул отцу АДР (ОТЕЦ,ОТДАВАТЬ)
В-НАПР указатель на Монино В-НАПР (МОНИНО,УКАЗАТЕЛЬ)
ВРЕМЯ Это произошло вчера ВРЕМЯ (ВЧЕРА, ПРОИЗОЙТИ)
ЗНАЧ Высота дома – 20 метров ЗНАЧ (20 МЕТРОВ, ВЫСОТА)
ИДЕНТ Дом N 20 ИДЕНТ (N 20, ДОМ)
ИМЯ Дворник Степанов ИМЯ (СТЕПАНОВ,ДВОРНИК)
ИНСТР резать ножом ИНСТР (НОЖ,РЕЗАТЬ)
ИСХ-Т яблоки из Молдавии ИСХ-Т (МОЛДАВИЯ, ЯБЛОКИ)
К-АГЕНТ купил у старьевщика К-АГЕНТ (СТАРЬЕВЩИК,КУПИТЬ)
КОЛИЧ два яблока КОЛИЧ (ДВА, ЯБЛОКО)
КОН-Т уехать в Москву КОН-Т (МОСКВА, УЕХАТЬ)
ЛОК жить в глуши ЛОК (ГЛУШЬ, ЖИТЬ)
МАСШТ Банк России МАСШТ (РОССИЯ, БАНК)
МАТЕР сумка из кожи МАТЕР (КОЖА,СУМКА)
НАЗН книга для детей НАЗН (ДЕТИ, КНИГА)
ОБ уничтожить мост ОБ (МОСТ,УНИЧТОЖИТЬ)
ОГРН выделять по возрасту ОГРН (ВОЗРАСТ,ВЫДЕЛЕНИЕ)
ОЦЕНКА хорошо относиться ОЦЕНКА (ХОРОШО, ОТНОСИТЬСЯ)
ПАРАМ высота дома ПАРАМ (ВЫСОТА, ДОМ)
ПАЦИЕН арест преступника ПАЦИЕН (ПРЕСТУПНИК, АРЕСТ)
ПОСРЕД закончить доклад анекдотом ПОСРЕД(АНЕКДОТ, ЗАКОНЧИТЬ)
ПРИЗН красивый шар ПРИЗН (КРАСИВЫЙ, ШАР)
ПРИНАДЛ дом отца ПРИНАДЛ (ДОМ,ОТЕЦ,)
ПРИЧ деревья повалены ураганом ПРИЧ (УРАГАН,ПОВАЛИТЬ)
РЕЗЛТ испечь пирог РЕЗЛТ (ПИРОГ,ИСПЕЧЬ)
СОДЕРЖ рассказать о весне СОДЕРЖ (ВЕСНА,РАССКАЗАТЬ)
СПОСОБ идти босиком СПОСОБ (БОСИКОМ, ИДТИ)
СРЕДСТВО красить белилами СРЕДСТВО (БЕЛИЛО, КРАСИТЬ)
СТЕПЕНЬ весьма преуспеть СТЕПЕНЬ(ВЕСЬМА, ПРЕУСПЕТЬ)
СУБ любовь отца СУБ(ОТЕЦ, ЛЮБОВЬ)
ТЕМА говорить о Москве ТЕМА (МОСКВА,ГОВОРИТЬ)
ЦЕЛЬ забастовка в целях повышения зарплаты ЦЕЛЬ (ПОВЫШЕНИЕ, ЗАБАСТОВКА)
ЧАСТЬ ножка стула ЧАСТЬ (НОЖКА, СТУЛ)

Как уже было сказано, многие из вышеперечисленных отношений можно найти в других лингвистических теориях. Для подтверждения последнего утверждения мы разберем примеры использования семантических ролей в одной статье Падучевой.

Падучева Пример ФРАП-ПОЛИТЕКСТ-ДИАЛИНГ
Агенс Иван приехал АГЕНТ (Иван, поехать)
Конечный пункт приехал в Варшаву КОН-Т(Варшава, приехать)
Адресат сказать отцу АДР(отец, сказать)
Степень наполнить полностью СТЕПЕНЬ(полностью, наполнить)
Направление движения поехать направо В-НАПР(направо, поехать)
Исходный пункт приехать из Москвы ИСХ-Т(Москва, приехать)
Пациенс съесть яблоко ПАЦИЕН(яблоко, съесть)
Место банка кишела ЛОК(банка, кишеть)
Содержание чтение нравится ему СОДЕРЖ(чтение, нравиться)
Посессор борода Ивана ПРИНАДЛ(борода, Петр)
Инструмент открывать ключом ИНСТР(ключ, открывать)
Результат резать на куски РЕЗЛТ(куски, резать)

Приведем еще один перечень семантических отношений из книги Апресян:

Апресян Пример ФРАП-ПОЛИТЕКСТ-ДИАЛИНГ
Sub(субъект) поезд движется СУБ (Поезд, двигаться)
Contrag (контрагент) покупать у старьевщика К-АГЕНТ (старьевщик, покупать)
Cap (глава) вина перед коллективом
Obj (объект) гладить руку, стрелять в мишень ОБ(рука, гладить)
КОН-Т (мишень, стрелять)
Content (содержание) знать об отъезде СОДЕРЖ(отъезд, знать)
Adr (адресат) сообщать президенту АДР (президент, сообщать)
Recip (получатель) давать детям, дарить людям АДР (дети, давать)
АДР (люди, дарить)
Via (посредник) передовать через секретаря ПОСРЕД(секретарь, передавать)
Is (источник) брать в кассе ИСХ-Т (касса, брать)
Loc (место) находиться в лесу ЛОК(лес, находиться)
Ab (начальная точка) вывести из леса ИСХ-Т(лес, вывести)
Ad (конечная точка) везти в город КОН-Т(город, везти)
Itin (маршрут) идти по дороге
Med (средство) прибивать гвоздями СРЕДСТВО (гвозди, прибивать)
Instr (инструмент) резать ножом ИНСТР (нож, резать)
Mod(способ) обращаться плохо АСПЕКТ (плохо, обращаться)
Cond (условие) если P, то Q УСЛ (P,Q)
Motiv(мотивировка) награждать за храбрость ПРИЧ(храбрость, награждать)
Caus (причина) радоваться подарку, проистекать из-за Q ПРИЧ (подарок, радоваться)
ПРИЧ(Q, проистекать)
Result (результат) превращать в воду РЕЗЛТ(вода, превращать)
Dest (цель) стремиться к общему благу ЦЕЛЬ (благо, стремиться)
Asp (аспект) превосходить по качеству ОГРН (качество, превосходить)
Quant (количество) пять человек КОЛИЧ(пять, человек)
Period (срок) отпуск на два месяца ВРЕМЯ (на два месяца, отпуск)
Temp (время) начаться в полночь ВРЕМЯ (полночь, начаться)

Все примеры, приведенные в статье Падучевой и книге Апресяна, не противоречат ни примерам, данным нами выше, ни нашему пониманию семантических валентностей. Это достаточно весомый аргумент в пользу универсальности используемого нами перечня семантических отношений.

Несмотря на общепризнанность, рассматриваемый набор семантических отношений обладает одним недостатком: одни отношения похожи на другие, но показать их сходство и различие достаточно трудно. О некоторых, например, можно сказать, что они являются разновидностями других, а именно:

  • АГЕНТ, АВТОР – разновидности СУБ;
  • КОН-Т, ИСХ-Т – разновидности ЛОК.

Другие корелляции между семантическими отношениями будут рассмотрены в параграфе "Иерархия семантических отношений".

В системе ФРАП-ПОЛИТЕКСТ-ДИАЛИНГ кроме семантически наполненных отношений, перечисленных выше, есть еще два вспомогательных отношения П_АКТ и В_АКТ (первый и второй актанты), которые используются для описания валентных структур слов-отношений (см. ниже "Общая категоризация лексики"). Например, слову часть (которое обозначает отношение ЧАСТЬ) будут приписаны валентности П_АКТ и В_АКТ, которые должны исчезнуть на этапе семантического анализа. Например, для фразы Москва – часть России сначала будет построено: П_АКТ(Москва, часть), В_АКТ(Россия, часть), что потом перейдет в формулу ЧАСТЬ(Москва, Россия).

Основными семантическими классами лексемы считаются ЭТК.ОБ, ЭТК.СИТ, ЭТК, ОТН, ОПЕР.

Принципиальное разделение между ЭТК.ОБ и ЭТК.СИТ заключается в том, что лексемы ЭТК.ОБ обычно выполняют роль участников ситуации, которые обозначают слова категории ЭТК.СИТ. Например, в ситуации точить (ЭТК.СИТ) может быть участвовать объект напильник (ЭТК.ОБ) и объект рабочий(ЭТК. ОБ).

Для ситуаций определено место и время, что в тексте означает, что слова ЭТК.СИТ могут свободно принимать обстоятельства места и времени. Например, фраза Рабочий точил деталь напильником может разрастись до фразы Вчера в цеху рабочий точил деталь напильником. Однако в предложении, в котором встречается более одного слова ЭТК.СИТ, часто возникает неоднозначность, когда неясно, какую ситуацию уточняет обстоятельство места или времени (см. ниже).

Разделение лексики по категориям можно использовать в самых разных ситуациях, например, для сборки однородных именных групп. По нашим расчетам, в 90 процентах однородных именных групп члены однородного ряда имеют одну и ту же категорию. То есть для научно-технического текста случаи однородного ряда типа Володя и революция (ЭТК.ОБ и ЭТК.СИТ) маргинальны.

Семантические характеристики

Семантические характеристики (СХ) в словаре РОСС играют важнейшую роль в семантическом описании слов. В словаре РОСС семантических характеристик около 40. Из СХ строятся формулы (с логическими связками и, или). Каждому слову приписана некоторая формула, составленная из СХ.

Также для каждого слова фиксируется валентная структура , где Аi - описание актанта, которое является парой <ГХi, CХi >, где ГХi - некое описание грамматического выражения актанта в предложении, а CХi - семантическое описание актанта, и CХi - формула, составленная из СХ.

Когда алгоритм пытается собрать валентную структуру слова, критерием установления связи служит соответствие значения полей СХ и ГХ, приписанных актанту, значению полей СХi и ГХi, приписанных главному слову. Таким образом собирается валентная структура слова.

Хотя изначально СХ вводились как простые селективные ограничения, отбраковывающие некоторые связи, проведенные синтаксическим анализом, теперь за каждой из них закреплено определенное значение . Ниже мы приведем перечень основных СХ. Для каждой СХ будем давать примеры слов, содержащих ее в своем значении, а также примеры слов, для которых одна из СХi содержит эту семантическую характеристику. Например, для СХ АРТ(артефакт) будут даны слова типа модель, памятник, которые собственно являются артефактами, и пример выпускать машины, где второй актант глагола выпускать может быть артефактом.

СХ Комментарий Примеры слов с таким СХ Примеры слов с таким СХi
АБСТР Любое абстрактное существительное или прилагательное модель, план,
тенденция, обстоятельство
внедрять технологию;
использовать план
АРТ Артефакт. Все, что сделано человеком. машина, хлеб, памятник выпускать машины;
требование закона
ВЕЛИЧ Прилагательные, образованные от параметрических существительных и от существительных, обозначающих какое-либо значение на параметрической шкале высокий, мощный
большой
---
ВЕЩВО Любое название химического вещества или того, что можно как-либо дозировать, отмерять, продавать по весу или объему. аммиак, бензин, ядохимикат вес натрия;
дом из бетона;
месторождение нефти
ВЛАСТЬ Высшие государственные и военные должности и учреждения. Любые должности, связанные с непосредственным управлением людьми. генерал, президент, руководитель министр назначил;
Дума ратифицировала;
секретарь директора
ВМЕСТЛ Все, что предназначено для содержания чего-либо другого. мешок, сейф, гараж --
ВОСПР все глаголы и существительные восприятия слушать, видеть, чувствовать --
ВРЕД Все, к чему человек обычно относится как к нежелательному. катастрофа, война, перегрузка устранить недостаток
ГЕОГР Любой географический объект остров, река набережная реки
впадать море
стоять на холме
ГОС Любое название государства или тип государства республика, Россия компартия России
парламент Украины
политика США
представитель ЮАР
ДВИЖ Глаголы движения (в том числе декаузативы) идти, ронять --
ДОЛЖ Должность, профессия, социальный статус повар, партработник --
Д-УСТР Деталь устройства карбюратор, валик --
ИЗМ Действия-изменения наращивать, реформировать, копить --
ИНТЕЛ все действия, непосредственно связанные с мыслительной деятельностью надеяться, изучать, решать --
ИНТРВЛ Временной интервал день, неделя продлить на два дня;
бюджет на 2000 год
ИНФ Слова, обозначающие информацию знание, команда, утверждение, новость --
КОММУНИК Глаголы речи выражать, выступать, репортаж --
НОСИНФ Носители информации. Это можно прочесть, а потом сжечь. книга, газета, заметка заголовок книги
публикация заметки
написать статью
Н-ТРЕБ Набор требований. (разновидность НОСИНФа) закон, инструкция нарушать закон
соблюдать инструкции
отменять указ
ОДЕЯТ Область деятельности физика, балет, быт министр культуры
ОДУШ Семантически одушевленный объект папа, президент Отец рассказывает
любовь Ивана
ОРГ Любая организация колхоз, школа актив банка
директор института
облигации банка
ПРЕДМ Любой предмет (объект, который меньше по размерам среднего человека). Часто является АРТ.В отличие от УСТР устроен просто. марка, бинокль --
ПРОТЯЖ Протяженные географические объекты дорога, граница река впадает в море
СОБИР все, что обозначает множество однотипных объектов библиотека, молодежь --
СОЦ Любые ситуации, выходящие за пределы одной семьи митинг, коррупция, олимпиада --
УСТР Любое устройство компьютер, лифт чинить компьютер
разобрать лифт
ФИН Все, что связано с финансами деньги, банк, долг продавать за рубли
индексировать пенсию
ХОР Все, что оценивается как положительное взаимопомощь, мужество --
ЭМОЦ Обычно прилагательные, которые выражают эмоции мизерный, могучий, несчастный --
ЯВЛЕН Ситуация, для которой трудно найти причину смерч, терроризм --

Некоторые из перечисленных характеристик очевидно не могут использоваться самостоятельно. Например, характеристика СОБИР, которая обозначает множественность, должна использоваться только с какими-то другими СХ:

СХ(библиотека) = СОБИР, НОСИНФ

СХ(молодежь) = СОБИР, ОДУШ.

Существует еще две несамостоятельные характеристики: ОТСУТ и КАУЗ. Обе характеристики действуют на следующую за ними в семантической формуле СХ. Первая из них – оператор отрицания:

СХ(бесчувственно) = ОТСУТ, ЭМОЦ

СХ(стоять) = ОТСУТ, ДВИЖ.

Вторая обозначает оператор каузации:

СХ(наращивать) = КАУЗ, ИЗМ

СХ(обязывать) = КАУЗ, МОДЛ.

Подчеркнем, что все три "операторных" характеристики (СОБИР, КАУЗ, ОТСУТ) действуют только на первую справа семантическую характеристику.

Взаимосвязи семантических характеристик

Некоторые характеристики можно назвать составными, т.к. их можно выразить через другие. Например:

  • НОСИНФ = ИНФ, ПРЕДМ (носитель информации – это предмет, содержащий информацию);
  • Н-ТРЕБ = ВЛАСТЬ, НОСИНФ (набор требований - это носитель информации, опубликованный агентом с пометой ВЛАСТЬ).

Такие характеристики используются только для удобства.

Есть характеристики, которые являются антонимами. Использование их в одной конъюнкции запрещено. Например:

  • ВРЕД, ХОР;
  • АБСТР, ПРЕДМ.

Существуют характеристики, которые являются разновидностями других:

  • ОРГ – разновидность ОДУШ. Таким образом, любая организация считается семантически одушевленной;
  • ДОЛЖ - разновидность ОДУШ;
  • Д-УСТР,УСТР – разновидности АРТ;
  • СОЦ, ФИН - разновидности ОДЕЯТ.

Входом в словарь считается пара <слово, номер значения>. Для каждого входа составляется словарная статья – набор пар вида <название поля, значение поля>. Между названием поля и его значением ставится знак "=". Название поля состоит из собственно названия и (факультативно) некоторого набора индексов. Например: ГХ1, СХ(1), СХ1(2) и т.д. Если поле идет без индекса, значит оно относится к главному слову (обозначается С), если с индексом n без скобок – значит к актанту с номером n (обозначается Аn). Значение индекса в скобках будет объяснено в параграфе, относящемся к словарю словосочетаний.

За каждым названием поля зафиксировано некоторое значение. Приведем перечень основных полей словаря РОСС:

Поле Расшифровка Примеры значений поля
КАТ категория лексемы ЭТК.ОБ, ЭТК, ЭТК.СИТ...
СХ семантическая характеристика слова ОДУШ, ФИН...
СХ1,...,СХ7 семантические ограничения актантов (1,...,7) ОДУШ ФИН
ГХ грамматическая характеристика слова СУЩ:ИГ
ГЛ:ГГ
ГХ1,...,ГХ7 грамматические ограничения актантов к_доп:РОБСТ_ГР: у+Р
ВАЛ валентная структура слова СУБ, А1, С
ЛФ лексические функции Magn: жгучий

Для записи значения поля в словаре заданы домены (списки констант), из которых можно собирать сложные формулы. Из констант нескольких доменов можно собрать один т.н. элемент . Например, элемент "к_доп:Р" собран из трех доменов (домен синтаксических отношений, домен двоеточия и домен падежей). Ниже мы приведем перечень основных доменов словаря РОСС:

Название домена Расшифровка Примеры
Д_КАТ категория ЭТК.ОБ, ЭТК.СИТ,...
Д_ГРУППЫ синтаксические группы ОБСТ_ГР, ГГ, ИГ,...
Д_СИН_О синтаксические отношения к_доп, с_опр, п_доп, отпредик...
Д_ЛФ лексические функции Magn, Oper, Func,...
Д_ПАДЕЖ падежи И,Р,Д,В,Т,П
Д_ПО предметная область фин, информ,...
Д_ПРЕДЛОГ предлоги в,на,у,...
Д_СЕМ_О семантические отношения СУБ, ИДЕНТ,...
Д_СХ семантические характеристики ОДУШ,ОРГ,...
Д_ЧАСТЬ_РЕЧИ часть речи СУЩ, ПРИЛ, НАР,...
Д_ЧИСЛО грамматическое число ед, мн
Д_АКТАНТЫ обозначение актантов и главного слова в статье С,А1,...,А7

Как уже было сказано, формат одного элемента задается набором названий доменов, который называется сигнатурой . Например, элемент СУЩ:ИГ задается сигнатурой Д_ЧАСТЬ_РЕЧИ, Д_ДВОЕТОЧИЕ, Д_ГРУППЫ.

Теперь перейдем собственно к значениям полей. Значения полей чисто формально делятся на три типа:

  • Одиночные (значение такого поля может состоять только из одного элемента);
  • Множественные (значением такого поля может быть набор элементов);
  • Формульное (значением такого поля может быть набор наборов элементов).

Каждое поле приписано ровно одному типу. Для каждого типа разработан свой формат записи. Значение одиночного поля записывается так:

<значение поля> = элемент, например, КАТ = ЭТК.ОБ.

Значение множественного поля записывается так:

<значение поля> = элемент.... элемент

например:

ВАЛ = СУБ (А1,С) ОБ(А2,С).

Формульное поле записывается так:

<значение поля> = 1 элемент.... элемент, 2 элемент.... элемент, .... n элемент.... элемент,

пример значения поля СХ:

CХ = 1 ДОЛЖ ФИН 2 ДОЛЖ СОЦ

Здесь значение состоит из двух наборов (ДОЛЖ и ФИН) и (ДОЛЖ и СОЦ). Считается, что в полях ГХ и СХ между наборами элементов стоит дизъюнкция, а между элементами внутри одного набора стоит конъюнкция (за исключением случая, когда первый элемент - "операторный" (ОТСУТ, СОБИР, КАУЗ)). Таким образом, приведенная выше запись значения поля СХ означает, что слово С может быть "финансовой должностью" или "социальной должностью".

Нужно еще добавить, что символ "*" в записи значения поля обозначает любой элемент, возможный в данной сигнатуре в этой позиции.

Полное формальное описание словарной статьи словаря РОСС содержится в Сокирко.

Шаблонная статья для некоторого класс слов - это общая часть всех словарных статьей слов этого класса. Перечислим некоторые из них:

  • Слова-отношения. Эти слова обозначают семантические отношения (например, часть , признак). Поле СХ обязательно должно содержать название семантического отношения, к которому восходит это слово. Поле ВАЛ должно быть таким:
ВАЛ = П-АКТ, А1, С В-АКТ, А2, С

Второй актант этих слов часто напрямую грамматически не выражается (как зависимый или подчиняющий синтаксический актант), поэтому ГХ2 в этой статье отсутствует.

  • Прилагательные. Большинство прилагательных обладают одной синтаксически пассивной валентностью на существительные, которая переходит в отношение ПРИЗН или ОЦЕНКА. Это выражается следующей шаблонной статьей:
КАТ = ЭТК // прилагательные все принадлежат // категории ЭТК ГХ = 1 ПРИЛ:с_опр // часть речи, син.роль прилагательного ВАЛ = ПРИЗН, С, А1 // м.б., ОЦЕНКА ГХ1 = 1 X! : ИГ // так записывается синтаксически // пассивная валентность на именную группу
  • В словаре довольно много слов, обозначающих должности (ДОЛЖ), например: абитуриент, авиадиспетчер, дворник и т.д. У этих слов почти всегда есть валентность на актант ИДЕНТ или ИМЯ, который синтаксически примыкает к описываемой должности (дворник Иванов, гражданин Петров и т.д.). Для таких слов шаблонная статья будет следующей:
КАТ = 1 ЭТК.ОБ ГХ = 1 СУЩ:ИГ СХ = 1 ДОЛЖ ВАЛ = ИДЕНТ, А1 , С // м.б., ИМЯ ГХ1 = 1 прим_опр: ИГ СХ1 = 1 ОДУШ
  • Еще один класс слов – переходные глаголы действия с АГЕНТ в первой валентности (косить , валить , печатать... ). Эти глаголы имеют большую лексическую наполненность. АГЕНТ в валентной структуре означает, что первый участник контролирует ход самого действия и его результат. Вот шаблонная статья для таких глаголов:
КАТ = 1 ЭТК.СИТ ГХ = 1 ГЛ:ГГ ВАЛ = АГЕНТ, А1 , С ОБ, А2 , С ГХ1 = 1 подл: И СХ1 = 1 ОДУШ ГХ2 = 1 п_доп: В
  • Класс модальных слов в РОССе. Модальность – одно из сложнейших понятий теории языка, и здесь мы не будем касаться вопроса определения того, что такое модальное слово. Скажем только, что модальное слово устанавливает определенное отношение между некоторой ситуацией и внешним или внутренним участником. Необходимость выделения модальных слов в отдельную семантическую группу возникла из-за того, что синтаксические средства выражения модальности крайне разнообразны.

Любому модальному слову в словаре должна быть приписана СХ МОДЛ. У модального слова может быть три валентности: СОДЕРЖ, СУБ, ОГРН.

СОДЕРЖ – это та ситуация, которую характеризует модальное слово по достоверности/недостоверности, возможности/невозможности, желаемости/нежелаемости и др.

СУБ – тот одушевленный участник, который находится с ситуацией в модальном отношении. Тот, кому нужно, хочется, необходимо, невозможно и т.д.

ОГРН – ограничение распространения модальности ситуации:

Эти статьи мне необходимы для подготовки к экзамену .

Для некоторых слов субъект модальности может являться участником модальной ситуации, точнее, ее первым актантом, а может и не являться. Однако есть такие модальные слова, у которых СУБ всегда является первым актантом СОДЕРЖ (мочь, вправе, время ).

У всех модальных слов в нашем понимании есть валентность СУБ, валентности ОГРН может и не быть (хотеть, мочь ).

Обязательной частью словарных статей для модальных слов будет:

СХ = МОДЛ ВАЛ = СУБ, А1 , С СОДЕРЖ, А2 , С СХ1 = 1 ОДУШ

Кроме этого, в эти статьи часто еще входят следующие поля:

ГХ1 = 1 к_доп: Д ГХ2 = 1 отпредик: инф ДОП = СУБ (А1 , А2)

Иерархия семантических отношений

Теперь рассмотрим более сложные случаи связей между семантическими отношениями:

АДР, В-НАПР, КОН-Т

Все три отношения обычно входят в валентную структуру некоторого действия С. Общность этих отношений проявляется, например, в английском языке на синтаксическом уровне:

I talk to you => АДР(you, talk)

I go to the town => КОН-Т(town,go)

Тhe vane points to the north => В-НАПР(north, point)

Различие между АДР и КОН-Т заключается в том, что АДРесат – это семантически одушевленный участник ситуации С. КОН-Т, напротив, семантически неодушевленный участник. Соответственно, от АДР можно ждать некоторой реакции на действие С, а от КОН-Т - нельзя.

Предполагается, что после завершения действия С один из участников ситуации должен переместиться в КОН-Т или в АДРесата. Для валентности В-НАПР последнее утверждение неверно. В-НАПР указывает только направление, но не точку.

В книге Апресян предполагается, что Adr(АДР) может быть участником только информационного процесса. В системе ДИАЛИНГ валентность АДР понимается шире, например: помощь врагу, награда солдату.

СПОСОБ, ИНСТР, СРЕДСТВ, ПОСРЕД

Как и в предыдущем случае, все четыре отношения обычно используются в контексте некоторого действия С. Эти отношения часто выражаются русским творительным или английским предлогом with:

To paint smth. with grey => СРЕДСТВО(paint , grey )

The warship was armed with nuclear weapons => ИНСТР(nuclear weapons , arm )

You are trying to prove it with your figures => СПОСОБ (figures, prove)

He concluded his address with a poem => ПОСРЕД(poem, conclude)

Отношение СПОСОБ – самое общее из этих четырех. ИНСТР отличается от СРЕДСТВО тем, что СРЕДСТВО должно расходоваться в процессе выполнения действия С, а ИНСТР - нет. ПОСРЕД – отношение, связывающее такой объект Х с действием С, который в принципе не был предназначен для действия С, но был в нем использован. Использование ПОСРЕД для действия С не противоречит никаким природным законам, но в нем самом не заложено, что он должен быть использован для Х.

ИДЕНТ, ИМЯ

ИДЕНТ отличается от ИМЯ тем, что ИДЕНТ предполагает некоторую уникальность среди ему похожих. В примере Дом N 20 идентификатор N 20 обязан обеспечить только уникальность Дома N 20 среди всех других домов. В примере мальчик Петя, имя Петя возможно несет какие-то дополнительные коннотации. Однако во многих случаях эти два отношения следует приравнивать.

СУБ, АГЕНТ

Предполагается, что АГЕНТ какой-то ситуации всегда действует с некоторой целью. Он является либо каузатором, либо инициатором, либо каким-то другим активным, целеполагающим участником. СУБ не является таковым. Если АГЕНТ обычно участник действия или процесса, то СУБ – первый актант какой-то ситуации-состояния.

ПРИЗН, ОЦЕНКА, ПАРАМ

ПРИЗН – наиболее общее из этих отношений. ОЦЕНКА обычно связывается с некоторым субъективным признаком, меняющимся в зависимости от времени, места и человека. ОЦЕНКА часто бинарна (плохо – хорошо, красиво – уродливо и т.д.).

ПАРАМ обычно связан с числовым значением (отношение ЗНАЧ), т.е. формула ПАРАМ(А,B) предполагает, что где-то должно быть сказано ЗНАЧ(С,А). Например, для предложения Высота дома – восемь метров, строятся две формулы ПАРАМ(высота, дом), ЗНАЧ(восемь метров, высота). Подробнее о ПАРАМ смотри Семенова.

ЦЕЛЬ, НАЗН

Актант, заполняющий валентность НАЗН, обозначает то, зачем был создан этот объект. Хозяин валентности НАЗН обычно не является семантически одушевленным, а валентность ЦЕЛЬ, напротив, возникает у АГЕНТа, т.е. у семантически одушевленного субъекта.

ОБ, СОДЕРЖ.

Несмотря на кажущуюся разницу между ОБ и СОДЕРЖ, они часто взаимозаменяемы. Однако СОДЕРЖ – это обычно целая ситуация. Например, вторая валентность слова сказать скорее СОДЕРЖ, чем ОБ (сказать, что думаешь; сказать, как выйти наружу и т.д.). Напротив, вторая валентность глагола беречь скорее ОБ. Хотя возможны фразы:

говорить о Президенте (ЭТК.ОБ)

беречь любовь (ЭТК.СИТ), то есть прямо противоположные примеры.

Множественные актанты (МНА)

Множественный актант возникает там, где одна валентность предиката заполняется многими актантами. Синтаксический однородный ряд всегда переходит во множественный актант. Например:
Петя и Маша => МНА и (Петя, Маша ).

В этом случае мы будем называть слова Петя,Маша элементами МНА, а союз и - оператором МНА или оператором однородности.

Множественные актанты – это явление скорее текстовое, чем словарное. Однако, на самом деле, МНА включено в валентные структуры некоторых слов, например, слов связать, соединять .
Это необходимо для осуществления следующих синонимических преобразований:

Петя связан с Машей

Петя и Маша связаны.

Понятие множественного актанта - это обобщение понятия симметричного предиката, описанного в работе Иомдин. В этой работе симметричным предикатом называется такой предикат P, что P(X,Y) ó P(Y,X), где X и Y валентности P, например, X борется с Y ó Y борется с Х. В нашей интерпретации все симметричные предикаты имеют только одну валентность на множественный актант, а не две симметричные валентности. С помощью такой валентной структуры легко объясняются примеры с симметричными предикатами, в которых число участников либо неизвестно, либо больше двух:

Компьютеры связаны между собой.

Петя, Вася и Саша – друзья.

Таким образом, множественный актант – это множество актантов, заполняющих одну валентность предиката и упорядоченных между собой оператором однородности.