Полная парадигма. Морфология. Орфоэпия. Частотность. Словарь содержит 208 035 лемм (5 695 022 словоформ), является развитием словаря "Полная парадигма. Морфология" 2014 года. Исправлены замеченные ошибки (в том числе и те, о которых сообщили читатели), добавлены слова - последние 26 000 лемм из текстов художественной литературы. Словарь составлен на основе известного файла "Полная акцентуированная парадигма по Зализняку" (2 645 347 словоформ) и существенно расширен за счет таких словарей в электронном виде, как "Лопатин В. В. Полный орфографический словарь русского языка", "Словарь иностранных слов, Москва: Русский язык, 1988", "Новый толково-словообразовательный словарь русского языка. Автор Т. Ф. Ефремова. 2000 г.", "Толковый словарь под ред. C. И. Ожегова и Н. Ю. Шведовой, М., Азъ, 1992 г." (все эти файлы доступны на http://www.speakrus.ru/dict2/index.htm) и некоторых онлайн-словарей (особенно "Викисловарь") и энциклопедий. Кроме того, полностью обработан файл "Советский энциклопедический словарь" на наличие отсутствующих в словаре слов (кроме собственных). Для лемм, отсутствующих в доступных словарях, использованы данные из Национального корпуса русского языка и очевидные соображения. Отличия от файла августа 2021 года: увеличен объем, уточнены морфологические характеристики некоторых словоформ, исправлены некоторые ошибки. Структура словаря: словарные статьи отделены друг от друга пустой строкой; каждая статья начинается леммой, за ней следуют строки относящихся к ней словоформ. Каждая строка состоит из четырёх полей, разделенных тройкой символов " | ": собственно слово, его морфологические характеристики, ударение и особенности произношения, в последнем поле - некий уникальный цифровой код, однозначно идентифицирующий словоформу. Неупотребляемые словоформы отмечены звёздочкой (отмечены не все) - особенно это относится к прилагательным, образованным от причастий и совпадающих с ними. Пробелы в начале строки обозначают грамматическую подчиненность словоформы словоформе, находящейся выше в строке без пробелов. Для лемм перед полем "Код" добавлены ещё три поля характеристик: частотность (на миллион словоупотреблений по данным НКРЯ), признак собственного и семантическая характеристика (для собственных). Морфологическая характеристика приводится для каждой словоформы, состоит из цепочки прозрачных по смыслу сокращений, разделённых пробелами. Некоторые пояснения по морфологическим характеристикам: - для предлогов указан падеж, который имеет управляемое слово; - для существительных приводится признак одушевлённости/неодушевлённости, а если он не указан, то словоформа имеет этот признак, зависящий от его лексического значения; - сокращение "общ" указывает на общий род (мужской и женский); - сокращения "парт", "счет", "мест", "зват" указывают на партитивный, счетный, местный и звательный падежи соответственно; - для несклоняемых существительных падеж не приводится (отсутствие падежа и есть признак несклоняемости); - для наречий после их морфологических характеристик приводятся сокращения лексико-грамматических групп, к которым они относятся. Словоформы в полном составе даются не для всех лемм: например, для леммы "пистоль 13971" (женский род) не указаны словоформы множественного числа, так как они полностью совпадают со словоформами множественного числа леммы "пистоль 136494" (мужской род) и не отличаются от них семантически. В некоторых случаях приведены, казалось бы, совершенно одинаковые леммы с идентичными наборами словоформ - "сливка 158366" и "сливка 4154700", но это существенно разные слова, как по словообразованию, так и морфемному составу: первая - "уменьшительное от "слива"", вторая - "процесс действия по значению глагола "сливать"". В других случаях - "выкрашивать 178604" - приведена только одна лемма с одним набором словоформ, хотя леммы с толкованиями "покрывать, пропитывать краской; окрашивать" и "раскрошив, доставать, извлекать из середины" имеют разные корни (такая неоднозначность разрешается в другой части словаря). Для 3-его поля "Произношение и ударение" важные особенности произношения приведены в файле "Произношение. Ударение", являющимся частью предисловия к "Словарю русского языка" С. И. Ожегова. Произношение приведено для всех слов словаря, ударение для почти всех (для тех, что найдены в файлах-словарях). Для ударений принято обозначение " ' " для основного и вариативного, " ` " для побочного (второстепенного). Данные по произношению и ударению не полны. Для части словаря есть расширения, здесь не приведённые (для этого и введены уникальные коды словоформ - для состыковки частей словаря): морфемный состав; толкование лемм. Данные не свободны от ошибок и распространяются "как есть" на данный момент, однако постоянно дополняются и исправляются. Автор с благодарностью примет все замечания, уточнения и дополнения по адресу hagen_m@mail.ru Февраль 2022