стажер-исследователь Лаборатории языковой конвергенции, Нацио-нальный исследовательский университет «Высшая школа экономики», Россия, Санкт-Петербург, p.maksimenko@hse.ru
Статья посвящена дообучению и применению большой языковой модели типа BERT для решения задачи классификации литературных текстов по жанрам. В качестве источника материала для создания обучающей выборки используются фанфикшн-произведения, входящие в русскоязычную электронную базу фанфикшн, которая насчитывает более 160 тыс. текстов. Набор данных для обучения нейросетевого алгоритма содержит фанфикшн-тексты, каждый из которых имеет одну из восьми жанровых меток или более. В статье представлены результаты апробации и оценки эффективности трех версий жанрового классификатора (многометочная, многоклассовая и бинарная) как на исходных данных, так и на тестовой выборке художественной литературы. В ходе исследования также были сопоставлены показатели качества классификации для текстов разных жанров.
фанфикшн; жанровая классификация; массовая литература; BERT.
Скачать текст статьиДля цитирования: Максименко П.И. Жанровая классификация литературных текстов с применением нейросетевых методов (на материале русскоязычной электронной базы фанфикшн) // Человек: Образ и сущность. Гуманитарные аспекты. Москва. ИНИОН РАН, 2025. № 1 (61). С. 184-200. DOI: 10.31249/chel/2025.01.13