Периодическое рецензируемое научное издание ИНИОН РАН

Жанровая классификация литературных текстов с применением нейросетевых методов (на материале русскоязычной электронной базы фанфикшн) (Open access)

Максименко Полина Игоревна

стажер-исследователь Лаборатории языковой конвергенции, Нацио-нальный исследовательский университет «Высшая школа экономики», Россия, Санкт-Петербург, p.maksimenko@hse.ru

Аннотация

Статья посвящена дообучению и применению большой языковой модели типа BERT для решения задачи классификации литературных текстов по жанрам. В качестве источника материала для создания обучающей выборки используются фанфикшн-произведения, входящие в русскоязычную электронную базу фанфикшн, которая насчитывает более 160 тыс. текстов. Набор данных для обучения нейросетевого алгоритма содержит фанфикшн-тексты, каждый из которых имеет одну из восьми жанровых меток или более. В статье представлены результаты апробации и оценки эффективности трех версий жанрового классификатора (многометочная, многоклассовая и бинарная) как на исходных данных, так и на тестовой выборке художественной литературы. В ходе исследования также были сопоставлены показатели качества классификации для текстов разных жанров.

Ключевые слова

фанфикшн; жанровая классификация; массовая литература; BERT.

Скачать текст статьи

Для цитирования: Максименко П.И. Жанровая классификация литературных текстов с применением нейросетевых методов (на материале русскоязычной электронной базы фанфикшн) // Человек: Образ и сущность. Гуманитарные аспекты. Москва. ИНИОН РАН, 2025. № 1 (61). С. 184-200. DOI: 10.31249/chel/2025.01.13


Оформить заказ

Наличными

Безналичный платеж по реквизитам

Печатный

Электронный (PDF по e-mail)