Аннотация.
Разработан метод анализа литературных авторских текстов на основе выбора наиболее частотных, характерных для определенного авторского стиля служебных частей речи, и вычисления их весовых коэффициентов (базируется на вычислении наиболее часто используемых в литературных произведениях предлогов, союзов и частиц). Сам процесс вычисления весовых коэффициентов, определяемых отношениями величин служебных частей речи в тексте к общему объему слов, подробно проанализирован. Приводятся экспериментальные результаты по установлению авторства литературных текстов для двух авторов. Результаты получены путем сопоставлений числовых значений однотипных весовых коэффициентов, выраженных в процентах. Полученные теоретические и практические результаты могут быть использованы для анализа, выявления лингвистических особенностей, отличий не только художественных текстов, но, в дальнейшем, текстов любого жанра и стиля.
Ключевые слова:
весовой коэффициент, служебные слова, авторство, текст, показатель идентичности, повторяемость.
DOI 10.14357/20718632240207
EDN WGWOTS
Стр. 74-85. Литература
1. Михеев М.Ю., Эрлих Л.И. Идиостилевой профиль и определение авторства текста по частотам служебных слов // Научно-техническая информация. Серия 2: Информационные процессы и системы. 2018. №2. С. 25-34 2. Михеев М.Ю., Эрлих Л.И. Текстовые скрепы и их частоты как различительный признак авторских идиостилей Электронный ресурс. Дата обращения 15.03.2024. https://ruslang.ru/sites/default/files/doc/grigoriev2022/Mish.pdf 3. Орлова, М. В. Михеев М.Ю., Эрлих Л.И. Об отличиях русского научного идиостиля от художественного по частотам употребления текстовых скреп / Вопросы литературы. 2022. № 1. с.118-140. 4. Кукушкина О.В., Поликарпов А.А. Частотные и распределительные характеристики русских предлогов и синтаксем, с ними связанных (по «Ядерному компью-терному корпусу текстов русских газет конца ХХ-ого века») // Язык, сознание, коммуникация. Выпуск 47. М.: МАКС Пресс. том 47. 2013. с. 341-362 5. Всеволодова М.В., Кукушкина О.В., Поликарпов А.А. Русские предлоги и средства предложного типа. Материалы к функционально-грамматическому описанию реального употребления. Книга 1. Введение в объективную грамматику и лексикографию русских предложных единиц. М.: URSS, 2013. 304 с. 6. Большакова Е.И., Воронцов К.В., Ефремова Н.Э., Клышинский Э.С., Лукашевич Н.В., Сапин А.С. Автоматическая обработка текстов на естественном языке и анализ данных. М.: НИУ ВШЭ. 2017. 269 с. 7. Смирнов И.В., Шелманов А.О. Семантико-синтаксический анализ естественных языков // Искусственный интеллект и принятие решений. 2013. № 1. С. 41-54. 8. Морозов Н.А. Лингвистические спектры: Средство для отличения плагиатов от истинных произведений того или другого известного автора: Стилеметрический этюд // Известия Отдела русского языка и словесности Императорской Академиинаук. 1915. Т. 20, кн. 4. С. 93-127. 9. Марков А.А. Об одном применении статистического метода // Изв.Имп.акад.наук. Серия 6. 1916. N4. с. 239-242. 10. Атрибуция текста: теория и практика (festivalnauki.ru). Электронный ресурс. Дата обращения 12.02.2024. 11. Smith Peter, Aldrigde W. (2011): Improving Authorship Attribution: Optimizing Burrows’s Delta Method // Journal of Quantitative Linguistics 18. Рр. 63–88. 12. Рыжкович А.Ч. К вопросу о треминологическом статусе предлога // Universum: Филология и искусствоведение: электронный научный журнал. 2018. № 9(55). URL: http://7universum.com/ru/ philology/archive/item/6385 13. Shalymov D, Granichin O, Klebanov L, Volkovich Z. Literary writing style recognition via a minimal spanning treebased approach // Expert Systems with Applications 61, 145-153, 2016 DOI: 10.1016/j.eswa.2016.05.032 14. Суетин В. Ю. Применение частотных характеристик для определения авторства литературных текстов // Вестник ТвГУ. Серия: Прикладная математика. 2022, выпуск 2. с. 84–89 DOI: 10.26456/vtpmk637 15. Воронина, М. Ю. Орлов Ю. Н. Определение автора текста методом сегментации. Федеральный исследовательский центр «Институт прикладной математики им. М. В. Келдыша Российской академии наук», 2022. DOI: https://doi.org/10.20537/2076-7633-2022-14-5-1199-1210 16. Кислицын А.А., Кислицына М.Ю. Распознавание выборочных распределений среди системы эталонов: метод ближайшего соседа // Препринты ИПМ им. М.В.Келдыша. 2023. № 29. 21с. https://doi.org/10.20948/prepr- 2023-29 https://library.keldysh.ru/preprint.asp?id=2023-2 17. Горожанов А. И. Создание лингвистического корпуса на основе инструментов обработки естественного языка: планирование программных решений // Филологические науки. Вопросы теории и практики. 2023. Том 16. Выпуск 5. С. 1616-1620. 18. Гаспаров М.Л. Лингвистика стиха // Известия PAH. Сер. лит. и языка. – М., 1994. Т. 53. № 6. с. 28-35. 19. Федянин Д. Н., Русяева Е. Ю., Ахобадзе Г. Н. Лингвистический анализатор текста: Свидетельство о государственной регистрации программы для ЭВМ № 2023668307 РФ; Зарег. 25.08.2023. 20. Литрес. Электронный ресурс: https://www.litres.ru/book/maks-alekseevichglebov/ chernyy-staratel-67077536/ Дата обращения 10.01.2024.
|