ОБРАБОТКА ИНФОРМАЦИИ И АНАЛИЗ ДАННЫХ
ИНТЕЛЛЕКТУАЛЬНЫЕ СИСТЕМЫ И ТЕХНОЛОГИИ
Г. Н. Ахобадзе, Е. Ю. Русяева "Некоторые особенности литературных текстов при их сопоставлении для определения их авторства"
МАТЕМАТИЧЕСКОЕ МОДЕЛИРОВАНИЕ
ПРОГРАММНАЯ ИНЖЕНЕРИЯ
Г. Н. Ахобадзе, Е. Ю. Русяева "Некоторые особенности литературных текстов при их сопоставлении для определения их авторства"
Аннотация. 

Разработан метод анализа литературных авторских текстов на основе выбора наиболее частотных, характерных для определенного авторского стиля служебных частей речи, и вычисления их весовых коэффициентов (базируется на вычислении наиболее часто используемых в литературных произведениях предлогов, союзов и частиц). Сам процесс вычисления весовых коэффициентов, определяемых отношениями величин служебных частей речи в тексте к общему объему слов, подробно проанализирован. Приводятся экспериментальные результаты по установлению авторства литературных текстов для двух авторов. Результаты получены путем сопоставлений числовых значений однотипных весовых коэффициентов, выраженных в процентах. Полученные теоретические и практические результаты могут быть использованы для анализа, выявления лингвистических особенностей, отличий не только художественных текстов, но, в дальнейшем, текстов любого жанра и стиля.

Ключевые слова: 

весовой коэффициент, служебные слова, авторство, текст, показатель идентичности, повторяемость.

DOI 10.14357/20718632240207 

EDN WGWOTS

Стр. 74-85.
 
Литература

1. Михеев М.Ю., Эрлих Л.И. Идиостилевой профиль и определение авторства текста по частотам служебных слов // Научно-техническая информация. Серия 2: Информационные процессы и системы. 2018. №2. С. 25-34
2. Михеев М.Ю., Эрлих Л.И. Текстовые скрепы и их частоты как различительный признак авторских идиостилей Электронный ресурс. Дата обращения 15.03.2024.
https://ruslang.ru/sites/default/files/doc/grigoriev2022/Mish.pdf
3. Орлова, М. В. Михеев М.Ю., Эрлих Л.И. Об отличиях русского научного идиостиля от художественного по частотам употребления текстовых скреп / Вопросы литературы. 2022. № 1. с.118-140.
4. Кукушкина О.В., Поликарпов А.А. Частотные и распределительные характеристики русских предлогов и синтаксем, с ними связанных (по «Ядерному компью-терному корпусу текстов русских газет конца ХХ-ого века») // Язык, сознание, коммуникация. Выпуск 47. М.: МАКС Пресс. том 47. 2013. с. 341-362
5. Всеволодова М.В., Кукушкина О.В., Поликарпов А.А. Русские предлоги и средства предложного типа. Материалы к функционально-грамматическому описанию реального употребления. Книга 1. Введение в объективную грамматику и лексикографию русских предложных единиц. М.: URSS, 2013. 304 с.
6. Большакова Е.И., Воронцов К.В., Ефремова Н.Э., Клышинский Э.С., Лукашевич Н.В., Сапин А.С. Автоматическая обработка текстов на естественном языке и анализ данных. М.: НИУ ВШЭ. 2017. 269 с.
7. Смирнов И.В., Шелманов А.О. Семантико-синтаксический анализ естественных языков // Искусственный интеллект и принятие решений. 2013. № 1. С. 41-54.
8. Морозов Н.А. Лингвистические спектры: Средство для отличения плагиатов от истинных произведений того или другого известного автора: Стилеметрический этюд // Известия Отдела русского языка и словесности Императорской Академиинаук. 1915. Т. 20, кн. 4. С. 93-127.
9. Марков А.А. Об одном применении статистического метода // Изв.Имп.акад.наук. Серия 6. 1916. N4. с. 239-242.
10. Атрибуция текста: теория и практика (festivalnauki.ru). Электронный ресурс. Дата обращения 12.02.2024.
11. Smith Peter, Aldrigde W. (2011): Improving Authorship Attribution: Optimizing Burrows’s Delta Method // Journal of Quantitative Linguistics 18. Рр. 63–88.
12. Рыжкович А.Ч. К вопросу о треминологическом статусе предлога // Universum: Филология и искусствоведение: электронный научный журнал. 2018. № 9(55). URL:
http://7universum.com/ru/ philology/archive/item/6385
13. Shalymov D, Granichin O, Klebanov L, Volkovich Z. Literary writing style recognition via a minimal spanning treebased approach // Expert Systems with Applications 61, 145-153, 2016 DOI: 10.1016/j.eswa.2016.05.032
14. Суетин В. Ю. Применение частотных характеристик для определения авторства литературных текстов // Вестник ТвГУ. Серия: Прикладная математика. 2022, выпуск 2. с. 84–89 DOI: 10.26456/vtpmk637
15. Воронина, М. Ю. Орлов Ю. Н. Определение автора текста методом сегментации. Федеральный исследовательский центр «Институт прикладной математики им. М. В. Келдыша Российской академии наук», 2022.
DOI: https://doi.org/10.20537/2076-7633-2022-14-5-1199-1210
16. Кислицын А.А., Кислицына М.Ю. Распознавание выборочных распределений среди системы эталонов: метод ближайшего соседа // Препринты ИПМ им. М.В.Келдыша. 2023. № 29. 21с. https://doi.org/10.20948/prepr-
2023-29 https://library.keldysh.ru/preprint.asp?id=2023-2
17. Горожанов А. И. Создание лингвистического корпуса на основе инструментов обработки естественного языка: планирование программных решений // Филологические науки. Вопросы теории и практики. 2023. Том 16. Выпуск 5. С. 1616-1620.
18. Гаспаров М.Л. Лингвистика стиха // Известия PAH. Сер. лит. и языка. – М., 1994. Т. 53. № 6. с. 28-35.
19. Федянин Д. Н., Русяева Е. Ю., Ахобадзе Г. Н. Лингвистический анализатор текста: Свидетельство о государственной регистрации программы для ЭВМ № 2023668307 РФ; Зарег. 25.08.2023.
20. Литрес. Электронный ресурс:
https://www.litres.ru/book/maks-alekseevichglebov/
chernyy-staratel-67077536/ Дата обращения 10.01.2024.
 

2024 / 03
2024 / 02
2024 / 01
2023 / 04

© ФИЦ ИУ РАН 2008-2018. Создание сайта "РосИнтернет технологии".