Аннотация.
На основе методов индуктивной логики рассматривается подход к выявлению импликативных взаимосвязей вида «Если A, то b» в больших данных в условиях их низкой достоверности и противоречивости. Для работы с данными используются логики с векторной семантикой в форме VTF-логик. Наличие или отсутствие явлений в таблицах их совместной встречаемости формализуется векторами истинности с компонентами v+ и v-, где v+ мера истинности утверждения о наличии явления, v- - мера его ложности. На основе статистической индукции вычисляется показатель обоснованности причинно-следственной связи как усредненное значение векторов истинности соответствующих нестрогих высказываний. Получившееся значение трактуется как нестрогая вероятность связи, которая выступает векторным показателем ее обоснованности. Обсуждается применимость подхода для обработки качественных и количественных данных, а также данных, содержащих артефакты.
Ключевые слова:
большие данные, интеллектуальный анализ данных, индуктивный вывод, нестрогая вероятность, логики с векторной семантикой.
DOI 10.14357/20718632240201
EDN HUCOJV
Стр. 3-14.
Литература
1. Формула Big Data: семь «V» + неординарная задача. URL: https://www.fsight.ru/blog/formula-big-data-sem-vneordinarnaja-zadacha-2/ 2. Лобанов А.А. Большие данные: проблемы обработки // Вестник МГТУ МИРЭА. 2014. № 3(4). С. 51-58. 3. Абрамова А.А. Анализ использования больших данных для принятия решений в промышленной сфере // Экономика и качество систем связи. 2023, № 3. С. 13-21. 4. Кельчевская Н.Р., Колясников М.С. Использование больших данных в стратегическом управлении знаниями компании, следующей трендам Индустрии 4.0 // Лидерство и менеджмент. 2020. Том 7. № 3. С. 405-426. doi: 10.18334/lim.7.3.110662. 5. Fosso Wamba S. et al. How ‘big data’ can make big impact: Findings from a systematic review and a longitudinal case study // International Journal of Production Economics.2015. Vol. 165. pp. 234-246. doi: 10.1016/j.ijpe.2014.12.031. 6. Орешков В.И. Интеллектуальный анализ данных как современный инструмент поддержки управленческих решений // Вестник Рязанского государственного агро-технологического университета имени П.А. Костычева. 2011. № 4 (12). С. 55-59. 7. Емельченков Е.П. Большие данные. Методы интеллектуального анализа // Системы компьютерной математики и их приложения. 2013. № 14. С. 75-79. 8. Есауленко А.С., Никоненко Н.Д. Большие данные. Реальность и перспективы // Управление инновациями: теория, методология, практика. 2016. № 17. С. 74-79. 9. Медведев Д.А. Большие данные: причины появления и как их можно использовать // Наука и образование сегодня. 2019. № 4(39). С. 14-16. 10. Кузора C.С., Натаров И.П. Цифровая трансформация и большие данные // Вестник Российского университета дружбы народов. Серия: Государственное и муниципальное управление. 2022. Т. 9. № 2. C. 150–161. doi: 10.22363/2312-8313-2022-9-2-150-161. 11. Магеррамов З.Т., Абдуллаев В.Г., Магеррамова А.З. Big Data: проблемы, методы анализа, алгоритмы // Радиоэлектроника и информатика, 2017. №3. С. 42-52. 12. Арустамов А. Критерии качества данных, 2023. URL: https://loginom.ru/blog/data-quality-criteria. 13. Дударев В.А. Подход к заполнению пропусков в обучающих выборках для компьютерного конструирования неорганических соединений // Вестник МИТХТ. 2014, Т.9, №1. С. 73-75. 14. Финн В.К. Об интеллектуальном анализе данных // Новости искусственного интеллекта, 2004, №3. С. 1-20. 15. Финн В. К. Об определении эмпирических закономерностей посредством ДСМ - метода автоматического порождения гипотез // Искусственный интеллект и принятие решений, 2010. №4. С. 41-48. 16. Виноградов Д.В. Анализ результатов применения ВКФ-системы: успехи и открытая проблема // Научно-техническая информация. Серия 2: Информационные процессы и системы, 2017. № 5. С. 1-4. 17. Панов А. И. Выявление причинно-следственных связей в данных психологического тестирования логическими методами // Искусственный интеллект и принятие решений, 2013. №1. С. 24–32. 18. ДСМ-метод автоматического порождения гипотез: Логические и эпистемологические основания / Сост. О.М. Аншаков, Е.Ф. Фабрикантова. М.: Книжный дом «ЛИБРИКОМ», 2009. – 432 с. 19. Dunn J.M. Algebra of Intensional Logics. Doctoral Dissertation University of Pittsburg, Ann Arbor, 1966. 20. Dunn J.M. Intuitive semantics for first-degree entailment and “coupled trees” // Philosophical Studies.Vol. 29, 1976. - pp.149-158. 21. Belnap N. A useful four-valued logic // J.M.Dunn and G.Epstein (eds.). Modern Uses of Multiple-Valued Logic. - Dordrecht: D. Reidel Publish. Co., 1977. pp. 8-37. 22. Belnap N. How a computer should think // G. Ryle (ed.). Contemporary Aspects of Philosophy. Stocksfield: Oriel Press Ltd., 1977. P. 30-55. 23. Аршинский Л.В. Методы обработки нестрогих высказываний. Иркутск: изд-во ВСИ МВД России, 1998. 40 с. 24. Ивлев Ю.В. Логика: Учебник 3-е изд. М.: ТК Велби, Изд-во Проспект, 2004. 288 с. 25. Голенков В.В. Статистические основы индуктивного вывода: учеб. пособие. Минск: БГУИР, 2009. 202 с. 26. Кайберг Г. Вероятность и индуктивная логика / Пер. с англ. – М.: Изд-во «Прогресс», 1978. 373 с. (Kyburg H.E. Probability and Inductive Logic. – L.: Macmillan, 1970. 272 p.). 27. Inductive Inference. URL: https://www.sciencedirect.com/topics/mathematics/inductive-inference 28. Аршинский Л.В., Лебедев В.С. Объективизация баз знаний интеллектуальных систем на основе индуктивного вывода с использованием нестрогих вероятностей // Информационные и математические технологии в науке и управлении. 2022. № 4(28). С. 190-200. doi:10.38028/ESI.2022.28.4.015. 29. Аршинский Л.В. Приложение логик с векторной семантикой к описанию случайных событий и оценке риска // Проблемы анализа риска. 2005. Т.2. № 3. С.231-248. 30. Нечеткая логика в моделях управления и искусственного интеллекта / под ред. Д.А. Поспелова. М.: Наука. Гл. ред. физ.-мат. лит., 1986. 312 с. 31. Gottwald S. Treatise on Many-Valued Logics. Leipzig, 2000. 604 p. 32. Аршинский Л.В. Оценка истинности взаимоисключающих гипотез средствами векторной логики // Информационные и математические технологии/ Труды Байкальской Всероссийской конференции «Информационные и математические технологии». Иркутск: ИСЭМ СО РАН, 2004. С. 188-194. 33. Pima Indians Diabetes – EDA & Prediction (0.906). URL: https://www.kaggle.com/code/vincentlugat/pima-indiansdiabetes- eda-prediction-0-906/input. 34. Уровень сахара в крови: норма, установленная ВОЗ для здоровых людей. URL: https://yandex.ru/health/turbo/articles?id=4419.
|