О.Н. Тушканова "Экспериментальное исследование численных мер оценки ассоциативных и причинных связей в больших данных"
В работе приводится краткое описание сущности методов ассоциативного и причинного анализа данных и проблем, затрудняющие его применение в больших данных. Описывается схема ускоренного поиска множества причинных связей. Приводится список численных мер, предложенных к настоящему времени для оценки “силы” ассоциативной связи пары атрибутов в статистике, социологии, машинном обучении и интеллектуальном анализе данных. Приводятся результаты анализа их формальных свойств, в терминах которых формулируются необходимые условия, которым должны удовлетворять меры связи причинного характера. Описываются результаты экспериментального исследования выделенных численных мер, которые позволяют сформировать упорядоченный список наиболее перспективных мер, пригодных для оценки силы причинной связи.

Ключевые слова:

ассоциативная мера, причинная мера, причинный анализ, большие данные.

Стр. 23-32.

"Experimental Study of the Numerical Measures for Mining Associative and Causal Relationship in Big Data"

Big data analysis is one of the topmost problems of information technologies. In this context, associative and causal analyses are considered as perspective approaches to efficient discovering of the relationships between big data attributes. However, traditionally used causal structure discovery models are of exponential complexity. Current trend in big data causal analysis is using various measures indicating the “strength” of associations between pairs of attributes. However, data scientists have no guidance, which of them are preferable in various applications. The paper surveys the numerical measures proposed to date and conducts theoretical and experimental comparative analyses of them in order to detect those of them that best fit the basic requirements to the big data processing. The conclusions regarding the most promising measures recommended to researchers and practitioners in big data causal analysis are drawn.


association measure, causal measure, causal analysis, big data.

