ИНТЕЛЛЕКТУАЛЬНЫЕ СИСТЕМЫ И ТЕХНОЛОГИИ
ВЫЧИСЛИТЕЛЬНЫЕ СИСТЕМЫ
В.А. Райхлин, Р.К. Классен "Сравнительно недорогие гибридные технологии консервативных СУБД больших объемов"
РАСПОЗНАВАНИЕ ОБРАЗОВ
УПРАВЛЕНИЕ И ПРИНЯТИЕ РЕШЕНИЙ
В.А. Райхлин, Р.К. Классен "Сравнительно недорогие гибридные технологии консервативных СУБД больших объемов"

Аннотация.

Обсуждаются вопросы организации консервативных СУБД на сравнительно недорогих кластерных платформах с применением средств MySQL1 и GPU-акселераторов на исполнительном уровне. Актуальность принятой ориентации на работу с базами данных больших объемов определяется современными тенденциями интеллектуальной обработки больших информационных массивов. Повышение объема баз данных требует их хеширования по узлам кластера. Это обуславливает необходимость использования регулярного плана обработки запросов. Применение однородных кластерных технологий (СУБД Clusterix, оптимальная конфигурация «совмещенная симметрия») требует дополнительно динамической сегментации промежуточных и временных отношений. Для управления базами данных больших объемов предложены гибридные технологии (проекты Clusterix-N и Clusterix-G), что позволяет исключить динамическую сегментацию и значительно повысить эффективность по критерию производительность/стоимость. В них данные располагаются в оперативной памяти ОП узлов. Отличительной особенностью СУБД Clusterix-G с GPU-акселераторами является работа со сжатыми базами данных, что позволяет увеличить их объем при ограниченных объемах ОП. Предложенные технологии более эффективны в сравнении с Clusterix, а по производительности Clusterix-G должна в разы превышать Clusterix-N для интерконнекта среднего быстродействия.

Ключевые слова:

консервативные СУБД, большие данные, доступные кластерные платформы, регулярный план обработки, гибридные технологии, сжатие баз данных, применение графических ускорителей, сравнительные оценки эффективности и производительности.

Стр. 46-59

Литература

1. Szalay A.S. The Sloan Digital Sky Survey and beyond //SIGMOD Record. 2008. Vol.37, No.2. P. 61–66.
2. Shiers J. The Worldwide LHC Computing Grid (worldwide LCG) //Computer Physics Communications. 2007. Vol. 177 No. 1-2. P. 219–223.
3. Taniar D., Leung C., Rahayu J. W. High-performance parallel database processing and grid databases. – John Wiley & Sons Inc., Hoboken, 2008.
4. Raikhlin, V.A. Simulation of Distributed Database Machines //Programming and Computer Software. Vol. 22, Issue 2, 1996, P. 68-74.
5. Абрамов Е.В. Параллельная СУБД Clusterix. Разработка прототипа и его натурное исследование // Вестник КГТУ им. А.Н.Туполева. Казань. 2006. № 2. С.50-55.
6. Martin, J. Computer database organization. Second Edition – Prentice-Hall, Inc., Englewood Cliffs, New Jersey 07632, 1977. 713 p.
7. Райхлин В.А., Минязев Р.Ш. Мультикластеризация распределенных СУБД консервативного типа // Нелинейный мир. Т.9. 2011. № 8. С.473-481.
8. Классен Р.К. Повышение эффективности параллельной СУБД консервативного типа на кластерной платформе с многоядерными узлами // Вестник КГТУ им. А.Н.Туполева. Казань. 2015. № 1. С. 112-118.
9. CoGaDB – Column-oriented GPU-accelerated DBMS. URL:http://cogadb.cs.tudortmund.de/wordpress.
10. PGStrom 2016. URL:https://wiki.postgresql.org/index.php?title=PGStrom&oldid=25517.
11. Беседин Д. Первый взгляд на DDR3. Изучаем новое поколение памяти DDR SDRAM, теоретически и практически //ixbt.com. 2007. URL:
http://www.ixbt.com/mainboard/ddr3-rmma.shtml
12. Петров С.В. Шины PCI, PCI Express. Архитектура, дизайн, принципы функционирования. //СПб.: БХВ-Петербург, 2006. 416 с.
13. Rauhe H. Finding the Right Processor for the Job CoProcessors in a DBMS. Ilmenau University of Technology, Ilmenau, 2014. 113 p.
14. Wenbin F., Bingsheng H., Qiong L. Database Compression on Graphics Processors //Proc. VLDB Endow., Vol. 3, No. 1-2, Sep 2010. P.670-680.
15. Raikhlin V.A., Klassen R.K. Can GPU-accelerator significantly increase the effectiveness of conservative DBMS considerable volumes on cluster platforms? //2017 International Siberian Conference on Control and Communications (SIBCON). 2017. P. 1-5. DOI: 10.1109/SIBCON.2017.7998474
16. Blelloch G. Introduction to Data Compression. Pittsburgh: Carnegie Mellon University, 2013. P.25-26
17. Классен Р.К. Программа региональной балансировки нагрузки к базе данных консервативного типа на кластерной платформе «PerformSys». Свидетельство о государственной регистрации программы для ЭВМ №2017611785 от 09.02.2017.
18. Монтируемый в стойку сервер System x3950 X6 | Lenovo (RU). URL: https://www3.lenovo.com/ru/ru/datacenter/servers/mission-critical/System-x3950-6/p/WMD00000002

2018 / 02
2018 / 01
2017 / 04
2017 / 03

© ФИЦ ИУ РАН 2008-2018. Создание сайта "РосИнтернет технологии".