|
Р.К. Классен "Особенности эффективной обработки SQL - запросов к базам данных консервативного типа" |
|
Аннотация. Рассматриваются вопросы обработки SQL-запросов с высоким удельным весом операций join к базам данных консервативного типа (с эпизодическим обновлением данных в специально выделяемое время) повышенных объемов на платформе GPU-кластера. Модифицируется архитектура ранее разработанной параллельной СУБД Clusterix-N (N – от New). Предлагаются методы организации динамической сегментации про- межуточных/временных отношений на выделенном узле с GPU-ускорителями и полной загрузки процессорных ядер узлов уровней JOIN и IO. Проводится сравнение производительности этой СУБД с оригинальной СУБД PerformSys на ограниченном тесте TPC-H (без операций записи) с VБД=60 GB и VБД=120 GB. Ключевые слова: базы данных консервативного типа, повышенные объемы данных, модификация архитектуры параллельной СУБД, динамическая сегментация промежуточных/временных отношений, применение графических ускорителей, полная загрузка процессорных ядер, сравнительные оценки производительности. Стр. 108-118. DOI 10.14357/207186321804011 Полная версия статьи в формате pdf. Литература 1. Matt Turck Firing on All Cylinders: The 2017 Big Data Landscape [Web page] // URL: http://mattturck.com/bigdata2017/ 2. Paradigm4: Creators of SciDB a computational DBMS URL: https://www.paradigm4.com/ 3. In-Memory Database | VoltDB URL: https://www.voltdb.com/ 4. Postgres-XL | Open Source Scalable SQL Database Cluster URL: https://www.postgres-xl.org/ 5. Абрамов, Е.В. Параллельная СУБД Clusterix. Разработка прототипа и его натурное исследование /Е.В. Абрамов //Вестник КГТУ им. А.Н. Туполева. – 2006. – №2. – С.50-55. 6. Райхлин, В.А. Информационные кластеры как диссипативные системы //В.А. Райхлин, Д.О. Шагеев //Нелинейный мир. – 2009. – Т.7, №5.– С.323-334. 7. В.А. Райхлин, Р.К. Классен Сравнительно недорогие гибридные технологии консервативных СУБД больших объемов // Информационные технологии и вычислительные системы. Москва. – 2018. – Т. 68. №1. – С. 46-59. 8. TPC BenchmarkTM H Standard Specification Revision 2.17.1, URL: http://www.tpc.org/tpc_documents_current_versions/pdf/t pc-h_v2.17.1.pdf 9. Реализация хеширования на GPU. URL: https://github.com/rozh1/gpuhash 10. Martin, J. Computer database organization. Second Edition — Prentice-Hall, Inc., Eng-lewood Cliffs, New Jersey 07632, 1977. 11. Классен Р.К. Программа региональной балансировки нагрузки к базе данных консервативного типа на кластерной платформе «PerformSys». Свидетельство о государственной регистрации программы для ЭВМ №2017611785 от 09.02.2017. 12. Классен Р.К. Повышение эффективности параллельной СУБД консервативного типа на кластерной платформе с многоядерными узлами // Вестник КГТУ им. А.Н.Туполева, № 1, 2015. С. 112-118. 13. Vadim A. Raikhlin, Roman K. Klassen Can GPUaccelerator significantly increase the effectiveness of conservative DBMS considerable volumes on cluster platforms? //2017 International Siberian Conference on Control and Communications (SIBCON). 2017. P. 1-5. DOI: 10.1109/SIBCON.2017.7998474 14. В.А. Райхлин, Р.Ш. Минязев Анализ процессов в кластерах консервативных баз данных с позиций самоорганизации // Вестник КГТУ им. А.Н.Туполева, № 2, 2015. С. 120-126. 15. PerformSys. URL: https://github.com/rozh1/PerformSys 16. Clusterix-N. URL: https://bitbucket.org/rozh/clusterixn
|