Аннотация.
Статья посвящена вопросам комплексного изучения аппаратного и программного обеспечения гибридных вычислительных систем на базе современных процессоров IBM семейства POWER и графических сопроцессоров NVIDIA Tesla. Исследована производительность подсистемы памяти и центральных процессоров при проведении параллельных вычислений с применением различных технологий параллельного программирования. Изучена эффективность функционирования математических библиотек, в том числе предусматривающих выгрузку вычислений на сопроцессоры. По результатам проведенной работы даны базовые рекомендации по использованию оборудования подобного класса для решения различных научных задач.
Ключевые слова:
гибридная вычислительная система, архитектура компьютера, IBM POWER8, IBM POWER9, Intel Xeon Platinum 8160, математическая библиотека, одновременная многопоточность, производительность, тест
Стр. 27-40.
DOI 10.14357/20718632210303 Литература
1. Brodtkorb A.R., Dyken C., Hagen T.R., Hjelmervik J.M., Storaasli, O.O. State-of-the-art in Heterogeneous Computing // Scientific Programming. 2010. V. 18. No. 1. P. 1–33. DOI: 10.1155/2010/540159. 2. Sinharoy B., Van Norstrand J.A., Eickemeyer R.J., Le H.Q., Leenstra J., Nguyen D.Q., Konigsburg B., Ward K., Brown M.D., Moreira J.E., Levitan D., Tung S., Hrusecky D., Bishop J.W., Gschwind M., Boersma M., Kroener M., Kaltenbach M., Karkhanis T., Fernsler K.M. IBM POWER8 processor core microarchitecture // IBM Journal of Research and Development. 2015. Vol. 59, No. 1. P. 2:1–2:21. DOI: 10.1147/JRD.2014.2376112. 3. Eggers S.J., Emer J.S., Levy H.M., Lo J.L., Stamm R.L., Tullsen D.M. Simultaneous multithreading: a platform for next-generation processors // IEEE Micro. 1997. Vol. 17, No. 5. P. 12–19. DOI: 10.1109/40.621209. 4. Starke W.J., Stuecheli J., Daly D.M., Dodson J.S., Auernhammer F., Sagmeister P.M., Guthrie G.L., Marino C.F., Siegel M., Blaner B. The cache and memory subsystems of the IBM POWER8 processor // IBM Journal of Research and Development. 2015. Vol. 59, No. 1. P. 3:1- 3:13. DOI: 10.1147/JRD.2014.2376131. 5. Foley D., Danskin J. Ultra-Performance Pascal GPU and NVLink Interconnect // IEEE Micro. 2017. Vol. 37. No. 2. P. 7–17. DOI: 10.1109/MM.2017.37. 6. Sadasivam S.K., Thompto B.W., Kalla R., Starke W.J. IBM Power9 Processor Architecture // IEEE Micro. 2017. Vol. 37. No. 2. P. 40–51. DOI: 10.1109/MM.2017.40. 7. Starke W.J., Dodson J.S., Stuecheli J., Retter E., Michael B.W., Powell S.J., Marcella J.A. IBM POWER9 memory architectures for optimized systems // IBM Journal of Research and Development. 2018. Vol. 62. No. 4/5. P 3:1– 3:13. DOI: 10.1147/JRD.2018.2846159. 8. Choquette J., Giroux O., Foley D. Volta: Performance and Programmability // IEEE Micro. 2018. Vol. 38. No. 2. P. 42–52. DOI: 10.1109/MM.2018.022071134. 9. Mulnix D. Intel Xeon Processor Scalable Family Technical Overview // [Электронный ресурс] – Режим доступа https://software.intel.com/ru-ru/articles/intelxeon- processor-scalable-family-technical-overview (дата обращения 08.04.2020). 10. Mal’kovskii S. I., Sorokin A. A., Korolev S. P., Zatsarinnyi A. A., Tsoi G. I. Performance Evaluation of a Hybrid Computer Cluster Built on IBM POWER8 Microprocessors // Programming and Computer Software. 2019. Vol. 45. No. 6, P. 324-332. DOI: 10.1134/S0361768819060057. 11. Мальковский С.И., Пересветов В.В. Оценка производительности вычислительного кластера на четырехъядерных процессорах // Материалы межрегиональной научно-практической конференции «Информационные и коммуникационные технологии в образовании и научной деятельности» 21-23 сентября 2009 года, г. Хабаровск. 2009. С. 261–268. 12. McCalpin J.D. Memory Bandwidth and Machine Balance in Current High Performance Computers // IEEE Technical Committee on Computer Architecture Newsletter. 1995. P. 19-25. 13. Bailey, D.; Barszcz, E.; Barton, J.; Browning, D.; Carter, R.; Dagum, L.; Fatoohi, R.; Fineberg, S.; Frederickson, P.; Lasinski, T.; Schreiber, R.; Simon, H.; Venkatakrishnan, V.; Weeratunga, S. The NAS Parallel Benchmarks. RNR Technical Report RNR 94-007 // [Электронный ресурс] – Режим доступа https://www.davidhbailey.com/dhbpapers/npb.pdf (дата обращения 07.05.2020). 14. Steinbach P., Werner M. gearshifft – The FFT Benchmark Suite for Heterogeneous Platforms. In: Kunkel J., Yokota R., Balaji P., Keyes D. (eds) High Performance Computing. ISC 2017. Lecture Notes in Computer Science. 2017. Vol 10266. Springer, Cham. P. 199–216. DOI: 10.1007/978-3-319-58667-0_11. 15. DGEMM // Электронный ресурс – Режим доступа https://web.archive.org/web/20180408033423/http://www. nersc.gov/research-and-development/apex/apexbenchmarks/ dgemm/ (Дата обращения 08.04.2018). 16. Никитин О.Ю., Лукьянова О.А. Анализ ускорения глубокого обучения на основе вычислительной системы IBM POWER8 // Материалы V международной научно- практической конференции «Информационные технологии и высокопроизводительные вычисления» 16–19 сентября 2019 года, г. Хабаровск. 2019. С. 199–203. 17. Карцев А.И., Мальковский С.И., Волович К.И., Сорокин А.А. Исследование производительности и масштабируемости пакета Quantum ESPRESSO при изучении низкоразмерных систем на гибридных вычислительных системах // Материалы I международной конференции «Математическое моделирование в материаловедении электронных компонентов» 21–23 октября 2019 года, г. Москва. 2019. С. 18–20. 18. Волков К.Н., Добров Ю.В., Карпенко А.Г., Мальковский С.И., Сорокин А.А. Моделирование газовой динамики гиперзвуковых летательных аппаратов с использованием модели высокотемпературного воздуха и графических процессоров // Вычислительные методы и программирование. 2021. Т. 22. С. 29–46. DOI: 10.26089/NumMet.v22r103. 19. Sorokin A.A., Makogonov S.V., Korolev S.P. The Information Infrastructure for Collective Scientific Work in the Far East of Russia // Scientific and Technical Information Processing. 2017. Vol. 4. P. 302–304. DOI: 10.3103/S0147688217040153. 20. Положение о ЦКП «Информатика» // [Электронный ресурс] – Режим доступа http://www.frccsc.ru/ckp (дата обращения 22.01.2020).
|