|
П.Б. Богданов, О.Ю. Сударева "Производительность процессоров КОМДИВ на ряде типовых расчётных задач" |
|
Аннотация. Рассматриваются отечественные специализированные микропроцессоры семейства КОМДИВ, разработанные в ФГУ ФНЦ НИИСИ РАН: КОМДИВ128-РИО и КОМДИВ128-М. Для трёх алгоритмов: быстрого преобразования Фурье, геометрического многосеточного метода и умножения разреженной матрицы на вектор, – приводятся сравнительные результаты замеров производительности на этих процессорах с продуктами компаний Intel, Texas Instruments и МЦСТ. Делаются выводы о возможности применения процессоров КОМДИВ в вычислениях общего назначения. Ключевые слова: КОМДИВ, Эльбрус, обработка сигналов, БПФ, NAS Parallel Benchmarks, MG, SpMV. Стр. 104-111. Полная версия статьи в формате pdf. Литература1. Райко Г.О., Павловский Ю.А., Мельканович В.С. Технология программирования многопроцессорной обработки гидроакустических сигналов на вычислительных устройствах семейства «КОМДИВ» // Гидроакустика. Вып. 20 (2). — СПб.: ОАО «Концерн "Океанприбор"», 2014. — 118 с.2. Павлов А.Н. Обзор коммуникационной среды RapidIO. Формальная модель RapidIO. Программная поддержка RapidIO // Моделирование и визуализация. Многопроцессорные системы. Инструментальные средства разработки ПО / Сборник статей под редакцией академика РАН В. Б. Бетелина. — М.: НИИСИ РАН, 2009. — c.105–147. 3. Сударева О.Ю. Эффективная реализация алгоритмов быстрого преобразования Фурье и свёртки на микропроцессоре КОМДИВ128-РИО. — Москва: НИИСИ РАН, 2014. — 266 с. 4. D. Bailey, E. Barszcz, J. Barton, D. Browning, R. Carter, L. Dagum, R. Fatoohi, S. Fineberg, P. Fred-erickson, T. Lasinski, R. Schreiber, H. Simon,V.Venkatakrishnan and S.Weeratunga. The NAS Parallel Benchmarks // RNR Technical Report RNR-94-007, March 1994. 5. Сударева О.Ю. Реализация алгоритма MG из пакета NPB для многопроцессорного вычислительного комплекса на базе микропроцессора КОМДИВ128-РИО // Труды НИИСИ РАН, 2015. Т. 5, № 1, с. 75–78. 6. Богданов П.Б., Сударева О.Ю. Применение отечественных специализированных процессоров семейства КОМДИВ в научных расчётах // Информационные Технологии и Вычислительные Системы, 2016. Т. 3, с. 45–65. 7. Frigo M., Johnson S. G. The design and implementation of FFTW3 // Proceedings of the IEEE, 2005. V. 93, № 2, pp. 216–231. 8. Kumar Mukesh. White Paper — Comparing TI’s TMS320C6671 DSP with ADI’s ADSP-TS201S TigerSHARC ® Processor // SPRABN8A — January 2012. 9. Li Xiaohui, Blinka Ellen. Very large FFT for TMS320C6678 processors // Texas Instruments — 2015. 10. АО «МЦСТ». Микропроцессор Эльбрус-4С // 11. URL: http://www.mcst.ru/mikroprocessor-elbrus4s 12. Тютляева Е.О., Конюхов С.С., Московский А.А., Одинцов И.О. Оценка потенциала использования платформы Эльбрус для высокопроизводительных вычислений // Суперкомпьютерные дни в России: труды международной конференции, 2016. C. 373–385. 13. Богданов П.Б., Сударева О.Ю. Гетерогенное программирование в рамках стандарта OpenCL // Супервычисления и математическое моделирование: труды XV Международной конференции, 13-17 октября 2014 г. / под ред. Р.М. Шагалиева. – Саров: ФГУП «РФЯЦ ВНИИЭФ», 2015. С. 123–137. 14. DDR3 SDRAM // URL: https://en.wikipedia.org/wiki/DDR3_SDRAM
|