ИНТЕЛЛЕКТУАЛЬНЫЕ СИСТЕМЫ И ТЕХНОЛОГИИ
ВЫЧИСЛИТЕЛЬНЫЕ СИСТЕМЫ И СЕТИ
А. Е. Маслов, А. А. Зорин "Анализ производительности векторизованных алгоритмов"
МАТЕМАТИЧЕСКОЕ МОДЕЛИРОВАНИЕ
А. Е. Маслов, А. А. Зорин "Анализ производительности векторизованных алгоритмов"
Аннотация. 

Работа посвящена оценке эффективности применения векторизации для алгоритмов, встречающихся в различных задачах, с целью повышения производительности. Определены рациональные случаи для применения SIMD-расширения. Определены возможности достижения заявленного теоретического предела повышения производительности. Произведено сравнение применений SSE и AVX расширений для различных типов данных (double, float, комплексные float и double).

Ключевые слова: 

векторизация; SIMD; SSE; AVX; скалярное произведение; свертка; корреляция.

Стр. 50-61.

DOI 10.14357/20718632220405
 
Литература

1. J. M. Cebrián, M. Jahre and L. Natvig, "Optimized hardware for suboptimal software: The case for SIMD-aware benchmarks," 2014 IEEE International Symposium on Performance Analysis of Systems and Software (ISPASS), 2014, pp. 66-75, doi: 10.1109/ISPASS.2014.6844462.
2. Jakobs, T., Naumann, B. & Rünger, G. Performance and energy consumption of the SIMD Gram–Schmidt process for vector orthogonalization. J Supercomput 76, 1999–2021 (2020). https://doi.org/10.1007/s11227-019-02839-0
3. Cui, C., Zhang, X., Jin, Z. (2019). Performance Analysis of Existing SIMD Architectures. In: Xu, W., Xiao, L., Li, J., Zhu, Z. (eds) Computer Engineering and Technology.NCCET 2019. Communications in Computer and Information Science, vol 1146. Springer, Singapore.
https://doi.org/10.1007/978-981-15-1850-8_4
4. L. Zhang, X. Yang and W. Yu, "Acceleration study for the FDTD method using SSE and AVX instructions," 2012 2nd International Conference on Consumer Electronics, Communications and Networks (CECNet), 2012, pp. 2342-2344, doi: 10.1109/CECNet.2012.6201608. 
5. J. M. Cebrián, L. Natvig and J. C. Meyer, "Improving Energy Efficiency through Parallelization and Vectorization on Intel Core i5 and i7 Processors," 2012 SC Companion: High Performance Computing, Networking Storage and Analysis, 2012, pp. 675-684, doi: 10.1109/SC.Companion.2012.93.
6. Intel Intrinsics Guide [Электронный ресурс]. URL:
https://www.intel.com/content/www/us/en/docs/intrinsicsguide/index.html# (дата обращения 05.07.2022).
7. Shahbahrami A, Juurlink B, Vassiliadis S (2005) Efficient vectorization of the FIR filter. In: Proc b16th annual workshop on circuits, systems and signal processing (ProRISC2005), November, pp 432–437.
8. Šverko, Z.; Vrankić, M.; Vlahinić, S.; Rogelj, P. Complex Pearson Correlation Coefficient for EEG Connectivity Analysis. Sensors 2022, 22, 1477.
https://doi.org/10.3390/s22041477.
 
2024 / 01
2023 / 04
2023 / 03
2023 / 02

© ФИЦ ИУ РАН 2008-2018. Создание сайта "РосИнтернет технологии".