Tachyum анонсировала выход обширного руководства по оптимизации производительности для своего универсального процессора Prodigy. Этот 1600-страничный документ предлагает детальную информацию о том, как максимально использовать встроенные в Prodigy функции производительности. Руководство включает рекомендации по разработке высокопроизводительного программного обеспечения для различных приложений, таких как облачные вычисления, искусственный интеллект и высокопроизводительные вычисления (HPC).
В руководстве подробно описана революционная микроархитектура Prodigy, а также его встроенные функции, инструкции процессора, пропускные способности и задержки. Также представлены счетчики производительности Prodigy, которые позволяют проводить мониторинг и анализ производительности в широком спектре событий во время выполнения.
Документ охватывает специальные аспекты оптимизации производительности, включая ограничения диспетчеризации, выравнивание загрузки/хранения, оптимизацию операций с памятью, выравнивание инструкций ветвления и доступ к специальным регистраторам. Основатель и CEO Tachyum отметил, что программисты, инженеры по тестированию и разработчики компиляторов смогут глубже понять, как Prodigy обеспечивает преимущества производительности для эффективной обработки рабочих нагрузок в области AI, облачных вычислений и HPC.
Инструкция по архитектуре процессора Prodigy (ISA) включает множество векторных и матричных инструкций, оптимизирующих производительность операций с векторами и матрицами. Prodigy сочетает в себе элементы RISC и CISC, исключая сложные и неэффективные инструкции, характерные для многих CISC-процессоров. Все инструкции имеют ширину 32 или 64 бита, а некоторые из них включают доступ к памяти для повышения производительности.
Prodigy предлагает выдающуюся производительность для всех типов рабочих нагрузок, позволяя серверам в дата-центрах динамически переключаться между вычислительными доменами, такими как AI/ML, HPC и облачные вычисления, с использованием единой однородной архитектуры. Это значительно снижает капитальные и операционные затраты, устраняя необходимость в дорогостоящем специализированном оборудовании для AI и увеличивая использование серверов.
С Prodigy, который интегрирует 192 высокопроизводительных 64-битных вычислительных ядра, пользователи могут рассчитывать на производительность, превышающую в 4,5 раза производительность лучших x86 процессоров для облачных задач, в 3 раза для HPC и в 6 раз для AI приложений.