Mesa 24.3 видит «существенные улучшения» в вычислительном шейдере AMD Clear/Copy-Buffer. Известный разработчик AMD Mesa Марек Ольшак продолжает неустанно оптимизировать драйвер RadeonSI Gallium3D и связанный с ним код для обеспечения пиковой производительности графического стека AMD.
В последнее время Марек работает над оптимизацией вычислительного шейдера clear/copy_buffer в общий код AMD и, как часть этого, над добавлением поддержки невыровненных копий.
В запросе на слияние, открытом несколько недель назад, Марек описывает это как «существенное улучшение», которое с ночи было включено в Mesa 24.3. Марек отмечает в запросе на слияние:
«Это существенное улучшение вычислительного шейдера clear/copy_buffer в radeonsi, который также перемещен в src/amd/common.
Добавлена поддержка очисток и копий буферов без выравнивания, при этом производительность остается такой же, как и при выровненных очистках и копиях. Оптимальное выравнивание для смещений буфера — 256, а не 4.
Последует дополнительная настройка под конкретный чип, но для Navi31 это уже оптимально».
Приятно видеть, что еще больше оптимизаций Марека готовы для Mesa Git. Будет интересно посмотреть, каких еще настроек Марек достигнет к выходу стабильной версии Mesa 24.3, которая должна появиться в 4 квартале.