A desenvolvedora Natalie Vock, que trabalha para a Valve, enviou melhorias de desempenho ainda mais impressionantes para GPUs AMD no Linux com Mesa. Este é um trabalho adicional além do que foi mesclado recentementee isso já era impressionante.
O primeiro que foi enviado para Mesa há 2 dias e já mesclado intitulado “Usar wave32 para RT em gfx11+”, na solicitação eles observaram:
O ACO ficou muito melhor na formação de instruções VOPD e nos testes
o feedback parece apontar em uma direção ligeiramente positiva para isso.
gfx12 também começará a exigir wave32 para alocação dinâmica de VGPR em
algum ponto.
Medições no navi31:
Cyberpunk 2077:
Diferença com 95,0% de confiança
1,12333 +/- 0,42876
1,88216% +/- 0,718391%
(t de Student, s agrupado = 0,189165)
Referência do Mito Negro Wukong:
Diferença com 95,0% de confiança
4 +/- 1,30862
13,9535% +/- 4,56495%
(t de Student, s agrupado = 0,57735)
Portal com RTX:
66,2ms->61,5ms (~7,64% de melhoria)
O segundo que foi aberto há cerca de 20 horas intitulado “Usar chamadas de função para separar a compilação de shader de qualquer hit/interseção” é igualmente impressionante:
Finalmente temos chamadas de função para raytracing!
Agora, vamos usá-los para coisas muito legais.
Com este MR, o RADV pode compilar sombreadores de qualquer ocorrência e de interseção separadamente. Chega de inlining forçado de tudo em um enorme megashader! Em jogos que usam/compilam muito shaders de qualquer hit/interseção, isso acarreta algumas melhorias realmente malucas em todas as gerações de GPU:
Compilar pipelines RT em jogos UE4 com raytracing (por exemplo, Ghostwire Tokyo, The Callisto Protocol) torna-se 10 vezes mais rápido. Sim, uma ordem de grandeza! Em uma captura do Ghostwire Tokyo Fossilize que descobri, o tempo de repetição passou de 4 minutos e 20 segundos para apenas 20 segundos.
Esses jogos UE também tendiam a apresentar travamentos terríveis sempre que um novo pipeline RT era compilado.
Essa gagueira desapareceu completamente.
Além disso, o desempenho do tempo de execução também melhora muito (nos aplicativos afetados). Quem diria que incorporar centenas de shaders em um loop incrivelmente quente poderia ser ruim para o desempenho?!
Pela matemática rápida dos guardanapos, acho que o desempenho puro do RT no Ghostwire Tokyo melhora mais de 2x. De qualquer forma, o FPS vai de ~30 a ~40 no meu 7900XTX.
Parece que com o MR também igualamos aproximadamente o desempenho do Windows na cena do Ghostwire Tokyo que testei.
As melhorias de desempenho em diferentes aplicativos/títulos não UE4 podem variar, mas tenho certeza de que alguns aplicativos devem se beneficiar. (Cyberpunk 2077, no entanto, não. Ele realmente usa apenas 1 shader de qualquer impacto no máximo e, portanto, não é afetado por este MR.)
Para a organização MR:
Isto é baseado em !38679 para uma boa alocação de registros em shaders de qualquer acerto.
A maioria dos outros commits ACO (529b0546, 40b49ff5 e 9702e59e) são opcionais – eles melhoram o desempenho, mas este MR é benéfico com ou sem eles. Posso dividi-los em outro MR, se preferir.
Fonte original: Forônio
Esperançosamente, não serão encontradas regressões depois de tudo isso, mas meu cérebro, que não é um especialista, espera que isso continue acontecendo. 2026 será forte para drivers gráficos Linux de código aberto.
Imagino que boa parte deste trabalho seja para conseguir a nova máquina a vapor preparar.
Quanto a quando esperar os próximos lançamentos do Mesa? Do cronograma de lançamento:
|
Filial
|
Data prevista
|
Liberar
|
Notas
|
|---|---|---|---|
|
25.3
|
14/01/2026
|
25.3.4
|
|
|
28/01/2026
|
25.3.5
|
||
|
11/02/2026
|
25.3.6
|
Última versão 25.3 planejada
|
|
|
26,0
|
21/01/2026
|
26.0.0-rc1
|
Ponto de ramificação 26,0
|
|
28/01/2026
|
26.0.0-rc2
|
||
|
04/02/2026
|
26.0.0-rc3
|
||
|
11/02/2026
|
26.0.0-rc4
|
ou 26.0.0 final
|






