Home / VideoGame / Ainda mais melhorias de desempenho de ray tracing da AMD chegando ao Mesa no Linux

VideoGame

Ainda mais melhorias de desempenho de ray tracing da AMD chegando ao Mesa no Linux

janeiro 17, 2026

A desenvolvedora Natalie Vock, que trabalha para a Valve, enviou melhorias de desempenho ainda mais impressionantes para GPUs AMD no Linux com Mesa. Este é um trabalho adicional além do que foi mesclado recentementee isso já era impressionante.

O primeiro que foi enviado para Mesa há 2 dias e já mesclado intitulado “Usar wave32 para RT em gfx11+”, na solicitação eles observaram:

O ACO ficou muito melhor na formação de instruções VOPD e nos testes
o feedback parece apontar em uma direção ligeiramente positiva para isso.

gfx12 também começará a exigir wave32 para alocação dinâmica de VGPR em
algum ponto.

Medições no navi31:

Cyberpunk 2077:
Diferença com 95,0% de confiança
1,12333 +/- 0,42876
1,88216% +/- 0,718391%
(t de Student, s agrupado = 0,189165)

Referência do Mito Negro Wukong:
Diferença com 95,0% de confiança
4 +/- 1,30862
13,9535% +/- 4,56495%
(t de Student, s agrupado = 0,57735)

Portal com RTX:
66,2ms->61,5ms (~7,64% de melhoria)

Na foto – Cyberpunk 2077

O segundo que foi aberto há cerca de 20 horas intitulado “Usar chamadas de função para separar a compilação de shader de qualquer hit/interseção” é igualmente impressionante:

Finalmente temos chamadas de função para raytracing!

Agora, vamos usá-los para coisas muito legais.

Com este MR, o RADV pode compilar sombreadores de qualquer ocorrência e de interseção separadamente. Chega de inlining forçado de tudo em um enorme megashader! Em jogos que usam/compilam muito shaders de qualquer hit/interseção, isso acarreta algumas melhorias realmente malucas em todas as gerações de GPU:

Compilar pipelines RT em jogos UE4 com raytracing (por exemplo, Ghostwire Tokyo, The Callisto Protocol) torna-se 10 vezes mais rápido. Sim, uma ordem de grandeza! Em uma captura do Ghostwire Tokyo Fossilize que descobri, o tempo de repetição passou de 4 minutos e 20 segundos para apenas 20 segundos.
Esses jogos UE também tendiam a apresentar travamentos terríveis sempre que um novo pipeline RT era compilado.
Essa gagueira desapareceu completamente.

Além disso, o desempenho do tempo de execução também melhora muito (nos aplicativos afetados). Quem diria que incorporar centenas de shaders em um loop incrivelmente quente poderia ser ruim para o desempenho?!
Pela matemática rápida dos guardanapos, acho que o desempenho puro do RT no Ghostwire Tokyo melhora mais de 2x. De qualquer forma, o FPS vai de ~30 a ~40 no meu 7900XTX.
Parece que com o MR também igualamos aproximadamente o desempenho do Windows na cena do Ghostwire Tokyo que testei.

As melhorias de desempenho em diferentes aplicativos/títulos não UE4 podem variar, mas tenho certeza de que alguns aplicativos devem se beneficiar. (Cyberpunk 2077, no entanto, não. Ele realmente usa apenas 1 shader de qualquer impacto no máximo e, portanto, não é afetado por este MR.)

Para a organização MR:

Isto é baseado em !38679 para uma boa alocação de registros em shaders de qualquer acerto.

A maioria dos outros commits ACO (529b0546, 40b49ff5 e 9702e59e) são opcionais – eles melhoram o desempenho, mas este MR é benéfico com ou sem eles. Posso dividi-los em outro MR, se preferir.

Fonte original: Forônio

Esperançosamente, não serão encontradas regressões depois de tudo isso, mas meu cérebro, que não é um especialista, espera que isso continue acontecendo. 2026 será forte para drivers gráficos Linux de código aberto.

Imagino que boa parte deste trabalho seja para conseguir a nova máquina a vapor preparar.

Quanto a quando esperar os próximos lançamentos do Mesa? Do cronograma de lançamento:

Filial	Data prevista	Liberar	Notas
25.3	14/01/2026	25.3.4
	28/01/2026	25.3.5
	11/02/2026	25.3.6	Última versão 25.3 planejada
26,0	21/01/2026	26.0.0-rc1	Ponto de ramificação 26,0
	28/01/2026	26.0.0-rc2
	04/02/2026	26.0.0-rc3
	11/02/2026	26.0.0-rc4	ou 26.0.0 final

Filial

Data prevista

Liberar

Notas

25.3

14/01/2026

25.3.4

28/01/2026

25.3.5

11/02/2026

25.3.6

Última versão 25.3 planejada