amd/lower_mem_access_bit_sizes: be more careful with 8/16-bit scratch load

Signed-off-by: Rhys Perry <pendingchaos02@gmail.com> Backport-to: 25.3 Reviewed-by: Georg Lehmann <dadschoorse@gmail.com> (cherry picked from commit e89b22280f) Part-of: <https://gitlab.freedesktop.org/mesa/mesa/-/merge_requests/38010>
2025-12-24 21:50:12 +01:00 · 2025-10-17 15:39:20 +01:00 · 2025-10-17 15:39:20 +01:00 · c1cf6e75ae
commit c1cf6e75ae
parent 2b8675fd86
2 changed files with 7 additions and 6 deletions
--- a/.pick_status.json
+++ b/.pick_status.json
@ -224,7 +224,7 @@
        "description": "amd/lower_mem_access_bit_sizes: be more careful with 8/16-bit scratch load",
        "nominated": true,
        "nomination_type": 4,
-        "resolution": 0,
+        "resolution": 1,
        "main_sha": null,
        "because_sha": null,
        "notes": null
--- a/src/amd/common/nir/ac_nir_lower_mem_access_bit_sizes.c
+++ b/src/amd/common/nir/ac_nir_lower_mem_access_bit_sizes.c
@ -121,10 +121,11 @@ lower_mem_access_cb(nir_intrinsic_op intrin, uint8_t bytes, uint8_t bit_size, ui
      return res;
   }

+   const bool is_buffer_load = intrin == nir_intrinsic_load_ubo ||
+                               intrin == nir_intrinsic_load_ssbo ||
+                               intrin == nir_intrinsic_load_constant;
+
   if (is_smem) {
-      const bool is_buffer_load = intrin == nir_intrinsic_load_ubo ||
-                                  intrin == nir_intrinsic_load_ssbo ||
-                                  intrin == nir_intrinsic_load_constant;
      const bool supported_subdword = cb_data->gfx_level >= GFX12 &&
                                      intrin != nir_intrinsic_load_push_constant &&
                                      (!cb_data->use_llvm || intrin != nir_intrinsic_load_ubo);
@ -194,8 +195,8 @@ lower_mem_access_cb(nir_intrinsic_op intrin, uint8_t bytes, uint8_t bit_size, ui

   const uint32_t max_pad = 4 - MIN2(combined_align, 4);

-   /* Global loads don't have bounds checking, so increasing the size might not be safe. */
-   if (intrin == nir_intrinsic_load_global || intrin == nir_intrinsic_load_global_constant) {
+   /* Global/scratch loads don't have bounds checking, so increasing the size might not be safe. */
+   if (!is_buffer_load) {
      if (align_mul < 4) {
         /* If we split the load, only lower it to 32-bit if this is a SMEM load. */
         const unsigned chunk_bytes = align(bytes, 4) - max_pad;