tu: Rework emit_xs_config()

Rework it to take all active/enabled shader stages in one shot, to simplify things and drop the xs_configs table. This lets us use the variant reg packers directly to better deal with register changes across generations. Signed-off-by: Rob Clark <rob.clark@oss.qualcomm.com> Part-of: <https://gitlab.freedesktop.org/mesa/mesa/-/merge_requests/39029>
2025-12-20 03:00:11 +01:00 · 2025-12-18 13:00:31 -08:00 · 2025-12-18 13:00:31 -08:00 · b91a614baf
commit b91a614baf
parent dd489e2615
4 changed files with 79 additions and 81 deletions
--- a/src/freedreno/vulkan/tu_clear_blit.cc
+++ b/src/freedreno/vulkan/tu_clear_blit.cc
@ -875,16 +875,12 @@ r3d_common(struct tu_cmd_buffer *cmd, struct tu_cs *cs, enum r3d_type type,
         .cs_bindless = CHIP == A6XX ? 0x1f : 0xff,
         .gfx_bindless = CHIP == A6XX ? 0x1f : 0xff,));

-   tu_crb crb = cs->crb(2 * 5 + 2 * 11);
-   tu6_emit_xs_config<CHIP>(crb, MESA_SHADER_VERTEX, vs);
-   tu6_emit_xs_config<CHIP>(crb, MESA_SHADER_TESS_CTRL, NULL);
-   tu6_emit_xs_config<CHIP>(crb, MESA_SHADER_TESS_EVAL, NULL);
-   tu6_emit_xs_config<CHIP>(crb, MESA_SHADER_GEOMETRY, NULL);
-   tu6_emit_xs_config<CHIP>(crb, MESA_SHADER_FRAGMENT, fs);
-   struct tu_pvtmem_config pvtmem = {};
-   tu6_emit_xs(crb, cs->device, MESA_SHADER_VERTEX, vs, &pvtmem, vs_iova);
-   tu6_emit_xs(crb, cs->device, MESA_SHADER_FRAGMENT, fs, &pvtmem, fs_iova);
-   crb.flush();
+   with_crb (cs, 2 * 5 + 2 * 11) {
+      tu6_emit_xs_config<CHIP>(crb, { .vs = vs, .fs = fs });
+      struct tu_pvtmem_config pvtmem = {};
+      tu6_emit_xs(crb, cs->device, MESA_SHADER_VERTEX, vs, &pvtmem, vs_iova);
+      tu6_emit_xs(crb, cs->device, MESA_SHADER_FRAGMENT, fs, &pvtmem, fs_iova);
+   }

   tu6_emit_xs_constants(cs, MESA_SHADER_VERTEX, vs, vs_iova);
   tu6_emit_xs_constants(cs, MESA_SHADER_FRAGMENT, fs, fs_iova);
--- a/src/freedreno/vulkan/tu_pipeline.cc
+++ b/src/freedreno/vulkan/tu_pipeline.cc
@ -338,71 +338,72 @@ tu_push_consts_type(const struct tu_pipeline_layout *layout,
   }
 }

-template <chip CHIP>
-struct xs_config {
-   uint16_t reg_sp_xs_config;
-   uint16_t reg_hlsq_xs_ctrl;
-};
+static uint32_t
+sp_xs_config(const struct ir3_shader_variant *v)
+{
+   if (!v)
+      return 0;

-template <chip CHIP>
-static const xs_config<CHIP> xs_configs[] = {
-   [MESA_SHADER_VERTEX] = {
-      REG_A6XX_SP_VS_CONFIG,
-      CHIP == A6XX ? REG_A6XX_SP_VS_CONST_CONFIG : REG_A7XX_SP_VS_CONST_CONFIG,
-   },
-   [MESA_SHADER_TESS_CTRL] = {
-      REG_A6XX_SP_HS_CONFIG,
-      CHIP == A6XX ? REG_A6XX_SP_HS_CONST_CONFIG : REG_A7XX_SP_HS_CONST_CONFIG,
-   },
-   [MESA_SHADER_TESS_EVAL] = {
-      REG_A6XX_SP_DS_CONFIG,
-      CHIP == A6XX ? REG_A6XX_SP_DS_CONST_CONFIG : REG_A7XX_SP_DS_CONST_CONFIG,
-   },
-   [MESA_SHADER_GEOMETRY] = {
-      REG_A6XX_SP_GS_CONFIG,
-      CHIP == A6XX ? REG_A6XX_SP_GS_CONST_CONFIG : REG_A7XX_SP_GS_CONST_CONFIG,
-   },
-   [MESA_SHADER_FRAGMENT] = {
-      REG_A6XX_SP_PS_CONFIG,
-      CHIP == A6XX ? REG_A6XX_SP_PS_CONST_CONFIG : REG_A7XX_SP_PS_CONST_CONFIG,
-   },
-   [MESA_SHADER_COMPUTE] = {
-      REG_A6XX_SP_CS_CONFIG,
-      CHIP == A6XX ? REG_A6XX_SP_CS_CONST_CONFIG : REG_A7XX_SP_CS_CONST_CONFIG,
-   },
-};
+   return A6XX_SP_VS_CONFIG_ENABLED |
+         COND(v->bindless_tex, A6XX_SP_VS_CONFIG_BINDLESS_TEX) |
+         COND(v->bindless_samp, A6XX_SP_VS_CONFIG_BINDLESS_SAMP) |
+         COND(v->bindless_ibo, A6XX_SP_VS_CONFIG_BINDLESS_UAV) |
+         COND(v->bindless_ubo, A6XX_SP_VS_CONFIG_BINDLESS_UBO) |
+         A6XX_SP_VS_CONFIG_NUAV(ir3_shader_num_uavs(v)) |
+         A6XX_SP_VS_CONFIG_NTEX(v->num_samp) |
+         A6XX_SP_VS_CONFIG_NSAMP(v->num_samp);
+}
+
+static bool
+push_shared_consts(const struct ir3_shader_variant *v)
+{
+   return v && v->shader_options.push_consts_type == IR3_PUSH_CONSTS_SHARED_PREAMBLE;
+}

 template <chip CHIP>
 void
-tu6_emit_xs_config(struct tu_crb &crb,
-                   mesa_shader_stage stage, /* xs->type, but xs may be NULL */
-                   const struct ir3_shader_variant *xs)
+tu6_emit_xs_config(struct tu_crb &crb, struct tu_shader_stages stages)
 {
-   const struct xs_config<CHIP> *cfg = &xs_configs<CHIP>[stage];
+   if (stages.cs) {
+      crb.add(SP_CS_CONST_CONFIG(CHIP,
+         .constlen = stages.cs->constlen,
+         .enabled = true,
+         .read_imm_shared_consts = push_shared_consts(stages.cs),
+      ));
+      crb.add(A6XX_SP_CS_CONFIG(.dword = sp_xs_config(stages.cs)));
+   } else {
+      crb.add(SP_VS_CONST_CONFIG(CHIP,
+         .constlen = COND(stages.vs, stages.vs->constlen),
+         .enabled = stages.vs,
+         .read_imm_shared_consts = push_shared_consts(stages.vs),
+      ));
+      crb.add(SP_HS_CONST_CONFIG(CHIP,
+         .constlen = COND(stages.hs, stages.hs->constlen),
+         .enabled = stages.hs,
+         .read_imm_shared_consts = push_shared_consts(stages.hs),
+      ));
+      crb.add(SP_DS_CONST_CONFIG(CHIP,
+         .constlen = COND(stages.ds, stages.ds->constlen),
+         .enabled = stages.ds,
+         .read_imm_shared_consts = push_shared_consts(stages.ds),
+      ));
+      crb.add(SP_GS_CONST_CONFIG(CHIP,
+         .constlen = COND(stages.gs, stages.gs->constlen),
+         .enabled = stages.gs,
+         .read_imm_shared_consts = push_shared_consts(stages.gs),
+      ));
+      crb.add(SP_PS_CONST_CONFIG(CHIP,
+         .constlen = COND(stages.fs, stages.fs->constlen),
+         .enabled = stages.fs,
+         .read_imm_shared_consts = push_shared_consts(stages.fs),
+      ));

-   if (!xs) {
-      /* shader stage disabled */
-      crb.add(tu_reg_value { .reg = cfg->reg_sp_xs_config, .value = 0 });
-      crb.add(tu_reg_value { .reg = cfg->reg_hlsq_xs_ctrl, .value = 0 });
-      return;
+      crb.add(A6XX_SP_VS_CONFIG(.dword = sp_xs_config(stages.vs)));
+      crb.add(A6XX_SP_HS_CONFIG(.dword = sp_xs_config(stages.hs)));
+      crb.add(A6XX_SP_DS_CONFIG(.dword = sp_xs_config(stages.ds)));
+      crb.add(A6XX_SP_GS_CONFIG(.dword = sp_xs_config(stages.gs)));
+      crb.add(A6XX_SP_PS_CONFIG(.dword = sp_xs_config(stages.fs)));
   }
-
-   crb.add(tu_reg_value {
-      .reg = cfg->reg_sp_xs_config,
-      .value = A6XX_SP_VS_CONFIG_ENABLED |
-               COND(xs->bindless_tex, A6XX_SP_VS_CONFIG_BINDLESS_TEX) |
-               COND(xs->bindless_samp, A6XX_SP_VS_CONFIG_BINDLESS_SAMP) |
-               COND(xs->bindless_ibo, A6XX_SP_VS_CONFIG_BINDLESS_UAV) |
-               COND(xs->bindless_ubo, A6XX_SP_VS_CONFIG_BINDLESS_UBO) |
-               A6XX_SP_VS_CONFIG_NTEX(xs->num_samp) |
-               A6XX_SP_VS_CONFIG_NSAMP(xs->num_samp) });
-   crb.add(tu_reg_value {
-      .reg = cfg->reg_hlsq_xs_ctrl,
-      .value = A6XX_SP_VS_CONST_CONFIG_CONSTLEN(xs->constlen) |
-               A6XX_SP_VS_CONST_CONFIG_ENABLED |
-               COND(xs->shader_options.push_consts_type ==
-                       IR3_PUSH_CONSTS_SHARED_PREAMBLE,
-                    A7XX_SP_VS_CONST_CONFIG_READ_IMM_SHARED_CONSTS) });
 }
 TU_GENX(tu6_emit_xs_config);

@ -1266,11 +1267,14 @@ tu6_emit_program_config(struct tu_cs *cs,
                          .ds_state = true, .gs_state = true,
                          .fs_state = true, .gfx_uav = true,
                          .gfx_shared_const = shared_consts_enable));
-   for (size_t stage_idx = MESA_SHADER_VERTEX;
-        stage_idx <= MESA_SHADER_FRAGMENT; stage_idx++) {
-      mesa_shader_stage stage = (mesa_shader_stage) stage_idx;
-      tu6_emit_xs_config<CHIP>(crb, stage, variants[stage]);
-   }
+
+   const struct ir3_shader_variant *vs = variants[MESA_SHADER_VERTEX];
+   const struct ir3_shader_variant *hs = variants[MESA_SHADER_TESS_CTRL];
+   const struct ir3_shader_variant *ds = variants[MESA_SHADER_TESS_EVAL];
+   const struct ir3_shader_variant *gs = variants[MESA_SHADER_GEOMETRY];
+   const struct ir3_shader_variant *fs = variants[MESA_SHADER_FRAGMENT];
+
+   tu6_emit_xs_config<CHIP>(crb, { .vs = vs, .hs = hs, .ds = ds, .gs = gs, .fs = fs });

   crb.flush();

@ -1280,11 +1284,6 @@ tu6_emit_program_config(struct tu_cs *cs,
      tu6_emit_dynamic_offset(cs, variants[stage], shaders[stage], prog);
   }

-   const struct ir3_shader_variant *vs = variants[MESA_SHADER_VERTEX];
-   const struct ir3_shader_variant *hs = variants[MESA_SHADER_TESS_CTRL];
-   const struct ir3_shader_variant *ds = variants[MESA_SHADER_TESS_EVAL];
-   const struct ir3_shader_variant *gs = variants[MESA_SHADER_GEOMETRY];
-
   if (hs) {
      tu6_emit_link_map(cs, vs, hs, SB6_HS_SHADER);
      tu6_emit_link_map(cs, hs, ds, SB6_DS_SHADER);
--- a/src/freedreno/vulkan/tu_pipeline.h
+++ b/src/freedreno/vulkan/tu_pipeline.h
@ -301,11 +301,14 @@ struct tu_pvtmem_config {
   bool per_wave;
 };

+struct tu_shader_stages {
+   const struct ir3_shader_variant *vs, *hs, *ds, *gs, *fs, *cs;
+};
+
 template <chip CHIP>
 void
 tu6_emit_xs_config(struct tu_crb &crb,
-                   mesa_shader_stage stage,
-                   const struct ir3_shader_variant *xs);
+                   struct tu_shader_stages stages);

 template <chip CHIP>
 void
--- a/src/freedreno/vulkan/tu_shader.cc
+++ b/src/freedreno/vulkan/tu_shader.cc
@ -1781,7 +1781,7 @@ tu6_emit_cs_config(struct tu_cs *cs,

      crb.add(SP_UPDATE_CNTL(CHIP, .cs_state = true, .cs_uav = true,
                             .cs_shared_const = shared_consts_enable));
-      tu6_emit_xs_config<CHIP>(crb, MESA_SHADER_COMPUTE, v);
+      tu6_emit_xs_config<CHIP>(crb, { .cs = v });
      tu6_emit_xs(crb, cs->device, MESA_SHADER_COMPUTE, v, pvtmem, binary_iova);
   }
   tu6_emit_xs_constants(cs, MESA_SHADER_COMPUTE, v, binary_iova);