panvk: Switch JM clear queries to CLC

Signed-off-by: Mary Guillemard <mary.guillemard@collabora.com> Reviewed-by: Alyssa Rosenzweig <alyssa@rosenzweig.io> Part-of: <https://gitlab.freedesktop.org/mesa/mesa/-/merge_requests/32721>
2026-05-06 02:58:05 +02:00 · 2024-12-19 14:40:18 +01:00 · 2024-12-19 14:40:18 +01:00 · 7881e48321
commit 7881e48321
parent 3ed5557baf
3 changed files with 30 additions and 170 deletions
--- a/src/panfrost/libpan/query_pool.cl
+++ b/src/panfrost/libpan/query_pool.cl
@ -54,4 +54,26 @@ panlib_copy_query_result(uint64_t pool_addr, global uint32_t *available_addr,
      vk_write_query(dst, 1, flags, available);
   }
 }
+
+KERNEL(1)
+panlib_clear_query_result(uint64_t pool_addr, global uint32_t *available_addr,
+                          uint32_t query_stride, uint32_t first_query,
+                          uint32_t query_count, uint32_t report_count,
+                          uint32_t availaible_value)
+{
+   uint32_t i = cl_global_id.x;
+
+   if (i >= query_count)
+      return;
+
+   uint32_t query = first_query + i;
+   global uint64_t *report_addr =
+      (global uint64_t *)(pool_addr + ((uint64_t)query * query_stride));
+
+   available_addr[query] = availaible_value;
+
+   for (uint32_t i = 0; i < report_count; i++)
+      report_addr[i] = 0;
+}
+
 #endif
--- a/src/panfrost/vulkan/jm/panvk_vX_cmd_query.c
+++ b/src/panfrost/vulkan/jm/panvk_vX_cmd_query.c
@ -78,188 +78,27 @@ close_batch(struct panvk_cmd_buffer *cmd, bool had_batch)
      panvk_per_arch(cmd_close_batch)(cmd);
 }

-#define load_info(__b, __type, __field_name)                                   \
-   nir_load_push_constant((__b), 1,                                            \
-                          sizeof(((__type *)NULL)->__field_name) * 8,          \
-                          nir_imm_int(b, offsetof(__type, __field_name)))
-
-struct panvk_clear_query_push {
-   uint64_t pool_addr;
-   uint64_t available_addr;
-   uint32_t query_stride;
-   uint32_t first_query;
-   uint32_t query_count;
-   uint32_t reports_per_query;
-   uint32_t availaible_value;
-};
-
-static void
-panvk_nir_clear_query(nir_builder *b, nir_def *i)
-{
-   nir_def *pool_addr = load_info(b, struct panvk_clear_query_push, pool_addr);
-   nir_def *available_addr =
-      nir_u2u64(b, load_info(b, struct panvk_clear_query_push, available_addr));
-   nir_def *query_stride =
-      load_info(b, struct panvk_clear_query_push, query_stride);
-   nir_def *first_query =
-      load_info(b, struct panvk_clear_query_push, first_query);
-   nir_def *reports_per_query =
-      load_info(b, struct panvk_clear_query_push, reports_per_query);
-   nir_def *avail_value =
-      load_info(b, struct panvk_clear_query_push, availaible_value);
-
-   nir_def *query = nir_iadd(b, first_query, i);
-
-   nir_def *avail_addr = panvk_nir_available_dev_addr(b, available_addr, query);
-   nir_def *report_addr =
-      panvk_nir_query_report_dev_addr(b, pool_addr, query_stride, query);
-
-   nir_store_global(b, avail_addr, 4, avail_value, 0x1);
-
-   nir_def *zero = nir_imm_int64(b, 0);
-   nir_variable *r = nir_local_variable_create(b->impl, glsl_uint_type(), "r");
-   nir_store_var(b, r, nir_imm_int(b, 0), 0x1);
-
-   uint32_t qwords_per_report =
-      DIV_ROUND_UP(sizeof(struct panvk_query_report), sizeof(uint64_t));
-
-   nir_push_loop(b);
-   {
-      nir_def *report_idx = nir_load_var(b, r);
-      nir_break_if(b, nir_ige(b, report_idx, reports_per_query));
-
-      nir_def *base_addr = nir_iadd(
-         b, report_addr,
-         nir_i2i64(
-            b, nir_imul_imm(b, report_idx, sizeof(struct panvk_query_report))));
-
-      for (uint32_t y = 0; y < qwords_per_report; y++) {
-         nir_def *addr = nir_iadd_imm(b, base_addr, y * sizeof(uint64_t));
-         nir_store_global(b, addr, 8, zero, 0x1);
-      }
-
-      nir_store_var(b, r, nir_iadd_imm(b, report_idx, 1), 0x1);
-   }
-   nir_pop_loop(b, NULL);
-}
-
-static nir_shader *
-build_clear_queries_shader(uint32_t max_threads_per_wg)
-{
-   nir_builder build = nir_builder_init_simple_shader(
-      MESA_SHADER_COMPUTE, NULL, "panvk-meta-clear-queries");
-   nir_builder *b = &build;
-
-   b->shader->info.workgroup_size[0] = max_threads_per_wg;
-   nir_def *wg_id = nir_load_workgroup_id(b);
-   nir_def *i =
-      nir_iadd(b, nir_load_subgroup_invocation(b),
-               nir_imul_imm(b, nir_channel(b, wg_id, 0), max_threads_per_wg));
-
-   nir_def *query_count =
-      load_info(b, struct panvk_clear_query_push, query_count);
-   nir_push_if(b, nir_ilt(b, i, query_count));
-   {
-      panvk_nir_clear_query(b, i);
-   }
-   nir_pop_if(b, NULL);
-
-   return build.shader;
-}
-
-static VkResult
-get_clear_queries_pipeline(struct panvk_device *dev, const void *key_data,
-                           size_t key_size, VkPipelineLayout layout,
-                           VkPipeline *pipeline_out)
-{
-   const struct panvk_physical_device *phys_dev =
-      to_panvk_physical_device(dev->vk.physical);
-
-   const VkPipelineShaderStageNirCreateInfoMESA nir_info = {
-      .sType = VK_STRUCTURE_TYPE_PIPELINE_SHADER_STAGE_NIR_CREATE_INFO_MESA,
-      .nir =
-         build_clear_queries_shader(phys_dev->kmod.props.max_threads_per_wg),
-   };
-   const VkComputePipelineCreateInfo info = {
-      .sType = VK_STRUCTURE_TYPE_COMPUTE_PIPELINE_CREATE_INFO,
-      .stage =
-         {
-            .sType = VK_STRUCTURE_TYPE_PIPELINE_SHADER_STAGE_CREATE_INFO,
-            .pNext = &nir_info,
-            .stage = VK_SHADER_STAGE_COMPUTE_BIT,
-            .pName = "main",
-         },
-      .layout = layout,
-   };
-
-   return vk_meta_create_compute_pipeline(&dev->vk, &dev->meta, &info, key_data,
-                                          key_size, pipeline_out);
-}
-
 static void
 panvk_emit_clear_queries(struct panvk_cmd_buffer *cmd,
                         struct panvk_query_pool *pool, bool availaible,
                         uint32_t first_query, uint32_t query_count)
 {
-   struct panvk_device *dev = to_panvk_device(cmd->vk.base.device);
-   const struct panvk_physical_device *phys_dev =
-      to_panvk_physical_device(dev->vk.physical);
-   VkResult result;
-
-   const struct panvk_clear_query_push push = {
+   const struct panlib_clear_query_result_args push = {
      .pool_addr = panvk_priv_mem_dev_addr(pool->mem),
      .available_addr = panvk_priv_mem_dev_addr(pool->available_mem),
      .query_stride = pool->query_stride,
      .first_query = first_query,
      .query_count = query_count,
-      .reports_per_query = pool->reports_per_query,
+      .report_count = pool->reports_per_query,
      .availaible_value = availaible,
   };

-   const enum panvk_meta_object_key_type key =
-      PANVK_META_OBJECT_KEY_CLEAR_QUERY_POOL_PIPELINE;
-   const VkPushConstantRange push_range = {
-      .stageFlags = VK_SHADER_STAGE_COMPUTE_BIT,
-      .size = sizeof(push),
-   };
-   VkPipelineLayout layout;
-   result = vk_meta_get_pipeline_layout(&dev->vk, &dev->meta, NULL, &push_range,
-                                        &key, sizeof(key), &layout);
-   if (result != VK_SUCCESS) {
-      vk_command_buffer_set_error(&cmd->vk, result);
-      return;
-   }
-
-   VkPipeline pipeline = vk_meta_lookup_pipeline(&dev->meta, &key, sizeof(key));
-
-   if (pipeline == VK_NULL_HANDLE) {
-      result =
-         get_clear_queries_pipeline(dev, &key, sizeof(key), layout, &pipeline);
-
-      if (result != VK_SUCCESS) {
-         vk_command_buffer_set_error(&cmd->vk, result);
-         return;
-      }
-   }
-
-   /* Save previous cmd state */
-   struct panvk_cmd_meta_compute_save_ctx save = {0};
-   panvk_per_arch(cmd_meta_compute_start)(cmd, &save);
-
-   dev->vk.dispatch_table.CmdBindPipeline(panvk_cmd_buffer_to_handle(cmd),
-                                          VK_PIPELINE_BIND_POINT_COMPUTE,
-                                          pipeline);
-
-   dev->vk.dispatch_table.CmdPushConstants(panvk_cmd_buffer_to_handle(cmd),
-                                           layout, VK_SHADER_STAGE_COMPUTE_BIT,
-                                           0, sizeof(push), &push);
-
-   dev->vk.dispatch_table.CmdDispatchBase(
-      panvk_cmd_buffer_to_handle(cmd), 0, 0, 0,
-      DIV_ROUND_UP(query_count, phys_dev->kmod.props.max_threads_per_wg), 1, 1);
-
-   /* Restore previous cmd state */
-   panvk_per_arch(cmd_meta_compute_end)(cmd, &save);
+   bool had_batch;
+   open_batch(cmd, &had_batch);
+   struct panvk_precomp_ctx precomp_ctx = panvk_per_arch(precomp_cs)(cmd);
+   panlib_clear_query_result_struct(&precomp_ctx, panlib_1d(query_count),
+                                    PANLIB_BARRIER_NONE, push);
+   close_batch(cmd, had_batch);
 }

 VKAPI_ATTR void VKAPI_CALL
--- a/src/panfrost/vulkan/panvk_meta.h
+++ b/src/panfrost/vulkan/panvk_meta.h
@ -16,7 +16,6 @@ enum panvk_meta_object_key_type {
   PANVK_META_OBJECT_KEY_BLEND_SHADER = VK_META_OBJECT_KEY_DRIVER_OFFSET,
   PANVK_META_OBJECT_KEY_COPY_DESC_SHADER,
   PANVK_META_OBJECT_KEY_FB_PRELOAD_SHADER,
-   PANVK_META_OBJECT_KEY_CLEAR_QUERY_POOL_PIPELINE,
 };

 static inline VkFormat