fdo-mirrors/mesa

mirror of https://gitlab.freedesktop.org/mesa/mesa.git synced 2026-05-17 03:08:07 +02:00

Author	SHA1	Message	Date
Bas Nieuwenhuizen	76daa30e4a	radv: Use correct flush bits for flushing L2 during CB/DB flushes. Copied from radeonsi. Putting in the correct metadata flush commands for eventually not flushing L2 on CB/DB switch. Does not remove the need for V_028A90_CACHE_FLUSH_AND_INV_TS_EVENT at the moment. Reviewed-by: Samuel Pitoiset <samuel.pitoiset@gmail.com>	2018-01-04 19:35:36 +01:00
Bas Nieuwenhuizen	f2c9f13ec2	radv: Invalidate L1 for VK_ACCESS_VERTEX_ATTRIBUTE_READ_BIT. These are just shaders reads, so we need to invalidate L1. Fixes: `6dbb0eaccc` "radv: handle subpass cache flushes" Reviewed-by: Samuel Pitoiset <samuel.pitoiset@gmail.com>	2018-01-04 19:35:36 +01:00
Samuel Pitoiset	2670ebb584	radv/gfx9: reduce the number of input VGPRs for the GS stage This can still be improved, but let's start with this. Signed-off-by: Samuel Pitoiset <samuel.pitoiset@gmail.com> Reviewed-by: Bas Nieuwenhuizen <bas@basnieuwenhuizen.nl>	2018-01-04 18:43:25 +01:00
Samuel Pitoiset	a4d2782664	amd/common: scan if gl_PrimitiveID is used before translating to LLVM It makes more sense to move all scan stuff in the same place. Also, we don't really need to duplicate the uses_primid field for each stages. Signed-off-by: Samuel Pitoiset <samuel.pitoiset@gmail.com> Reviewed-by: Marek Olšák <marek.olsak@amd.com>	2018-01-04 18:43:09 +01:00
Samuel Pitoiset	3b2cb2f99a	amd/common: scan if gl_InvocationID is used Signed-off-by: Samuel Pitoiset <samuel.pitoiset@gmail.com> Reviewed-by: Marek Olšák <marek.olsak@amd.com>	2018-01-04 18:43:07 +01:00
Bas Nieuwenhuizen	79724c89f8	ac: rename has_sync_file to has_fence_to_handle. sync_files are in linux since 4.7, while the amdgpu fence_to_handle ioctl is only in 4.15. In particular we don't need it for sync_file in radv, because everything happens via syncobjs, which got support earlier than fence_to_handle. Reviewed-by: Marek Olšák <marek.olsak@amd.com>	2018-01-04 01:12:09 +01:00
Bas Nieuwenhuizen	c99426ea83	ac/nir: Handle loading data from compact arrays. Fixes: `f4e499ec79` "radv: add initial non-conformant radv vulkan driver" Reviewed-by: Dave Airlie <airlied@redhat.com>	2018-01-04 00:14:23 +01:00
Bas Nieuwenhuizen	1c78e4f053	radv: Allow writing 0 scissors. When rasterization is disabled we can have that few. Fixes: `76603aa90b` "radv: Drop the default viewport when 0 viewports are given." Reviewed-by: Dave Airlie <airlied@redhat.com>	2018-01-04 00:14:19 +01:00
Bas Nieuwenhuizen	5158603182	radv: Use correct HTILE expanded words. Seems like users are actually hitting 0xFFFFFFFF actually making things broken for them, and the mad max regression is fixed, so lets put this in once more. v2: Use 0xf for depth-only htile. (Dave) Fixes: `af2844116f` "radv: Revert HTILE reset word to 0xFFFFFFFF." Reviewed-by: Dave Airlie <airlied@redhat.com>	2018-01-04 00:14:03 +01:00
Marek Olšák	4f19cc82f9	ac: rename has_syncobj_wait -> has_syncobj_wait_for_submit Reviewed-by: Bas Nieuwenhuizen <bas@basnieuwenhuizen.nl>	2018-01-04 00:07:45 +01:00
Bas Nieuwenhuizen	6a36bfc64d	radv: Implement binning on GFX9. Overall it does not really help or hurt. The deferred demo gets 1% improvement and some games a 3% decrease, so I don't think this should be enabled by default. But with the code upstream it is easier to experiment with it. v2: Remove initializing the registers from si_emit_config. Reviewed-by: Dave Airlie <airlied@redhat.com>	2017-12-31 15:07:07 +01:00
Bas Nieuwenhuizen	b0d17270ad	radv: Add flag for enabling binning. Letting it be disabled by default. Reviewed-by: Dave Airlie <airlied@redhat.com>	2017-12-31 13:47:51 +01:00
Bas Nieuwenhuizen	b0a6fd0274	radv: Also set DCC params for sampling for input attachment usage. Those are implemented as texture sampling, so we need to make the texture TC-compatible too. Fixes: `34d23e82ca` "radv: set some dcc parameters depending on if texture will be sampled" Reviewed-by: Fredrik Höglund <fredrik@kde.org>	2017-12-29 23:42:30 +01:00
Bas Nieuwenhuizen	ab957243e1	radv: Enable DCC with transfers. Before this DCC was in practice disabled for most games. This enables practical DCC use. Expect a 5-10% perf increase on a bunch of games on vega @ 4k. Reviewed-by: Dave Airlie <airlied@redhat.com> Tested-by: Dieter Nützel <Dieter@nuetzel-hh.de>	2017-12-29 12:22:02 +01:00
Bas Nieuwenhuizen	eb9a4c3464	radv: Decompress copy destination if formats are incompatible. If both source and destination are DCC compressed, and their formats are not compatible, we need to decompress one of them to make sure we can do reinterpretation (which needs src format == dst format) . Reviewed-by: Dave Airlie <airlied@redhat.com> Tested-by: Dieter Nützel <Dieter@nuetzel-hh.de>	2017-12-29 12:21:58 +01:00
Bas Nieuwenhuizen	44fcf58744	radv: Disable DCC for GENERAL layout and compute transfer dest. Apps can use this for render feedback loops, where things are defined if they render each pixel only once. However, DCC fails here, as the level of coherence is a block not a pixel, so disable it. This is also going to help implementing other stuff. Even if we optimize this later to only happen if there actually is a loop (if possible at all ...), then the machinery is still useful to exclude images accessible by the SDMA queue when that is implemented. Reviewed-by: Dave Airlie <airlied@redhat.com> Tested-by: Dieter Nützel <Dieter@nuetzel-hh.de>	2017-12-29 12:21:53 +01:00
Bas Nieuwenhuizen	95f50f7f6c	radv: Don't init DCC metadata during FS resolve. It should already be valid there + the RB will update it during rendering. Reviewed-by: Dave Airlie <airlied@redhat.com> Tested-by: Dieter Nützel <Dieter@nuetzel-hh.de>	2017-12-29 12:21:49 +01:00
Bas Nieuwenhuizen	1cfab28e6e	radv: Make color meta operations layout aware. For fast clear eliminate and decompressions, we always use the most compressed format. For clears, the code already creates a renderpass on demand with the exact same layout as specified. Otherwise we start distinguishing between GENERAL and TRANSFER_DST_OPTIMAL. Reviewed-by: Dave Airlie <airlied@redhat.com> Tested-by: Dieter Nützel <Dieter@nuetzel-hh.de>	2017-12-29 12:21:44 +01:00
Bas Nieuwenhuizen	3e2a6191c9	radv: Add compute DCC decompress. We do an in place copy where we read compressed and write decompressed. By doing this in sizes that cover entire DCC blocks and waiting for all reads in the block before starting to write we avoid corruption. In the end we clear the DCC metadata to 0xffffffff. Reviewed-by: Dave Airlie <airlied@redhat.com> Tested-by: Dieter Nützel <Dieter@nuetzel-hh.de>	2017-12-29 12:21:40 +01:00
Bas Nieuwenhuizen	8abaa3aeaa	radv: Use the meta fast clear destructor on construction failure. Simplifies failure paths. The caller already calls radv_device_finish_meta_fast_clear_flush_state on failure. Reviewed-by: Dave Airlie <airlied@redhat.com> Tested-by: Dieter Nützel <Dieter@nuetzel-hh.de>	2017-12-29 12:21:35 +01:00
Bas Nieuwenhuizen	e5feeec140	radv: Add GFX DCC decompress. Reviewed-by: Dave Airlie <airlied@redhat.com> Tested-by: Dieter Nützel <Dieter@nuetzel-hh.de>	2017-12-29 12:21:31 +01:00
Bas Nieuwenhuizen	fc80f52536	radv: Don't enable DCC / TC compat HTILE for storage images. We don't get a layout when binding to a descriptor set, but can assume that the LAYOUT is GENERAL. For DCC stores with the DCC bits set will result in a hang, so better be safe than sorry. Reviewed-by: Dave Airlie <airlied@redhat.com> Tested-by: Dieter Nützel <Dieter@nuetzel-hh.de>	2017-12-29 12:21:15 +01:00
Bas Nieuwenhuizen	516a80b579	Revert "radv/gfx9: fix block compression texture views." This reverts commit `5951578043`. The mentioned commit causes a hang in DoW3 on Vega. Fixes: `5951578043` "radv/gfx9: fix block compression texture views." Acked-by: Dave Airlie <airlied@redhat.com>	2017-12-29 11:21:43 +01:00
Dave Airlie	a4c23ce1b6	radv/gfx9: use correct swizzle parameter to work out border swizzle. This should fix: dEQP-VK.pipeline.sampler.view_type.*.format.b4g4r4a4_unorm_pack16.address_modes.all_mode_clamp_to_border_opaque_black and a few others in that area. Fixes: `b11c4a5546` (radv: add texture descriptor/fmask/cmask support for GFX9) Reviewed-by: Bas Nieuwenhuizen <bas@basnieuwenhuizen.nl> Signed-off-by: Dave Airlie <airlied@redhat.com>	2017-12-29 12:09:13 +10:00
Dave Airlie	868377ab33	radv/gfx9: use a bigger hammer to flush cb/db caches. amdvlk is probably more subtle than this but it never uses the inv cb/db variants, we fail some CTS tests without this. Fixes: dEQP-VK.renderpass.dedicated_allocation.formats.d32_sfloat_s8_uint.input*. Fixes: `c2fbeb7ca0` (radv: add GFX9 cache flushing support.) Reviewed-by: Bas Nieuwenhuizen <bas@basnieuwenhuizen.nl> (for now :-) Signed-off-by: Dave Airlie <airlied@redhat.com>	2017-12-29 11:43:30 +10:00
Dave Airlie	5951578043	radv/gfx9: fix block compression texture views. This ports a fix from amdvlk, to fix the sizing for mip levels when block compressed images are viewed using uncompressed views. Fixes: dEQP-VK.image.texel_view_compatible.graphic.extendedbc Fixes: `e38685cc62` 'Revert "radv: disable support for VEGA for now."' Reviewed-by: Bas Nieuwenhuizen <bas@basnieuwenhuizen.nl> Signed-off-by: Dave Airlie <airlied@redhat.com>	2017-12-29 11:42:47 +10:00
Dave Airlie	420627e6e7	radv/gfx9: fix buffer to image for 3d images on compute queues This fixes some of the broken: dEQP-VK.synchronization.op.multi_queue.64x64x8 tests. Fixes: `e38685cc62` 'Revert "radv: disable support for VEGA for now."' Reviewed-by: Bas Nieuwenhuizen <bas@basnieuwenhuizen.nl> Signed-off-by: Dave Airlie <airlied@redhat.com>	2017-12-29 09:37:09 +10:00
Dave Airlie	09612a62e1	radv/gfx9: fix 3d image clears on compute queues This fixes some of the broken: dEQP-VK.synchronization.op.multi_queue.64x64x8 tests. Fixes: `e38685cc62` 'Revert "radv: disable support for VEGA for now."' Reviewed-by: Bas Nieuwenhuizen <bas@basnieuwenhuizen.nl> Signed-off-by: Dave Airlie <airlied@redhat.com>	2017-12-29 09:37:05 +10:00
Dave Airlie	d08f267814	radv/gfx9: fix 3d image to image transfers on compute queues. This fixes some of the broken: dEQP-VK.synchronization.op.multi_queue.64x64x8 tests. Fixes: `e38685cc62` 'Revert "radv: disable support for VEGA for now."' Reviewed-by: Bas Nieuwenhuizen <bas@basnieuwenhuizen.nl> Signed-off-by: Dave Airlie <airlied@redhat.com>	2017-12-29 09:37:00 +10:00
Dave Airlie	ec1edd0fd2	radv: fix pipeline statistics end query on compute queue It's legal to a pipeline stat query on a compute queue, but we'd emit the wrong packet here. This should fix it to emit the correct packet. Noticed while inspecting the mpv hang. Fixes: `ad61eac250` (radv: factor out eop event writing code. (v2)) Reviewed-by: Bas Nieuwenhuizen <bas@basnieuwenhuizen.nl> Signed-off-by: Dave Airlie <airlied@redhat.com>	2017-12-28 19:31:01 +10:00
Dave Airlie	38e4467e99	radv: fix events on compute queues. The event emission wasn't sending the correct packet for gfx8 compute queues, which explains why it works on vega fine. This fixes the mpv vulkan hang. Fixes: `ad61eac250` (radv: factor out eop event writing code. (v2)) Reviewed-by: Bas Nieuwenhuizen <bas@basnieuwenhuizen.nl> Signed-off-by: Dave Airlie <airlied@redhat.com>	2017-12-28 19:30:32 +10:00
Dave Airlie	ff75d3a9aa	radv: move local bos usage to a perftest flag. These seem mildly unstable on vega, crashing CTS in various fun ways, and looks like leaking memory. Disable for now, but leave the option to enable them. Reviewed-by: Bas Nieuwenhuizen <bas@basnieuwenhuizen.nl> Signed-off-by: Dave Airlie <airlied@redhat.com>	2017-12-28 19:30:16 +10:00
Bas Nieuwenhuizen	a636208ace	radv: Always use fragment resolve if dest uses DCC. HW resolve does not support it either. Fixes: `2a04f5481d` "radv/meta: select resolve paths" Reviewed-by: Dave Airlie <airlied@redhat.com>	2017-12-28 00:30:47 +01:00
Bas Nieuwenhuizen	da192b50b2	radv: Use correct framebuffer size for partial FS resolves. Framebuffer is from 0,0, not (dst.x, dst.y). Fixes: `69136f4e63` "radv/meta: add resolve pass using fragment/vertex shaders" Reviewed-by: Dave Airlie <airlied@redhat.com>	2017-12-28 00:30:47 +01:00
Bas Nieuwenhuizen	73279da41d	radv: Fix fragment resolve destination offset. The position start at (dst.x, dst.y), so if we want the source to start at (src.x, src.y), we have to offset by (src.x-dst.x,src.y-dst.y). Haven't tested that this fixed anything yet, but found by inspection. Fixes: `69136f4e63` "radv/meta: add resolve pass using fragment/vertex shaders" Reviewed-by: Dave Airlie <airlied@redhat.com>	2017-12-28 00:26:07 +01:00
Bas Nieuwenhuizen	258ebe79a0	radv: Don't handle DCC in compute resolve. If the destination has DCC, we will use the FS resolve. Reviewed-by: Dave Airlie <airlied@redhat.com>	2017-12-28 00:26:07 +01:00
Bas Nieuwenhuizen	cebc9a119d	radv: Flush caches before subpass resolve. Fixes: `f4e499ec79` "radv: add initial non-conformant radv vulkan driver" Reviewed-by: Dave Airlie <airlied@redhat.com>	2017-12-28 00:26:07 +01:00
Bas Nieuwenhuizen	c39947ce30	radv: Invert condition for all samples identical during resolve. the samples_identical instruction returns 0 if they are differet, so we have to do the extra work if the result is 0, not if it is != 0. Fixes: `f4e499ec79` "radv: add initial non-conformant radv vulkan driver" Reviewed-by: Dave Airlie <airlied@redhat.com>	2017-12-28 00:26:07 +01:00
Dave Airlie	d2acf97e49	radv: don't do format replacement on tc compat htile surfaces. For copies the texture unit needs to know the depth format so it can read the htile data properly. This fixes: dEQP-VK.renderpass.suballocation.formats.d32_sfloat_s8_uint.load.clear Fixes: `ad3d98da9f` (radv: enable tc compatible htile for d32s8 also.) Reviewed-by: Bas Nieuwenhuizen <bas@basnieuwenhuizen.nl> Signed-off-by: Dave Airlie <airlied@redhat.com>	2017-12-28 05:24:52 +10:00
Dave Airlie	5ba26ed6e5	radv/gfx9: use correct stencil format for tc compat htile. This needs to correspond to the bit depth of the Z plane. noticed in passing reading amdvlk. Fixes: `fc6c77e162` (radv: fix TC-compat HTILE with VK_FORMAT_D32_SFLOAT_S8_UINT on Vega) Reviewed-by: Samuel Pitoiset <samuel.pitoiset@gmail.com> Reviewed-by: Bas Nieuwenhuizen <bas@basnieuwenhuizen.nl> Signed-off-by: Dave Airlie <airlied@redhat.com>	2017-12-28 05:23:49 +10:00
Samuel Pitoiset	3260a96c17	amd/common: rework set_userdata_location() and rename to set_loc() Signed-off-by: Samuel Pitoiset <samuel.pitoiset@gmail.com> Reviewed-by: Bas Nieuwenhuizen <bas@basnieuwenhuizen.nl>	2017-12-27 10:25:17 +01:00
Samuel Pitoiset	4221a816e2	amd/common: rename set_userdata_location_shader() to set_loc_shader() Signed-off-by: Samuel Pitoiset <samuel.pitoiset@gmail.com> Reviewed-by: Bas Nieuwenhuizen <bas@basnieuwenhuizen.nl>	2017-12-27 10:25:15 +01:00
Samuel Pitoiset	5081fd398e	amd/common: replace set_userdata_location_indirect() by set_loc_desc() Signed-off-by: Samuel Pitoiset <samuel.pitoiset@gmail.com> Reviewed-by: Bas Nieuwenhuizen <bas@basnieuwenhuizen.nl>	2017-12-27 10:25:13 +01:00
Samuel Pitoiset	f8202ef683	amd/common: rename radv_define_vs_user_sgprs_phase2() ... to set_vs_specific_input_locs(). Signed-off-by: Samuel Pitoiset <samuel.pitoiset@gmail.com> Reviewed-by: Bas Nieuwenhuizen <bas@basnieuwenhuizen.nl>	2017-12-27 10:25:11 +01:00
Samuel Pitoiset	9d5a1787ee	amd/common: rename radv_define_common_user_sgprs_phase2() ... to set_global_input_locs(). Signed-off-by: Samuel Pitoiset <samuel.pitoiset@gmail.com> Reviewed-by: Bas Nieuwenhuizen <bas@basnieuwenhuizen.nl>	2017-12-27 10:25:08 +01:00
Samuel Pitoiset	9a2393a510	amd/common: rename add_user_sgpr_array_argument() to add_array_arg() Signed-off-by: Samuel Pitoiset <samuel.pitoiset@gmail.com> Reviewed-by: Bas Nieuwenhuizen <bas@basnieuwenhuizen.nl>	2017-12-27 10:25:06 +01:00
Samuel Pitoiset	b6217bdbee	amd/common: replace add_sgpr_argument() by add_arg() Signed-off-by: Samuel Pitoiset <samuel.pitoiset@gmail.com> Reviewed-by: Bas Nieuwenhuizen <bas@basnieuwenhuizen.nl>	2017-12-27 10:25:04 +01:00
Samuel Pitoiset	32bbc9eb0f	amd/common: replace add_user_sgpr_argument() by add_arg() Signed-off-by: Samuel Pitoiset <samuel.pitoiset@gmail.com> Reviewed-by: Bas Nieuwenhuizen <bas@basnieuwenhuizen.nl>	2017-12-27 10:25:02 +01:00
Samuel Pitoiset	e946b5360d	amd/common: replace add_vgpr_argument() by add_arg() Signed-off-by: Samuel Pitoiset <samuel.pitoiset@gmail.com> Reviewed-by: Bas Nieuwenhuizen <bas@basnieuwenhuizen.nl>	2017-12-27 10:24:59 +01:00
Samuel Pitoiset	f1242a8976	amd/common: add new add_arg() helper for SGPRs/VGPRs arguments The idea is to clean up the add arguments logic. Signed-off-by: Samuel Pitoiset <samuel.pitoiset@gmail.com> Reviewed-by: Bas Nieuwenhuizen <bas@basnieuwenhuizen.nl>	2017-12-27 10:24:57 +01:00

1 2 3 4 5 ...

1754 commits