From 9b762a3caf161433a9cebb0ed37983beed632805 Mon Sep 17 00:00:00 2001
From: Vignesh Raman <vignesh.raman@collabora.com>
Date: Tue, 17 Sep 2024 17:39:01 +0530
Subject: [PATCH] ci/lava: update unit tests

Update unit tests to handle exit code in HWCI result output.

Co-developed-by: Guilherme Gallo <guilherme.gallo@collabora.com>
Signed-off-by: Vignesh Raman <vignesh.raman@collabora.com>
Part-of: <https://gitlab.freedesktop.org/mesa/mesa/-/merge_requests/31189>
---
 .gitlab-ci/tests/lava/helpers.py            | 22 +++--
 .gitlab-ci/tests/test_lava_job_submitter.py | 95 ++++++++++++++-------
 2 files changed, 76 insertions(+), 41 deletions(-)

diff --git a/.gitlab-ci/tests/lava/helpers.py b/.gitlab-ci/tests/lava/helpers.py
index d78aa1c10d1..82d8c81ef23 100644
--- a/.gitlab-ci/tests/lava/helpers.py
+++ b/.gitlab-ci/tests/lava/helpers.py
@@ -34,22 +34,22 @@ def create_lava_yaml_msg(
 
 
 def generate_testsuite_result(
-    name="test-mesa-ci", result="pass", metadata_extra=None, extra=None
+    name="test-mesa-ci", result="pass", exit_code=0, metadata_extra=None, extra=None
 ):
     if metadata_extra is None:
         metadata_extra = {}
     if extra is None:
         extra = {}
-    return {"metadata": {"result": result, **metadata_extra}, "name": name}
+    return {"metadata": {"result": result, "exit_code": exit_code, **metadata_extra}, "name": name}
 
 
 def jobs_logs_response(
-    finished=False, msg=None, lvl="target", result=None
+    finished=False, msg=None, lvl="target", result=None, exit_code=None
 ) -> Tuple[bool, str]:
     timed_msg = {"dt": str(datetime.now()), "msg": "New message", "lvl": lvl}
     if result:
         timed_msg["lvl"] = "target"
-        timed_msg["msg"] = f"hwci: mesa: {result}"
+        timed_msg["msg"] = f"hwci: mesa: {result}, exit_code: {exit_code}"
 
     logs = [timed_msg] if msg is None else msg
 
@@ -57,7 +57,10 @@ def jobs_logs_response(
 
 
 def section_aware_message_generator(
-    messages: dict[LogSectionType, Iterable[int]], result: Optional[str] = None
+    messages: dict[LogSectionType,
+    Iterable[int]],
+    result: Optional[str] = None,
+    exit_code: Optional[int] = None
 ) -> Iterable[tuple[dict, Iterable[int]]]:
     default = [1]
 
@@ -69,7 +72,7 @@ def section_aware_message_generator(
         if result and section_type == result_message_section:
             # To consider the job finished, the result `echo` should be produced
             # in the correct section
-            yield create_lava_yaml_msg(msg=f"hwci: mesa: {result}"), delay
+            yield create_lava_yaml_msg(msg=f"hwci: mesa: {result}, exit_code: {exit_code}"), delay
 
 
 def message_generator():
@@ -87,6 +90,7 @@ def generate_n_logs(
     tick_fn: Union[Generator, Iterable[int], int] = 1,
     level_fn=level_generator,
     result="pass",
+    exit_code=0,
 ):
     """Simulate a log partitionated in n components"""
     level_gen = level_fn()
@@ -109,7 +113,7 @@ def generate_n_logs(
                 yield jobs_logs_response(finished=False, msg=[], lvl=level)
 
             time_travel.tick(tick_sec)
-            yield jobs_logs_response(finished=True, result=result)
+            yield jobs_logs_response(finished=True, result=result, exit_code=exit_code)
 
 
 def to_iterable(tick_fn):
@@ -121,12 +125,12 @@ def to_iterable(tick_fn):
         return cycle((tick_fn,))
 
 
-def mock_logs(messages=None, result=None):
+def mock_logs(messages=None, result=None, exit_code=None):
     if messages is None:
         messages = {}
     with freeze_time(datetime.now()) as time_travel:
         # Simulate a complete run given by message_fn
-        for msg, tick_list in section_aware_message_generator(messages, result):
+        for msg, tick_list in section_aware_message_generator(messages, result, exit_code):
             for tick_sec in tick_list:
                 yield jobs_logs_response(finished=False, msg=[msg])
                 time_travel.tick(tick_sec)
diff --git a/.gitlab-ci/tests/test_lava_job_submitter.py b/.gitlab-ci/tests/test_lava_job_submitter.py
index 3b609fd036b..93db8664f1f 100644
--- a/.gitlab-ci/tests/test_lava_job_submitter.py
+++ b/.gitlab-ci/tests/test_lava_job_submitter.py
@@ -94,8 +94,8 @@ NETWORK_EXCEPTION = xmlrpc.client.ProtocolError("", 0, "test", {})
 XMLRPC_FAULT = xmlrpc.client.Fault(0, "test")
 
 PROXY_SCENARIOS = {
-    "simple pass case": (mock_logs(result="pass"), does_not_raise(), "pass", {}),
-    "simple fail case": (mock_logs(result="fail"), does_not_raise(), "fail", {}),
+    "simple pass case": (mock_logs(result="pass", exit_code=0), does_not_raise(), "pass", 0, {}),
+    "simple fail case": (mock_logs(result="fail", exit_code=1), does_not_raise(), "fail", 1, {}),
     "simple hung case": (
         mock_logs(
             messages={
@@ -105,18 +105,21 @@ PROXY_SCENARIOS = {
                 * 1000
             },
             result="fail",
+            exit_code=1,
         ),
         pytest.raises(MesaCIRetryError),
         "hung",
+        1,
         {},
     ),
     "leftover dump from last job in boot section": (
         (
             mock_lava_signal(LogSectionType.LAVA_BOOT),
-            jobs_logs_response(finished=False, msg=None, result="fail"),
+            jobs_logs_response(finished=False, msg=None, result="fail", exit_code=1),
         ),
         pytest.raises(MesaCIRetryError),
         "hung",
+        1,
         {},
     ),
     "boot works at last retry": (
@@ -129,9 +132,11 @@ PROXY_SCENARIOS = {
                 + [1]
             },
             result="pass",
+            exit_code=0,
         ),
         does_not_raise(),
         "pass",
+        0,
         {},
     ),
     "test case took too long": pytest.param(
@@ -143,46 +148,54 @@ PROXY_SCENARIOS = {
                 * (NUMBER_OF_MAX_ATTEMPTS + 1)
             },
             result="pass",
+            exit_code=0,
         ),
         pytest.raises(MesaCIRetryError),
         "pass",
+        0,
         {},
     ),
     "timed out more times than retry attempts": (
         generate_n_logs(n=4, tick_fn=9999999),
         pytest.raises(MesaCIRetryError),
         "fail",
+        1,
         {},
     ),
     "long log case, no silence": (
         mock_logs(
             messages={LogSectionType.TEST_CASE: [1] * (1000)},
             result="pass",
+            exit_code=0,
         ),
         does_not_raise(),
         "pass",
+        0,
         {},
     ),
     "no retries, testsuite succeed": (
-        mock_logs(result="pass"),
+        mock_logs(result="pass", exit_code=0),
         does_not_raise(),
         "pass",
-        {"testsuite_results": [generate_testsuite_result(result="pass")]},
+        0,
+        {"testsuite_results": [generate_testsuite_result(result="pass", exit_code=0)]},
     ),
     "no retries, but testsuite fails": (
-        mock_logs(result="fail"),
+        mock_logs(result="fail", exit_code=1),
         does_not_raise(),
         "fail",
-        {"testsuite_results": [generate_testsuite_result(result="fail")]},
+        1,
+        {"testsuite_results": [generate_testsuite_result(result="fail", exit_code=1)]},
     ),
     "no retries, one testsuite fails": (
-        generate_n_logs(n=1, tick_fn=0, result="fail"),
+        mock_logs(result="fail", exit_code=1),
         does_not_raise(),
         "fail",
+        1,
         {
             "testsuite_results": [
-                generate_testsuite_result(result="fail"),
-                generate_testsuite_result(result="pass"),
+                generate_testsuite_result(result="fail", exit_code=1),
+                generate_testsuite_result(result="pass", exit_code=0),
             ]
         },
     ),
@@ -190,13 +203,15 @@ PROXY_SCENARIOS = {
         generate_n_logs(n=NUMBER_OF_MAX_ATTEMPTS + 1, tick_fn=100000),
         pytest.raises(MesaCIRetryError),
         "fail",
+        1,
         {},
     ),
     # If a protocol error happens, _call_proxy will retry without affecting timeouts
     "unstable connection, ProtocolError followed by final message": (
-        (NETWORK_EXCEPTION, *list(mock_logs(result="pass"))),
+        (NETWORK_EXCEPTION, *list(mock_logs(result="pass", exit_code=0))),
         does_not_raise(),
         "pass",
+        0,
         {},
     ),
     # After an arbitrary number of retries, _call_proxy should call sys.exit
@@ -204,14 +219,15 @@ PROXY_SCENARIOS = {
         repeat(NETWORK_EXCEPTION),
         pytest.raises(SystemExit),
         "fail",
+        1,
         {},
     ),
-    "XMLRPC Fault": ([XMLRPC_FAULT], pytest.raises(MesaCIRetryError), False, {}),
+    "XMLRPC Fault": ([XMLRPC_FAULT], pytest.raises(MesaCIRetryError), False, 1, {}),
 }
 
 
 @pytest.mark.parametrize(
-    "test_log, expectation, job_result, proxy_args",
+    "test_log, expectation, job_result, exit_code, proxy_args",
     PROXY_SCENARIOS.values(),
     ids=PROXY_SCENARIOS.keys(),
 )
@@ -220,6 +236,7 @@ def test_retriable_follow_job(
     test_log,
     expectation,
     job_result,
+    exit_code,
     proxy_args,
     mock_proxy,
 ):
@@ -227,10 +244,11 @@ def test_retriable_follow_job(
         proxy = mock_proxy(side_effect=test_log, **proxy_args)
         job: LAVAJob = retriable_follow_job(proxy, "")
         assert job_result == job.status
+        assert exit_code == job.exit_code
 
 
-WAIT_FOR_JOB_SCENARIOS = {"one log run taking (sec):": (mock_logs(result="pass"))}
 
+WAIT_FOR_JOB_SCENARIOS = {"one log run taking (sec):": (mock_logs(result="pass", exit_code=0))}
 
 @pytest.mark.parametrize("wait_time", (DEVICE_HANGING_TIMEOUT_SEC * 2,))
 @pytest.mark.parametrize(
@@ -256,6 +274,7 @@ def test_simulate_a_long_wait_to_start_a_job(
     delta_time = end_time - start_time
 
     assert job.status == "pass"
+    assert job.exit_code == 0
     assert delta_time.total_seconds() >= wait_time
 
 
@@ -309,37 +328,43 @@ def test_log_corruption(mock_sleep, data_sequence, expected_exception, mock_prox
 LAVA_RESULT_LOG_SCENARIOS = {
     # the submitter should accept xtrace logs
     "Bash xtrace echo with kmsg interleaving": (
-        "echo hwci: mesa: pass[  737.673352] <LAVA_SIGNAL_ENDTC mesa-ci>",
-        "pass",
+        "echo hwci: mesa: pass, exit_code: 0[  737.673352] <LAVA_SIGNAL_ENDTC mesa-ci>",
+        "pass", 0,
     ),
     # the submitter should accept xtrace logs
     "kmsg result print": (
-        "[  737.673352] hwci: mesa: pass",
-        "pass",
+        "[  737.673352] hwci: mesa: pass, exit_code: 0",
+        "pass", 0,
     ),
     # if the job result echo has a very bad luck, it still can be interleaved
     # with kmsg
     "echo output with kmsg interleaving": (
-        "hwci: mesa: pass[  737.673352] <LAVA_SIGNAL_ENDTC mesa-ci>",
-        "pass",
+        "hwci: mesa: pass, exit_code: 0[  737.673352] <LAVA_SIGNAL_ENDTC mesa-ci>",
+        "pass", 0,
     ),
     "fail case": (
-        "hwci: mesa: fail",
-        "fail",
+        "hwci: mesa: fail, exit_code: 1",
+        "fail", 1,
+    ),
+    # fail case with different exit code
+    "fail case (exit code 101)": (
+        "hwci: mesa: fail, exit_code: 101",
+        "fail", 101,
     ),
 }
 
 
 @pytest.mark.parametrize(
-    "message, expectation",
+    "message, expected_status, expected_exit_code",
     LAVA_RESULT_LOG_SCENARIOS.values(),
     ids=LAVA_RESULT_LOG_SCENARIOS.keys(),
 )
-def test_parse_job_result_from_log(message, expectation, mock_proxy):
+def test_parse_job_result_from_log(message, expected_status, expected_exit_code, mock_proxy):
     job = LAVAJob(mock_proxy(), "")
     job.parse_job_result_from_log([message])
 
-    assert job.status == expectation
+    assert job.status == expected_status
+    assert job.exit_code == expected_exit_code
 
 
 @pytest.mark.slow(
@@ -428,11 +453,11 @@ def test_full_yaml_log(mock_proxy, frozen_time, lava_job_submitter):
 
 
 @pytest.mark.parametrize(
-    "validate_only,finished_job_status,expected_combined_status,expected_exit_code",
+    "validate_only,finished_job_status,job_exit_code,expected_combined_status",
     [
-        (True, "pass", None, None),
-        (False, "pass", "pass", 0),
-        (False, "fail", "fail", 1),
+        (True, "pass", None, None,),
+        (False, "pass", 0, "pass",),
+        (False, "fail", 1, "fail",),
     ],
     ids=[
         "validate_only_no_job_submission",
@@ -441,11 +466,12 @@ def test_full_yaml_log(mock_proxy, frozen_time, lava_job_submitter):
     ],
 )
 def test_job_combined_status(
+    mock_proxy,
     lava_job_submitter,
     validate_only,
     finished_job_status,
+    job_exit_code,
     expected_combined_status,
-    expected_exit_code,
 ):
     lava_job_submitter.validate_only = validate_only
 
@@ -456,22 +482,27 @@ def test_job_combined_status(
     ) as mock_prepare_submission, patch("sys.exit"):
         from lava.lava_job_submitter import STRUCTURAL_LOG
 
-        mock_retriable_follow_job.return_value = MagicMock(status=finished_job_status)
+        mock_retriable_follow_job.return_value = MagicMock(
+            status=finished_job_status, exit_code=job_exit_code
+        )
 
         mock_job_definition = MagicMock(spec=str)
         mock_prepare_submission.return_value = mock_job_definition
         original_status: str = STRUCTURAL_LOG.get("job_combined_status")
+        original_exit_code: int = STRUCTURAL_LOG.get("job_exit_code")
 
         if validate_only:
             lava_job_submitter.submit()
             mock_retriable_follow_job.assert_not_called()
             assert STRUCTURAL_LOG.get("job_combined_status") == original_status
+            assert STRUCTURAL_LOG.get("job_exit_code") == original_exit_code
             return
 
         try:
             lava_job_submitter.submit()
 
         except SystemExit as e:
-            assert e.code == expected_exit_code
+            assert e.code == job_exit_code
 
         assert STRUCTURAL_LOG["job_combined_status"] == expected_combined_status
+        assert STRUCTURAL_LOG["job_exit_code"] == job_exit_code