Fix EPQ crash from missing partition directory in EState
authorAmit Langote <amitlan@postgresql.org>
Thu, 16 Oct 2025 05:01:44 +0000 (14:01 +0900)
committerAmit Langote <amitlan@postgresql.org>
Thu, 16 Oct 2025 05:01:44 +0000 (14:01 +0900)
EvalPlanQualStart() failed to propagate es_partition_directory into
the child EState used for EPQ rechecks. When execution time partition
pruning ran during the EPQ scan, executor code dereferenced a NULL
partition directory and crashed.

Previously, propagating es_partition_directory into the EPQ EState was
unnecessary because CreatePartitionPruneState(), which sets it on
demand, also initialized the exec-pruning context.  After commit
d47cbf474, CreatePartitionPruneState() now initializes only the init-
time pruning context, leaving exec-pruning context initialization to
ExecInitNode(). Since EvalPlanQualStart() runs only ExecInitNode() and
not CreatePartitionPruneState(), it can encounter a NULL
es_partition_directory.  Other executor fields initialized during
CreatePartitionPruneState() are already copied into the child EState
thanks to commit 8741e48e5d, but es_partition_directory was missed.

Fix by borrowing the parent estate's  es_partition_directory in
EvalPlanQualStart(), and by clearing that field in EvalPlanQualEnd()
so the parent remains responsible for freeing the directory.

Add an isolation test permutation that triggers EPQ with execution-
time partition pruning, the case that reproduces this crash.

Bug: #19078
Reported-by: Yuri Zamyatin <yuri@yrz.am>
Diagnosed-by: David Rowley <dgrowleyml@gmail.com>
Author: David Rowley <dgrowleyml@gmail.com>
Co-authored-by: Amit Langote <amitlangote09@gmail.com>
Discussion: https://postgr.es/m/19078-dfd62f840a2c0766@postgresql.org
Backpatch-through: 18

src/backend/executor/execMain.c
src/test/isolation/expected/eval-plan-qual.out
src/test/isolation/specs/eval-plan-qual.spec

index 831c55ce78740d695107c8dbfb52a790592581f9..713e926329c38366d83e71680f6b329a1884c1d4 100644 (file)
@@ -3093,6 +3093,9 @@ EvalPlanQualStart(EPQState *epqstate, Plan *planTree)
    rcestate->es_part_prune_states = parentestate->es_part_prune_states;
    rcestate->es_part_prune_results = parentestate->es_part_prune_results;
 
+   /* We'll also borrow the es_partition_directory from the parent state */
+   rcestate->es_partition_directory = parentestate->es_partition_directory;
+
    /*
     * Initialize private state information for each SubPlan.  We must do this
     * before running ExecInitNode on the main query tree, since
@@ -3210,6 +3213,13 @@ EvalPlanQualEnd(EPQState *epqstate)
 
    MemoryContextSwitchTo(oldcontext);
 
+   /*
+    * NULLify the partition directory before freeing the executor state.
+    * Since EvalPlanQualStart() just borrowed the parent EState's directory,
+    * we'd better leave it up to the parent to delete it.
+    */
+   estate->es_partition_directory = NULL;
+
    FreeExecutorState(estate);
 
    /* Mark EPQState idle */
index 60eca44b4e37c294b487501ed78b7895781bed72..05fffe0d5708f281067e0e4f8f01ea791590768e 100644 (file)
@@ -1466,3 +1466,10 @@ step s2pp3: EXECUTE epd(1); <waiting ...>
 step c1: COMMIT;
 step s2pp3: <... completed>
 step c2: COMMIT;
+
+starting permutation: s1pp1 s2pp4 c1 c2
+step s1pp1: UPDATE another_parttbl SET b = b + 1 WHERE a = 1;
+step s2pp4: DELETE FROM another_parttbl WHERE a = (SELECT 1); <waiting ...>
+step c1: COMMIT;
+step s2pp4: <... completed>
+step c2: COMMIT;
index 64afffb1d83b11b97edfaa397d267ef98b366b8b..80e1e6bb307b3361aa4030ee6267d35301164ca5 100644 (file)
@@ -316,6 +316,7 @@ step r2 { ROLLBACK; }
 step s2pp1 { SET plan_cache_mode TO force_generic_plan; }
 step s2pp2 { PREPARE epd AS DELETE FROM another_parttbl WHERE a = $1; }
 step s2pp3 { EXECUTE epd(1); }
+step s2pp4 { DELETE FROM another_parttbl WHERE a = (SELECT 1); }
 
 session s3
 setup      { BEGIN ISOLATION LEVEL READ COMMITTED; }
@@ -423,3 +424,4 @@ permutation sys1 sysmerge2 c1 c2
 
 # Exercise run-time partition pruning code in an EPQ recheck
 permutation s1pp1 s2pp1 s2pp2 s2pp3 c1 c2
+permutation s1pp1 s2pp4 c1 c2