snowflakedb · sfc-gh-aalam · Jun 14, 2024 · May 22, 2024 · May 22, 2024 · May 29, 2024
@@ -927,7 +927,7 @@ def do_resolve_with_resolved_children(
                 )
 
         if isinstance(logical_plan, UnresolvedRelation):
-            return self.plan_builder.table(logical_plan.name)
+            return self.plan_builder.table(logical_plan.name, logical_plan)
 
         if isinstance(logical_plan, SnowflakeCreateTable):
             return self.plan_builder.save_as_table(

@@ -2,8 +2,23 @@
 # Copyright (c) 2012-2024 Snowflake Computing Inc. All rights reserved.
 #
 
+import sys
 from typing import AbstractSet, Optional
 
+# collections.Counter does not pass type checker. Changes with appropriate type hints were made in 3.9+
+if sys.version_info <= (3, 9):
-if sys.version_info <= (3, 9):
+if sys.version_info < (3, 9):
-if sys.version_info <= (3, 9):
+if sys.version_info < (3, 9):
+    import collections
+    import typing
+
+    KT = typing.TypeVar("KT")
+
+    class Counter(collections.Counter, typing.Counter[KT]):
+        pass
+
+else:
+    from collections import Counter
+
+from snowflake.snowpark._internal.analyzer.complexity_stat import ComplexityStat
 from snowflake.snowpark._internal.analyzer.expression import (
     Expression,
     derive_dependent_columns,
@@ -26,6 +41,10 @@ def __str__(self):
     def dependent_column_names(self) -> Optional[AbstractSet[str]]:
         return derive_dependent_columns(self.left, self.right)
 
+    @property
+    def individual_complexity_stat(self) -> Counter[str]:
+        return Counter({ComplexityStat.LOW_IMPACT.value: 1})
+
 
 class BinaryArithmeticExpression(BinaryExpression):
     pass

@@ -2,8 +2,23 @@
 # Copyright (c) 2012-2024 Snowflake Computing Inc. All rights reserved.
 #
 
+import sys
 from typing import List, Optional
 
+# collections.Counter does not pass type checker. Changes with appropriate type hints were made in 3.9+
+if sys.version_info <= (3, 9):
+    import collections
+    import typing
+
+    KT = typing.TypeVar("KT")
+
+    class Counter(collections.Counter, typing.Counter[KT]):
+        pass
+
+else:
+    from collections import Counter
+
+from snowflake.snowpark._internal.analyzer.complexity_stat import ComplexityStat
 from snowflake.snowpark._internal.analyzer.expression import Expression
 from snowflake.snowpark._internal.analyzer.snowflake_plan_node import LogicalPlan
 from snowflake.snowpark._internal.error_message import SnowparkClientExceptionMessages
@@ -69,7 +84,10 @@ def __init__(self, left: LogicalPlan, right: LogicalPlan) -> None:
 
 
 class SetOperation(BinaryNode):
-    pass
+    @property
+    def individual_complexity_stat(self) -> Counter[str]:
+        # (left) operator (right)
+        return Counter({ComplexityStat.SET_OPERATION.value: 1})
 
 
 class Except(SetOperation):
@@ -187,3 +205,23 @@ def __init__(
     @property
     def sql(self) -> str:
         return self.join_type.sql
+
+    @property
+    def individual_complexity_stat(self) -> Counter[str]:
+        # SELECT * FROM (left) AS left_alias join_type_sql JOIN (right) AS right_alias match_cond, using_cond, join_cond
+        estimate = Counter({ComplexityStat.JOIN.value: 1})
+        if isinstance(self.join_type, UsingJoin) and self.join_type.using_columns:
+            estimate += Counter(
 if isinstance(logical_plan, Join): 
     join_condition = ( 
         self.analyze( 
             logical_plan.join_condition, df_aliased_col_name_to_real_col_name 
         ) 
         if logical_plan.join_condition 
         else "" 
     ) 
     match_condition = ( 
         self.analyze( 
             logical_plan.match_condition, df_aliased_col_name_to_real_col_name 
         ) 
         if logical_plan.match_condition 
         else "" 
     ) 
     return self.plan_builder.join( 
         resolved_children[logical_plan.left], 
         resolved_children[logical_plan.right], 
         logical_plan.join_type, 
         join_condition, 
         match_condition, 
         logical_plan, 
         self.session.conf.get("use_constant_subquery_alias", False), 
     ) 
 def join_statement( 
     left: str, 
     right: str, 
     join_type: JoinType, 
     join_condition: str, 
     match_condition: str, 
     use_constant_subquery_alias: bool, 
 ) -> str: 
     if isinstance(join_type, (LeftSemi, LeftAnti)): 
         return left_semi_or_anti_join_statement( 
             left, right, join_type, join_condition, use_constant_subquery_alias 
         ) 
     if isinstance(join_type, AsOf): 
         return asof_join_statement( 
             left, right, join_condition, match_condition, use_constant_subquery_alias 
         ) 
     if isinstance(join_type, UsingJoin) and isinstance( 
         join_type.tpe, (LeftSemi, LeftAnti) 
     ): 
         raise ValueError(f"Unexpected using clause in {join_type.tpe} join") 
     return snowflake_supported_join_statement( 
         left, 
         right, 
         join_type, 
         join_condition, 
         match_condition, 
         use_constant_subquery_alias, 
     ) 
 if isinstance(logical_plan, Join): 
     join_condition = ( 
         self.analyze( 
             logical_plan.join_condition, df_aliased_col_name_to_real_col_name 
         ) 
         if logical_plan.join_condition 
         else "" 
     ) 
     match_condition = ( 
         self.analyze( 
             logical_plan.match_condition, df_aliased_col_name_to_real_col_name 
         ) 
         if logical_plan.match_condition 
         else "" 
     ) 
     return self.plan_builder.join( 
         resolved_children[logical_plan.left], 
         resolved_children[logical_plan.right], 
         logical_plan.join_type, 
         join_condition, 
         match_condition, 
         logical_plan, 
         self.session.conf.get("use_constant_subquery_alias", False), 
     ) 
 def join_statement( 
     left: str, 
     right: str, 
     join_type: JoinType, 
     join_condition: str, 
     match_condition: str, 
     use_constant_subquery_alias: bool, 
 ) -> str: 
     if isinstance(join_type, (LeftSemi, LeftAnti)): 
         return left_semi_or_anti_join_statement( 
             left, right, join_type, join_condition, use_constant_subquery_alias 
         ) 
     if isinstance(join_type, AsOf): 
         return asof_join_statement( 
             left, right, join_condition, match_condition, use_constant_subquery_alias 
         ) 
     if isinstance(join_type, UsingJoin) and isinstance( 
         join_type.tpe, (LeftSemi, LeftAnti) 
     ): 
         raise ValueError(f"Unexpected using clause in {join_type.tpe} join") 
     return snowflake_supported_join_statement( 
         left, 
         right, 
         join_type, 
         join_condition, 
         match_condition, 
         use_constant_subquery_alias, 
     ) 
+                {ComplexityStat.COLUMN.value: len(self.join_type.using_columns)}
+            )
+        estimate += (
+            self.join_condition.cumulative_complexity_stat
+            if self.join_condition
+            else Counter()
+        )
+        estimate += (
+            self.match_condition.cumulative_complexity_stat
+            if self.match_condition
+            else Counter()
+        )
+        return estimate
diff --git a/src/snowflake/snowpark/_internal/analyzer/complexity_stat.py b/src/snowflake/snowpark/_internal/analyzer/complexity_stat.py
@@ -0,0 +1,24 @@
+#
+# Copyright (c) 2012-2024 Snowflake Computing Inc. All rights reserved.
+#
+
+from enum import Enum
+
+
+class ComplexityStat(Enum):
+    FILTER = "filter"
+    ORDER_BY = "order_by"
+    JOIN = "join"
+    SET_OPERATION = "set_operation"  # UNION, EXCEPT, INTERSECT, UNION ALL
+    SAMPLE = "sample"
+    PIVOT = "pivot"
+    UNPIVOT = "unpivot"
+    WINDOW = "window"
+    GROUP_BY = "group_by"
+    PARTITION_BY = "partition_by"
+    CASE_WHEN = "case_when"
+    LITERAL = "literal"
+    COLUMN = "column"
+    FUNCTION = "function"
+    IN = "in"
+    LOW_IMPACT = "low_impact"