AQuery/reconstruct/expr.py

from typing import Optional, Set

from engine.types import *
from reconstruct.ast import ast_node
from reconstruct.storage import ColRef, Context

# TODO: Decouple expr and upgrade architecture
# C_CODE : get ccode/sql code?
# projections : C/SQL/decltype string
# orderby/joins/where : SQL only
# assumption/groupby : C/sql
# is_udfexpr: C only

class expr(ast_node):
    name='expr'
    valid_joincond = {
        0 : ('and', 'eq', 'not'),
        1 : ('or', 'neq', 'not'),
        2 : ('', '', '')
    }
    @property
    def udf_decltypecall(self):
        return self._udf_decltypecall if self._udf_decltypecall else self.sql
    
    @udf_decltypecall.setter
    def udf_decltypecall(self, val):
        self._udf_decltypecall = val
    
    @property
    def need_decltypestr(self):
        return self._udf_decltypecall is not None
    
    def __init__(self, parent, node, *, c_code = None, supress_undefined = False):
        from reconstruct.ast import projection, udf

        # gen2 expr have multi-passes
        # first pass parse json into expr tree
        # generate target code in later passes upon need
        self.children = []
        self.opname = ''
        self.curr_code = ''
        self.counts = {}
        self.type = None
        self.raw_col = None
        self.udf : Optional[udf] = None
        self.inside_agg = False
        self.is_special = False
        self.is_ColExpr = False
        self.is_recursive_call_inudf = False
        self.codlets : list = []
        self.codebuf : Optional[str] = None
        self._udf_decltypecall = None
        self.node = node
        self.supress_undefined = supress_undefined
        if(type(parent) is expr):
            self.next_valid = parent.next_valid
            self.inside_agg = parent.inside_agg
            self.is_udfexpr = parent.is_udfexpr
            self.is_agg_func = parent.is_agg_func
            self.root : expr = parent.root
            self.c_code = parent.c_code
            self.builtin_vars = parent.builtin_vars
        else:
            self.join_conditions = []
            self.next_valid = 0
            self.is_agg_func = False
            self.is_udfexpr = type(parent) is udf
            self.root : expr = self
            self.c_code = self.is_udfexpr or type(parent) is projection
            if self.is_udfexpr:
                self.udf : udf = parent
                self.builtin_vars = self.udf.builtin.keys()
            else:
                self.builtin_vars = []
        if type(c_code) is bool:
            self.c_code = c_code
        
        self.udf_called = None
        self.cols_mentioned : Optional[set[ColRef]] = None
        ast_node.__init__(self, parent, node, None)

    def init(self, _):
        from reconstruct.ast import _tmp_join_union, projection
        parent = self.parent
        self.is_compound = parent.is_compound if type(parent) is expr else False
        if type(parent) in [projection, expr, _tmp_join_union]:
            self.datasource = parent.datasource
        else:
            self.datasource = self.context.datasource
        self.udf_map = parent.context.udf_map
        self.func_maps = {**builtin_func, **self.udf_map, **user_module_func}
        self.operators = {**builtin_operators, **self.udf_map, **user_module_func}
        self.ext_aggfuncs = ['sum', 'avg', 'count', 'min', 'max', 'last', 'first', 'prev', 'next']
        
    def produce(self, node):
        from engine.utils import enlist
        from reconstruct.ast import udf, projection
        
        if type(node) is dict:
            if 'literal' in node:
                node = node['literal']
            else:
                if len(node) > 1:
                    print(f'Parser Error: {node} has more than 1 dict entry.')

                is_joincond = False
                for key, val in node.items():
                    key = key.lower()
                    if key not in self.valid_joincond[self.next_valid]:
                        self.next_valid = 2
                    else:
                        if key == self.valid_joincond[self.next_valid][2]:
                            self.next_valid = not self.next_valid
                        elif key == self.valid_joincond[self.next_valid][1]:
                            self.next_valid = 2
                            is_joincond = True
                    if key in self.operators:
                        if key in builtin_func:
                            if self.is_agg_func:
                                self.root.is_special = True # Nested Aggregation
                            else:
                                self.is_agg_func = True
                        
                        op = self.operators[key]
                        count_distinct = False
                        if key == 'count' and type(val) is dict and 'distinct' in val:
                            count_distinct = True
                            val = val['distinct']
                            
                        val = enlist(val)
                        exp_vals = []
                        for v in val:
                            if (
                                    type(v) is str and  
                                    '*' in v and 
                                    key != 'count'
                                ):
                                cols = self.datasource.get_cols(v)
                                if cols:
                                    for c in cols:
                                        exp_vals.append(expr(self, c.name, c_code=self.c_code))
                            else:
                                exp_vals.append(expr(self, v, c_code=self.c_code))
                                
                        self.children = exp_vals
                        self.opname = key
                        
                        str_vals = [e.sql for e in exp_vals]
                        type_vals = [e.type for e in exp_vals]
                        is_compound = max([e.is_compound for e in exp_vals])
                        if key in self.ext_aggfuncs:
                            self.is_compound = max(0, is_compound - 1)
                        else:
                            self.is_compound = is_compound
                        try:
                            self.type = op.return_type(*type_vals)
                        except AttributeError as e:
                            if type(self.root.parent) is not udf:
                                # TODO: do something when this is not an error
                                print(f'alert: {e}')
                                pass
                            self.type = AnyT
                            
                        if count_distinct: # inject distinct col later
                            self.sql = f'{{{op(self.c_code, *str_vals, True)}}}'
                        else:
                            self.sql = op(self.c_code, *str_vals)
                            
                        special_func = [*self.context.udf_map.keys(), *self.context.module_map.keys(), 
                                        "maxs", "mins", "avgs", "sums", "deltas", "last", "first", 
                                        "stddevs", "vars", "ratios", "pack", "truncate"]
                        
                        if (
                                self.context.special_gb 
                                    or 
                                (
                                    type(self.root.parent) is projection 
                                        and
                                    self.root.parent.force_use_spgb
                                )
                           ):
                            special_func = [*special_func, *self.ext_aggfuncs]
                            
                        if key in special_func and not self.is_special:
                            self.is_special = True
                            if key in self.context.udf_map:
                                self.root.udf_called = self.context.udf_map[key]
                                if self.is_udfexpr and key == self.root.udf.name:
                                    self.root.is_recursive_call_inudf = True
                            elif key in user_module_func.keys():
                                udf.try_init_udf(self.context)                           
                            # TODO: make udf_called a set!
                            p = self.parent
                            while type(p) is expr and not p.udf_called:
                                p.udf_called = self.udf_called
                                p = p.parent
                            p = self.parent
                            while type(p) is expr and not p.is_special:
                                p.is_special = True
                                p = p.parent

                        need_decltypestr = any([e.need_decltypestr for e in exp_vals])        
                        if need_decltypestr or (self.udf_called and type(op) is udf):
                            decltypestr_vals = [e.udf_decltypecall for e in exp_vals]
                            self.udf_decltypecall = op(self.c_code, *decltypestr_vals)

                            if self.udf_called and type(op) is udf:
                                self.udf_decltypecall = op.decltypecall(self.c_code, *decltypestr_vals)
                
                    elif self.is_udfexpr:
                        var_table = self.root.udf.var_table
                        vec = key.split('.')
                        _vars = [*var_table, *self.builtin_vars]
                        def get_vname (node):
                            if node in self.builtin_vars:
                                self.root.udf.builtin[node].enabled = True
                                self.builtin_var = node
                                return node
                            else:
                                return var_table[node]
                        if vec[0] not in _vars:
                            # print(f'Use of undefined variable {vec[0]}')
                            # TODO: do something when this is not an error
                            pass
                        else:
                            vname = get_vname(vec[0])
                            val = enlist(val)
                            if(len(val) > 2):
                                print('Warning: more than 2 indexes found for subvec operator.')
                            ex = [expr(self, v, c_code = self.c_code) for v in val]
                            idxs = ', '.join([e.sql for e in ex])
                            self.sql = f'{vname}.subvec({idxs})'
                            if any([e.need_decltypestr for e in ex]):
                                self.udf_decltypecall = f'{vname}.subvec({[", ".join([e.udf_decltypecall for e in ex])]})'
                        if key == 'get' and len(val) > 1:
                            ex_vname = expr(self, val[0], c_code=self.c_code)
                            self.sql = f'{ex_vname.sql}[{expr(self, val[1], c_code=self.c_code).sql}]'
                            if hasattr(ex_vname, 'builtin_var'):
                                if not hasattr(self, 'builtin_var'):
                                    self.builtin_var = []
                                self.builtin_var = [*self.builtin_var, *ex_vname.builtin_var]
                                self.udf_decltypecall = ex_vname.sql
                    else:
                        print(f'Undefined expr: {key}{val}')
                
                if (is_joincond and len(self.children) == 2
                    and all([c.is_ColExpr for c in self.children])) :
                    self.root.join_conditions.append(
                            (self.children[0].raw_col, self.children[1].raw_col)
                        )
                    
        if type(node) is str:
            if self.is_udfexpr:
                curr_udf : udf = self.root.udf
                var_table = curr_udf.var_table
                split = node.split('.')
                if split[0] in var_table:
                    varname = var_table[split[0]]
                    if curr_udf.agg and varname in curr_udf.vecs:
                        if len(split) > 1:
                            if split[1] == 'vec':
                                self.sql += varname
                            elif split[1] == 'len':
                                self.sql += f'{varname}.size'
                            else:
                                print(f'no member {split[1]} in object {varname}')
                        else:
                            self.sql += f'{varname}[{curr_udf.idx_var}]'
                    else:
                        self.sql += varname
                elif self.supress_undefined or split[0] in self.builtin_vars:
                    self.sql += node
                    if split[0] in self.builtin_vars:
                        curr_udf.builtin[split[0]].enabled = True
                        self.builtin_var = split[0]
                else:
                    print(f'Undefined varname: {split[0]}')
                
    
            # get the column from the datasource in SQL context
            else:
                if self.datasource is not None:
                    if (node == '*' and 
                        not (type(self.parent) is expr 
                             and 'count' in self.parent.node)):
                        self.datasource.all_cols(ordered = True)
                    else:
                        self.raw_col = self.datasource.parse_col_names(node)
                        self.raw_col = self.raw_col if type(self.raw_col) is ColRef else None
                if self.raw_col is not None:
                    self.is_ColExpr = True
                    table_name = ''
                    if '.' in node:
                        table_name = self.raw_col.table.table_name
                        if self.raw_col.table.alias:
                            alias = iter(self.raw_col.table.alias)
                            try:
                                a = next(alias)
                                while(not a or a == table_name):
                                    a = next(alias)
                                if (a and a != table_name):
                                    table_name = a
                            except StopIteration:
                                pass
                    if table_name:
                        table_name = table_name + '.'
                    self.sql = table_name + self.raw_col.name
                    self.type = self.raw_col.type
                    self.is_compound = True
                    self.is_compound += self.raw_col.compound
                    self.opname = self.raw_col
                else:
                    self.sql = '\'' + node + '\'' if node != '*' else '*'
                    self.type = StrT
                    self.opname = self.sql
                if self.c_code and self.datasource is not None:
                    if (type(self.parent) is expr and 
                        'distinct' in self.parent.node and 
                        not self.is_special):
                        # this node is executed by monetdb
                        # gb condition, not special
                        self.sql  = f'distinct({self.sql})'
                    self.sql = f'{{y(\"{self.sql}\")}}'
        elif type(node) is bool:
            self.type = BoolT
            self.opname = node
            if self.c_code:
                self.sql = '1' if node else '0'
            else:
                self.sql = 'TRUE' if node else 'FALSE'
        elif type(node) is not dict:
            self.sql = f'{node}'
            self.opname = node
            if type(node) is int:
                if (node >= 2**63 - 1 or node <= -2**63):
                    self.type = HgeT
                elif (node >= 2**31 - 1 or node <= -2**31):
                    self.type = LongT
                elif node >= 2**15 - 1 or node <= -2**15:
                    self.type = IntT
                elif node >= 2**7 - 1 or node <= -2**7:
                    self.type = ShortT
                else:
                    self.type = ByteT
            elif type(node) is float:
                self.type = DoubleT
    
    def finalize(self, override = False):
        from reconstruct.ast import udf
        if self.codebuf is None or override:
            self.codebuf = ''
            for c in self.codlets:
                if type(c) is str:
                    self.codebuf += c
                elif type(c) is udf:
                    self.codebuf += c()
                elif type(c) is expr:
                    self.codebuf += c.finalize(override=override)
        return self.codebuf

    def codegen(self, delegate):
        self.curr_code = ''
        for c in self.children:
            self.curr_code += c.codegen(delegate)
        return self.curr_code
    
    def __str__(self):
        return self.sql
    def __repr__(self):
        return self.__str__()
    
    # builtins is readonly, so it's okay to set default value as an object
    # eval is only called at root expr.
    def eval(self, c_code = None, y = lambda t: t, 
             materialize_builtin = False, _decltypestr = False, 
             count = lambda : 'count', var_inject = None, 
             *, 
             gettype = False):
        assert(self.is_root)
        def call(decltypestr = False) -> str:
            nonlocal c_code, y, materialize_builtin, count, var_inject
            if var_inject:
                for k, v in var_inject.items():
                    locals()[k] = v
            if self.udf_called is not None:
                loc = locals()
                builtin_vars = self.udf_called.builtin_used
                for b in self.udf_called.builtin_var.all:
                        exec(f'loc["{b}"] = lambda: "{{{b}()}}"')
                if builtin_vars:
                    if type(materialize_builtin) is dict:
                        for b in builtin_vars:
                            exec(f'loc["{b}"] = lambda: "{materialize_builtin[b]}"')
                    elif self.is_recursive_call_inudf:
                        for b in builtin_vars:
                            exec(f'loc["{b}"] = lambda : "{b}"')
                
            x = self.c_code if c_code is None else c_code
            from engine.utils import escape_qoutes
            if decltypestr:
                return eval('f\'' + escape_qoutes(self.udf_decltypecall) + '\'')
            self.sql.replace("'", "\\'")
            return eval('f\'' + escape_qoutes(self.sql) + '\'')
        if self.is_recursive_call_inudf or (self.need_decltypestr and self.is_udfexpr) or gettype:
            return call
        else:
            return call(_decltypestr)
        
    @property
    def is_root(self):
        return self.root == self


# For UDFs: first check if agg variable is used as vector 
# if not, then check if its length is used
class fastscan(expr):
    name = 'fastscan'
    
    def init(self, _):
        self.vec_vars = set()
        self.requested_lens = set()
        super().init(self, _)
        
    def process(self, key : str):
        segs = key.split('.')
        var_table = self.root.udf.var_table
        if segs[0] in var_table and len(segs) > 1:
            if segs[1] == 'vec':
                self.vec_vars.add(segs[0])
            elif segs[1] == 'len':
                self.requested_lens.add(segs[0])
        
    def produce(self, node):
        from engine.utils import enlist
        if type(node) is dict:
            for key, val in node.items():
                if key in self.operators:
                    val = enlist(val)
                elif self.is_udfexpr:
                    self.process(key)
                [fastscan(self, v, c_code = self.c_code) for v in val]

        elif type(node) is str:
            self.process(node)


class getrefs(expr):
    name = 'getrefs'
    
    def init(self, _):
        self.datasource.rec = set()
        self.rec = None
        
    def produce(self, node):
        from engine.utils import enlist
        if type(node) is dict:
            for key, val in node.items():
                if key in self.operators:
                    val = enlist(val)
                [getrefs(self, v, c_code = self.c_code) for v in val]

        elif type(node) is str:
             self.datasource.parse_col_names(node)
    
    def consume(self, _):
        if self.root == self:
            self.rec = self.datasource.rec
            self.datasource.rec = None
bug fix on select into 2 years ago			`from typing import Optional, Set`
read complex data from csv 2 years ago
			`from engine.types import *`
fix gitw 2 years ago			`from reconstruct.ast import ast_node`
simple udf code generation 2 years ago			`from reconstruct.storage import ColRef, Context`
fix gitw 2 years ago
simple udf code generation 2 years ago			`# TODO: Decouple expr and upgrade architecture`
			`# C_CODE : get ccode/sql code?`
			`# projections : C/SQL/decltype string`
			`# orderby/joins/where : SQL only`
			`# assumption/groupby : C/sql`
			`# is_udfexpr: C only`

fix gitw 2 years ago			`class expr(ast_node):`
			`name='expr'`
Updated instructions, bulid drivers, bug fixes 2 years ago			`valid_joincond = {`
			`0 : ('and', 'eq', 'not'),`
			`1 : ('or', 'neq', 'not'),`
			`2 : ('', '', '')`
			`}`
simple udf code generation 2 years ago			`@property`
			`def udf_decltypecall(self):`
			`return self._udf_decltypecall if self._udf_decltypecall else self.sql`

			`@udf_decltypecall.setter`
			`def udf_decltypecall(self, val):`
			`self._udf_decltypecall = val`

			`@property`
			`def need_decltypestr(self):`
			`return self._udf_decltypecall is not None`

			`def __init__(self, parent, node, *, c_code = None, supress_undefined = False):`
			`from reconstruct.ast import projection, udf`
read complex data from csv 2 years ago
imporved build driver, basic support for count() 2 years ago			`# gen2 expr have multi-passes`
			`# first pass parse json into expr tree`
			`# generate target code in later passes upon need`
			`self.children = []`
			`self.opname = ''`
			`self.curr_code = ''`
			`self.counts = {}`
udf support for monetdbe backend 2 years ago			`self.type = None`
fix gitw 2 years ago			`self.raw_col = None`
simple udf code generation 2 years ago			`self.udf : Optional[udf] = None`
fix gitw 2 years ago			`self.inside_agg = False`
udf support for monetdbe backend 2 years ago			`self.is_special = False`
simple udf code generation 2 years ago			`self.is_ColExpr = False`
			`self.is_recursive_call_inudf = False`
			`self.codlets : list = []`
			`self.codebuf : Optional[str] = None`
			`self._udf_decltypecall = None`
fixed int128 problem, groupby agg 2 years ago			`self.node = node`
simple udf code generation 2 years ago			`self.supress_undefined = supress_undefined`
fix gitw 2 years ago			`if(type(parent) is expr):`
Updated instructions, bulid drivers, bug fixes 2 years ago			`self.next_valid = parent.next_valid`
fix gitw 2 years ago			`self.inside_agg = parent.inside_agg`
simple udf code generation 2 years ago			`self.is_udfexpr = parent.is_udfexpr`
regression: nested aggregation support 2 years ago			`self.is_agg_func = parent.is_agg_func`
simple udf code generation 2 years ago			`self.root : expr = parent.root`
udf support for monetdbe backend 2 years ago			`self.c_code = parent.c_code`
simple udf code generation 2 years ago			`self.builtin_vars = parent.builtin_vars`
			`else:`
Updated instructions, bulid drivers, bug fixes 2 years ago			`self.join_conditions = []`
			`self.next_valid = 0`
regression: nested aggregation support 2 years ago			`self.is_agg_func = False`
simple udf code generation 2 years ago			`self.is_udfexpr = type(parent) is udf`
			`self.root : expr = self`
			`self.c_code = self.is_udfexpr or type(parent) is projection`
			`if self.is_udfexpr:`
			`self.udf : udf = parent`
			`self.builtin_vars = self.udf.builtin.keys()`
			`else:`
			`self.builtin_vars = []`
udf support for monetdbe backend 2 years ago			`if type(c_code) is bool:`
			`self.c_code = c_code`

Assumption, outfile, bugfixes on type deduction 2 years ago			`self.udf_called = None`
			`self.cols_mentioned : Optional[set[ColRef]] = None`
fix gitw 2 years ago			`ast_node.__init__(self, parent, node, None)`

			`def init(self, _):`
read complex data from csv 2 years ago			`from reconstruct.ast import _tmp_join_union, projection`
fix gitw 2 years ago			`parent = self.parent`
			`self.is_compound = parent.is_compound if type(parent) is expr else False`
fixed join using, join on 2 years ago			`if type(parent) in [projection, expr, _tmp_join_union]:`
fix gitw 2 years ago			`self.datasource = parent.datasource`
			`else:`
			`self.datasource = self.context.datasource`
			`self.udf_map = parent.context.udf_map`
regression: nested aggregation support 2 years ago			`self.func_maps = {builtin_func, self.udf_map, **user_module_func}`
			`self.operators = {builtin_operators, self.udf_map, **user_module_func}`
Added prev/next aggregation functions 2 years ago			`self.ext_aggfuncs = ['sum', 'avg', 'count', 'min', 'max', 'last', 'first', 'prev', 'next']`
simple udf code generation 2 years ago
fix gitw 2 years ago			`def produce(self, node):`
udf support for monetdbe backend 2 years ago			`from engine.utils import enlist`
fixed bugs wrt sp groupbys, insert multiple values 2 years ago			`from reconstruct.ast import udf, projection`
simple udf code generation 2 years ago
fix gitw 2 years ago			`if type(node) is dict:`
Bug fixes for alias&join. Add test in presentation. 2 years ago			`if 'literal' in node:`
			`node = node['literal']`
			`else:`
			`if len(node) > 1:`
			`print(f'Parser Error: {node} has more than 1 dict entry.')`
Updated instructions, bulid drivers, bug fixes 2 years ago
			`is_joincond = False`
Bug fixes for alias&join. Add test in presentation. 2 years ago			`for key, val in node.items():`
initial distinct support 2 years ago			`key = key.lower()`
Updated instructions, bulid drivers, bug fixes 2 years ago			`if key not in self.valid_joincond[self.next_valid]:`
			`self.next_valid = 2`
			`else:`
			`if key == self.valid_joincond[self.next_valid][2]:`
			`self.next_valid = not self.next_valid`
			`elif key == self.valid_joincond[self.next_valid][1]:`
			`self.next_valid = 2`
			`is_joincond = True`
Bug fixes for alias&join. Add test in presentation. 2 years ago			`if key in self.operators:`
			`if key in builtin_func:`
			`if self.is_agg_func:`
			`self.root.is_special = True # Nested Aggregation`
			`else:`
			`self.is_agg_func = True`
imporved build driver, basic support for count() 2 years ago
Bug fixes for alias&join. Add test in presentation. 2 years ago			`op = self.operators[key]`
			`count_distinct = False`
			`if key == 'count' and type(val) is dict and 'distinct' in val:`
			`count_distinct = True`
			`val = val['distinct']`
pack(*), truncate, bug fixes 2 years ago
Bug fixes for alias&join. Add test in presentation. 2 years ago			`val = enlist(val)`
pack(*), truncate, bug fixes 2 years ago			`exp_vals = []`
			`for v in val:`
			`if (`
			`type(v) is str and`
			`'*' in v and`
			`key != 'count'`
			`):`
			`cols = self.datasource.get_cols(v)`
			`if cols:`
			`for c in cols:`
			`exp_vals.append(expr(self, c.name, c_code=self.c_code))`
			`else:`
			`exp_vals.append(expr(self, v, c_code=self.c_code))`

Bug fixes for alias&join. Add test in presentation. 2 years ago			`self.children = exp_vals`
			`self.opname = key`
More Date/Time, Complex expr on groupby, bug fixes 2 years ago
Bug fixes for alias&join. Add test in presentation. 2 years ago			`str_vals = [e.sql for e in exp_vals]`
			`type_vals = [e.type for e in exp_vals]`
fixed wildcard compound cols, ratios, etc. 2 years ago			`is_compound = max([e.is_compound for e in exp_vals])`
Bug fixes for alias&join. Add test in presentation. 2 years ago			`if key in self.ext_aggfuncs:`
fixed wildcard compound cols, ratios, etc. 2 years ago			`self.is_compound = max(0, is_compound - 1)`
Bug fixes for alias&join. Add test in presentation. 2 years ago			`else:`
			`self.is_compound = is_compound`
			`try:`
			`self.type = op.return_type(*type_vals)`
			`except AttributeError as e:`
initial distinct support 2 years ago			`if type(self.root.parent) is not udf:`
Bug fixes for alias&join. Add test in presentation. 2 years ago			`# TODO: do something when this is not an error`
initial distinct support 2 years ago			`print(f'alert: {e}')`
Bug fixes for alias&join. Add test in presentation. 2 years ago			`pass`
			`self.type = AnyT`

			`if count_distinct: # inject distinct col later`
			`self.sql = f'{{{op(self.c_code, *str_vals, True)}}}'`
			`else:`
			`self.sql = op(self.c_code, *str_vals)`

			`special_func = [self.context.udf_map.keys(), self.context.module_map.keys(),`
pack(*), truncate, bug fixes 2 years ago			`"maxs", "mins", "avgs", "sums", "deltas", "last", "first",`
Added var(s), stddev(s). New ITC, stats. bugfix on aggregations. 2 years ago			`"stddevs", "vars", "ratios", "pack", "truncate"]`
fixed bugs wrt sp groupbys, insert multiple values 2 years ago
			`if (`
			`self.context.special_gb`
			`or`
			`(`
			`type(self.root.parent) is projection`
			`and`
			`self.root.parent.force_use_spgb`
			`)`
			`):`
Bug fixes for alias&join. Add test in presentation. 2 years ago			`special_func = [special_func, self.ext_aggfuncs]`

			`if key in special_func and not self.is_special:`
			`self.is_special = True`
			`if key in self.context.udf_map:`
			`self.root.udf_called = self.context.udf_map[key]`
			`if self.is_udfexpr and key == self.root.udf.name:`
			`self.root.is_recursive_call_inudf = True`
			`elif key in user_module_func.keys():`
			`udf.try_init_udf(self.context)`
			`# TODO: make udf_called a set!`
			`p = self.parent`
			`while type(p) is expr and not p.udf_called:`
			`p.udf_called = self.udf_called`
			`p = p.parent`
			`p = self.parent`
			`while type(p) is expr and not p.is_special:`
			`p.is_special = True`
			`p = p.parent`
Assumption, outfile, bugfixes on type deduction 2 years ago
Bug fixes for alias&join. Add test in presentation. 2 years ago			`need_decltypestr = any([e.need_decltypestr for e in exp_vals])`
			`if need_decltypestr or (self.udf_called and type(op) is udf):`
			`decltypestr_vals = [e.udf_decltypecall for e in exp_vals]`
			`self.udf_decltypecall = op(self.c_code, *decltypestr_vals)`
simple udf code generation 2 years ago
Bug fixes for alias&join. Add test in presentation. 2 years ago			`if self.udf_called and type(op) is udf:`
			`self.udf_decltypecall = op.decltypecall(self.c_code, *decltypestr_vals)`

			`elif self.is_udfexpr:`
			`var_table = self.root.udf.var_table`
			`vec = key.split('.')`
			`_vars = [var_table, self.builtin_vars]`
			`def get_vname (node):`
			`if node in self.builtin_vars:`
			`self.root.udf.builtin[node].enabled = True`
			`self.builtin_var = node`
			`return node`
			`else:`
			`return var_table[node]`
			`if vec[0] not in _vars:`
			`# print(f'Use of undefined variable {vec[0]}')`
			`# TODO: do something when this is not an error`
			`pass`
simple udf code generation 2 years ago			`else:`
Bug fixes for alias&join. Add test in presentation. 2 years ago			`vname = get_vname(vec[0])`
			`val = enlist(val)`
			`if(len(val) > 2):`
			`print('Warning: more than 2 indexes found for subvec operator.')`
			`ex = [expr(self, v, c_code = self.c_code) for v in val]`
			`idxs = ', '.join([e.sql for e in ex])`
			`self.sql = f'{vname}.subvec({idxs})'`
			`if any([e.need_decltypestr for e in ex]):`
			`self.udf_decltypecall = f'{vname}.subvec({[", ".join([e.udf_decltypecall for e in ex])]})'`
			`if key == 'get' and len(val) > 1:`
			`ex_vname = expr(self, val[0], c_code=self.c_code)`
			`self.sql = f'{ex_vname.sql}[{expr(self, val[1], c_code=self.c_code).sql}]'`
			`if hasattr(ex_vname, 'builtin_var'):`
			`if not hasattr(self, 'builtin_var'):`
			`self.builtin_var = []`
			`self.builtin_var = [self.builtin_var, ex_vname.builtin_var]`
			`self.udf_decltypecall = ex_vname.sql`
simple udf code generation 2 years ago			`else:`
Bug fixes for alias&join. Add test in presentation. 2 years ago			`print(f'Undefined expr: {key}{val}')`
bug fix on select into 2 years ago
Updated instructions, bulid drivers, bug fixes 2 years ago			`if (is_joincond and len(self.children) == 2`
			`and all([c.is_ColExpr for c in self.children])) :`
updated documentations. 2 years ago			`self.root.join_conditions.append(`
fixed regression. 2 years ago			`(self.children[0].raw_col, self.children[1].raw_col)`
updated documentations. 2 years ago			`)`
bug fix on select into 2 years ago
Bug fixes for alias&join. Add test in presentation. 2 years ago			`if type(node) is str:`
simple udf code generation 2 years ago			`if self.is_udfexpr:`
			`curr_udf : udf = self.root.udf`
			`var_table = curr_udf.var_table`
			`split = node.split('.')`
			`if split[0] in var_table:`
			`varname = var_table[split[0]]`
			`if curr_udf.agg and varname in curr_udf.vecs:`
			`if len(split) > 1:`
			`if split[1] == 'vec':`
			`self.sql += varname`
			`elif split[1] == 'len':`
			`self.sql += f'{varname}.size'`
			`else:`
			`print(f'no member {split[1]} in object {varname}')`
			`else:`
			`self.sql += f'{varname}[{curr_udf.idx_var}]'`
			`else:`
			`self.sql += varname`
			`elif self.supress_undefined or split[0] in self.builtin_vars:`
			`self.sql += node`
			`if split[0] in self.builtin_vars:`
			`curr_udf.builtin[split[0]].enabled = True`
			`self.builtin_var = split[0]`
			`else:`
			`print(f'Undefined varname: {split[0]}')`


			`# get the column from the datasource in SQL context`
fix gitw 2 years ago			`else:`
simple udf code generation 2 years ago			`if self.datasource is not None:`
bug fix on select into 2 years ago			`if (node == '*' and`
			`not (type(self.parent) is expr`
			`and 'count' in self.parent.node)):`
bug fixes and clarification 2 years ago			`self.datasource.all_cols(ordered = True)`
bug fix on select into 2 years ago			`else:`
			`self.raw_col = self.datasource.parse_col_names(node)`
			`self.raw_col = self.raw_col if type(self.raw_col) is ColRef else None`
simple udf code generation 2 years ago			`if self.raw_col is not None:`
			`self.is_ColExpr = True`
Bug fixes for alias&join. Add test in presentation. 2 years ago			`table_name = ''`
			`if '.' in node:`
			`table_name = self.raw_col.table.table_name`
			`if self.raw_col.table.alias:`
			`alias = iter(self.raw_col.table.alias)`
			`try:`
			`a = next(alias)`
			`while(not a or a == table_name):`
			`a = next(alias)`
			`if (a and a != table_name):`
			`table_name = a`
			`except StopIteration:`
			`pass`
			`if table_name:`
			`table_name = table_name + '.'`
			`self.sql = table_name + self.raw_col.name`
simple udf code generation 2 years ago			`self.type = self.raw_col.type`
bug fixes 2 years ago			`self.is_compound = True`
fixed wildcard compound cols, ratios, etc. 2 years ago			`self.is_compound += self.raw_col.compound`
imporved build driver, basic support for count() 2 years ago			`self.opname = self.raw_col`
simple udf code generation 2 years ago			`else:`
bug fix on select into 2 years ago			`self.sql = '\'' + node + '\'' if node != '' else ''`
simple udf code generation 2 years ago			`self.type = StrT`
Bug fixes for alias&join. Add test in presentation. 2 years ago			`self.opname = self.sql`
simple udf code generation 2 years ago			`if self.c_code and self.datasource is not None:`
bug fix on select into 2 years ago			`if (type(self.parent) is expr and`
			`'distinct' in self.parent.node and`
			`not self.is_special):`
			`# this node is executed by monetdb`
			`# gb condition, not special`
			`self.sql = f'distinct({self.sql})'`
simple udf code generation 2 years ago			`self.sql = f'{{y(\"{self.sql}\")}}'`
fix gitw 2 years ago			`elif type(node) is bool:`
regression: nested aggregation support 2 years ago			`self.type = BoolT`
imporved build driver, basic support for count() 2 years ago			`self.opname = node`
udf support for monetdbe backend 2 years ago			`if self.c_code:`
			`self.sql = '1' if node else '0'`
			`else:`
			`self.sql = 'TRUE' if node else 'FALSE'`
Bug fixes for alias&join. Add test in presentation. 2 years ago			`elif type(node) is not dict:`
fix gitw 2 years ago			`self.sql = f'{node}'`
imporved build driver, basic support for count() 2 years ago			`self.opname = node`
udf support for monetdbe backend 2 years ago			`if type(node) is int:`
bug fix 2 years ago			`if (node >= 263 - 1 or node <= -263):`
bug fixes 2 years ago			`self.type = HgeT`
			`elif (node >= 231 - 1 or node <= -231):`
bug fix 2 years ago			`self.type = LongT`
bug fixes 2 years ago			`elif node >= 215 - 1 or node <= -215:`
bug fix 2 years ago			`self.type = IntT`
bug fixes 2 years ago			`elif node >= 27 - 1 or node <= -27:`
			`self.type = ShortT`
			`else:`
			`self.type = ByteT`
udf support for monetdbe backend 2 years ago			`elif type(node) is float:`
			`self.type = DoubleT`
bug fixes 2 years ago
simple udf code generation 2 years ago			`def finalize(self, override = False):`
			`from reconstruct.ast import udf`
			`if self.codebuf is None or override:`
			`self.codebuf = ''`
			`for c in self.codlets:`
			`if type(c) is str:`
			`self.codebuf += c`
			`elif type(c) is udf:`
			`self.codebuf += c()`
			`elif type(c) is expr:`
			`self.codebuf += c.finalize(override=override)`
			`return self.codebuf`

imporved build driver, basic support for count() 2 years ago			`def codegen(self, delegate):`
			`self.curr_code = ''`
			`for c in self.children:`
			`self.curr_code += c.codegen(delegate)`
			`return self.curr_code`

fix gitw 2 years ago			`def __str__(self):`
			`return self.sql`
			`def __repr__(self):`
			`return self.__str__()`
simple udf code generation 2 years ago
			`# builtins is readonly, so it's okay to set default value as an object`
			`# eval is only called at root expr.`
imporved build driver, basic support for count() 2 years ago			`def eval(self, c_code = None, y = lambda t: t,`
			`materialize_builtin = False, _decltypestr = False,`
			`count = lambda : 'count', var_inject = None,`
			`*,`
			`gettype = False):`
simple udf code generation 2 years ago			`assert(self.is_root)`
			`def call(decltypestr = False) -> str:`
imporved build driver, basic support for count() 2 years ago			`nonlocal c_code, y, materialize_builtin, count, var_inject`
			`if var_inject:`
			`for k, v in var_inject.items():`
			`locals()[k] = v`
Assumption, outfile, bugfixes on type deduction 2 years ago			`if self.udf_called is not None:`
simple udf code generation 2 years ago			`loc = locals()`
Assumption, outfile, bugfixes on type deduction 2 years ago			`builtin_vars = self.udf_called.builtin_used`
			`for b in self.udf_called.builtin_var.all:`
simple udf code generation 2 years ago			`exec(f'loc["{b}"] = lambda: "{{{b}()}}"')`
			`if builtin_vars:`
			`if type(materialize_builtin) is dict:`
			`for b in builtin_vars:`
			`exec(f'loc["{b}"] = lambda: "{materialize_builtin[b]}"')`
			`elif self.is_recursive_call_inudf:`
			`for b in builtin_vars:`
			`exec(f'loc["{b}"] = lambda : "{b}"')`
bug fixes 2 years ago
simple udf code generation 2 years ago			`x = self.c_code if c_code is None else c_code`
Updated instructions, bulid drivers, bug fixes 2 years ago			`from engine.utils import escape_qoutes`
simple udf code generation 2 years ago			`if decltypestr:`
Updated instructions, bulid drivers, bug fixes 2 years ago			`return eval('f\'' + escape_qoutes(self.udf_decltypecall) + '\'')`
			`self.sql.replace("'", "\\'")`
			`return eval('f\'' + escape_qoutes(self.sql) + '\'')`
simple udf code generation 2 years ago			`if self.is_recursive_call_inudf or (self.need_decltypestr and self.is_udfexpr) or gettype:`
			`return call`
			`else:`
			`return call(_decltypestr)`

			`@property`
			`def is_root(self):`
			`return self.root == self`


			`# For UDFs: first check if agg variable is used as vector`
			`# if not, then check if its length is used`
			`class fastscan(expr):`
			`name = 'fastscan'`

			`def init(self, _):`
			`self.vec_vars = set()`
			`self.requested_lens = set()`
			`super().init(self, _)`

			`def process(self, key : str):`
			`segs = key.split('.')`
			`var_table = self.root.udf.var_table`
			`if segs[0] in var_table and len(segs) > 1:`
			`if segs[1] == 'vec':`
			`self.vec_vars.add(segs[0])`
			`elif segs[1] == 'len':`
			`self.requested_lens.add(segs[0])`

			`def produce(self, node):`
			`from engine.utils import enlist`
			`if type(node) is dict:`
			`for key, val in node.items():`
			`if key in self.operators:`
			`val = enlist(val)`
			`elif self.is_udfexpr:`
			`self.process(key)`
			`[fastscan(self, v, c_code = self.c_code) for v in val]`

			`elif type(node) is str:`
			`self.process(node)`
udf support for monetdbe backend 2 years ago
simple udf code generation 2 years ago
			`class getrefs(expr):`
			`name = 'getrefs'`

			`def init(self, _):`
			`self.datasource.rec = set()`
			`self.rec = None`

			`def produce(self, node):`
			`from engine.utils import enlist`
			`if type(node) is dict:`
			`for key, val in node.items():`
			`if key in self.operators:`
			`val = enlist(val)`
			`[getrefs(self, v, c_code = self.c_code) for v in val]`

			`elif type(node) is str:`
			`self.datasource.parse_col_names(node)`

			`def consume(self, _):`
			`if self.root == self:`
			`self.rec = self.datasource.rec`
initial distinct support 2 years ago			`self.datasource.rec = None`