|
@@ -3032,6 +3032,7 @@ class ProductAttributesPredictor():
|
|
|
if len(set(col0_l) & self.header_set) > len(col0_l) * 0.2 and len(col0_l)==len(col1_l): # 保证两个列数一致
|
|
|
header_list2 = []
|
|
|
product = demand = budget = order_begin = order_end = ""
|
|
|
+ tenderee = ""
|
|
|
for i in range(len(col0_l)):
|
|
|
if re.search('项目名称', col0_l[i]):
|
|
|
header_list2.append(col0_l[i])
|
|
@@ -3051,6 +3052,8 @@ class ProductAttributesPredictor():
|
|
|
elif re.search('预算单位|(采购|招标|购买)(单位|人|方|主体)|项目业主|采购商|申购单位|需求单位|业主单位', col0_l[i]):
|
|
|
header_list2.append(col0_l[i])
|
|
|
tenderee = re.sub("\s","",col1_l[i])
|
|
|
+ if len(tenderee) > 20:
|
|
|
+ tenderee = ""
|
|
|
elif re.search('采购时间|采购实施月份|采购月份|采购日期', col0_l[i]):
|
|
|
header_list2.append(col0_l[i])
|
|
|
order_time = col1_l[i].strip()
|