|
@@ -4151,14 +4151,14 @@ class DocChannel():
|
|
'产权交易': '经营权|承包权|使用权|租赁权|股权|债权|排污权|化学需氧量|储备量|竞价销售|销售结果|出租|招租|拍租|竞租|续租|挂牌|出让|废[旧弃]?(物资|设备|资源|金属|钢筋|料)处[置理]',
|
|
'产权交易': '经营权|承包权|使用权|租赁权|股权|债权|排污权|化学需氧量|储备量|竞价销售|销售结果|出租|招租|拍租|竞租|续租|挂牌|出让|废[旧弃]?(物资|设备|资源|金属|钢筋|料)处[置理]',
|
|
'产权交易2': '使用权|租赁权|股权|债权|排污权|竞价销售|销售结果|出租|招租|拍租|竞租|续租|挂牌|出让|废[旧弃]?(物资|设备|资源|金属|钢筋|料)处[置理]',
|
|
'产权交易2': '使用权|租赁权|股权|债权|排污权|竞价销售|销售结果|出租|招租|拍租|竞租|续租|挂牌|出让|废[旧弃]?(物资|设备|资源|金属|钢筋|料)处[置理]',
|
|
# '采招数据': '(采购|招标|询价|议价|比价|比选|遴选|邀请|邀标|磋商|洽谈|约谈|谈判|征询|调研)的?(公告|公示|中标|成交|结果|$)|工程招标|定点服务|(设备|服务|\w{2})[直采]购|(建设|改造)项目|工程|拦标价|控制价|银行|资格选定|资金|公款|存款|存放|现金管理|招募|入围|入库',
|
|
# '采招数据': '(采购|招标|询价|议价|比价|比选|遴选|邀请|邀标|磋商|洽谈|约谈|谈判|征询|调研)的?(公告|公示|中标|成交|结果|$)|工程招标|定点服务|(设备|服务|\w{2})[直采]购|(建设|改造)项目|工程|拦标价|控制价|银行|资格选定|资金|公款|存款|存放|现金管理|招募|入围|入库',
|
|
- '采招数据': '(采购|招标|询价|议价|比价|比选|遴选|邀请|邀标|磋商|洽谈|约谈|谈判|征询|调研)的?(公告|公示|中标|成交|结果|$)|工程招标|定点服务|(设备|服务|\w{2})[直采]购|(建设|改造)项目|拦标价|控制价|资格选定|资格认定|资金|公款|存款|现金管理|招募|入库',
|
|
|
|
|
|
+ '采招数据': '(采购|招标|询价|议价|比价|比选|遴选|邀请|邀标|磋商|洽谈|约谈|谈判|征询|调研)的?(公告|公示|中标|成交|结果|$)|工程招标|定点服务|(设备|服务|\w{2})[直采]购|(建设|改造)项目|拦标价|控制价|资格选定|资格认定|资金|公款|存款|现金管理|招募|入库|遴选.{,25}(服务|事务所|机构)',
|
|
# |竞价 采招/产权都有竞价方式 # 意向|需求|预公?告|报建|总承包|工程|施工|设计|勘察|代理|监理 |变更|答疑|澄清|中标|成交|合同|废标|流标
|
|
# |竞价 采招/产权都有竞价方式 # 意向|需求|预公?告|报建|总承包|工程|施工|设计|勘察|代理|监理 |变更|答疑|澄清|中标|成交|合同|废标|流标
|
|
'新闻资讯': '(考试|面试|笔试)成绩|成绩的?(公告|公示|公布)|公开招聘|招聘(公告|简章|启事|合同制)|疫情防控\s{,5}(通知|情况|提示)|行政审批结果'
|
|
'新闻资讯': '(考试|面试|笔试)成绩|成绩的?(公告|公示|公布)|公开招聘|招聘(公告|简章|启事|合同制)|疫情防控\s{,5}(通知|情况|提示)|行政审批结果'
|
|
}
|
|
}
|
|
self.life_dic = {
|
|
self.life_dic = {
|
|
'采购意向': '采购意向|招标意向|选取意向|意向公告|意向公示',
|
|
'采购意向': '采购意向|招标意向|选取意向|意向公告|意向公示',
|
|
'采购意向neg': '发布政府采购意向|采购意向公告已于',
|
|
'采购意向neg': '发布政府采购意向|采购意向公告已于',
|
|
- '招标预告': '(预计|计划)(采购|招标)(时间|日期)|采购(计划编号|需求方案|预告|预案)|(预|需求)公示|需求(方案|信息|论证|公告|公示)',
|
|
|
|
|
|
+ '招标预告': '(预计|计划)(招标|采购|发标|发包)(时间|日期)|采购(计划编号|需求方案|预告|预案)|(预|需求)公示|需求(方案|信息|论证|公告|公示)',
|
|
'招标公告': '(采购|招标|竞选|报名)条件|报名(时间|流程|方法|要求|\w{,5}材料)[:\s]|[^\w]成交规则|参加竞价采购交易资格|(申请人|投标人|供应商|报价人|参选人)的?资格(要求|条件)|获取(采购|招标|询价|议价|竞价|比价|比选|遴选|邀请|邀标|磋商|洽谈|约谈|谈判|竞谈|应答)文件|(采购|招标|询价|议价|竞价|比价|比选|遴选|邀请|邀标|磋商|洽谈|约谈|谈判|竞谈|应答)文件的?(获取|领取)|评选方式:?\s*价格最低',
|
|
'招标公告': '(采购|招标|竞选|报名)条件|报名(时间|流程|方法|要求|\w{,5}材料)[:\s]|[^\w]成交规则|参加竞价采购交易资格|(申请人|投标人|供应商|报价人|参选人)的?资格(要求|条件)|获取(采购|招标|询价|议价|竞价|比价|比选|遴选|邀请|邀标|磋商|洽谈|约谈|谈判|竞谈|应答)文件|(采购|招标|询价|议价|竞价|比价|比选|遴选|邀请|邀标|磋商|洽谈|约谈|谈判|竞谈|应答)文件的?(获取|领取)|评选方式:?\s*价格最低',
|
|
'资审结果': '资审及业绩公示|资审结果及业绩|资格后审情况报告|资格(后审|预审|审查)结果(公告|公示)|(预审|审查)工作已经?结束|未通过原因', #|资格
|
|
'资审结果': '资审及业绩公示|资审结果及业绩|资格后审情况报告|资格(后审|预审|审查)结果(公告|公示)|(预审|审查)工作已经?结束|未通过原因', #|资格
|
|
'招标答疑': '现澄清(为|如下)|答疑补遗|澄清内容如下|第[0-9一二三四五]次澄清|答疑澄清|(最高(投标)?限价|控制价|拦标价)公示', # |异议的回复
|
|
'招标答疑': '现澄清(为|如下)|答疑补遗|澄清内容如下|第[0-9一二三四五]次澄清|答疑澄清|(最高(投标)?限价|控制价|拦标价)公示', # |异议的回复
|
|
@@ -4783,11 +4783,14 @@ class DocChannel():
|
|
return False
|
|
return False
|
|
|
|
|
|
tenderee = ""
|
|
tenderee = ""
|
|
|
|
+ agency = ""
|
|
try:
|
|
try:
|
|
for k, v in prem['prem'].items():
|
|
for k, v in prem['prem'].items():
|
|
for link in v['roleList']:
|
|
for link in v['roleList']:
|
|
if link['role_name'] == 'tenderee' and tenderee == "":
|
|
if link['role_name'] == 'tenderee' and tenderee == "":
|
|
tenderee = link['role_text']
|
|
tenderee = link['role_text']
|
|
|
|
+ if link['role_name'] == 'agency' and agency == "":
|
|
|
|
+ agency = link['role_text']
|
|
except Exception as e:
|
|
except Exception as e:
|
|
# print('解析prem 获取招标人、代理人出错')
|
|
# print('解析prem 获取招标人、代理人出错')
|
|
pass
|
|
pass
|
|
@@ -4798,6 +4801,9 @@ class DocChannel():
|
|
if tenderee:
|
|
if tenderee:
|
|
title = title.replace(tenderee, " ")
|
|
title = title.replace(tenderee, " ")
|
|
text = text.replace(tenderee, " ")
|
|
text = text.replace(tenderee, " ")
|
|
|
|
+ if agency:
|
|
|
|
+ title = title.replace(agency, " ")
|
|
|
|
+ text = text.replace(agency, " ")
|
|
prem_json = json.dumps(prem, ensure_ascii=False)
|
|
prem_json = json.dumps(prem, ensure_ascii=False)
|
|
if result['docchannel']['docchannel'] in ['中标信息', '合同公告'] and origin_dic.get(
|
|
if result['docchannel']['docchannel'] in ['中标信息', '合同公告'] and origin_dic.get(
|
|
original_docchannel, '') in ['招标公告', '采购意向', '招标预告', '公告变更'] and is_contain_winner(
|
|
original_docchannel, '') in ['招标公告', '采购意向', '招标预告', '公告变更'] and is_contain_winner(
|
|
@@ -4811,7 +4817,10 @@ class DocChannel():
|
|
msc += '最终规则修改:中标公告无中标人且包含新闻资讯关键词,返回新闻资讯类型'
|
|
msc += '最终规则修改:中标公告无中标人且包含新闻资讯关键词,返回新闻资讯类型'
|
|
elif result['docchannel']['docchannel'] == '废标公告' and is_contain_winner(prem_json) and re.search(
|
|
elif result['docchannel']['docchannel'] == '废标公告' and is_contain_winner(prem_json) and re.search(
|
|
self.title_life_dic['废标公告'], title) == None:
|
|
self.title_life_dic['废标公告'], title) == None:
|
|
- result['docchannel']['docchannel'] = '中标信息'
|
|
|
|
|
|
+ if re.search(self.title_life_dic['合同公告'], title):
|
|
|
|
+ result['docchannel']['docchannel'] = '合同公告'
|
|
|
|
+ else:
|
|
|
|
+ result['docchannel']['docchannel'] = '中标信息'
|
|
msc += '最终规则修改:预测为废标却有中标人且标题无废标关键词改为中标信息;'
|
|
msc += '最终规则修改:预测为废标却有中标人且标题无废标关键词改为中标信息;'
|
|
elif result['docchannel']['docchannel'] in ['招标答疑'] and re.search(
|
|
elif result['docchannel']['docchannel'] in ['招标答疑'] and re.search(
|
|
self.title_life_dic['招标答疑'], title) == None and origin_dic.get(
|
|
self.title_life_dic['招标答疑'], title) == None and origin_dic.get(
|
|
@@ -8583,7 +8592,7 @@ class EntityTypeRulePredictor():
|
|
self.pattern_addr_delivery = '(交货|交付|收货|提货|交接|送货(安装)?|送达|到货|供货|卸货)((期|时间)[及和、])?)?(地[点址区]?|区域)[:为]'
|
|
self.pattern_addr_delivery = '(交货|交付|收货|提货|交接|送货(安装)?|送达|到货|供货|卸货)((期|时间)[及和、])?)?(地[点址区]?|区域)[:为]'
|
|
self.pattern_addr_project = '(项目|施工|实施|建设|工程|服务|展示|看样|拍卖)(实施|服务|现场)?(地[点址区]|位置|所在地区?)(位于)?[:为]|项目位于|[^\w]所[属在](区域|地区?):|存放地[点址]?[:为]' # 银行所属区域:北京市西城区 不作项目地址
|
|
self.pattern_addr_project = '(项目|施工|实施|建设|工程|服务|展示|看样|拍卖)(实施|服务|现场)?(地[点址区]|位置|所在地区?)(位于)?[:为]|项目位于|[^\w]所[属在](区域|地区?):|存放地[点址]?[:为]' # 银行所属区域:北京市西城区 不作项目地址
|
|
self.pattern_addr_contact = '(联系|收件人?|邮寄)地[点址区][:为]|行政区:'
|
|
self.pattern_addr_contact = '(联系|收件人?|邮寄)地[点址区][:为]|行政区:'
|
|
- self.pattern_time_planned = '(计划|预计|预期)(采购|招标|发包)时间|招标(公告|文件)(预计|预期|计划)发布时间'
|
|
|
|
|
|
+ self.pattern_time_planned = '(计划|预计|预期)(招标|采购|发标|发包)时间|招标(公告|文件)(预计|预期|计划)发布时间'
|
|
self.pattern_code_investment = '投资(审批)?项目[编代]码[:为]'
|
|
self.pattern_code_investment = '投资(审批)?项目[编代]码[:为]'
|
|
self.pattern_addr_dic = {'addr_bidopen': self.pattern_addr_bidopen,
|
|
self.pattern_addr_dic = {'addr_bidopen': self.pattern_addr_bidopen,
|
|
'addr_bidsend': self.pattern_addr_bidsend,
|
|
'addr_bidsend': self.pattern_addr_bidsend,
|