|
@@ -89,7 +89,7 @@ def predict(doc_id,text):
|
|
print("getPREMs")
|
|
print("getPREMs")
|
|
prem = getAttributes.getPREMs(list_sentences,list_entitys,list_articles)
|
|
prem = getAttributes.getPREMs(list_sentences,list_entitys,list_articles)
|
|
print("getPREMs")
|
|
print("getPREMs")
|
|
- punish_dic = punish.get_punish_extracts(list_sentences, list_entitys, title='投诉处理 ', text=text)
|
|
|
|
|
|
+ punish_dic = punish.get_punish_extracts(list_sentences, list_entitys, title='', text=text)
|
|
print(punish_dic)
|
|
print(punish_dic)
|
|
prem[0][1]['punish'] = punish_dic
|
|
prem[0][1]['punish'] = punish_dic
|
|
|
|
|
|
@@ -99,6 +99,7 @@ def predict(doc_id,text):
|
|
time_release = [] # 发布时间
|
|
time_release = [] # 发布时间
|
|
time_bidopen = [] # 开标时间
|
|
time_bidopen = [] # 开标时间
|
|
time_bidclose = [] # 截标时间
|
|
time_bidclose = [] # 截标时间
|
|
|
|
+ list_person_review = []
|
|
for entity in list_entitys[0]:
|
|
for entity in list_entitys[0]:
|
|
if entity.entity_type == 'bidway':
|
|
if entity.entity_type == 'bidway':
|
|
bidway.append(entity.entity_text)
|
|
bidway.append(entity.entity_text)
|
|
@@ -149,8 +150,8 @@ def test(name,content):
|
|
if __name__=="__main__":
|
|
if __name__=="__main__":
|
|
# filename = "比地_52_79929693.html"
|
|
# filename = "比地_52_79929693.html"
|
|
# #text = codecs.open("C:\\Users\\User\\Desktop\\数据20191014\\"+filename,"r",encoding="utf8").read()
|
|
# #text = codecs.open("C:\\Users\\User\\Desktop\\数据20191014\\"+filename,"r",encoding="utf8").read()
|
|
- # text = codecs.open("C:\\Users\\User\\Desktop\\2.html","r",encoding="utf8").read()
|
|
|
|
- # content = str(BeautifulSoup(text).find("div",id="pcontent"))
|
|
|
|
|
|
+ text = codecs.open("C:\\Users\\User\\Desktop\\2.html","r",encoding="utf8").read()
|
|
|
|
+ content = str(BeautifulSoup(text).find("div",id="pcontent"))
|
|
# df_a = {"html":[]}
|
|
# df_a = {"html":[]}
|
|
# df_a["html"].append(re.sub('\r|\n|\r\n',"",content))
|
|
# df_a["html"].append(re.sub('\r|\n|\r\n',"",content))
|
|
# import pandas as pd
|
|
# import pandas as pd
|
|
@@ -164,14 +165,14 @@ if __name__=="__main__":
|
|
# text = '''大庆禾工煤炭分质清洁利用项目-临时用电二期工程设备、物资采购中标候选人公示,更多咨询报价请点击:http://bulletin.cebpubservice.com/candidateBulletin/2020-03-31/2678597.html,大庆禾工煤炭分质清洁利用顶目-临时用电二期工程设备、物资釆购中标候选人,(招标编号:XYwZ-20200309-5),公示结束时间:2020年04月03日,、评标情况,标段(包)[001大庆禾工煤嶽分质清洁利用项目-临时用屯二期工程设备、物资采购,中标候选人基本情况,
|
|
# text = '''大庆禾工煤炭分质清洁利用项目-临时用电二期工程设备、物资采购中标候选人公示,更多咨询报价请点击:http://bulletin.cebpubservice.com/candidateBulletin/2020-03-31/2678597.html,大庆禾工煤炭分质清洁利用顶目-临时用电二期工程设备、物资釆购中标候选人,(招标编号:XYwZ-20200309-5),公示结束时间:2020年04月03日,、评标情况,标段(包)[001大庆禾工煤嶽分质清洁利用项目-临时用屯二期工程设备、物资采购,中标候选人基本情况,
|
|
# 中标候选人第1名:哈尔滨龙网电力设备有限公司,投标报价:19.98万元,质量,合格,工期/交货期/服务期:30天,中标候选人第2名:
|
|
# 中标候选人第1名:哈尔滨龙网电力设备有限公司,投标报价:19.98万元,质量,合格,工期/交货期/服务期:30天,中标候选人第2名:
|
|
# 哈尔滨昊龙电气没备制造有限公司,投标报价:19.87万元,质,量:合格,工期/交货期/服务期:30天,'''
|
|
# 哈尔滨昊龙电气没备制造有限公司,投标报价:19.87万元,质,量:合格,工期/交货期/服务期:30天,'''
|
|
- text = '中标候选人第1名:哈尔滨龙网电力设备有限公司,投标报价:19.98万元,质量,合格,工期/交货期/服务期:30天。\
|
|
|
|
- 投诉处理公告,投诉人:张三。文章编号:京财采投字(2018)第42号。政府采购项目招标方式:公开招标,联系人:黎明。\
|
|
|
|
- 建设资金来源及性质:资本金40%,自筹60%,,xx.=建设资金来源自筹,项目出资比例为100%,\
|
|
|
|
- 二次供水泵房浊度仪进行国内组织公开招标采购,时间:2020-05-26,15:15:00,竞价结束时间:2020-05-26,15:45:00允许延时:是,'
|
|
|
|
|
|
+ # text = '中标候选人第1名:哈尔滨龙网电力设备有限公司,投标报价:19.98万元,质量,合格,工期/交货期/服务期:30天。\
|
|
|
|
+ # 投诉处理公告,投诉人:张三。文章编号:京财采投字(2018)第42号。政府采购项目招标方式:公开招标,联系人:黎明。\
|
|
|
|
+ # 建设资金来源及性质:资本金40%,自筹60%,,xx.=建设资金来源自筹,项目出资比例为100%,\
|
|
|
|
+ # 二次供水泵房浊度仪进行国内组织公开招标采购,时间:2020-05-26,15:15:00,竞价结束时间:2020-05-26,15:45:00允许延时:是,'
|
|
a = time.time()
|
|
a = time.time()
|
|
print("start")
|
|
print("start")
|
|
- # print(predict("12",content))
|
|
|
|
- print(predict("投诉处理公告", text))
|
|
|
|
|
|
+ print(predict("12",content))
|
|
|
|
+ # print(predict("投诉处理公告", text))
|
|
#test("12",text)
|
|
#test("12",text)
|
|
print("takes",time.time()-a)
|
|
print("takes",time.time()-a)
|
|
pass
|
|
pass
|