%!s(int64=3) %!d(string=hai) anos · 22a860d4aa
--- a/.idea/sonarlint-state.xml
+++ b/.idea/sonarlint-state.xml
@@ -0,0 +1,6 @@
 
															+<?xml version="1.0" encoding="UTF-8"?>
														
 
															+<project version="4">
														
 
															+  <component name="SonarLintProjectState">
														
 
															+    <lastEventPolling>1631004326176</lastEventPolling>
														
 
															+  </component>
														
 
															+</project>
														
--- a/.idea/sonarlint.xml
+++ b/.idea/sonarlint.xml
@@ -0,0 +1,8 @@
 
															+<?xml version="1.0" encoding="UTF-8"?>
														
 
															+<project version="4">
														
 
															+  <component name="SonarLintProjectSettings">
														
 
															+    <option name="bindingEnabled" value="true" />
														
 
															+    <option name="projectKey" value="BiddingKG" />
														
 
															+    <option name="serverId" value="sonarqube" />
														
 
															+  </component>
														
 
															+</project>
														
--- a/.idea/sonarlint/issuestore/index.pb
+++ b/.idea/sonarlint/issuestore/index.pb
--- a/.scannerwork/.sonar_lock
+++ b/.scannerwork/.sonar_lock
--- a/.scannerwork/report-task.txt
+++ b/.scannerwork/report-task.txt
@@ -0,0 +1,6 @@
 
															+projectKey=BiddingKG
														
 
															+serverUrl=http://192.168.2.102:9000
														
 
															+serverVersion=9.0.1.46107
														
 
															+dashboardUrl=http://192.168.2.102:9000/dashboard?id=BiddingKG
														
 
															+ceTaskId=AXu_QxDamj0G_RX-Yx74
														
 
															+ceTaskUrl=http://192.168.2.102:9000/api/ce/task?id=AXu_QxDamj0G_RX-Yx74
														
--- a/BiddingKG/dl/interface/extract.py
+++ b/BiddingKG/dl/interface/extract.py
@@ -104,14 +104,14 @@ def predict(doc_id,text,title=""):
 
															     data_res["success"] = True
														
 
															-    for _article in list_articles:
														
 
															-        log(_article.content)
														
 
															-
														
 
															-    for list_entity in list_entitys:
														
 
															-        for _entity in list_entity:
														
 
															-            log("type:%s,text:%s,label:%s,values:%s,sentence:%s,begin_index:%s,end_index:%s"%
														
 
															-                  (str(_entity.entity_type),str(_entity.entity_text),str(_entity.label),str(_entity.values),str(_entity.sentence_index),
														
 
															-                   str(_entity.begin_index),str(_entity.end_index)))
														
 
															+    # for _article in list_articles:
														
 
															+    #     log(_article.content)
														
 
															+    #
														
 
															+    # for list_entity in list_entitys:
														
 
															+    #     for _entity in list_entity:
														
 
															+    #         log("type:%s,text:%s,label:%s,values:%s,sentence:%s,begin_index:%s,end_index:%s"%
														
 
															+    #               (str(_entity.entity_type),str(_entity.entity_text),str(_entity.label),str(_entity.values),str(_entity.sentence_index),
														
 
															+    #                str(_entity.begin_index),str(_entity.end_index)))
														
 
															     return json.dumps(data_res,cls=MyEncoder,sort_keys=True,indent=4,ensure_ascii=False)
														
@@ -122,9 +122,9 @@ def test(name,content):
 
															         "id":name
														
 
															     }
														
 
															     myheaders = {'Content-Type': 'application/json'}
														
 
															-    _resp = requests.post("http://192.168.2.101:15015" + '/article_extract', json=user, headers=myheaders, verify=True)
														
 
															+    _resp = requests.post("http://192.168.2.102:15030" + '/article_extract', json=user, headers=myheaders, verify=True)
														
 
															     resp_json = _resp.content.decode("utf-8")
														
 
															-    print(resp_json)
														
 
															+    # print(resp_json)
														
 
															     return resp_json
														
--- a/BiddingKG/dl/metrics/__init__.py
+++ b/BiddingKG/dl/metrics/__init__.py
--- a/BiddingKG/dl/metrics/extractMetric.py
+++ b/BiddingKG/dl/metrics/extractMetric.py
@@ -0,0 +1,343 @@
 
															+
														
 
															+import psycopg2
														
 
															+from BiddingKG.dl.interface.extract import predict,test
														
 
															+from BiddingKG.dl.common.Utils import getUnifyMoney,timeFormat
														
 
															+import re
														
 
															+import json
														
 
															+
														
 
															+class ExtractMetric():
														
 
															+
														
 
															+    def __init__(self):
														
 
															+        self.conn1 = self.getConnection_postgres("iepy")
														
 
															+        self.conn2 = self.getConnection_postgres("iepy")
														
 
															+
														
 
															+    def fitDataByRule(self,data):
														
 
															+        symbol_dict = {"(":")",
														
 
															+                       "（":"）",
														
 
															+                       "[":"]",
														
 
															+                       "【":"】",
														
 
															+                       ")":"(",
														
 
															+                       "）":"（",
														
 
															+                       "]":"[",
														
 
															+                       "】":"【"}
														
 
															+        leftSymbol_pattern = re.compile("[\(（\[【]")
														
 
															+        rightSymbol_pattern = re.compile("[\)）\]】]")
														
 
															+        leftfinds = re.findall(leftSymbol_pattern,data)
														
 
															+        rightfinds = re.findall(rightSymbol_pattern,data)
														
 
															+        result = data
														
 
															+        if len(leftfinds)+len(rightfinds)==0:
														
 
															+            return data
														
 
															+        elif len(leftfinds)==len(rightfinds):
														
 
															+            return data
														
 
															+        elif abs(len(leftfinds)-len(rightfinds))==1:
														
 
															+            if len(leftfinds)>len(rightfinds):
														
 
															+                if symbol_dict.get(data[0]) is not None:
														
 
															+                    result = data[1:]
														
 
															+                else:
														
 
															+                    #print(symbol_dict.get(leftfinds[0]))
														
 
															+                    result = data+symbol_dict.get(leftfinds[0])
														
 
															+            else:
														
 
															+                if symbol_dict.get(data[-1]) is not None:
														
 
															+                    result = data[:-1]
														
 
															+                else:
														
 
															+                    result = symbol_dict.get(rightfinds[0])+data
														
 
															+        return  result
														
 
															+
														
 
															+
														
 
															+    def getConnection_postgres(self,db):
														
 
															+        conn = psycopg2.connect(dbname=db,user="postgres",password="postgres",host="192.168.2.103")
														
 
															+        return conn
														
 
															+
														
 
															+    def label2interface(self,list_anno,Htext):
														
 
															+        dict_result = {}
														
 
															+        dict_anno = {}
														
 
															+        for _anno in list_anno:
														
 
															+            value = _anno["value"]
														
 
															+            _split = value.split("\t")
														
 
															+            if _split[0][0]=="T":
														
 
															+                _type,_begin,_end = _split[1].split(" ")
														
 
															+                dict_anno[_split[0]] = {"id":_split[0],"type":_type,"text":_split[2],"begin":int(_begin),"end":int(_end)}
														
 
															+            elif _split[0][0]=="R":
														
 
															+                _type,arg1,arg2 = _split[1].split(" ")
														
 
															+                dict_anno[_split[0]] = {"id":_split[0],"type":_type,"arg1":arg1.split(":")[1],"arg2":arg2.split(":")[1]}
														
 
															+        dict_role = {}
														
 
															+        dict_money = {}
														
 
															+        dict_person2role = {}
														
 
															+        dict_name_freq_score = {}
														
 
															+        pattern_score = re.compile("工程|服务|采购|施工|项目|系统|招标|中标|公告|学校|[大中小]学校?|医院|公司|分公司|研究院|政府采购中心|学院|中心校?|办公室|政府|财[政务]局|办事处|委员会|[部总支]队|警卫局|幼儿园|党委|党校|银行|分行|解放军|发电厂|供电局|管理所|供电公司|卷烟厂|机务段|研究[院所]|油厂|调查局|调查中心|出版社|电视台|监狱|水厂|服务站|信用合作联社|信用社|交易所|交易中心|交易中心党校|科学院|测绘所|运输厅|管理处|局|中心|机关|部门?|处|科|厂|集团|图书馆|馆|所|厅|楼|区|酒店|场|基地|矿|餐厅|酒店")
														
 
															+        for k,v in dict_anno.items():
														
 
															+            if v.get("type") in ["code","product","person_review"]:
														
 
															+                if v.get("type") not in dict_result:
														
 
															+                    dict_result[v.get("type")] = []
														
 
															+                dict_result[v.get("type")].append(v.get("text"))
														
 
															+                dict_result[v.get("type")] = list(set(dict_result[v.get("type")]))
														
 
															+            if v.get("type") in ["name","bidway","moneysource","serviceTime","time_release","time_bidopen","time_bidclose"]:
														
 
															+                if v.get("type")=="name":
														
 
															+                    _name = self.fitDataByRule(v.get("text"))
														
 
															+                    w = 1 if re.search('(项目|工程|招标|合同|标项|标的|计划|询价|询价单|询价通知书|申购)(名称|标题|主题)[:：\s]', _name)!=None else 0.5
														
 
															+                    if _name not in dict_name_freq_score:
														
 
															+                        # dict_name_freq_score[_name] = [1,len(re.findall(pattern_score,_name))+len(_name)*0.1]
														
 
															+                        dict_name_freq_score[_name] = [1, (len(re.findall(pattern_score, _name)) + len(_name) * 0.05)*w]
														
 
															+                    else:
														
 
															+                        dict_name_freq_score[_name][0] += 1
														
 
															+                    max_score = 0
														
 
															+                    for _k1,_v1 in dict_name_freq_score.items():
														
 
															+                        if _v1[0]*_v1[1]>max_score:
														
 
															+                            max_score = _v1[0]*_v1[1]
														
 
															+                            dict_result[v.get("type")] = _k1
														
 
															+                if v.get("type") not in dict_result:
														
 
															+                    if v.get("type") in ["time_release","time_bidopen","time_bidclose"]:
														
 
															+                        _t = timeFormat(v.get("text"))
														
 
															+                    else:
														
 
															+                        _t = v.get("text")
														
 
															+                    dict_result[v.get("type")] = _t
														
 
															+            _split = v.get("type").split("_")
														
 
															+            if len(_split)>1:
														
 
															+                if _split[1]=="tenderee":
														
 
															+                    dict_role["tenderee"] = {"subject":v.get("text")}
														
 
															+                if _split[1]=="agency":
														
 
															+                    dict_role["agency"] = {"subject":v.get("text")}
														
 
															+                if _split[1]=="tenderer":
														
 
															+                    dict_role["tenderer"] = {"subject":v.get("text")}
														
 
															+                if _split[1]=="secondTenderer":
														
 
															+                    dict_role["secondTenderer"] = {"subject":v.get("text")}
														
 
															+                if _split[1]=="thirdTenderer":
														
 
															+                    dict_role["thirdTenderer"] = {"subject":v.get("text")}
														
 
															+        tendereeMoney = 0
														
 
															+        for k,v in dict_anno.items():
														
 
															+            _split = v.get("type").split("_")
														
 
															+            if v.get("type") in ["money_tendereeMoney"]:
														
 
															+                _before_text = Htext[max(v["begin"]-10,0):v["begin"]]
														
 
															+                if re.search("万",_before_text) is not None and re.search("整",_before_text) is None:
														
 
															+                    _unit = 10000
														
 
															+                else:
														
 
															+                    _unit = 1
														
 
															+                tendereeMoney = float(getUnifyMoney(v["text"])*_unit)
														
 
															+            if v.get("type") in ["rel_tendereeMoney","rel_tendererMoney"]:
														
 
															+                arg1 = v.get("arg1")
														
 
															+                arg2 = v.get("arg2")
														
 
															+                for _k,_v in dict_role.items():
														
 
															+                    if _v["subject"]==dict_anno[arg1]["text"]:
														
 
															+                        _before_text = Htext[max(dict_anno[arg2]["begin"]-10,0):dict_anno[arg2]["begin"]]
														
 
															+                        if re.search("万",_before_text) is not None and re.search("整",_before_text) is None:
														
 
															+                            _unit = 10000
														
 
															+                        else:
														
 
															+                            _unit = 1
														
 
															+                        _v["money"] = float(getUnifyMoney(dict_anno[arg2]["text"])*_unit)
														
 
															+            if v.get("type")=="person_tendereePerson":
														
 
															+                if "tenderee" in dict_role:
														
 
															+                    if "person" not in dict_role["tenderee"]:
														
 
															+                        dict_role["tenderee"]["person"] = []
														
 
															+                    dict_role["tenderee"]["person"].append({"person":v["text"]})
														
 
															+            if v.get("type")=="person_agencyPerson":
														
 
															+                if "agency" in dict_role:
														
 
															+                    if "person" not in dict_role["agency"]:
														
 
															+                        dict_role["agency"]["person"] = []
														
 
															+                    dict_role["agency"]["person"].append({"person":v["text"]})
														
 
															+            if v.get("type")=="rel_person":
														
 
															+                arg1 = v.get("arg1")
														
 
															+                arg2 = v.get("arg2")
														
 
															+                for _k,_v in dict_role.items():
														
 
															+                    if _v["subject"]==dict_anno[arg1]["text"]:
														
 
															+                        if "person" not in dict_role[_k]:
														
 
															+                            dict_role[_k]["person"] = []
														
 
															+                        dict_role[_k]["person"].append({"person":dict_anno[arg2]["text"]})
														
 
															+                        dict_person2role[dict_anno[arg2]["text"]] = _k
														
 
															+        for k,v in dict_anno.items():
														
 
															+            if v.get("type")=="rel_phone":
														
 
															+                arg1 = v.get("arg1")
														
 
															+                arg2 = v.get("arg2")
														
 
															+                _person = dict_anno[arg1]["text"]
														
 
															+                if _person in dict_person2role:
														
 
															+                    for item in dict_role[dict_person2role[_person]]["person"]:
														
 
															+                        if item["person"]==_person:
														
 
															+                            item["phone"] = dict_anno[arg2]["text"]
														
 
															+
														
 
															+
														
 
															+        roleList = []
														
 
															+        for k,v in dict_role.items():
														
 
															+            if k=="tenderee":
														
 
															+                _role = "tenderee"
														
 
															+            if k=="agency":
														
 
															+                _role = "agency"
														
 
															+            if k=="tenderer":
														
 
															+                _role = "win_tenderer"
														
 
															+            if k=="secondTenderer":
														
 
															+                _role = "second_tenderer"
														
 
															+            if k=="thirdTenderer":
														
 
															+                _role = "third_tenderer"
														
 
															+            list_person = []
														
 
															+            set_person = set()
														
 
															+            for item in v.get("person",[]):
														
 
															+                if item["person"] not in set_person:
														
 
															+                    list_person.append([item["person"],item.get("phone","")])
														
 
															+                    set_person.add(item["person"])
														
 
															+            roleList.append([_role,v.get("subject","").replace("(","（").replace(")","）"),v.get("money",0),list_person,""])
														
 
															+
														
 
															+        dict_result["prem"] = {"Project":{"roleList":roleList,"tendereeMoney":tendereeMoney}}
														
 
															+        return dict_result
														
 
															+
														
 
															+
														
 
															+    def culExtractMetrics(self):
														
 
															+        conn = self.conn1
														
 
															+        cursor = conn.cursor()
														
 
															+        sql = ' select begin_time,end_time,"user",doc_count from corpus_payroll where end_time<=\'2021-07-25\' order by end_time desc limit 20'
														
 
															+        cursor.execute(sql)
														
 
															+        list_diff = []
														
 
															+        rows_payroll = cursor.fetchall()
														
 
															+        for _payroll in rows_payroll:
														
 
															+            _begin_time = _payroll[0]
														
 
															+            _end_time = _payroll[1]
														
 
															+            _user = _payroll[2]
														
 
															+            doc_count = _payroll[3]
														
 
															+            print(_user,_begin_time,_end_time,doc_count)
														
 
															+            _sql = "select document_id,value from brat_bratannotation where document_id in (select human_identifier from corpus_iedocument where edituser='%s' and to_char(edittime,'yyyy-mm-dd')>='%s' and to_char(edittime,'yyyy-mm-dd')<='%s' limit 100)  order by document_id"%(_user,_begin_time,_end_time)
														
 
															+            cursor.execute(_sql)
														
 
															+            rows = cursor.fetchall()
														
 
															+            if len(rows)>0:
														
 
															+                current_docid = rows[0][0]
														
 
															+                _index = -1
														
 
															+                list_values = []
														
 
															+                while _index<len(rows)-1:
														
 
															+                    _index += 1
														
 
															+                    row = rows[_index]
														
 
															+                    document_id = row[0]
														
 
															+                    value = row[1]
														
 
															+                    if document_id!=current_docid:
														
 
															+                        print(current_docid)
														
 
															+                        sql = "select text from corpus_iedocument where human_identifier='%s'"%(str(current_docid))
														
 
															+                        cursor.execute(sql)
														
 
															+                        content = cursor.fetchall()[0][0]
														
 
															+                        _inter = self.label2interface(list_values,content)
														
 
															+                        _inter2 = self.extractFromInterface(content)
														
 
															+                        if not len(_inter2.get("prem").keys())>1:
														
 
															+                            _diff = self.getDiff(_inter,_inter2)
														
 
															+                            list_diff.append(_diff)
														
 
															+                        _index -= 1
														
 
															+                        current_docid = document_id
														
 
															+                        list_values = []
														
 
															+                    else:
														
 
															+                        list_values.append({"document_id":document_id,"value":value})
														
 
															+        metrics = self.getMetrics(list_diff)
														
 
															+        print(metrics)
														
 
															+
														
 
															+    def extractFromInterface(self,content):
														
 
															+        return json.loads(test("",content))
														
 
															+
														
 
															+    def getDiff(self,_inter,_inter2):
														
 
															+        _dict = {}
														
 
															+        for k in ["code","product","person_review"]:
														
 
															+            set_k1 = _inter.get(k,set())
														
 
															+            set_k2 = _inter2.get(k,set())
														
 
															+            _dict["%s_inter"%k] = len(set_k1)
														
 
															+            _dict["%s_inter2"%k] = len(set_k2)
														
 
															+            _dict["%s_union"%k] = len(set(set_k1)&set(set_k2))
														
 
															+
														
 
															+        for k in ["name","bidway","moneysource","serviceTime","time_release","time_bidopen","time_bidclose"]:
														
 
															+            _k1 = _inter.get(k,"")
														
 
															+            _k2 = _inter2.get(k,"")
														
 
															+            len_k1 = 0 if _k1=="" else 1
														
 
															+            len_k2 = 0 if _k2=="" else 1
														
 
															+            len_union = 1 if _k1==_k2 and len_k1==1 else 0
														
 
															+            _dict["%s_inter"%k] = len_k1
														
 
															+            _dict["%s_inter2"%k] = len_k2
														
 
															+            _dict["%s_union"%k] = len_union
														
 
															+
														
 
															+
														
 
															+        dict_project = {}
														
 
															+        for k,v in _inter.get("prem",{}).items():
														
 
															+            if float(v.get("tendereeMoney",0))>0:
														
 
															+                dict_project["%s_inter"%("tendereeMoney")] = [float(v.get("tendereeMoney"))]
														
 
															+            for _role in v.get("roleList",[]):
														
 
															+                dict_project["%s_inter"%_role[0]] = [_role[1]]
														
 
															+                if _role[0] in ["win_tenderer","second_tenderer","third_tenderer"]:
														
 
															+                    if float(_role[2])>0:
														
 
															+                        dict_project["%s_money_inter"%_role[0]] = [float(_role[2])]
														
 
															+                for item in _role[3]:
														
 
															+                    _person = item[0]
														
 
															+                    _phone = item[1]
														
 
															+                    if _person=="" or _phone=="":
														
 
															+                        continue
														
 
															+                    if "%s_person_inter"%_role[0] not in dict_project:
														
 
															+                        dict_project["%s_person_inter"%_role[0]] = []
														
 
															+                    dict_project["%s_person_inter"%_role[0]].append("%s-%s"%(_role[1],_person))
														
 
															+                    if "person_phone_inter" not in dict_project:
														
 
															+                        dict_project["person_phone_inter"] = []
														
 
															+                    dict_project["person_phone_inter"].append("%s-%s"%(_person,_phone))
														
 
															+        for k,v in _inter2.get("prem",{}).items():
														
 
															+            if float(v.get("tendereeMoney",0))>0:
														
 
															+                dict_project["%s_inter2"%("tendereeMoney")] = [float(v.get("tendereeMoney"))]
														
 
															+            for _role in v.get("roleList",[]):
														
 
															+                dict_project["%s_inter2"%_role[0]] = [_role[1]]
														
 
															+                if _role[0] in ["win_tenderer","second_tenderer","third_tenderer"]:
														
 
															+                    if float(_role[2])>0:
														
 
															+                        dict_project["%s_money_inter2"%_role[0]] = [float(_role[2])]
														
 
															+                for item in _role[3]:
														
 
															+                    _person = item[0]
														
 
															+                    _phone = item[1]
														
 
															+                    if _person=="" or _phone=="":
														
 
															+                        continue
														
 
															+                    if "%s_person_inter2"%_role[0] not in dict_project:
														
 
															+                        dict_project["%s_person_inter2"%_role[0]] = []
														
 
															+                    dict_project["%s_person_inter2"%_role[0]].append("%s-%s"%(_role[1],_person))
														
 
															+                    if "person_phone_inter2" not in dict_project:
														
 
															+                        dict_project["person_phone_inter2"] = []
														
 
															+                    dict_project["person_phone_inter2"].append("%s-%s"%(_person,_phone))
														
 
															+        set_k = set()
														
 
															+        for k,v in dict_project.items():
														
 
															+            k_split = k.split("_")
														
 
															+            base_key = "_".join(k_split[:-1])
														
 
															+            if k_split[-1]=="inter":
														
 
															+                k2 = "inter2"
														
 
															+            else:
														
 
															+                k2 = "inter"
														
 
															+            if base_key in set_k:
														
 
															+                continue
														
 
															+            k_other = "%s_%s"%(base_key,k2)
														
 
															+            _dict[k] = len(v)
														
 
															+            _dict[k_other] = len(dict_project.get(k_other,[]))
														
 
															+            _dict["%s_union"%base_key] = len(set(v)&set(dict_project.get(k_other,[])))
														
 
															+            set_k.add(base_key)
														
 
															+        print("=========================")
														
 
															+        print(_inter)
														
 
															+        print("-----")
														
 
															+        print(_inter2)
														
 
															+        print("|||||")
														
 
															+        print(_dict)
														
 
															+        return _dict
														
 
															+
														
 
															+
														
 
															+
														
 
															+    def getMetrics(self,list_diff):
														
 
															+        dict_key_count = {}
														
 
															+        print("all_count:",list_diff)
														
 
															+        for _diff in list_diff:
														
 
															+            for k,v in _diff.items():
														
 
															+                if k not in dict_key_count:
														
 
															+                    dict_key_count[k] = 0
														
 
															+                dict_key_count[k] += v
														
 
															+        set_k = set()
														
 
															+        for k,v in dict_key_count.items():
														
 
															+            k_split = k.split("_")
														
 
															+            base_k = "_".join(k_split[:-1])
														
 
															+            if base_k in set_k:
														
 
															+                continue
														
 
															+            set_k.add(base_k)
														
 
															+            _count_inter = max(dict_key_count.get("%s_inter"%base_k,-1),1)
														
 
															+            _count_inter2 = max(dict_key_count.get("%s_inter2"%base_k,-1),1)
														
 
															+            _count_union = dict_key_count.get("%s_union"%base_k,0)
														
 
															+            _precision = _count_union/_count_inter2
														
 
															+            _recall = _count_union/_count_inter
														
 
															+            _f1 = 2*(_precision*_recall)/(_precision+_recall)
														
 
															+            print("%s: recall:%.3f,precision:%.3f,f1_score:%.3f"%(base_k,_recall,_precision,_f1))
														
 
															+            print(base_k)
														
 
															+            print("%.3f"%_f1)
														
 
															+            print("%.3f"%_precision)
														
 
															+            print("%.3f"%_recall)
														
 
															+
														
 
															+
														
 
															+
														
 
															+if __name__=="__main__":
														
 
															+    em = ExtractMetric()
														
 
															+    em.culExtractMetrics()
														
 
															+
														
--- a/BiddingKG/dl/relation_extraction/model.py
+++ b/BiddingKG/dl/relation_extraction/model.py
@@ -425,6 +425,11 @@ def save_model():
 
															 if __name__ == '__main__':
														
 
															     test_model = Relation_extraction()
														
 
															+    test_model.train_model.summary()
														
 
															+    print("object_model=====================")
														
 
															+    test_model.object_model.summary()
														
 
															+    print("subject_model=======================")
														
 
															+    test_model.subject_model.summary()
														
 
															     # save_model()
														
 
															     # ['<pad>','<unk>','<company/org>','<location>','<phone>','<contact_person>']
														
--- a/BiddingKG/dl/test/11.py
+++ b/BiddingKG/dl/test/11.py
@@ -0,0 +1,3 @@
 
															+a = "%d-"
														
 
															+
														
 
															+print(a%2)
														
--- a/BiddingKG/maxcompute/evaluates.py
+++ b/BiddingKG/maxcompute/evaluates.py
@@ -113,10 +113,11 @@ class Extract(BaseUDTF):
 
															         log("import done")
														
 
															         while True:
														
 
															             try:
														
 
															-                item = task_queue.get(True)
														
 
															+                item = task_queue.get(True,timeout=10)
														
 
															                 result_json = predict(item.get("docid",""),item.get("content",""),item.get("title",""))
														
 
															                 result_queue.put(result_json)
														
 
															             except:
														
 
															+                log("get data time out")
														
 
															                 pass
														
 
															     def __init__(self):
														
@@ -154,6 +155,7 @@ class Extract(BaseUDTF):
 
															         self.result_queue = Queue()
														
 
															         self.deal_process = Process(target=self.f_queue_process,args=(self.task_queue,self.result_queue))
														
 
															         self.deal_process.start()
														
 
															+        time.sleep(60*4)
														
 
															         import numpy as np
														
@@ -180,18 +182,33 @@ class Extract(BaseUDTF):
 
															         if content is not None and _doc_id not in [105677700,126694044,126795572,126951461,71708072,137850637]:
														
 
															+            #清除队列中的数据
														
 
															+            try:
														
 
															+                while(self.task_queue.qsize()>0):
														
 
															+                    self.task_queue.get(timeout=5)
														
 
															+            except Exception as e:
														
 
															+                pass
														
 
															+            try:
														
 
															+                while(self.result_queue.qsize()>0):
														
 
															+                    self.result_queue.get(timeout=5)
														
 
															+            except Exception as e:
														
 
															+                pass
														
 
															+
														
 
															             _item = {"docid":_doc_id,"content":content,"title":_title}
														
 
															-            self.task_queue.put(_item)
														
 
															+
														
 
															             try:
														
 
															+                _timeout = 60*4
														
 
															                 if not self.deal_process.is_alive():
														
 
															                     log("deal process is down")
														
 
															+                    self.task_queue = Queue()
														
 
															                     self.deal_process = Process(target=self.f_queue_process,args=(self.task_queue,self.result_queue))
														
 
															                     self.deal_process.start()
														
 
															-                result_json = self.result_queue.get(timeout=60*4)
														
 
															+                    _timeout += 60*4
														
 
															+                log("putting item to task_queue with docid:%s"%(str(_doc_id)))
														
 
															+                self.task_queue.put(_item)
														
 
															+                result_json = self.result_queue.get(timeout=_timeout)
														
 
															                 self.forward(page_time,int(_doc_id),result_json)
														
 
															             except Exception as e:
														
 
															                 log("dealing docid %s failed by timeout"%(str(_doc_id)))
														
 
															                 self.deal_process.kill()
														
 
															-                self.deal_process = Process(target=self.f_queue_process,args=(self.task_queue,self.result_queue))
														
 
															-                self.deal_process.start()