Преглед на файлове

修复fingerprint没有计算附件的问题

luojiehua преди 1 година
родител
ревизия
e0259ad9aa
променени са 1 файла, в които са добавени 3 реда и са изтрити 3 реда
  1. 3 3
      BiddingKG/dl/fingerprint/documentFingerprint.py

+ 3 - 3
BiddingKG/dl/fingerprint/documentFingerprint.py

@@ -13,9 +13,9 @@ def getHtmlText(sourceHtml):
         _href = _a.attrs.get("href","")
         if _href.find("www.bidizhaobiao.com")>0:
             _a.decompose()
-    richText = _soup.find("div",attrs={"class":"richTextFetch"})
-    if richText is not None:
-        richText.decompose()
+    # richText = _soup.find("div",attrs={"class":"richTextFetch"})
+    # if richText is not None:
+    #     richText.decompose()
     _text = _soup.get_text()
 
     _text = re.sub("\s*",'',_text)