Quellcode durchsuchen

修复fingerprint没有计算附件的问题

luojiehua vor 1 Jahr
Ursprung
Commit
e0259ad9aa
1 geänderte Dateien mit 3 neuen und 3 gelöschten Zeilen
  1. 3 3
      BiddingKG/dl/fingerprint/documentFingerprint.py

+ 3 - 3
BiddingKG/dl/fingerprint/documentFingerprint.py

@@ -13,9 +13,9 @@ def getHtmlText(sourceHtml):
         _href = _a.attrs.get("href","")
         if _href.find("www.bidizhaobiao.com")>0:
             _a.decompose()
-    richText = _soup.find("div",attrs={"class":"richTextFetch"})
-    if richText is not None:
-        richText.decompose()
+    # richText = _soup.find("div",attrs={"class":"richTextFetch"})
+    # if richText is not None:
+    #     richText.decompose()
     _text = _soup.get_text()
 
     _text = re.sub("\s*",'',_text)