2 次代碼提交 37d8ba8e70 ... 384f92f3cf

作者 SHA1 備註 提交日期
  luojiehua 384f92f3cf Merge remote-tracking branch 'origin/master' 1 周之前
  luojiehua f2b9d1e98c 解决ai提取有时没有包括附件的问题 1 周之前
共有 1 個文件被更改,包括 1 次插入0 次删除
  1. 1 0
      BaseDataMaintenance/AIUtils/html2text.py

+ 1 - 0
BaseDataMaintenance/AIUtils/html2text.py

@@ -6,6 +6,7 @@ import re
 def html2text_with_tablehtml(_html):
     # 如果输入是字符串,使用 BeautifulSoup 解析
     if isinstance(_html, str):
+        _html = re.sub("<html>|<body>|</body>|</html>","",_html)
         _soup = BeautifulSoup(_html, "lxml")
     else:
         _soup = _html