소스 검색

kvtree识别优化

luojiehua 5 달 전
부모
커밋
26c2fa6a4a
1개의 변경된 파일1개의 추가작업 그리고 10개의 파일을 삭제
  1. 1 10
      BiddingKG/dl/interface/html_2_kvtree.py

+ 1 - 10
BiddingKG/dl/interface/html_2_kvtree.py

@@ -315,16 +315,6 @@ def tree_reposition(tree,sentence_index=None):
 
 
 
 
 
 
-
-
-
-
-
-
-
-
-
-# 递归地将 DOM 转换为 JSON
 # 递归地将 DOM 转换为 JSON
 # 递归地将 DOM 转换为 JSON
 def dom_to_tree(node):
 def dom_to_tree(node):
     if node.name:  # 如果是标签节点
     if node.name:  # 如果是标签节点
@@ -358,6 +348,7 @@ def dom_to_tree(node):
                     _text += _t
                     _text += _t
             else:
             else:
                 _text += _t+" "
                 _text += _t+" "
+        _text = _text.strip()
         return DotDict({"tag":"text","name":"text","text": _text})
         return DotDict({"tag":"text","name":"text","text": _text})
     return None  # 忽略空白字符
     return None  # 忽略空白字符