소스 검색

Merge remote-tracking branch 'origin/master'

znj 3 년 전
부모
커밋
d404086432
2개의 변경된 파일5개의 추가작업 그리고 3개의 파일을 삭제
  1. 1 0
      BiddingKG/dl/interface/Preprocessing.py
  2. 4 3
      BiddingKG/dl/test/test4.py

+ 1 - 0
BiddingKG/dl/interface/Preprocessing.py

@@ -1464,6 +1464,7 @@ def get_preprocessed_article(articles,cost_time = dict(),useselffool=True):
     for article in articles:
         doc_id = article[0]
         sourceContent = article[1]
+        sourceContent = re.sub("<html>|</html>|<body>|</body>","",sourceContent)
         _send_doc_id = article[3]
         _title = article[4]
         #表格处理

파일 크기가 너무 크기때문에 변경 상태를 표시하지 않습니다.
+ 4 - 3
BiddingKG/dl/test/test4.py


이 변경점에서 너무 많은 파일들이 변경되어 몇몇 파일들은 표시되지 않았습니다.