Jelajahi Sumber

公告内容截断调试

luojiehua 2 tahun lalu
induk
melakukan
73bddf26dc
1 mengubah file dengan 1 tambahan dan 0 penghapusan
  1. 1 0
      BaseDataMaintenance/maintenance/dataflow_mq.py

+ 1 - 0
BaseDataMaintenance/maintenance/dataflow_mq.py

@@ -756,6 +756,7 @@ class Dataflow_ActivteMQ_extract(Dataflow_extract):
             if html_len>200000:
                 # if int(item.get("docid"))==238431011:
                 #     save(item,"238431011.pk")
+                log("docid %s dochtmlcon too long len %d "%(str(item.get("docid")),html_len))
                 try:
                     _dochtmlcon = re.sub("<html>|</html>|<body>|</body>", "", _dochtmlcon)
                     _soup = BeautifulSoup(_dochtmlcon,"lxml")