luojiehua f34dc68e72 AI提取增加医疗产品数据 преди 1 месец
..
AIUtils 5e681b3fc5 AI提取增加医疗产品数据 преди 1 месец
chat 9e5621cde3 数据遗漏检查后自动同步 преди 5 месеца
comment 2617fce7d5 数据处理效率优化,附件2000/10min,要素10000/10min,数据监控 преди 3 години
common 64c1215242 AI提取上线 преди 2 месеца
dataMonitor 8bcf3fb0dd Merge remote-tracking branch 'origin/master' преди 5 месеца
dataSource cceb10cdbf 要素提取补充AI提取 преди 3 месеца
interface db1f62f342 去重合并接口开发 преди 2 месеца
java 2617fce7d5 数据处理效率优化,附件2000/10min,要素10000/10min,数据监控 преди 3 години
maintenance f34dc68e72 AI提取增加医疗产品数据 преди 1 месец
maxcompute 59b020186b 采购意向去重规则 преди 1 месец
model a187ece310 AI提取优化%金额 преди 2 месеца
primarykey a8a8e88bc8 地址改为linux下使用内网,修改启动间隔和错误日志打印 преди 4 години
readme 59be57dc38 启动脚本 преди 2 години
services 5d9340b7b8 产品数据流版本 преди 1 година
test 5d9340b7b8 产品数据流版本 преди 1 година
__init__.py dc7a24c325 附件处理和上传第一版 преди 4 години
app.json 4c6dbfe709 附件处理和上传第2版,新增关系型数据支持,附近下载上传入库优化,要素提取eas接口等 преди 3 години
embedding_services.py dd72c9a29a 优化产品配置提取,完善缺失和冗余问题,预估提取率和准确率能达到80%以上 преди 1 година
fixDoc_to_queue_extract.py 24632dfe69 数据遗漏检查后自动同步 преди 6 месеца
monitor.py 4c6dbfe709 附件处理和上传第2版,新增关系型数据支持,附近下载上传入库优化,要素提取eas接口等 преди 3 години
readme.md 2617fce7d5 数据处理效率优化,附件2000/10min,要素10000/10min,数据监控 преди 3 години
start_dataflow_attach_monitor.py 95d42ef0ea 拟在建入库改造,完善follow生成,联系人生成 преди 2 години
start_dataflow_attachment.py 2617fce7d5 数据处理效率优化,附件2000/10min,要素10000/10min,数据监控 преди 3 години
start_dataflow_dumplicate.py 3fa7504cbc 调整监控报警,特殊情况增加@所有人 преди 2 години
start_dataflow_extract.py 2617fce7d5 数据处理效率优化,附件2000/10min,要素10000/10min,数据监控 преди 3 години
start_dataflow_init.py 2617fce7d5 数据处理效率优化,附件2000/10min,要素10000/10min,数据监控 преди 3 години
start_dataflow_merge.py 2617fce7d5 数据处理效率优化,附件2000/10min,要素10000/10min,数据监控 преди 3 години
start_dataflow_monitor.py 2617fce7d5 数据处理效率优化,附件2000/10min,要素10000/10min,数据监控 преди 3 години
start_drop_preproject_dump.py cf2a71ef1b 数据流优化(数据遗漏,过长数据丢弃),增加数据遗漏检查 преди 3 години
start_enterprise2Redis.py 0dd18a789f 新增 合法实体添加到Redis定时流程 преди 1 година
start_extract.py 4c6dbfe709 附件处理和上传第2版,新增关系型数据支持,附近下载上传入库优化,要素提取eas接口等 преди 3 години
start_fille_preproject.py 4c6dbfe709 附件处理和上传第2版,新增关系型数据支持,附近下载上传入库优化,要素提取eas接口等 преди 3 години
start_main.py 1fc79ae011 预下载附件及设置status流程 преди 1 година
start_product.py f7e579cf7e 提高配置提取的效率,修复因重启接口导致的附件未识别问题 преди 1 година
start_project_merge_server.py 9fa2fc346f 公告去重文档指纹不限时间,只要存在状态正常且文档指纹一样的公告即去重 преди 3 месеца
start_rollback_services.py 2617fce7d5 数据处理效率优化,附件2000/10min,要素10000/10min,数据监控 преди 3 години
start_sychro_attachFix.py 1053b8e26d 更改数据修复逻辑 преди 2 години
start_sychro_attachProcess.py 4c6dbfe709 附件处理和上传第2版,新增关系型数据支持,附近下载上传入库优化,要素提取eas接口等 преди 3 години
start_sychro_attachRec.py 4c6dbfe709 附件处理和上传第2版,新增关系型数据支持,附近下载上传入库优化,要素提取eas接口等 преди 3 години
start_sychro_attachUpload.py dc7a24c325 附件处理和上传第一版 преди 4 години
start_sychro_docFix.py 4c6dbfe709 附件处理和上传第2版,新增关系型数据支持,附近下载上传入库优化,要素提取eas接口等 преди 3 години
start_sychro_handInput.py 7b9d284cd0 地址改为linux下使用VPC преди 4 години
start_sychro_proposedBuilding.py 5d1cc0f663 初始提交 преди 4 години
start_sychro_unionMajor.py 5210e6dd0a 同步时mysql连接重置策略,重点项目、实时公告合并 преди 2 години
test.py 5d9340b7b8 产品数据流版本 преди 1 година
test_convert_interface.py 2617fce7d5 数据处理效率优化,附件2000/10min,要素10000/10min,数据监控 преди 3 години

readme.md

将执行环节ENV放在BaseDataMaintenance同级路径下如/home/python

1.执行cd /home/python 2.执行 ./ENV/bin/python ./BaseDataMaintenance/start_*.py

start_dataflow_attachment 启动数据流中的附件识别

start_dataflow_dumplicate 启动数据流中的去重

start_dataflow_extract 启动数据流中的要素提取

start_dataflow_merge 启动数据流中的合并

start_dataflow_remove 启动数据流中的清除临时表