znj 93ef878fee Merge branch 'master' of http://192.168.2.103:3000/luojiehua/BIDI_ML_INFO_EXTRACTION hace 1 año
..
channel_savedmodel 31496792aa 补交channel模型文件 hace 3 años
codename_savedmodel 4516c6d476 初始提交 hace 4 años
codename_savedmodel_bilstmcrf 4516c6d476 初始提交 hace 4 años
codename_savedmodel_tf 45c82f3a75 项目编码和名称代码更新 hace 4 años
codesplit_savedmodel 4516c6d476 初始提交 hace 4 años
form_context_savedmodel d8421be517 优化表格处理模型,公告内相同实体名称替换 hace 4 años
form_savedmodel 4516c6d476 初始提交 hace 4 años
industry_model 903575d0d6 行业分类文件提交 hace 2 años
industry_rule_kw_json 903575d0d6 行业分类文件提交 hace 2 años
money_savedmodel 4340c0cbeb 更新角色模型,金额模型,金额预处理,金额连接,返回结果添加 总投资和channel信息 hace 3 años
money_savedmodel_bilstmonly 4516c6d476 初始提交 hace 4 años
person_savedmodel 1e6c8f7ffc 新增评审专家的联系人模型提交 hace 4 años
person_savedmodel_backup 1e6c8f7ffc 新增评审专家的联系人模型提交 hace 4 años
person_savedmodel_new 9fcb0d621f 增加数据重新训练联系人分类模型 hace 4 años
person_savedmodel_new_znj f9ff3263cf "属性链接"更新 hace 3 años
product_savedmodel dab45a5d74 优化评审专家、服务期限、包号及产品 hace 2 años
role_savedmodel 9b97466121 更新角色模型;调整角色规则、表格提取、预处理表头规则等 hace 1 año
test bc946270b5 修复加载字典逻辑 hace 2 años
timesplit_model f529113ce6 时间分类新增类别 hace 3 años
123.py 4516c6d476 初始提交 hace 4 años
Connection.py 4516c6d476 初始提交 hace 4 años
Entitys.py ee9e1b8c33 优化表格多包提取;优化站源唯一招标人替换;优化金额提取 hace 1 año
Preprocessing.py 42ae8dd269 截标时间提取优化、时分秒提取优化 hace 1 año
README.rd 4516c6d476 初始提交 hace 4 años
__init__.py 4516c6d476 初始提交 hace 4 años
a.txt 4516c6d476 初始提交 hace 4 años
agency_set.pkl c17352ef64 优化项目名称提取;优化招标人代理人提取_大数据统计代理人集合;优化招标人/代理人斜杠分割提取;处理特殊中标表达名次在后面 hace 2 años
codename_classlabels.pk b77d6b5811 项目名称、编号模型代码更新 hace 4 años
codename_vocab.pk 4516c6d476 初始提交 hace 4 años
codename_w2v_matrix.pk 45c82f3a75 项目编码和名称代码更新 hace 4 años
codename_x.pk 4516c6d476 初始提交 hace 4 años
district_dic.pkl a523758a25 表格预处理修改;表格要素提取调整;包提取调整;角色金额规则调整;地区匹配调整 hace 2 años
district_tuple.pkl 3c1349a4d5 优化文末招标人召回;优化地区匹配逻辑 hace 1 año
end.xls 4516c6d476 初始提交 hace 4 años
extract.py 93ef878fee Merge branch 'master' of http://192.168.2.103:3000/luojiehua/BIDI_ML_INFO_EXTRACTION hace 1 año
flask.log 4516c6d476 初始提交 hace 4 años
getAccRecall.py 4516c6d476 初始提交 hace 4 años
getAttributes.py 42ae8dd269 截标时间提取优化、时分秒提取优化 hace 1 año
header_set.pkl 65f3b09d88 去除保质期作为服务期关键词 hace 1 año
modelFactory.py 995f8ec8c4 修复只公布一个标段的没提取包号;优化角色规则 hace 1 año
predictor.py 2ee196dc3b 补充采购意向备注及发布日期提取 hace 1 año
project_label_keywords.csv 8a516256a5 新增‘项目标签’字段提取 hace 1 año
run_model_server.py 4516c6d476 初始提交 hace 4 años
run_preprocess_server.py 4516c6d476 初始提交 hace 4 años
run_single_server.py 4516c6d476 初始提交 hace 4 años
run_utils.py 4516c6d476 初始提交 hace 4 años
run_web_server.py 4516c6d476 初始提交 hace 4 años
settings.py 4516c6d476 初始提交 hace 4 años
vocab_word.pk 4516c6d476 初始提交 hace 4 años
websource_tenderee.pkl 8e9c4bf478 字典匹配规则优化;金额及角色规则优化;数据源唯一招标人更新 hace 1 año

README.rd

Connection:定义连接数据库的方法
Entitys:文章类、句子类、实体类
getAccRecall:跑完验证集的数据之后,统计出各个模型的准召率
getAttributes:跑完模型之后,根据上下文给每个公司实体取得诸如所在包、金额、联系人等属性
predictor:加载模型和调用模型
Preprocessing:预处理方法、获取各个模型的输入数据
run_model_server:模型处理进程,负责从队列中取得待处理数据进行处理,然后保存到数据库
run_web_server:web服务进程,负责接收web请求,保存到数据库中,循环查询处理完成后的结果,返回请求端
settings:定义各种参数
testInterface:查询验证集的数据,发起web请求