fangjiasheng

fangjiasheng 推送了 master 分支的代碼到 fangjiasheng/FORMAT_CONVERSION_MAXCOMPUTE

5 月之前

fangjiasheng 推送了 master 分支的代碼到 fangjiasheng/FORMAT_CONVERSION_MAXCOMPUTE

  • ab202ff1fc 1. 新增wps类型 2. 新增ofd类型 3. 新增两列无边框表格识别 4. 修复ocr爆显存 5. pdf处理速度优化 6. 特殊康熙字体处理 7. 新增监控平均处理时间

5 月之前

fangjiasheng 推送了 master 分支的代碼到 fangjiasheng/FORMAT_CONVERSION_MAXCOMPUTE

  • ef08b56c48 附件识别,保留表格的合并单元格

9 月之前

fangjiasheng 推送了 master 分支的代碼到 fangjiasheng/FORMAT_CONVERSION_MAXCOMPUTE

10 月之前

fangjiasheng 推送了 master 分支的代碼到 lishimin/VerificationCode

  • 0917978c59 1. 新增验证码类型判断 2. 各验证码处理优化 3. 忽略dev

11 月之前

fangjiasheng 推送了 master 分支的代碼到 fangjiasheng/FORMAT_CONVERSION_MAXCOMPUTE

  • b83f835428 1. pdf去掉文字水印 2. pdf嵌套文本处理 3. pdf文本按照表格线分割 4. pdf表格线后处理优化 5. pdf乱码判断优化 6. pdf表格连接优化 7. 图片识别失败时依旧返回其他结果 8. 图片分割比例调整 9. 图片读取时判断透明部分,转为白色 10. doc、docx用tika提取文本

1 年之前

fangjiasheng 推送了 master 分支的代碼到 fangjiasheng/FORMAT_CONVERSION_MAXCOMPUTE

1 年之前

fangjiasheng 推送了 master 分支的代碼到 fangjiasheng/FORMAT_CONVERSION_MAXCOMPUTE

  • 1940d1af19 1. 调整目录机构 2. 优化doc、swf处理,使用tika处理doc,yaswfp处理swf 3. 新增监控 4. 优化图片方向识别前的ocr乱码判断

1 年之前

fangjiasheng 推送了 master 分支的代碼到 fangjiasheng/FORMAT_CONVERSION_MAXCOMPUTE

  • 6498479a13 定位占用内存大问题,优化; 监控内存并清理占用过大进程; docx报错多优化

1 年之前

fangjiasheng 推送了 master 分支的代碼到 fangjiasheng/FORMAT_CONVERSION_MAXCOMPUTE

  • fccc997e45 优化pdf表格顺序以及表格连接

1 年之前

fangjiasheng 推送了 master 分支的代碼到 fangjiasheng/FORMAT_CONVERSION_MAXCOMPUTE

1 年之前

fangjiasheng 推送了 master 分支的代碼到 fangjiasheng/FORMAT_CONVERSION_MAXCOMPUTE

1 年之前

fangjiasheng 推送了 master 分支的代碼到 fangjiasheng/FORMAT_CONVERSION_MAXCOMPUTE

1 年之前

fangjiasheng 推送了 master 分支的代碼到 fangjiasheng/FORMAT_CONVERSION_MAXCOMPUTE

1 年之前

fangjiasheng 推送了 master 分支的代碼到 fangjiasheng/FORMAT_CONVERSION_MAXCOMPUTE

1 年之前

fangjiasheng 推送了 master 分支的代碼到 fangjiasheng/FORMAT_CONVERSION_MAXCOMPUTE

1 年之前

fangjiasheng 推送了 master 分支的代碼到 fangjiasheng/FORMAT_CONVERSION_MAXCOMPUTE

  • c6ac7bddb9 优化 1. pdf表格线提取 2. docx提取 3. idc模型预处理优化,重新训练 4. pdf文字重复问题

1 年之前

fangjiasheng 推送了 master 分支的代碼到 fangjiasheng/FORMAT_CONVERSION_MAXCOMPUTE

  • d435211e3c 1.主接口增加超时时间参数 2.配置文件增加多GPU设置 3.pdf表格连接规则优化 4.pdf删除重复出现页眉页脚 5.pdf提取表格线优化 6.docx判断是否是网页格式 7.ocr增加只识别参数

2 年之前

fangjiasheng 推送了 master 分支的代碼到 fangjiasheng/FORMAT_CONVERSION_MAXCOMPUTE

  • 2405f43b4e 1.rar、zip文件页数修复,文件之间独立读取 2.pdf直接读表格线修复 3.pdf删除重复出现图片 4.pdf无边框表格判断规则优化 5.pdf新增表格连接规则 6.office转换接口判断是否运行 7.pdf计算IOU修复 8.docx编号报错修复 9.docx嵌套表格实现

2 年之前

fangjiasheng 推送了 master 分支的代碼到 fangjiasheng/FORMAT_CONVERSION_MAXCOMPUTE

2 年之前