为解决项目推进过程中,人工录入数据时存在的效率低下、易出错、重复劳动等痛点。中建八局发展建设公司流程与数据管理部自主研发了“苍穹表格文字智能识别提取”小程序。该小程序可适配钢筋原材检测报告、混凝土试块强度检测报告等,通过预设模版规则与OCR、AI 校验技术结合,能快速提取报告中关键结构化数据,大幅降低人工录入成本。
该系统的前端采用原生 WXML、WXSS 和 JS 构建页面并实现交互逻辑,通过 wx.request API 与后端进行数据通信。后端基于 Gin 框架开发,提供 RESTful API 接口,负责数据处理、业务逻辑实现,并以 JSON 格式返回响应结果。为优化服务部署与访问,系统引入 Nginx 作为反向代理,监听 80/443 端口,将 API 请求转发至 Gin 服务,有效解决了跨域访问和服务端口直接暴露的安全问题,同时 Nginx 也承担了静态资源的托管职责。整个系统部署在百度云 ECS 服务器上,该服务器集成了 Nginx、Gin 服务以及 Redis 数据库,构成了完整的技术架构。
“苍穹表格文字智能识别提取”小程序使用流程如下:
1、上传报告图片,完成预处理
这一步是提取的基础,核心是获取清晰可用的报告图像数据源。用户可直接拍摄施工现场的钢筋原材检测报告、混凝土试块强度报告等纸质文件,也能上传电脑或手机中存储的 PDF 格式电子报告截图。小程序会自动对图片做预处理,比如纠正拍摄时的倾斜角度、对图片大小进行限制。
2、匹配对应模板,锁定提取规则
系统内置建筑工程领域30余种固定模板,用户需根据报告类型手动选择。
3、多模型协同检测,交叉核验数据
这是保障提取准确性的核心环节,通过多个不同功能的大模型分工协作,避免单一模型的识别盲区。
4、人工修正完善,确保数据精准
针对模型检测中置信度低或标记异常的内容,由人工介入核对修改,弥补机器识别的局限性。例如当报告中存在手写批注的补充数据、打印模糊的字符,或是合并单元格导致的字段归属模糊等问题时,模型可能无法精准判断,此时检测人员或施工人员可对照原始报告,手动修正错误数据、补充缺失信息。
5、上传云文档,完成归档留存
人工确认无误后,用户可一键将提取后的结构化数据上传至指定云文档。云文档会自动记录上传时间、操作人员、报告关联项目等元信息,方便后续追溯查询。
目前,该小程序已在崂山人民医院项目中启动内部测试工作。测试阶段将重点验证不同应用场景下的报告识别准确率、业务流程适配性及操作便捷性。流程与数据管理部将持续收集一线使用人员的反馈建议,针对性优化功能细节、提升使用体验,既为后续在更多建筑工程类项目中规模化推广应用筑牢基础,也将通过测试积累多维度业务数据,为公司后续精益建造大模型的搭建提供有力支撑。(图片由中建八局发展建设公司授权提供)
以上内容为推广信息,所涉及内容不代表本网观点,不构成投资建议、消费建议。