工作原理
从扫描图到 Excel 表格,AI 经历了哪些步骤?
核心挑战
水文断面扫描图通常有5列组×3子列的复杂排版,高程整数部分常被省略(只印小数), 不同水文站的岸别起测规则不同。传统手动录入一张图需要 30~60 分钟。
AI 解决方案
1. 全局X聚类:用频次加权聚类识别所有列的位置,不依赖网格线
2. 高程补全算法:自动检测并补全被省略的高程整数部分
3. 岸别判定:根据OCR识别的"左/右"标记自动判断
4. 批量处理:一次上传多张图片,后台异步处理
使用说明
四步完成断面数据提取,新手也能快速上手
准备断面扫描图
将断面实测成果表扫描或拍照保存为 PNG / JPG 格式。要求图片清晰、文字可辨认。支持多张图片同时上传,系统会逐个处理。
建议分辨率 ≥ 150 DPI,避免手机拍照时的倾斜和阴影上传并启动识别
拖拽图片到上传区域(或点击选择文件),确认文件列表无误后点击「开始识别」。系统自动调用 PaddleOCR 进行中文文字识别,每个文字的位置和内容都会被记录。
支持 PNG / JPG / JPEG,单次最多 20 张等待 AI 处理
系统自动进行:OCR识别 → 全局X聚类定位列组 → 行列匹配 → 高程整数补全 → 岸别判定。每张图约需 15~30 秒,页面实时显示处理进度。
不要关闭页面,任务后台异步处理,可同时上传下一批下载 Excel 结果
处理完成后点击「下载Excel」获取结果。包含汇总 sheet(文件名/年份/站名/测量次数/数据点数)+ 各测次独立 sheet(序号/日期/起点距/高程/水位/备注),格式规范可直接用于报告。
建议人工抽查首尾各5行,确认岸别和起点距单调性正确视频教程
观看真实操作录屏,3 分钟掌握 OCR 工具使用方法
视频使用 OBS 录制,建议全屏观看。文件路径:/videos/ocr-tutorial.mp4
5列组×3子列
自动识别复杂的多列组排版
智能补全
自动推断被省略的高程整数
岸别判定
左岸/右岸自动标注
Excel导出
标准断面数据格式