AI + 水利专业

水文断面OCR提取工具

上传断面扫描图,AI 自动识别坐标数据,
导出为标准 Excel 表格。从小时级到分钟级。

工作原理

从扫描图到 Excel 表格,AI 经历了哪些步骤?

📤
上传图片
👁️
PaddleOCR
📊
X坐标聚类
🔢
高程补全
🏷️
岸别判定
📥
Excel导出

核心挑战

水文断面扫描图通常有5列组×3子列的复杂排版,高程整数部分常被省略(只印小数), 不同水文站的岸别起测规则不同。传统手动录入一张图需要 30~60 分钟。

AI 解决方案

1. 全局X聚类:用频次加权聚类识别所有列的位置,不依赖网格线
2. 高程补全算法:自动检测并补全被省略的高程整数部分
3. 岸别判定:根据OCR识别的"左/右"标记自动判断
4. 批量处理:一次上传多张图片,后台异步处理

使用说明

四步完成断面数据提取,新手也能快速上手

1

准备断面扫描图

将断面实测成果表扫描或拍照保存为 PNG / JPG 格式。要求图片清晰、文字可辨认。支持多张图片同时上传,系统会逐个处理。

建议分辨率 ≥ 150 DPI,避免手机拍照时的倾斜和阴影
2

上传并启动识别

拖拽图片到上传区域(或点击选择文件),确认文件列表无误后点击「开始识别」。系统自动调用 PaddleOCR 进行中文文字识别,每个文字的位置和内容都会被记录。

支持 PNG / JPG / JPEG,单次最多 20 张
3

等待 AI 处理

系统自动进行:OCR识别 → 全局X聚类定位列组 → 行列匹配 → 高程整数补全 → 岸别判定。每张图约需 15~30 秒,页面实时显示处理进度。

不要关闭页面,任务后台异步处理,可同时上传下一批
4

下载 Excel 结果

处理完成后点击「下载Excel」获取结果。包含汇总 sheet(文件名/年份/站名/测量次数/数据点数)+ 各测次独立 sheet(序号/日期/起点距/高程/水位/备注),格式规范可直接用于报告。

建议人工抽查首尾各5行,确认岸别和起点距单调性正确

视频教程

观看真实操作录屏,3 分钟掌握 OCR 工具使用方法

视频使用 OBS 录制,建议全屏观看。文件路径:/videos/ocr-tutorial.mp4

📊

5列组×3子列

自动识别复杂的多列组排版

🔢

智能补全

自动推断被省略的高程整数

🏷️

岸别判定

左岸/右岸自动标注

📥

Excel导出

标准断面数据格式

常见问题

支持哪些水文站的断面格式?
目前已验证沙圪堵站(左岸起测)和皇甫川站(右岸起测)。只要表格是"列组×三列"排版,通常都能被正确识别。
图片质量要求高吗?
清晰可辨认即可。严重倾斜、阴影过重、文字模糊会影响识别率。建议扫描分辨率 ≥ 150 DPI。
数据安全吗?
上传的图片和生成的 Excel 存储在自有服务器本地,24小时后自动清理。不会上传到任何第三方云服务。
识别结果不准怎么办?
建议人工抽查关键数据点(首尾行的岸别、起点距单调性)。工具的目标是减少90%的手动录入工作,剩余10%仍需专业人员判断。

准备试试?

上传你的第一张断面扫描图,体验从小时级到分钟级的改变

打开 OCR 工具 →