OCR 模型 Playground 使用手册

OCR Playground 是 Herdsman 为 PaddleOCR 等文字识别模型提供的专用测试界面。允许用户在不编写代码的情况下，直接上传图片并查看文字提取结果、置信度及模型运行状态。

启动 OCR 模型

屏幕截图 2026-06-02 150326

OCR Playground 界面专为图像处理设计，主要包含以下三个核心区域：

屏幕截图 2026-06-02 150351

图片上传：
- 拖拽上传：直接将本地图片拖入虚线框区域
- 点击选择：点击右上角 选择图片 按钮
- 支持格式：PNG / JPG / WebP / BMP
控制按钮：
- 识别：上传图片后，点击此按钮开始执行文字识别
- 停止：若识别过程耗时过长或需取消，点击此按钮中断任务

分为两个维度展示：

识别结果（全文本）：
- 展示从图片中提取出的完整纯文本内容
- 提供 复制结果 按钮，方便一键复制提取出的文字
文本行（结构化数据）：
- 逐行查看：展示模型识别出的每一行文本
- 置信度（Confidence）：显示每一行文字的识别可信度（如 0.98）
- 通过查看置信度，您可以判断模型对特定文字（如模糊字、生僻字）的识别把握有多大

性能指标：
- TTFA / RTF：首字响应时间与实时率，衡量识别速度
- 延迟 / 分块：显示处理延迟及数据传输分块情况
- 硬件占用：实时监控 CPU、GPU 和内存的使用率
运行日志：
- 显示 WARN（警告）、RUNTIME（运行时状态）、INFO（信息）等日志，用于排查模型加载失败或识别异常的问题

屏幕截图 2026-06-02 151723