OCR 模型 Playground 使用手册

OCR Playground 是 Herdsman 为 PaddleOCR 等文字识别模型提供的专用测试界面。允许用户在不编写代码的情况下,直接上传图片并查看文字提取结果、置信度及模型运行状态。

启动 OCR 模型

  1. 进入 模型中心 界面
  2. 在顶部功能区点击 图像处理,或在模型列表中找到带有 OCR 标签的模型
  3. 点击模型卡片右下角的 立即启动 按钮
  4. 待模型状态变为 正在运行 后,点击 查看详情 或直接点击卡片进入 Playground 界面

屏幕截图 2026-06-02 150326

界面功能详解

OCR Playground 界面专为图像处理设计,主要包含以下三个核心区域:

屏幕截图 2026-06-02 150351

图片输入与操作区(上部)

  • 图片上传
    • 拖拽上传:直接将本地图片拖入虚线框区域
    • 点击选择:点击右上角 选择图片 按钮
    • 支持格式:PNG / JPG / WebP / BMP
  • 控制按钮
    • 识别:上传图片后,点击此按钮开始执行文字识别
    • 停止:若识别过程耗时过长或需取消,点击此按钮中断任务

识别结果展示区(中部与下部)

分为两个维度展示:

  • 识别结果(全文本)
    • 展示从图片中提取出的完整纯文本内容
    • 提供 复制结果 按钮,方便一键复制提取出的文字
  • 文本行(结构化数据)
    • 逐行查看:展示模型识别出的每一行文本
    • 置信度(Confidence):显示每一行文字的识别可信度(如 0.98
    • 通过查看置信度,您可以判断模型对特定文字(如模糊字、生僻字)的识别把握有多大

运行状态监控(右侧边栏)

  • 性能指标
    • TTFA / RTF:首字响应时间与实时率,衡量识别速度
    • 延迟 / 分块:显示处理延迟及数据传输分块情况
    • 硬件占用:实时监控 CPU、GPU 和内存的使用率
  • 运行日志
    • 显示 WARN(警告)、RUNTIME(运行时状态)、INFO(信息)等日志,用于排查模型加载失败或识别异常的问题

快速操作流程

  1. 准备图片 — 准备一张包含文字的清晰图片(支持截图、扫描件等)
  2. 上传 — 将图片拖入 图片识别 区域
  3. 执行 — 点击左下角 识别 按钮
  4. 验证
    • 查看 识别结果 区域,确认文字是否提取准确
    • 查看 文本行 区域,检查是否有低置信度(如低于 0.6)的行
  5. 导出 — 点击 复制结果 将文字粘贴到文档中

屏幕截图 2026-06-02 151723