iPhone变身局域网OCR服务器:Apple Vision驱动,隐私无忧
利用Apple Vision Framework,OCR Server将iPhone转化为局域网内的OCR服务器,支持多语言识别,本地处理,确保隐私安全。
什么是OCR Server
OCR Server是一款基于Apple Vision Framework的iOS应用,它可以将您的iPhone变成一个局域网内可访问的OCR服务器。该应用提供网页上传和JSON API,支持多语言自动检测和高速识别,所有处理均在设备端完成,无需依赖云端,确保数据安全。


OCR Server核心能力
- 高精度文字识别:利用Vision的VNRecognizeTextRequest功能,对图像进行文字定位与提取,适用于常见场景的文本抽取。
- 多语言自动检测:自动识别多语种内容,减少手动切换语言的成本。
- 网页与API:在同一网络内,通过应用显示的IP用浏览器上传图片并获取识别结果;同时提供返回JSON的Web API,便于系统集成与自动化。
- 边界框与结构化结果:新版在JSON中加入文字位置等信息,便于二次标注与可视化。
- 100%本地处理与隐私保护:处理过程在iPhone上完成,不上传云端,适合对合规与保密有要求的场景。
适用场景
- 开发测试:为移动或后端应用提供局域网OCR测试环境。
- 团队协作:在办公室/工作室内共享OCR服务,统一入口、减少账号与配额管理。
- 离线处理:网络受限或禁止外连的环境下完成文字识别。
- 批量/集群:用多台iPhone组成轻量OCR集群,提升吞吐。
OCR Server如何使用
基本步骤
- 打开应用,内置服务器自动启动。
- 在同一Wi-Fi/局域网内,用任意设备访问屏幕上显示的IP。
- 通过网页上传图片,数秒内返回识别文本与结构化结果;或以API方式对接业务。
稳定运行建议
需要长时间不间断服务时,可启用iOS引导式访问(Guided Access),锁定在当前应用并管理自动锁屏行为,减少误触与待机中断。设置路径见Apple支持文档。

OCR Server下载地址
GitHub地址:https://github.com/riddleling/iOS-OCR-Server


App Store下载地址:OCR Server