Mac用户可直接用系统原生实况文本(需macOS 12+及M/A系列芯片)、快捷指令自动化OCR、OneNote for Mac、命令行Tesseract或QQ Mac客户端实现图片文字提取,无需额外安装软件。

如果您在Mac上看到一张含文字的图片,希望立即提取其中内容而无需安装额外软件,则可能是由于系统未启用实况文本(Live Text)功能或所用图片格式/场景不满足识别条件。以下是针对macOS原生实况文本与OCR识别的多种操作路径:
一、启用并使用macOS实况文本(Live Text)功能
实况文本是macOS Monterey(12.0)及以上版本内置的AI驱动OCR能力,可直接在照片、截图、Quick Look预览中识别并交互文字,无需打开第三方应用。该功能依赖设备硬件加速(需搭载A12 Bionic或M系列芯片的Mac),且仅对英文、简体中文、日文、韩文等主流语言实时生效。
1、确认系统版本:点击左上角苹果图标 → “关于本机”,确保系统为macOS Monterey 12.0或更高版本。
2、开启实况文本权限:进入“系统设置” → “隐私与安全性” → “全盘访问”,检查“照片”“预览”“访达”是否已勾选;若未列出,点击“+”号手动添加。
3、在“照片”App中识别:打开一张含清晰文字的图片 → 长按文字区域(或右键)→ 出现浮动菜单后选择“查找”“翻译”或“复制” → 文字将被自动框选并高亮,支持直接复制。
4、在“预览”中识别:用预览打开图片 → 将光标悬停于文字上方 → 出现文本光标形状 → 点击拖选文字 → 右键选择“拷贝” → 无需OCR按钮,全程零点击触发。
二、通过快捷指令自动化调用实况文本提取
当需批量处理或集成至工作流时,可创建自定义快捷指令,绕过图形界面直接调用系统级文本提取API,适用于截图、剪贴板图像等场景。
1、打开“快捷指令”App → 点击右上角“+”新建指令。
2、点击“添加操作” → 搜索并添加“从图像中提取文本”动作。
3、点击该动作中的“图像”字段 → 选择“输入快捷指令的信息”(支持传入剪贴板图像或文件路径)。
4、添加“拷贝到剪切板”动作 → 再添加“显示通知”动作,标题设为“OCR完成”,正文设为“已复制识别文字”。
5、点击右上角“…”,设定快捷指令名称为“OCR提取”,并启用“在快速操作中显示” → 此后在访达右键菜单或触控栏中即可一键调用。
三、使用OneNote for Mac执行OCR识别
OneNote for Mac内置OCR引擎,对低对比度、倾斜排版、PDF嵌入图等非理想图像具备更强容错性,适合处理扫描件或文档截图,识别结果可保留段落结构。
1、在OneNote中新建一页 → 将含文字的图片拖入页面,或使用“插入”→“图片”导入。
2、右键点击该图片 → 在上下文菜单中选择“从图片复制文本”。若选项为灰色,请等待24–48小时让后台OCR服务完成索引。
3、识别完成后,右键图片再次出现该选项 → 点击后系统自动提取全部可读文字 → 粘贴至任意应用即得纯文本,标点与换行基本准确。
四、调用命令行Tesseract-OCR进行高精度离线识别
Tesseract是Google开源OCR引擎,macOS可通过Homebrew安装,支持自定义语言包、图像预处理及批量脚本调用,适用于开发者或需控制识别参数的用户。
1、终端执行:brew install tesseract tesseract-lang(安装主程序及中文语言包)。
2、准备待识别图片,确保为PNG/JPEG格式且文字区域无严重畸变。
3、运行识别命令:tesseract input.png stdout -l chi_sim+eng(同时启用简体中文与英文模型)。
4、输出结果将直接打印至终端 → 使用重定向保存:tesseract input.png output -l chi_sim+eng && cat output.txt → 支持输出TXT、PDF、HOCR等多种格式,识别精度显著高于系统默认。
五、借助QQ Mac客户端实现屏幕区域级实时OCR
QQ for Mac内置“识别屏幕文字”功能,基于本地OCR引擎,响应快、无需联网,特别适合截取对话窗口、网页弹窗等动态界面中的文字片段。
1、打开QQ → 点击左上角“QQ”菜单 → “偏好设置” → “热键” → 开启“识别屏幕文字”并确认快捷键(默认为Ctrl + Command + O)。
2、按下快捷键 → 屏幕变暗并出现十字光标 → 拖拽框选目标文字区域(支持自由缩放与旋转校正)。
3、松开鼠标后立即弹出识别窗口 → 文字自动高亮显示 → 点击“复制”按钮或快捷键Command+C即可获取结果,识别延迟低于300ms。










