玩酷网

Zerox OCR,一个简单\通用的 OCR 处理文档的方法github.com

Zerox OCR,一个简单\通用的 OCR 处理文档的方法

github.com/getomni-ai/zerox

基本逻辑是:

1. 传入一个文件(pdf、docx、图片等)

2. 将该文件转换为一系列图片

3. 将每张图片传递给 GPT 并礼貌地请求 Markdown

4. 聚合响应并返回 Markdown ​​​