Zerox OCR,一个简单\通用的 OCR 处理文档的方法
github.com/getomni-ai/zerox
基本逻辑是:
1. 传入一个文件(pdf、docx、图片等)
2. 将该文件转换为一系列图片
3. 将每张图片传递给 GPT 并礼貌地请求 Markdown
4. 聚合响应并返回 Markdown
Zerox OCR,一个简单\通用的 OCR 处理文档的方法
github.com/getomni-ai/zerox
基本逻辑是:
1. 传入一个文件(pdf、docx、图片等)
2. 将该文件转换为一系列图片
3. 将每张图片传递给 GPT 并礼貌地请求 Markdown
4. 聚合响应并返回 Markdown