130 lines
3.4 KiB
Markdown
130 lines
3.4 KiB
Markdown
|
|
# 阿里云OCR配置指南
|
|||
|
|
|
|||
|
|
## 📋 概述
|
|||
|
|
|
|||
|
|
数据提取与转换器现在支持使用阿里云AI大模型进行图片文字识别,相比传统OCR具有更高的准确率和更好的中文支持。
|
|||
|
|
|
|||
|
|
## 🔑 获取阿里云AccessKey
|
|||
|
|
|
|||
|
|
### 1. 注册阿里云账号
|
|||
|
|
- 访问: https://www.aliyun.com
|
|||
|
|
- 注册并完成实名认证
|
|||
|
|
|
|||
|
|
### 2. 开通OCR服务
|
|||
|
|
- 登录阿里云控制台
|
|||
|
|
- 搜索"OCR"或访问: https://www.aliyun.com/product/ocr
|
|||
|
|
- 开通"通用文字识别"服务
|
|||
|
|
|
|||
|
|
### 3. 获取AccessKey
|
|||
|
|
1. 进入控制台 → 鼠标悬停头像 → AccessKey管理
|
|||
|
|
2. 创建AccessKey(或使用现有Key)
|
|||
|
|
3. 记录以下信息:
|
|||
|
|
- AccessKey ID
|
|||
|
|
- AccessKey Secret
|
|||
|
|
|
|||
|
|
## ⚙️ 配置环境变量
|
|||
|
|
|
|||
|
|
在`.env`文件中添加阿里云配置:
|
|||
|
|
|
|||
|
|
```env
|
|||
|
|
# 阿里云OCR配置
|
|||
|
|
ALIYUN_ACCESS_KEY_ID=您的AccessKey ID
|
|||
|
|
ALIYUN_ACCESS_KEY_SECRET=您的AccessKey Secret
|
|||
|
|
ALIYUN_OCR_ENDPOINT=ocr-api.cn-hangzhou.aliyuncs.com
|
|||
|
|
```
|
|||
|
|
|
|||
|
|
## 💰 费用说明
|
|||
|
|
|
|||
|
|
### 免费额度
|
|||
|
|
- 新用户通常有免费调用额度
|
|||
|
|
- 具体额度请查看阿里云OCR产品页面
|
|||
|
|
|
|||
|
|
### 计费方式
|
|||
|
|
- 按调用次数计费
|
|||
|
|
- 具体价格请参考阿里云官方定价
|
|||
|
|
|
|||
|
|
## 🎯 功能对比
|
|||
|
|
|
|||
|
|
| 功能 | 传统OCR (Tesseract) | AI大模型OCR (阿里云) |
|
|||
|
|
|------|-------------------|---------------------|
|
|||
|
|
| **安装复杂度** | 中等(需安装软件) | 简单(仅需配置Key) |
|
|||
|
|
| **识别准确率** | 一般 | 非常高 |
|
|||
|
|
| **中文支持** | 良好 | 优秀 |
|
|||
|
|
| **复杂图片** | 较差 | 优秀 |
|
|||
|
|
| **费用** | 免费 | 按调用次数收费 |
|
|||
|
|
| **处理速度** | 快速 | 中等(网络依赖) |
|
|||
|
|
|
|||
|
|
## 🔧 故障排除
|
|||
|
|
|
|||
|
|
### 常见问题
|
|||
|
|
|
|||
|
|
**1. "阿里云AccessKey未配置"**
|
|||
|
|
- 检查.env文件中是否已配置ALIYUN_ACCESS_KEY_ID和ALIYUN_ACCESS_KEY_SECRET
|
|||
|
|
- 确保AccessKey正确无误
|
|||
|
|
|
|||
|
|
**2. "权限不足"**
|
|||
|
|
- 确认已开通OCR服务
|
|||
|
|
- 检查AccessKey是否有OCR服务权限
|
|||
|
|
|
|||
|
|
**3. "网络连接失败"**
|
|||
|
|
- 检查网络连接
|
|||
|
|
- 确认防火墙未阻止请求
|
|||
|
|
|
|||
|
|
**4. "额度不足"**
|
|||
|
|
- 检查阿里云账户余额
|
|||
|
|
- 确认免费额度是否已用完
|
|||
|
|
|
|||
|
|
### 测试配置
|
|||
|
|
|
|||
|
|
使用以下命令测试阿里云OCR配置:
|
|||
|
|
|
|||
|
|
```bash
|
|||
|
|
cd d:\python\AI\data-extractor-converter
|
|||
|
|
uv run python -c "from utils.aliyun_ocr import check_aliyun_config; print(check_aliyun_config())"
|
|||
|
|
```
|
|||
|
|
|
|||
|
|
## 🚀 使用说明
|
|||
|
|
|
|||
|
|
### 在应用中使用
|
|||
|
|
|
|||
|
|
1. 访问应用 → 选择"🖼️ 图片OCR"功能
|
|||
|
|
2. 选择"AI大模型OCR (阿里云)"模式
|
|||
|
|
3. 上传图片文件
|
|||
|
|
4. 点击"识别文字"或导出按钮
|
|||
|
|
|
|||
|
|
### 支持的图片格式
|
|||
|
|
- JPG/JPEG
|
|||
|
|
- PNG
|
|||
|
|
- GIF
|
|||
|
|
- BMP
|
|||
|
|
|
|||
|
|
### 识别类型
|
|||
|
|
- **通用文字识别** - 普通图片中的文字
|
|||
|
|
- **表格识别** - 表格数据提取
|
|||
|
|
- **高级识别** - 复杂场景文字识别
|
|||
|
|
|
|||
|
|
## 💡 最佳实践
|
|||
|
|
|
|||
|
|
### 图片优化建议
|
|||
|
|
1. **清晰度**: 确保图片清晰,文字可读
|
|||
|
|
2. **分辨率**: 建议300dpi以上
|
|||
|
|
3. **背景**: 尽量使用纯色背景
|
|||
|
|
4. **角度**: 保持文字水平
|
|||
|
|
|
|||
|
|
### 成本控制
|
|||
|
|
1. **批量处理**: 尽量批量处理图片
|
|||
|
|
2. **图片预处理**: 先裁剪和优化图片
|
|||
|
|
3. **监控使用**: 定期查看阿里云使用量
|
|||
|
|
|
|||
|
|
## 📚 相关资源
|
|||
|
|
|
|||
|
|
- [阿里云OCR文档](https://help.aliyun.com/product/30419.html)
|
|||
|
|
- [AccessKey管理](https://ram.console.aliyun.com/manage/ak)
|
|||
|
|
- [OCR产品定价](https://www.aliyun.com/price/product#/ocr/detail)
|
|||
|
|
|
|||
|
|
## ⚠️ 注意事项
|
|||
|
|
|
|||
|
|
1. **安全性**: 不要将AccessKey提交到版本控制系统
|
|||
|
|
2. **费用**: 注意监控使用量,避免意外费用
|
|||
|
|
3. **网络**: AI OCR需要稳定的网络连接
|
|||
|
|
4. **备份**: 重要数据建议使用传统OCR作为备份方案
|