# OCR自动切割上传阿里云识别钢材公司复杂报价图 **Repository Path**: DLjun/SteelCompanyOCR ## Basic Information - **Project Name**: OCR自动切割上传阿里云识别钢材公司复杂报价图 - **Description**: OCR自动切割上传阿里云识别钢材公司复杂报价图 - **Primary Language**: Python - **License**: MIT - **Default Branch**: main - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2024-03-01 - **Last Updated**: 2024-03-01 ## Categories & Tags **Categories**: Uncategorized **Tags**: Python ## README # OCR自动切割上传阿里云识别钢材公司复杂报价图 #### 介绍 为当前公司开发的一款用于识别多个公司不同报价图片的OCR识别、切割、上传阿里云、分析数据为一体的超级臃肿代码 码力有限,看看就行 仅做备份、留念 #### 使用说明 1、首先需要找到一张适合的报价图 2、手动提取图中的点位,写入【\报价图片与文本\配置】的【#坐标.txt】 3、配置阿里云接口环境变量【ALIBABA_CLOUD_ACCESS_KEY_ID】、【ALIBABA_CLOUD_ACCESS_KEY_SECRET】 4、提取回传数据中的关键词,写入【\报价图片与文本\配置】的【#公司关键词.txt】 5、其他的看下面 #坐标.txt 用途:给与自动切图代码段坐标,并让代码按需求自动切图 数据格式: - 文件名/新文件名/左上角x坐标,左上角y坐标,右下角x坐标,右下角y坐标 修改示范: - 热联/热联_1/295,295,1147,HH 获取方法: - 使用工具【图片坐标拾取.exe】打开图片,选中左上角和右下角 - 如图片一致可以使用绝对坐标 - 如图片高不一致,可以使用HH获取图片的最高点 - 如图片款不一直,可以使用工具【坐标百分比计算器.py】 计算图片相对点位在图片宽度的相对定位,使用WW数字%配合代码自动校准 变量说明: - 坐标中,可以使用WW和HH来代表图像高度和宽度 例如图片是1920X1080,输入WW就会获取到1920,输入HH就可以获得1080 - 在WW或HH后面加上【数字%】就可以获取当前图片的相对位置 例如HH=1000,HH50%就是500 并且,在获取到百分比位置后,算法会自动校准他的相对距离最近的表格点位。 #公司关键词.txt 用途:替换OCR识别后返回的信息,识别标题行和特殊内容 数据格式: - 公司名$识别内容$替换内容 修改示范: -广之升$柳钢协议冷卷DC01/SPCC$材质=协议/DC01/SPCC 变量说明: - 当前识别关键词包含 【材质】 【规格】【优惠(废弃)】 - 公司名需与图片名一致 - 关键词会自动跟代码中OCR识别结果做相似度分析 Finally_需求材质.txt 用途:识别文件中包含的材质 数据格式: - 材质名 修改示范: - SPCC Finally_需求规格.txt 用途:识别文件中包含的规格 数据格式: - 厚度*宽度 修改示范: - 0.5*1250