帮助与文档 > 产品文档 > 视觉智能服务 > 常见问题 > 通用OCR
通用OCR

通用文字识别 相关

Q:图片格式和分辨率有限制吗?
A:目前图片格式支持jpg、png、bmp,图片的长和宽要求最短边大于10px,最长边小于2048 px。(最大边长超过2048的图像会被缩放,影响效果,建议控制输入图像像素)

Q:图片大小有限制吗?
A:图像编码后大小必须小于2M,建议不要超过1M;(编码后大于1M的图像会被缩放,影响效果,建议控制输入图像大小)

Q:识别的图片支持什么形式的输入?
A:目前文字识别接口仅支持base64编码输入。

Q:通用文字识别对中英文字体有要求吗?
A:字体没要求,但对特殊字体的支持可能不好。

Q:通用文字识别支持哪些语言识别?
A:目前支持二十余种语言,可在支持语言类型进行参数设置,后续会支持更多语种。

Q:支持文档扫描图片的文字识别吗?
A:目前开放的自然场景下,通用文字识别接口也同样支持文档扫描图片

Q:什么是base64编码,如何提供?
A:图片的base64编码指将一副图片数据编码成一串字符串,使用该字符串代替图像地址。您可以首先得到图片的二进制,然后用Base64格式编码即可。注:图片的base64编码是不包含图片头的,如(data:image/jpg;base64,)