最近遇到一个需求,通过minAreaRect得到最小外接矩阵后,还需要判断该矩形中的文字是横向排列还是纵向排列。网上查找很多教程,他们对minAreaRect函数以及其返回值的解释与我在实际操作时的结果都不一样,不知道是由于版本差异还是我操作的问题。我使用的版本是opencv-python 4.5.3.
要想判断矩形中的文字方向,首先要知道矩形四个点的坐标以及旋转角度。新版的opencv的改动就在于四个点坐标以及旋转角度的定义。例如,原来minAreaRect函数返回的旋转角度在[-90, 0)之间,然而在我使用的**opencv-python 4.5.3.**中返回的旋转角度在(0, 90]之间。
矩阵的旋转情况主要有以下几种情况:
文本横向排列:
文本纵向排列:
rotatedRect = cv2.minAreaRect(contours[0]) # 计算最小外接矩形 box = cv2.boxPoints(rotatedRect) # 计算矩形的坐标
在opencv中,最小外接矩形四个点的坐标定义如下:
(
x
1
,
y
1
)
(x_1, y_1)
(x1,y1):左上角的点,四个坐标中横坐标最小的点;
(
x
2
,
y
2
)
(x_2, y_2)
(x2,y2):右上角的点,四个坐标中纵坐标最小的点;
(
x
3
,
y
3
)
(x_3, y_3)
(x3,y3):右下角的点,四个坐标中横坐标最大的点;
(
x
4
,
y
4
)
(x_4, y_4)
(x4,y4):左下角的点,四个坐标中纵坐标最大的点;
在得到四个点的坐标后, ( x 1 , y 1 ) (x_1, y_1) (x1,y1)与 ( x 2 , y 2 ) (x_2, y_2) (x2,y2)的距离被认定为宽(width), ( x 2 , y 2 ) (x_2, y_2) (x2,y2)与 ( x 3 , y 3 ) (x_3, y_3) (x3,y3)的距离被认定为高(height)。我们发现矩形在旋转过程中宽和高对应的边是在不断变化的,这就是因为矩形四个点的坐标在不断变化。
这里旋转角度的计算感觉和以前的版本刚好相反,表示水平线顺时针旋转遇到矩阵第一条宽的角度,在(0, 90]之间。
(1)当旋转角度大于45度时,height需要大于width;
(2) 当旋转角度小于45度时,height需要小于width;
(1)当旋转角度大于45度时,height需要小于width;
(2) 当旋转角度小于45度时,height需要大于width;