跟着b站的教程学习链接:https://www.bilibili.com/video/BV1RQ4y1R7M6?p=6
内容基本按照教程走,进行了一些简单的注释和总结。
无原理解释,默认学过
1.读取和处理
图片读取
src = cv.imread("D:/ALL_LEARN/picture/cat.jpg", cv.IMREAD_GRAYSCALE) # opencv读取文件的路径不能有中文名 # src =img[0:50, 0:200] # 截取图像中的一部分 b, g, r = cv.split(src) # cv.IMREAD_GRAYSCALE 转灰度图像 cv.namedWindow("cat and girl", cv.WINDOW_AUTOSIZE) cv.imshow("cat and girl", src) cv.waitKey(0) # 等待事件触发,参数0表示指令发出后立即执行。本题是按任意键执行destroyAllWindows cv.destroyAllWindows() # 释放窗口 cv.imwrite()
视频读取
video_test01 = cv.VideoCapture("D:/ALL_LEARN/video/test01.mp4") # 检查是否能打开 if video_test01.isOpened(): open, frame = video_test01.read() else: open = False while open: ret, frame = video_test01.read() if frame is None: break # if ret == True: if ret: gray = cv.cvtColor(frame, cv.COLOR_BGR2GRAY) # 转灰度图 cv.imshow("result", gray) if cv.waitKey(10) & 0xFF == 27: # 27表示键盘中退出键Esc, 10表示功能运行速度 break video_test01.release() cv.destroyAllWindows()
2.ROI区域(兴趣区域)
src = cv.imread("D:/ALL_LEARN/picture/cat.jpg", cv.IMREAD_COLOR) # b, g, r = cv.split(src) # src = cv.merge(b, g, r) # 转回rgb图 cur_src = src.copy() cur_src[:, :, 0] = 0 # 前两个":"表示取所有像素点 cur_src[:, :, 1] = 0 # BGR 分表用012代表,各通道置0 cv.imshow("R", cur_src) cv.waitKey(0) cv.destroyAllWindows() cv.imwrite()
3.边界填充
src = cv.imread("D:/ALL_LEARN/picture/cat.jpg", cv.IMREAD_COLOR) replicate = cv.copyMakeBorder(src, 50, 50, 50, 50, borderType=cv.BORDER_CONSTANT) cv.imshow("R", replicate) cv.waitKey(0) cv.destroyAllWindows() cv.imwrite() # BORDER_REPLICATE:复制边缘像素 # BORDER_CONSTANT常量法,常数值填充,value=0, # BORDER_REFLECT:反射法,fedcba|abcdef|fedcba # BORDER_REFLECT_101:反射法:fedcba|bcdef|edcba
4.数值计算
# img_dog = cv.imread("dog.jpg") # img_cat = cv.imread("cat.jpg") # img_cat1 = img_cat + 10 # 所有值+10 # img_cat[:5, :, 0] # 打印前五行 # cv.add(img_cat, img_dog) # 像素点相加,大于255置255 # cv.resize(img_cat, (0, 0), fx=2, fy=1) # 重新设置大小 # cv.addWeighted(img_cat, 0.2, img_dog, 0.6) # 图像融合 ctrl+/取消注释
5.图像阈值
src = cv.imread("D:/ALL_LEARN/picture/cat.jpg", cv.IMREAD_GRAYSCALE) ret, dst = cv.threshold(src, 127, 255, type=cv.THRESH_TOZERO) cv.imshow("R", dst) cv.waitKey(0) cv.destroyAllWindows() # src:输入图,单通道,灰度图 # dst:输出图、thresh:阈值,maxval:像素值超过阈值后所赋予的值 # type:二值化类型,加上INV就是其反转 # type=cv.THRESH_BINARY超过阈值部分取maxval,否则取0 # cv.THRESH_BINARY_INV超过阈值部分取0,否则取maxval # THRESH_TOZERO大于阈值不变,否则取0 # THRESH_TRUNC:大于设为阈值,否则不变 # THRESH_MASK:不支持,未找到相关用法,尝试后全黑 # TOZERO:大于阈值不变,小于为0
6.图像平滑处理
# src = cv.imread("D:/ALL_LEARN/picture/cat.jpg", cv.IMREAD_GRAYSCALE) src = cv.imread("D:/ALL_LEARN/picture/cat.jpg", cv.IMREAD_COLOR) mean = cv.blur(src, (3, 3)) cv.imshow("mean", mean) cv.waitKey(0) cv.destroyAllWindows() """ 1.均值滤波 取滤波器均值 cv.blur(src,(3,3)) 2.方框滤波 加入归一化 cv.boxFilter(src,-1,(3,3),normalize=False) -1表示通道数一致 False表示不归一化,大于255取255 3.高斯滤波 构造权重矩阵 cv.GaussianBlur(src,(3,3),1) 4.中值滤波 找到均值后作为当前值 medianBlur 展示所有 res =np.hstack((,,,)) print(res) imshow(res) """
7.形态学
src = cv.imread("D:/ALL_LEARN/picture/cat.jpg", cv.IMREAD_GRAYSCALE) # src = cv.imread("D:/ALL_LEARN/picture/cat.jpg", cv.IMREAD_COLOR) kernel = np.ones((5, 5), np.uint8) erosion = cv.erode(src, kernel, iterations=1) cv.imshow("erosion", erosion) cv.waitKey(0) cv.destroyAllWindows() """ 1.腐蚀 kernel =no.ones((5,5),np.uint8) # 核大小决定每次腐蚀面积的大小 erosion=cv.erode(src,kernel,iterations=2)#iterations迭代次数 2.膨胀 dilate=cv.dilate(src,kernel,iterations=2)#iterations迭代次数 3.开闭运算 开运算:先腐蚀后膨胀 闭运算:先膨胀后腐蚀 open = cv.morphologyEx(src,cv.MORPH_OPEN,kernel) close = cv.morphologyEx(src,cv.MORPH_CLOSE,kernel) """
8.梯度计算
src = cv.imread("D:/ALL_LEARN/picture/cat.jpg", cv.IMREAD_GRAYSCALE) # src = cv.imread("D:/ALL_LEARN/picture/cat.jpg", cv.IMREAD_COLOR) kernel = np.ones((5, 5), np.uint8) sobel_x = cv.Sobel(src, cv.CV_64F, 1, 0, ksize=3) sobel_x = cv.convertScaleAbs(sobel_x) # 数值转换 cv.imshow("sobel_x", sobel_x) cv.waitKey(0) cv.destroyAllWindows() """ 1.Sobel算子:[(-1 0 1)(-2 0 2)(-1 0 1)] cv.Sobel(src,ddepth,dx,dy,ksize) sobel_x=cv.Sobel(src,cv.CV_64F,1,0,ksize=3) #计算dx,ddepth一般为-1,CV_64F可以表示负数的形式,然后取绝对值 sobel_x=cv.convertScaleAbs(sobel_x)#数值转换 #白到黑为正,黑到白为负,负数会被截断为0,需要取正 2.梯度计算方法 先计算dx,dy,再进行叠加(分开计算结果更好,为什么?) sobelxy=cv.addWeighted(sobelx,0.5,sobely,0.5) 3.Scharr算子[(-3 0 3)(-10 0 10)(-3 0 3)] 对于sobel,对结果更敏感,头发线条的梯度信息也会捕捉到 4.laplacian[(0 1 0)(1 -4 1)(0 1 0)] 但同时对噪声点也敏感 """
9.边缘检测
src = cv.imread("D:/ALL_LEARN/picture/cat.jpg", cv.IMREAD_GRAYSCALE) # src = cv.imread("D:/ALL_LEARN/picture/cat.jpg", cv.IMREAD_COLOR) src = src[200:500, 200:500] v1 = cv.Canny(src, 80, 150) # 80,150双阈值检测的阈值minVal,越小获得的边界越多 v2 = cv.Canny(src, 50, 100) res = np.hstack((v1, v2)) # vstack # takes 1 positional argument but 2 were given (()) cv.imshow("res", res) cv.waitKey(0) cv.destroyAllWindows() """ Canny边缘检测 1.使用高斯滤波,去噪 2.计算每个像素点梯度和方向,sobel算子。 3.应用非极大值(Non-Maximum Suppression)抑制,消除杂散响应 极大值抑制:同一目标获得多个结果,取概率最大的结果 1.线性插值法:亚像素点梯度的值为临近两点的均值(有权重) 2.把一个像素的梯度离散为八个方向进行计算 4.双阈值检测边缘:进一步过滤,获得真实的边界 5.抑制鼓励弱边缘 """