Opencv学习笔记二——基本图像操作

发布时间：2023-11-10 14:00

最近本人在学习OpenCV，简要地记一下笔记，课后温习的同时便于日后查阅。

所用教程是唐宇迪老师的OpenCV教程，个人觉得讲解清晰易懂，附上链接：https://www.bilibili.com/video/BV1tb4y1C7j7?p=5

一、截取图像

当我们使用imread读取一张图片后，返回值是一个多维数组。

如果采用的是3通道BGR读取，那么这个数组会是一个三维的，第一个维度表示纵向的像素点，第二个维度表示横向的像素点，第三个维度表示BGR中的通道。

所以截取的时候直接使用数组切片即可。

1.所需模块与自定义函数

import cv2
import numpy as np
import matplotlib.pyplot as plt

def cv_show(name, mat):
    cv2.imshow(name, mat)
    cv2.waitKey(0)
    cv2.destroyAllWindows()

2.截取

miku = cv2.imread('C://Users//rwhite//Pictures//_20210810092934.jpg', cv2.IMREAD_COLOR)
cv_show('miku', miku)
#截取图片的一部分
cv_show('miku', miku[0:200, 0:200])
#截取图片的某个通道
cv_show('miku', miku[:,:,2])

原图与处理得到的图片如下：

3.直接切分通道——split

b, g, r = cv2.split(miku)
cv_show('b', b)
cv_show('g', g)
cv_show('r', r)

处理得到的图片如下：

4.合并通道——merge

注意：merge传入的参数是一个元组！

m = cv2.merge((b, g, r))
cv_show('miku', m)

运行即可再次得到原图

二、简单处理图像

1.边界填充——copyMakeBoarder

###        函数原型
void copyMakeBorder( const Mat& src, Mat& dst,
int top, int bottom, int left, int right,
int borderType, const Scalar& value=Scalar() );

###        在python中使用
cv2.copyMakeBorder(src, top, bottom, left, right, borderType, value)

src,dst：原图与目标图像
top,bottom,left,right：分别表示在原图四周扩充边缘的大小
borderType：扩充边缘的类型，OpenCV中给出以下几种方式
value：若指定为常量填充，则需要设置常量填充的值

cv2.BORDER_REPLICATE	aaaaaa\|abcdefgh\|hhhhhhh	复制粘贴边缘像素
cv2.BORDER_REFLECT	fedcba\|abcdefgh\|hgfedcb	镜像复制【包括边缘点】
cv2.BORDER_REFLECT_101	gfedcb\|abcdefgh\|gfedcba	镜像复制【不包括边缘点】
cv2.BORDER_WRAP	cdefgh\|abcdefgh\|abcdefg	外包装法
cv2.BORDER_CONSTANT	iiiiii\|abcdefgh\|iiiiiii	常量复制

2.数值相加

直接与常数相加或者数组的值直接相加

###    数组的值直接相加
mikuu = miku + 10
mikuuu1 = miku + mikuu

cv_show('mikuu', mikuu)
cv_show('mikuuu1', mikuuu1)

使用函数cv2.add

mikuuu2 = cv2.add(mikuu, mikuuu1)

cv_show('mikuuu2', mikuuu1)

两者的区别：因为像素点的取值在0-255之间，如果用数组的值直接相加，每个像素点的结果都会自动对256取余。而如果使用函数add相加，则值超过255的像素点将会保留255

3.图像融合

图像融合前，需保证两张图片的大小一致，这就涉及一个缩放的操作

缩放图片

###    在python中使用
cv2.resize(InputArray src, OutputArray dst, Size, fx, fy, interpolation)

InputArray src	输入图片
OutputArray dst	输出图片
Size	输出图片尺寸
fx, fy	沿x轴，y轴的缩放系数
interpolation	插入方式

注意：Size是必须传入的参数，传入类型是一个元组！

插入方式具体参数如下：

INTER_NEAREST	最近邻插值
INTER_LINEAR	双线性插值（默认设置）
INTER_AREA	使用像素区域关系进行重采样。(在缩小时使用)
INTER_CUBIC	4x4像素邻域的双三次插值
INTER_LANCZOS4	8x8像素邻域的Lanczos插值

融合

###        函数原型
void cv::addWeighted ( InputArray  src1,
		double  	alpha,
		InputArray  src2,
		double  	beta,
		double  	gamma,
		OutputArray  dst,
		int  dtype = -1 
	)
###        在python中使用
dst = cv2.addWeighted(src1, alpha, src2, beta, gamma, dst, dtype)

该函数可用一个公式表示：

dst = src1 * alpha + src2 * beta + gamma

注意：alpha和beta表示两幅图像各自的权重，权重越高像素点的值越大，也就越明亮

miku = cv2.imread('C://Users//rwhite//Pictures//_20210810092934.jpg', cv2.IMREAD_COLOR)
rin = cv2.imread('C://Users//rwhite//Pictures//_20210810092925.jpg', cv2.IMREAD_COLOR)

cv_show('miku', miku)
cv_show('rin', rin)

res = cv2.addWeighted(miku, 0.6, rin, 0.4, 2)
cv_show('res', res)

3.图像阈值——threshold

###        函数原型
double cv::threshold( InputArray  src,
		OutputArray  dst,
		double  thresh,
		double  maxval,
		int  	type 
)
###        在python中使用
	retval, dst	= cv2.threshold( src, thresh, maxval, type, dst )

src	待处理的图像
dst	处理后的图像，大小、类型要与src一致
thresh	门槛值
maxval	最大值【在设置THRESH_BINARY和THRESH_BINARY_INV 时使用】
type	图像处理方式

type的具体设置如下：

cv2.THRESH_BINARY	超过阈值部分取maxval（最大值），否则取0
cv2.THRESH_BINARY_INV	THRESH_BINARY的反转
cv2.THRESH_TRUNC	大于阈值部分设为阈值，否则不变
cv2.THRESH_TOZERO	大于阈值部分不改变，否则设为0
cv2.THRESH_TOZERO_INV	THRESH_TOZERO的反转

注意：返回值有两个，第一个表示执行成功与否，第二个才是处理后的图像！

img = cv2.imread('C://Users//rwhite//Pictures//opencv//_20210511202744.jpg', cv2.IMREAD_COLOR)

ret, img1 = cv2.threshold(img, 127, 255, cv2.THRESH_BINARY)
ret, img2 = cv2.threshold(img, 127, 255, cv2.THRESH_BINARY_INV)
ret, img3 = cv2.threshold(img, 127, 255, cv2.THRESH_TRUNC)
ret, img4 = cv2.threshold(img, 127, 255, cv2.THRESH_TOZERO)
ret, img5 = cv2.threshold(img, 127, 255, cv2.THRESH_TOZERO_INV)

title = ['ORIGINAL', 'THRESH_BINARY', 'THRESH_BINARY_INV', 'THRESH_TRUNC', 'THRESH_TOZERO', 'THRESH_TOZERO_INV']
imgg = [img, img1, img2, img3, img4, img5]

for i in range(6):
    plt.subplot(2,3,i+1), plt.imshow(imgg[i])
    plt.title(title[i])
    plt.xticks([]),plt.yticks([])

plt.show()