发布时间:2023-11-10 14:00
最近本人在学习OpenCV,简要地记一下笔记,课后温习的同时便于日后查阅。
所用教程是唐宇迪老师的OpenCV教程,个人觉得讲解清晰易懂,附上链接:https://www.bilibili.com/video/BV1tb4y1C7j7?p=5
当我们使用imread读取一张图片后,返回值是一个多维数组。
如果采用的是3通道BGR读取,那么这个数组会是一个三维的,第一个维度表示纵向的像素点,第二个维度表示横向的像素点,第三个维度表示BGR中的通道。
所以截取的时候直接使用数组切片即可。
import cv2
import numpy as np
import matplotlib.pyplot as plt
def cv_show(name, mat):
cv2.imshow(name, mat)
cv2.waitKey(0)
cv2.destroyAllWindows()
miku = cv2.imread('C://Users//rwhite//Pictures//_20210810092934.jpg', cv2.IMREAD_COLOR)
cv_show('miku', miku)
#截取图片的一部分
cv_show('miku', miku[0:200, 0:200])
#截取图片的某个通道
cv_show('miku', miku[:,:,2])
原图与处理得到的图片如下:
b, g, r = cv2.split(miku)
cv_show('b', b)
cv_show('g', g)
cv_show('r', r)
处理得到的图片如下:
注意:merge传入的参数是一个元组!
m = cv2.merge((b, g, r))
cv_show('miku', m)
运行即可再次得到原图
### 函数原型
void copyMakeBorder( const Mat& src, Mat& dst,
int top, int bottom, int left, int right,
int borderType, const Scalar& value=Scalar() );
### 在python中使用
cv2.copyMakeBorder(src, top, bottom, left, right, borderType, value)
cv2.BORDER_REPLICATE |
aaaaaa|abcdefgh|hhhhhhh | 复制粘贴边缘像素 |
cv2.BORDER_REFLECT | fedcba|abcdefgh|hgfedcb | 镜像复制【包括边缘点】 |
cv2.BORDER_REFLECT_101 | gfedcb|abcdefgh|gfedcba | 镜像复制【不包括边缘点】 |
cv2.BORDER_WRAP | cdefgh|abcdefgh|abcdefg | 外包装法 |
cv2.BORDER_CONSTANT | iiiiii|abcdefgh|iiiiiii | 常量复制 |
### 数组的值直接相加
mikuu = miku + 10
mikuuu1 = miku + mikuu
cv_show('mikuu', mikuu)
cv_show('mikuuu1', mikuuu1)
mikuuu2 = cv2.add(mikuu, mikuuu1)
cv_show('mikuuu2', mikuuu1)
两者的区别:因为像素点的取值在0-255之间,如果用数组的值直接相加,每个像素点的结果都会自动对256取余。而如果使用函数add相加,则值超过255的像素点将会保留255
图像融合前,需保证两张图片的大小一致,这就涉及一个缩放的操作
### 在python中使用
cv2.resize(InputArray src, OutputArray dst, Size, fx, fy, interpolation)
InputArray src | 输入图片 |
OutputArray dst | 输出图片 |
Size | 输出图片尺寸 |
fx, fy | 沿x轴,y轴的缩放系数 |
interpolation | 插入方式 |
注意:Size是必须传入的参数,传入类型是一个元组!
插入方式具体参数如下:
INTER_NEAREST |
最近邻插值 |
INTER_LINEAR |
双线性插值(默认设置) |
INTER_AREA |
使用像素区域关系进行重采样。(在缩小时使用) |
INTER_CUBIC |
4x4像素邻域的双三次插值 |
INTER_LANCZOS4 |
8x8像素邻域的Lanczos插值 |
### 函数原型
void cv::addWeighted ( InputArray src1,
double alpha,
InputArray src2,
double beta,
double gamma,
OutputArray dst,
int dtype = -1
)
### 在python中使用
dst = cv2.addWeighted(src1, alpha, src2, beta, gamma, dst, dtype)
该函数可用一个公式表示:
dst = src1 * alpha + src2 * beta + gamma
注意:alpha和beta表示两幅图像各自的权重,权重越高像素点的值越大,也就越明亮
miku = cv2.imread('C://Users//rwhite//Pictures//_20210810092934.jpg', cv2.IMREAD_COLOR)
rin = cv2.imread('C://Users//rwhite//Pictures//_20210810092925.jpg', cv2.IMREAD_COLOR)
cv_show('miku', miku)
cv_show('rin', rin)
res = cv2.addWeighted(miku, 0.6, rin, 0.4, 2)
cv_show('res', res)
### 函数原型
double cv::threshold( InputArray src,
OutputArray dst,
double thresh,
double maxval,
int type
)
### 在python中使用
retval, dst = cv2.threshold( src, thresh, maxval, type, dst )
src | 待处理的图像 |
dst | 处理后的图像,大小、类型要与src一致 |
thresh | 门槛值 |
maxval | 最大值【在设置THRESH_BINARY和THRESH_BINARY_INV 时使用】 |
type | 图像处理方式 |
type的具体设置如下:
cv2.THRESH_BINARY | 超过阈值部分取maxval(最大值),否则取0 |
cv2.THRESH_BINARY_INV | THRESH_BINARY的反转 |
cv2.THRESH_TRUNC | 大于阈值部分设为阈值,否则不变 |
cv2.THRESH_TOZERO | 大于阈值部分不改变,否则设为0 |
cv2.THRESH_TOZERO_INV | THRESH_TOZERO的反转 |
注意:返回值有两个,第一个表示执行成功与否,第二个才是处理后的图像!
img = cv2.imread('C://Users//rwhite//Pictures//opencv//_20210511202744.jpg', cv2.IMREAD_COLOR)
ret, img1 = cv2.threshold(img, 127, 255, cv2.THRESH_BINARY)
ret, img2 = cv2.threshold(img, 127, 255, cv2.THRESH_BINARY_INV)
ret, img3 = cv2.threshold(img, 127, 255, cv2.THRESH_TRUNC)
ret, img4 = cv2.threshold(img, 127, 255, cv2.THRESH_TOZERO)
ret, img5 = cv2.threshold(img, 127, 255, cv2.THRESH_TOZERO_INV)
title = ['ORIGINAL', 'THRESH_BINARY', 'THRESH_BINARY_INV', 'THRESH_TRUNC', 'THRESH_TOZERO', 'THRESH_TOZERO_INV']
imgg = [img, img1, img2, img3, img4, img5]
for i in range(6):
plt.subplot(2,3,i+1), plt.imshow(imgg[i])
plt.title(title[i])
plt.xticks([]),plt.yticks([])
plt.show()