Opencv学习笔记二——基本图像操作

发布时间:2023-11-10 14:00

最近本人在学习OpenCV,简要地记一下笔记,课后温习的同时便于日后查阅。

所用教程是唐宇迪老师的OpenCV教程,个人觉得讲解清晰易懂,附上链接:https://www.bilibili.com/video/BV1tb4y1C7j7?p=5

一、截取图像

当我们使用imread读取一张图片后,返回值是一个多维数组。

如果采用的是3通道BGR读取,那么这个数组会是一个三维的,第一个维度表示纵向的像素点,第二个维度表示横向的像素点,第三个维度表示BGR中的通道。

所以截取的时候直接使用数组切片即可。

1.所需模块与自定义函数

import cv2
import numpy as np
import matplotlib.pyplot as plt

def cv_show(name, mat):
    cv2.imshow(name, mat)
    cv2.waitKey(0)
    cv2.destroyAllWindows()

2.截取

miku = cv2.imread('C://Users//rwhite//Pictures//_20210810092934.jpg', cv2.IMREAD_COLOR)
cv_show('miku', miku)
#截取图片的一部分
cv_show('miku', miku[0:200, 0:200])
#截取图片的某个通道
cv_show('miku', miku[:,:,2])

 原图与处理得到的图片如下:

Opencv学习笔记二——基本图像操作_第1张图片           

 3.直接切分通道——split

b, g, r = cv2.split(miku)
cv_show('b', b)
cv_show('g', g)
cv_show('r', r)

 处理得到的图片如下:

 Opencv学习笔记二——基本图像操作_第2张图片

4.合并通道——merge

注意:merge传入的参数是一个元组!

m = cv2.merge((b, g, r))
cv_show('miku', m)

 运行即可再次得到原图

 二、简单处理图像

1.边界填充——copyMakeBoarder

###        函数原型
void copyMakeBorder( const Mat& src, Mat& dst,
int top, int bottom, int left, int right,
int borderType, const Scalar& value=Scalar() );

###        在python中使用
cv2.copyMakeBorder(src, top, bottom, left, right, borderType, value)
  • src,dst:原图与目标图像
  • top,bottom,left,right:分别表示在原图四周扩充边缘的大小
  • borderType:扩充边缘的类型,OpenCV中给出以下几种方式
  • value:若指定为常量填充,则需要设置常量填充的值

cv2.BORDER_REPLICATE

aaaaaa|abcdefgh|hhhhhhh 复制粘贴边缘像素
cv2.BORDER_REFLECT fedcba|abcdefgh|hgfedcb 镜像复制【包括边缘点】
cv2.BORDER_REFLECT_101 gfedcb|abcdefgh|gfedcba 镜像复制【不包括边缘点】
cv2.BORDER_WRAP cdefgh|abcdefgh|abcdefg 外包装法
cv2.BORDER_CONSTANT iiiiii|abcdefgh|iiiiiii 常量复制

 2.数值相加

  • 直接与常数相加或者数组的值直接相加
###    数组的值直接相加
mikuu = miku + 10
mikuuu1 = miku + mikuu

cv_show('mikuu', mikuu)
cv_show('mikuuu1', mikuuu1)

 Opencv学习笔记二——基本图像操作_第3张图片

  •  使用函数cv2.add
mikuuu2 = cv2.add(mikuu, mikuuu1)

cv_show('mikuuu2', mikuuu1)

Opencv学习笔记二——基本图像操作_第4张图片

 两者的区别:因为像素点的取值在0-255之间,如果用数组的值直接相加,每个像素点的结果都会自动对256取余。而如果使用函数add相加,则值超过255的像素点将会保留255

 3.图像融合

 图像融合前,需保证两张图片的大小一致,这就涉及一个缩放的操作

  • 缩放图片
###    在python中使用
cv2.resize(InputArray src, OutputArray dst, Size, fx, fy, interpolation)
InputArray src 输入图片
OutputArray dst 输出图片
Size 输出图片尺寸
fx, fy 沿x轴,y轴的缩放系数
interpolation

插入方式

 注意:Size是必须传入的参数,传入类型是一个元组!

 插入方式具体参数如下:

INTER_NEAREST

最近邻插值

INTER_LINEAR

双线性插值(默认设置)

INTER_AREA

使用像素区域关系进行重采样。(在缩小时使用)

INTER_CUBIC

4x4像素邻域的双三次插值

INTER_LANCZOS4

8x8像素邻域的Lanczos插值

  • 融合
###        函数原型
void cv::addWeighted ( InputArray  src1,
		double  	alpha,
		InputArray  src2,
		double  	beta,
		double  	gamma,
		OutputArray  dst,
		int  dtype = -1 
	)
###        在python中使用
dst = cv2.addWeighted(src1, alpha, src2, beta, gamma, dst, dtype) 

 该函数可用一个公式表示:

dst = src1 * alpha + src2 * beta + gamma

 注意:alpha和beta表示两幅图像各自的权重,权重越高像素点的值越大,也就越明亮

miku = cv2.imread('C://Users//rwhite//Pictures//_20210810092934.jpg', cv2.IMREAD_COLOR)
rin = cv2.imread('C://Users//rwhite//Pictures//_20210810092925.jpg', cv2.IMREAD_COLOR)

cv_show('miku', miku)
cv_show('rin', rin)

res = cv2.addWeighted(miku, 0.6, rin, 0.4, 2)
cv_show('res', res)

Opencv学习笔记二——基本图像操作_第5张图片

 3.图像阈值——threshold

###        函数原型
double cv::threshold( InputArray  src,
		OutputArray  dst,
		double  thresh,
		double  maxval,
		int  	type 
)
###        在python中使用
	retval, dst	= cv2.threshold( src, thresh, maxval, type, dst )
src 待处理的图像
dst 处理后的图像,大小、类型要与src一致
thresh 门槛值
maxval 最大值【在设置THRESH_BINARY和THRESH_BINARY_INV 时使用】
type 图像处理方式

type的具体设置如下:

cv2.THRESH_BINARY 超过阈值部分取maxval(最大值),否则取0
cv2.THRESH_BINARY_INV THRESH_BINARY的反转
cv2.THRESH_TRUNC 大于阈值部分设为阈值,否则不变
cv2.THRESH_TOZERO 大于阈值部分不改变,否则设为0
cv2.THRESH_TOZERO_INV THRESH_TOZERO的反转

注意:返回值有两个,第一个表示执行成功与否,第二个才是处理后的图像!

img = cv2.imread('C://Users//rwhite//Pictures//opencv//_20210511202744.jpg', cv2.IMREAD_COLOR)

ret, img1 = cv2.threshold(img, 127, 255, cv2.THRESH_BINARY)
ret, img2 = cv2.threshold(img, 127, 255, cv2.THRESH_BINARY_INV)
ret, img3 = cv2.threshold(img, 127, 255, cv2.THRESH_TRUNC)
ret, img4 = cv2.threshold(img, 127, 255, cv2.THRESH_TOZERO)
ret, img5 = cv2.threshold(img, 127, 255, cv2.THRESH_TOZERO_INV)

title = ['ORIGINAL', 'THRESH_BINARY', 'THRESH_BINARY_INV', 'THRESH_TRUNC', 'THRESH_TOZERO', 'THRESH_TOZERO_INV']
imgg = [img, img1, img2, img3, img4, img5]

for i in range(6):
    plt.subplot(2,3,i+1), plt.imshow(imgg[i])
    plt.title(title[i])
    plt.xticks([]),plt.yticks([])

plt.show()

Opencv学习笔记二——基本图像操作_第6张图片

ItVuer - 免责声明 - 关于我们 - 联系我们

本网站信息来源于互联网,如有侵权请联系:561261067@qq.com

桂ICP备16001015号