大多数的cv应用程序需要将图像作为输入、同时也会将图像作为输出结果。一个交互式cv应用程序可能会将摄像头作为输入源,通过窗口显示输出结果。而其他的输入和输出还可能是图像文件、视频文件和原始字节(raw byte),因此就涉及到了图像、视频的读取。例如,在网络中传输的原始字节,这些原始字节可能是由应用中的图形处理算法产生的。

无论哪种格式,每个像素都会有一个值,但不同格式表示像素的方式有所不同。例如,可以通过二维NumPy数组来简单创建一个黑色的正方形图像:


  1. 图像读取

OpenCV的imread函数函数能支持各种静态图像文件格式。

在默认情况下,即使图像文件为灰度格式,cv2.imread(filename, flags)函数也会返回BGR格式的图像。 BGR与red-green-blue(RGB)所表示的色彩空间相同,但字节顺序相反。


filename:图片的绝对路径或者相对路径。 ps:路径中不能出现中文!

flags:图像的通道和色彩信息(默认值为1),即彩色图片。

flags = -1, 8位深度,原通道

flags = 0, 8位深度,1通道

flags = 1, 8位深度,3通道

flags = 2, 原深度, 1通道

flags = 3, 原深度, 3通道

flags = 4, 8位深度,3通道

如下是不同flags下读取结果:

#### 显示不同flags读取结果 def cv2flags(filename): flags = [0, 1,2,3,4] for flag in flags: m = cv2.imread(filename, flags=flag) cv2.namedWindow(f"flags={flag}", 0) cv2.imshow(f"flags={flag}", m) cv2.waitKey(0) filename = "./src/imgs/1.jpg" cv2flags(filename)


flags:图像的通道和色彩信息(默认值为1),即彩色图片。8位深度图片存储像素点的取值范围为 0~255, 4bit为存储像素点的取值范围为0~15,1通道为灰度图,3通道为彩色图。

概念上讲,一个字节能表示0到255的整数。目前,对于所有的实时图像应用而言,虽然有其他的表示形式,但一个像素通常由每个通道的一个字节表示。

一个OpenCV图像是.array类型的二维或三维数组。8位的灰度图像是一个含有字节值的二维数组。因此我们可以根据坐标位置进行访问,比如 横向 600 - 800、纵向100 - 200 修改为 蓝色(BGR=(255,0,0)):


有了这些基础知识点,我们就可以对图片或网络图片进行读取,方法极其简单:

### 核心点:获取图像字节数据 def show_url_image(url_path): resp = request.urlopen(url_path) image = np.asarray(bytearray(resp.read()), dtype="uint8") ### 字节流数组 img = cv2.imdecode(image, 1) cv2.namedWindow("show_url_image", 0) cv2.imshow("show_url_image", img) cv2.waitKey(0)


例如图片网址:https://gimg2.baidu.com/image_search/src=http%3A%2F%2Fnimg.ws.126.net%2F%3Furl%3Dhttp%253A%252F%252Fdingyue.ws.126.net%252F2021%252F0519%252F9cce43b4j00qtd2zt001tc000u000gym.jpg%26thumbnail%3D650x2147483647%26quality%3D80%26type%3Djpg&refer=http%3A%2F%2Fnimg.ws.126.net&app=2002&size=f9999,10000&q=a80&n=0&g=0n&fmt=auto?sec=1654813817&t=4c7e437f651f1bed927f835328c1b785

例如图片网址:https://img1.tt98.com/bizhi/20191204/ba00c1f662e1203e4e683748464e902a.jpg



2.视频读取:

OpenCV提供了VideoCapture类和Video Writer类来支持各种格式的视频文件。支持的格式类型会因系统的不同而变化,但应该都支持AVI格式。在到达视频文件末尾之前, VideoCapture类可通过read()函数来获取新的帧,每帧是一幅基于BGR格式的图像。

#### 视频读取 def show_video(video_path): cap = cv2.VideoCapture(video_path) while (cap.isOpened()): ret, frame = cap.read() if ret == True: frame1 = process(frame, opt=0) ###增加视频处理功能 met = np.hstack((frame, frame1)) cv2.namedWindow("show_video", 0) cv2.imshow("show_video", met) if cv2.waitKey(1) & 0xFF == ord('q'): break else: break


waitKey()的参数为等待键盘触发的时间,单位为毫秒,其返回值是一1(表示没有键被按下)或ASCII码,如27表示按下Esc键。ASCII码列表可以在http://www.asciitable.com/ 查阅。另外,Python提供了一个标准函数ord(),该函数可以将字符转换为ASCII码。例如,输入ord('a,)会返回970。


以上就是图片、视频读写的基本方法,是不是非常简单呢?

备注:免费获取源码,请评论区回复源码。