怎么用opencv读取图片和视频(如何用opencv读取图片)

大多数的cv应用程序需要将图像作为输入、同时也会将图像作为输出结果。一个交互式cv应用程序可能会将摄像头作为输入源，通过窗口显示输出结果。而其他的输入和输出还可能是图像文件、视频文件和原始字节（raw byte),因此就涉及到了图像、视频的读取。例如，在网络中传输的原始字节，这些原始字节可能是由应用中的图形处理算法产生的。

无论哪种格式，每个像素都会有一个值，但不同格式表示像素的方式有所不同。例如，可以通过二维NumPy数组来简单创建一个黑色的正方形图像：

图像读取

OpenCV的imread函数函数能支持各种静态图像文件格式。

在默认情况下，即使图像文件为灰度格式，cv2.imread(filename, flags）函数也会返回BGR格式的图像。 BGR与red-green-blue(RGB）所表示的色彩空间相同，但字节顺序相反。

filename：图片的绝对路径或者相对路径。 ps:路径中不能出现中文!

flags：图像的通道和色彩信息(默认值为1)，即彩色图片。

flags = -1, 8位深度，原通道

flags = 0， 8位深度，1通道

flags = 1， 8位深度，3通道

flags = 2，原深度， 1通道

flags = 3，原深度， 3通道

flags = 4， 8位深度，3通道

如下是不同flags下读取结果：

#### 显示不同flags读取结果 def cv2flags(filename): flags = [0, 1,2,3,4] for flag in flags: m = cv2.imread(filename, flags=flag) cv2.namedWindow(f"flags={flag}", 0) cv2.imshow(f"flags={flag}", m) cv2.waitKey(0) filename = "./src/imgs/1.jpg" cv2flags(filename)

flags：图像的通道和色彩信息(默认值为1)，即彩色图片。8位深度图片存储像素点的取值范围为 0~255， 4bit为存储像素点的取值范围为0~15，1通道为灰度图，3通道为彩色图。

概念上讲，一个字节能表示0到255的整数。目前，对于所有的实时图像应用而言，虽然有其他的表示形式，但一个像素通常由每个通道的一个字节表示。

一个OpenCV图像是．array类型的二维或三维数组。8位的灰度图像是一个含有字节值的二维数组。因此我们可以根据坐标位置进行访问，比如横向 600 - 800、纵向100 - 200 修改为蓝色（BGR=（255,0,0））：

有了这些基础知识点，我们就可以对图片或网络图片进行读取，方法极其简单：

### 核心点：获取图像字节数据 def show_url_image(url_path): resp = request.urlopen(url_path) image = np.asarray(bytearray(resp.read()), dtype="uint8") ### 字节流数组 img = cv2.imdecode(image, 1) cv2.namedWindow("show_url_image", 0) cv2.imshow("show_url_image", img) cv2.waitKey(0)

例如图片网址：https://gimg2.baidu.com/image_search/src=http%3A%2F%2Fnimg.ws.126.net%2F%3Furl%3Dhttp%253A%252F%252Fdingyue.ws.126.net%252F2021%252F0519%252F9cce43b4j00qtd2zt001tc000u000gym.jpg%26thumbnail%3D650x2147483647%26quality%3D80%26type%3Djpg&refer=http%3A%2F%2Fnimg.ws.126.net&app=2002&size=f9999,10000&q=a80&n=0&g=0n&fmt=auto?sec=1654813817&t=4c7e437f651f1bed927f835328c1b785

例如图片网址：https://img1.tt98.com/bizhi/20191204/ba00c1f662e1203e4e683748464e902a.jpg

2.视频读取：

OpenCV提供了VideoCapture类和Video Writer类来支持各种格式的视频文件。支持的格式类型会因系统的不同而变化，但应该都支持AVI格式。在到达视频文件末尾之前， VideoCapture类可通过read()函数来获取新的帧，每帧是一幅基于BGR格式的图像。

#### 视频读取 def show_video(video_path): cap = cv2.VideoCapture(video_path) while (cap.isOpened()): ret, frame = cap.read() if ret == True: frame1 = process(frame, opt=0) ###增加视频处理功能 met = np.hstack((frame, frame1)) cv2.namedWindow("show_video", 0) cv2.imshow("show_video", met) if cv2.waitKey(1) & 0xFF == ord('q'): break else: break

waitKey()的参数为等待键盘触发的时间，单位为毫秒，其返回值是一1（表示没有键被按下）或ASCII码，如27表示按下Esc键。ASCII码列表可以在http://www.asciitable.com/ 查阅。另外，Python提供了一个标准函数ord()，该函数可以将字符转换为ASCII码。例如，输入ord('a,）会返回970。

以上就是图片、视频读写的基本方法，是不是非常简单呢？