OpenCV-Python系列之傅里叶变换
傅里叶变换
我们生活在时间的世界中,早上7:00起来吃早饭,8:00去挤地铁,9:00开始上班。。。以时间为参照就是时域分析。
但是在频域中一切都是静止的!可能有些人无法理解,我建议大家看看这个文章,写的真是相当好,推荐!
https://zhuanlan.zhihu.com/p/19763358
傅里叶变换经常被用来分析不同滤波器的频率特性。我们可以使用 2D 离散傅里叶变换 (DFT) 分析图像的频域特性。实现 DFT 的一个快速算法被称为快速傅里叶变换(FFT)。
对于一个正弦信号,如果它的幅度变化非常快,即f数值比较大,我们可以说他是高频信号,如果变化非常慢,即f数值比较小,我们称之为低频信号。你可以把这种想法应用到图像中,那么我们如何看待图像的变化幅度大小呢?那就是看边界点和噪声,一般边界和噪声是图像中的高频分量(注意这里的高频是指变化非常快,而非出现的次数多)。如果没有如此大的幅度变化我们称之为低频分量。
那么用傅里叶变换进行滤波的优点在哪儿呢,它可以把图像由时域转换成频域,由于频域中的信息更为简单,所以滤波起来更为方便,滤波之后再转换到时域,那么就相当于一个滤波了。
傅里叶变换的作用
· 高频:变化剧烈的灰度分量,例如边界
· 低频:变化缓慢的灰度分量,例如一片大海
所以一般情况下,由于图像中的高频分量与低频分量都存在,我们可以用傅里叶变换进行滤波。
滤波
· 低通滤波器:只保留低频,会使得图像模糊
· 高通滤波器:只保留高频,会使得图像细节增强
我们来看傅里叶变换的函数原型:
dst=cv2.dft(src, dst=None, flags=None, nonzeroRows=None)
第一个参数src为输入图像
dst是输出图像,包括输出图像的大小和尺寸
flags有五种,为转换标志:
1、DFT _INVERSE:执行的是反向的一维或者二维的转换。
2、DFT _SCALE:矩阵的元素数量除以它,产生缩放效果。
3、DFT _COMPLEX_OUTPUT:执行正向转换。
4、DFT _REAL_OUTPUT:执行一维或二维复数阵列的逆变换,结果通常是相同大小的复数数组,但如果输入数组具有共轭复数对称性,则输出为真实数组。
5、DFT _ROWS:执行正向或者反向变换输入矩阵的每个单独的行,该标志可以同时转换多个矢量,并可用于减少开销以执行3D和更高维度的转换等。
nonzeroRows:表示当参数不为零时,函数假定只有nonzeroRows输入数组的第一行(未设置)或者只有输出数组的第一个(设置)包含非零,因此函数可以处理其余的行更有效率,并节省一些时间;这种技术对计算阵列互相关或使用DFT卷积非常有用。
继续来分析傅里叶逆变换函数:
dst = cv2.idft(src[, dst[, flags[, nonzeroRows]]])
src: 表示输入图像,包括实数或复数。
dst: 表示输出图像。
flags: 表示转换标记。
nonzeroRows: 表示要处理的dst行数,其余行的内容未定义。
得到的结果中频率为零的部分会在左上角,通常要转换到中心位置,可以通过np.fft.fftshift()和np.fft.ifftshift()变换来实现,前者是傅里叶变换,后者是傅里叶逆变换。
cv2.dft()返回的结果是双通道(实部、虚部),通常需要转换成图像格式才能展示(0,255),让我们看一下代码:
def dft(): img = cv2.imread('min.jpg', 0) # 将图像转换成灰度图 dft = cv2.dft(np.float32(img), flags=cv2.DFT_COMPLEX_OUTPUT) # 进行傅里叶变换 dft_shift = np.fft.fftshift(dft) # 将频率为零的部分转移到中心位置 magnitude_spectrum = 20 * np.log(cv2.magnitude(dft_shift[:, :, 0], dft_shift[:, :, 1])) # 公式 plt.subplot(121), plt.imshow(img, cmap='gray') plt.title('Input Image'), plt.xticks([]), plt.yticks([]) plt.subplot(122), plt.imshow(magnitude_spectrum, cmap='gray') plt.title('Magnitude Spectrum'), plt.xticks([]), plt.yticks([]) plt.show()
可以看到,中心部分比较亮,越靠近中间位置低频信息越多,而高频信息则都在边界部分。
接下来要想对其进行滤波,应该怎么办呢?
显而易见,既然我们要去除低频分量,那就定一个范围,比如30*30的正方形范围,以图像中心为正方形中心点,将这个范围以内的高亮度的像素点去掉,就完成了滤波,然后我们再使用傅里叶逆变换将图像还原就可以看到。
代码:
def filter(): img = cv2.imread('min.jpg', 0) img_float32 = np.float32(img) dft = cv2.dft(img_float32, flags=cv2.DFT_COMPLEX_OUTPUT) dft_shift = np.fft.fftshift(dft) rows, cols = img.shape crow, ccol = int(rows / 2), int(cols / 2) # 中心位置 # 低通滤波 mask = np.zeros((rows, cols, 2), np.uint8) mask[crow - 30:crow + 30, ccol - 30:ccol + 30] = 1 # 高通滤波器 # mask = np.ones((rows, cols, 2), np.uint8) # mask[crow-30:crow+30, ccol-30:ccol+30] = 0 # IDFT fshift = dft_shift * mask f_ishift = np.fft.ifftshift(fshift) img_back = cv2.idft(f_ishift) img_back = cv2.magnitude(img_back[:, :, 0], img_back[:, :, 1]) plt.subplot(121), plt.imshow(img, cmap='gray') plt.title('Input Image'), plt.xticks([]), plt.yticks([]) plt.subplot(122), plt.imshow(img_back, cmap='gray') plt.title('Result'), plt.xticks([]), plt.yticks([]) plt.show()
低通结果:
也可以设计高通滤波器将低频部分去除,代码在上面也有,只需修改掩模即可,构建一个掩模,与低频区域对应的地方设置为 0, 与高频区域对应的地方设置为 1。下图为效果图,高通结果:
可以看到,高通滤波相当于保留了图像的边缘部分,因为边缘部分属于高频信息。