卷積以后圖像大小計(jì)算公式 卷積神經(jīng)網(wǎng)絡(luò)如何進(jìn)行圖像識(shí)別?
卷積神經(jīng)網(wǎng)絡(luò)如何進(jìn)行圖像識(shí)別?可見(jiàn)這是更高級(jí)的互聯(lián)網(wǎng)技術(shù)的問(wèn)題!有些專(zhuān)業(yè)知識(shí)需要特別說(shuō)明。首先,我們需要知道什么是卷積神經(jīng)網(wǎng)絡(luò)?下面是我在網(wǎng)上搜索整理的一些粗淺的知識(shí)!卷積神經(jīng)網(wǎng)絡(luò)(CNN)是一種具有
卷積神經(jīng)網(wǎng)絡(luò)如何進(jìn)行圖像識(shí)別?
可見(jiàn)這是更高級(jí)的互聯(lián)網(wǎng)技術(shù)的問(wèn)題!有些專(zhuān)業(yè)知識(shí)需要特別說(shuō)明。
首先,我們需要知道什么是卷積神經(jīng)網(wǎng)絡(luò)?下面是我在網(wǎng)上搜索整理的一些粗淺的知識(shí)!
卷積神經(jīng)網(wǎng)絡(luò)(CNN)是一種具有深度結(jié)構(gòu)的前饋神經(jīng)網(wǎng)絡(luò),包含卷積計(jì)算,是深度學(xué)習(xí)的代表性算法之一。卷積神經(jīng)網(wǎng)絡(luò)具有表示學(xué)習(xí)的能力,可以根據(jù)其層次結(jié)構(gòu)對(duì)輸入信息進(jìn)行平移不變的分類(lèi),因此也被稱(chēng)為 "平移不變?nèi)斯ど窠?jīng)網(wǎng)絡(luò) "。具體解釋可以自己搜索。
那么卷積神經(jīng)網(wǎng)絡(luò)是如何實(shí)現(xiàn)圖像識(shí)別的呢?他有幾個(gè)臺(tái)階。
1、圖像識(shí)別數(shù)據(jù)收集
MNIST手寫(xiě)識(shí)別數(shù)據(jù)集的求解是一個(gè)相對(duì)簡(jiǎn)單的問(wèn)題,但是對(duì)于更復(fù)雜的類(lèi)別,可以使用CIFAR數(shù)據(jù)集。例如,CIFAR10數(shù)據(jù)集收集了來(lái)自10個(gè)不同類(lèi)別的60,000張圖片,每張圖片的像素為32x32,如下所示。
CIFAR10數(shù)據(jù)集類(lèi)似于MNIST,每張圖片的大小是固定的,每張圖片只包含一個(gè)類(lèi)別。不同的是CIFAR10中的圖片都是彩色的,分類(lèi)難度比MNIST高,人工標(biāo)注的正確率在94%左右。
在現(xiàn)實(shí)生活中,圖片的格式并不總是一成不變的,種類(lèi)遠(yuǎn)不止10種。每張圖片還包含多個(gè)元素,所以需要更強(qiáng)大的數(shù)據(jù)集。由斯坦福大學(xué)的李菲菲開(kāi)發(fā)的ImageNet擁有近1500萬(wàn)張圖片,這些圖片與大約2萬(wàn)個(gè)類(lèi)別相關(guān)。
ImageNet每年都會(huì)舉辦圖像識(shí)別大賽ILSVRC(現(xiàn)已關(guān)閉),每年比賽都會(huì)提供不同的數(shù)據(jù)集。下圖是Imag
倍積運(yùn)算?
卷積運(yùn)算是指從圖像的左上角打開(kāi)一個(gè)與模板大小相同的活動(dòng)窗口。將窗口圖像和模板像素進(jìn)行相應(yīng)的相乘和相加,用計(jì)算結(jié)果代替窗口中心像素的亮度值。然后,活動(dòng)窗口向右移動(dòng)一列,并執(zhí)行相同的操作。以此類(lèi)推,從左到右,從上到下,可以得到一個(gè)新的圖像。
空間濾波:是一種基于像素和相鄰像素的空間關(guān)系,通過(guò)卷積運(yùn)算實(shí)現(xiàn)圖像濾波的方法。頻域中的:濾波對(duì)圖像執(zhí)行傅立葉變換。