如何利用K-Means將文件夾中圖像進(jìn)行分類?
點(diǎn)擊上方“小白學(xué)視覺(jué)”,選擇加"星標(biāo)"或“置頂”
重磅干貨,第一時(shí)間送達(dá)
K-Means聚類是最常用的無(wú)監(jiān)督機(jī)器學(xué)習(xí)算法之一。顧名思義,它可用于創(chuàng)建數(shù)據(jù)集群,從本質(zhì)上將它們隔離。
現(xiàn)在,我們將做一個(gè)簡(jiǎn)單的示例,將文件夾中的圖像進(jìn)行分離,該文件夾既有貓也有狗的圖像。并且將創(chuàng)建兩個(gè)單獨(dú)的文件夾(群集),我們將介紹如何自動(dòng)確定K的最佳值。

貓和狗的圖像數(shù)據(jù)集
首先,我們將從導(dǎo)入所需的庫(kù)開(kāi)始。
import numpy as npimport tensorflow as tfimport matplotlib.pyplot as pltfrom sklearn.cluster import KMeansfrom sklearn.metrics import silhouette_scoreimport cv2import os, glob, shutil
input_dir = 'pets'glob_dir = input_dir + '/*.jpg'images = [cv2.resize(cv2.imread(file), (224, 224)) for file in glob.glob(glob_dir)]paths = [file for file in glob.glob(glob_dir)]images = np.array(np.float32(images).reshape(len(images), -1)/255)
現(xiàn)在,我們將在MobileNetV2(傳輸學(xué)習(xí))的幫助下進(jìn)行特征提取。當(dāng)然我們可以使用ResNet50,InceptionV3等,但是MobileNetV2速度很快,而且資源也不是很多。
model = tf.keras.applications.MobileNetV2(include_top=False,weights=’imagenet’, input_shape=(224, 224, 3))predictions = model.predict(images.reshape(-1, 224, 224, 3))pred_images = predictions.reshape(images.shape[0], -1)
現(xiàn)在,我們已經(jīng)實(shí)現(xiàn)了提取功能,現(xiàn)在可以使用KMeans進(jìn)行聚類了。
k = 2kmodel = KMeans(n_clusters = k, n_jobs=-1, random_state=728)kmodel.fit(pred_images)kpredictions = kmodel.predict(pred_images)shutil.rmtree(‘output’)for i in range(k):os.makedirs(“output\cluster” + str(i))for i in range(len(paths)):shutil.copy2(paths[i], “output\cluster”+str(kpredictions[i]))
輸出結(jié)果如下:
小狗:

貓:

另外我們?nèi)绾未_定數(shù)據(jù)集的K值?我們可以使用輪廓法或肘部法確定它。我們將在這里使用輪廓法,當(dāng)然這兩種方法都可獲得最可靠的結(jié)果,所以能直接確定K。
當(dāng)我們將馬的圖像添加到原始數(shù)據(jù)集中時(shí),我們來(lái)確定K的值。
sil = []kl = []kmax = 10for k in range(2, kmax+1):kmeans2 = KMeans(n_clusters = k).fit(pred_images)labels = kmeans2.labels_sil.append(silhouette_score(pred_images, labels, metric = ‘euclidean’))kl.append(k)
plt.plot(kl, sil)plt.ylabel(‘Silhoutte Score’)plt.ylabel(‘K’)plt.show()

如我們所見(jiàn),K的最佳值為3,我們還成功創(chuàng)建了第三個(gè)集群:

如我們所見(jiàn),K-Means聚類是用于圖像分離的出色算法。在某些時(shí)候,我們使用的方法可能無(wú)法提供準(zhǔn)確的結(jié)果,我們可以嘗試使用其他卷積神經(jīng)網(wǎng)絡(luò)對(duì)其進(jìn)行修復(fù),或者嘗試將圖像從BGR轉(zhuǎn)換為RGB,然后進(jìn)行處理。
交流群
歡迎加入公眾號(hào)讀者群一起和同行交流,目前有SLAM、三維視覺(jué)、傳感器、自動(dòng)駕駛、計(jì)算攝影、檢測(cè)、分割、識(shí)別、醫(yī)學(xué)影像、GAN、算法競(jìng)賽等微信群(以后會(huì)逐漸細(xì)分),請(qǐng)掃描下面微信號(hào)加群,備注:”昵稱+學(xué)校/公司+研究方向“,例如:”張三 + 上海交大 + 視覺(jué)SLAM“。請(qǐng)按照格式備注,否則不予通過(guò)。添加成功后會(huì)根據(jù)研究方向邀請(qǐng)進(jìn)入相關(guān)微信群。請(qǐng)勿在群內(nèi)發(fā)送廣告,否則會(huì)請(qǐng)出群,謝謝理解~

