資源簡介
關于層次聚類(hierarchical clustering)的基本步驟:
1、假設每個樣本為一類,計算每個類的距離,也就是相似度
2、把最近的兩個合為一新類,這樣類別數量就少了一個
3、重新新類與各個舊類(去了那兩個合并的類)之間的相似度;
4、循環重復2和3直到所有樣本點都歸為一類
這個計算的過程,相當于重構一個二叉樹,只是這個過程,是從樹葉-->樹枝-->樹干的構建過程
本資源詳細介紹層次聚類的算法
代碼片段和文件信息
#?-*-?coding:utf-8?-*-
‘‘‘
關于聚類(Clustering)的基本步驟:
1、假設每個樣本為一類,計算每個類的距離,也就是相似度
2、把最近的兩個合為一新類,這樣類別數量就少了一個
3、重新新類與各個舊類(去了那兩個合并的類)之間的相似度;
4、循環重復2和3直到所有樣本點都歸為一類
這個計算的過程,相當于重構一個二叉樹,只是這個過程,是從樹葉-->樹枝-->樹干的構建過程
本例將以14張圖片,做為樣本,進行聚類,點擊這里下載圖片樣本
當然,你也可以自己定義一個目錄,程序會讀取目錄下所有JPG圖片
如果你用了自己的圖片,在代碼中的一個數據的變化說明,就和使用的圖片樣本不同了,
同時,本文的主要目的是演示聚類(Clustering)的基本步驟,對于圖片的相似度的算法并不完善,效果也并不是十分理想
不過如果你使用自己從手機中導入的生活照,不同的場景大致還是能分類出來的
‘‘‘
from?PIL?import?ImageDrawImage
import?numpy?as?np
import?os
import?sys
nodeList?=?[]#用于存儲所有的節點,包含圖片節點,與聚類后的節點
distance?=?{}#用于存儲所有每兩個節點的距離,數據格式{(node1.idnode2.id):30.0(node2.idnode3.id):40.0}
class?node:
????def?__init__(self?data):
????????‘‘‘每個樣本及樣本合并后節點的類
????????????data:接受兩種格式,
????????????1、當為字符(string)時,是圖片的地址,同時也表示這個節點就是圖片
????????????2、合并后的類,傳入
?屬性????????????大小?????日期????時間???名稱
-----------?---------??----------?-----??----
?????文件?????239491??2018-01-30?18:19??imageAndCode\afsdav.jpg
?????文件?????111953??2018-01-30?18:35??imageAndCode\afvaf.jpg
?????文件??????33660??2018-01-30?18:32??imageAndCode\avasdf.jpg
?????文件?????426036??2018-01-30?18:34??imageAndCode\fasdfa.jpg
?????文件??????90674??2018-01-30?18:28??imageAndCode\fasfasdf.jpg
?????文件??????37241??2018-02-01?19:54??imageAndCode\hierarchicalResult.jpg
?????文件??????58099??2018-01-30?18:34??imageAndCode\safvadf.jpg
?????文件?????128845??2018-01-30?18:34??imageAndCode\vadasfs.jpg
?????文件??????58790??2018-01-30?18:14??imageAndCode\vadfaf.jpg
?????文件?????137147??2018-01-30?18:19??imageAndCode\vadsfasfwe.jpg
?????文件?????134349??2018-01-30?18:32??imageAndCode\vafafasd.jpg
?????文件?????181196??2018-01-30?18:20??imageAndCode\vafsdfasf.jpg
?????文件?????153979??2018-01-30?18:28??imageAndCode\vasdafe.jpg
?????文件?????178779??2018-01-30?18:19??imageAndCode\vasfadf.jpg
?????文件??????29957??2018-01-30?18:33??imageAndCode\vaweb.jpg
?????文件???????8344??2018-02-01?19:54??hierarchical.py
?????文件?????120966??2018-02-01?20:09??hierarchicalResult2.jpg
?????文件????????791??2018-02-01?20:15??說明.txt
?????目錄??????????0??2018-02-01?20:18??imageAndCode
-----------?---------??----------?-----??----
??????????????2130297????????????????????19
評論
共有 條評論