آموزش خوشه بندی
خوشهبندي را ميتوان به عنوان مهمترين مسئله در يادگيري بدون نظارت در نظر گرفت. خوشهبندي با يافتن يک ساختار درون يک مجموعه از دادههاي بدون برچسب درگير است. خوشه به مجموعهاي از دادهها گفته ميشود که به هم شباهتداشته باشند. در خوشهبندي سعي ميشود تا دادهها به خوشههايي تقسيم شوند که شباهت بين دادههاي درون هر خوشه حداکثر و شباهت بين دادههاي درون خوشههاي متفاوت حداقل شود.
شکل 1: در اين شکل نمونهاي از اعمال خوشهبندي روي يک مجموعه از دادهها مشخص شده است که از معيار فاصله(Distance) به عنوان عدم شباهت(Dissimilarity) بين دادهها استفاده شده است.
روشهاي خوشهبندي را ميتوان از چندين جنبه تقسيمبندي کرد:
1- خوشهبندي انحصاري (Exclusive or Hard Clustering) و خوشهبندي با همپوشي (Overlapping or Soft Clustering)
در روش خوشهبندي انحصاري پس از خوشهبندي هر داده دقيقأ به يک خوشه تعلق ميگيرد مانند روش خوشهبندي K-Means. ولي در خوشهبندي با همپوشي پس از خوشهبندي به هر داده يک درجه تعلق بازاء هر خوشه نسبت داده ميشود. به عبارتي يک داده ميتواند بانسبتهاي متفاوتي به چندين خوشه تعلق داشته باشد. نمونهاي از آن خوشهبندي فازياست.
2- خوشهبندي سلسله مراتبي (Hierarchical) و خوشهبندي مسطح(Flat)
در روش خوشه بندي سلسله مراتبي، به خوشههاي نهايي بر اساس ميزان عموميت آنها ساختاري سلسله مراتبي نسبت داده ميشود. مانند روشSingle Link. ولي در خوشهبندي مسطح تمامي خوشههاي نهايي داراي يک ميزان عموميت هستند مانندK-Means. به ساختار سلسله مراتبي حاصل از روشهاي خوشهبندي سلسله مراتبي دندوگرام (Dendogram) گفته ميشود.
با توجه با اينکه روشهاي خوشهبندي سلسله مراتبي اطلاعات بيشتر و دقيقتري توليد ميکنند براي تحليل دادههاي با جزئيات پيشنهاد ميشوند ولي از طرفي چون پيچيدگي محاسباتي بالايي دارند براي مجموعه دادههاي بزرگ روشهاي خوشهبندي مسطح پيشنهاد ميشوند.
برای مطالعه در مورد روش های خوشه بندی بر روی لینک های زیر کلیک کنید
آموزش خوشه بندی سلسله مراتبی (hierarchical)
آموزش خوشه بندی مبتنی بر چگالی (Dbscan)