تجزیه و تحلیل خوشه ایی

تجزیه و تحلیل خوشه ایی

مرز بندي و تفكيك زماني- مكاني به واحدهاي مستقل از يكديگر بر اساس يك يا چند معيار مفروض همواره در كانون توجه جغرافيدانان بوده است. امروزه با استفاده از تكنيك هاي نوين آماري، اقليم شناسان به دنبال استفاده از روشهايي مي باشند كه با حداقل خطا، واقعيت هاي موجود در پهنه هاي اقليمي را آشكار سازند. تحليل خوشه اي يكي از روشهاي آماري است كه در زمينه كاهش داده ها و پيدا كردن گروههاي واقعي مورد استفاده قرار مي گيرد. دسته بندي بر اساس مشابهت ها يا عدم مشابهت ها انجام مي شود. به اين ترتيب مي توان از روشهاي پايگاني انباشتي و يا پايگاني شكافتي استفاده نمود. در روش انباشتي هر فرد، ابتدا يك گروه مجزا را تشكيل مي دهد، سپس گروههاي نزديك به هم بتدريج تركيب مي شوند تا در نهايت كليه افراد يا اعضا در يك گروه قرار مي گيرند. ولي در روش شكافتي ابتدا كليه افراد در يك گروه قرار مي گيرند، سپس اين گروه به دو گروه و دو گروه به چند گروه به نحوي تقسيم مي شود كه در نهايت هر فرد در گروه خود جاي گيرد. در روش انباشتي ضريب تشابه و در روش شكافتي همگني درون گروهي ملاك گروه بندي است(مسعوديان).

         تجزيه خوشه اي يك عنوان كلي براي يك سري از روشهاي رياضي است كه براي پيدا كردن شباهت بين مواد در يك مجموعه بكار مي رود. هدف بسياري از فعاليتهاي تحقيقاتي پي بردن به اين است كه كداميك از مواد موجود در يك مجموعه مشابه و يا متفاوت هستند. بدين منظور بهترين روش استفاده از طبقه بندي است. روشهاي تجزيه خوشه اي عمل طبقه بندي را با استفاده از فرمولهاي رياضي انجام مي دهد. بنا براين مي توان گفت تجزيه خوشه اي اصولي ترين روش براي برآورد شباهت بين افراد در يك مجموعه است(فرشاد فر).

         در تجزيه خوشه اي معمولا p صفت بر روي n ماده اندازه گيري مي شود و بعد يك ماتريس n*p از داده هاي خام تشكيل مي شود. سپس ماتريس داده هاي خام به ماتريس شباهتها يا فاصله ها تبديل شده و با استفاده از يكي از تكنيكهاي طبقه بندي مواد رابر اساس شباهت بين آنها گروهبندي مي كنند. هدف از تشكيل خوشه ها يا دسته ها آن است كه در هر دسته موادي را قرار دهيم كه داراي پراش يا تنوع كمتري نسبت به پراش و تنوع موجود بين دسته ها باشند(همان منبع).

          اگر دريك تحليل مؤلفه مبنا ماتريس داده ها آرايش s داشته باشد براي هر زمان دلخواه مي توان مقدار  مؤلفه را جايگزين  متغير مشاهده شده در آن روز دانست. درعين حال چون كاملاً امكان پذير است كه مقدار بيش از يك مؤلفه براي هر  t ارزش عدد زيادي داشته باشد نمي توان بزرگترين نمره ازميان k مؤلفه ياد شده را نماينده t دانست. برپايه اين استدلال به نظر مي رسد بجاي روشي كه تاكنون متداول بوده و براي شناسائي رابطه الگوهاي گردشي جو مياني با رويدادهاي محيطي بالاترين و پايين ترين نمرات مؤلفه ها بكار گرفته مي شده اند بهتر است بعد زماني ماتريس داده ها (ماتريس نمرات مؤلفه ها) با توجه به مقادير نمرات مؤلفه ها دسته بندي شود.

چون قبل از انجام دسته بندي هيچ ايده اي درباره تعداد دسته ها نداريم انجام تحليل خوشه اي براي شناسايي دسته ها عملي به نظر مي رسد. دراين صورت مثلاً k مؤلفه متعلق به  t1 با k مؤلفه متعلق به  t2  تک تک بايكديگر مقايسه ميشوند تا درجه همانندي آنها با يكديگر آشكار شود سپس تمامي t ها برحسب درجه همانندي با يكديگر خوشه مي شوند. بنابراين دريك تحليل خوشه اي دوگام اساسي وجود دارد.گام اول محاسبه درجه همانندي افراد با يكديگر وگام دوم چگونگي ادغام (پيوند) افراد برحسب درجه همانندي آنها با يكديگر است.

    بسته به روشي كه براي محاسبه درجه همانندي وچگونگي ادغام انتخاب مي كنيم يك تحليل خوشه اي را مي توان به شيوه هاي مختلفي اجرا كرد.

   براي محاسبه درجه همانندي روشهاي مختلفي پيشنهاد شده است كه برخي از آنها عبارتند از: فاصله اقليدسي، فاصله همبستگي، فاصله همينگ، فاصله ماهالانوبيس، فاصله مينكوسكي، فاصله كوسينوسي، فاصله بلوک شهري، فاصله جاكارد و فاصله چبيشف.

       درمطالعات اقليمي غالباً براي محاسبه درجه ناهمانندي (همانندي) از فاصلة اقليدسي استفاده ميشود. درمواردي كه مقياس اندازه گيري متغيرها متفاوت و داراي دامنه هاي مختلفي باشند استفاده از فاصله اقليدسي استاندارد شده توصيه مي شود.

پس از اندازه گيري درجه همانندي بايدشيوه اي براي ادغام اقلامي كه  بالاترين همانندي را نشان داده اند بكار برد. شيوه هاي مختلفي براي ادغام معرفي شده اند كه از آن جمله اند: پيوند تكي ، پيوند كامل، پيوند متوسط، پيوند وزني، پيوند مركزي، پيوند ميانه و پيوند وارد.       

درروش واردگروه هايr  و  sدر صورتي ادغام ميشوند كه افزايش پراش ناشي از ادغام آنها نسبت به ادغام هريك از آنها با ديگر گروهها كمينه باشد                                                                          

درمطالعات اقليم شناختي عمدتاً از روش ادغام وارد استفاده مي شود زيرا در اينصورت ميزان پراش درونگروهي به حداقل مي رسد و همگني گروههاي حاصله به حداكثر مي رسد.

 2-5-1- هدف از تجزيه خوشه اي:

        به طور كلي هدف از تجزيه خوشه اي را مي توان به صورت زير خلاصه كرد :

       الف- گروهبندي آزمودني ها از لحاظ p صفت صورت مي گيرد، بطوريكه افراد هم گروه از لحاظ p صفت بسيار شبيه هم و افراد غير هم گروه بسيار به هم ناشبيه هستند.

      ب- بنابراين هدف از تجزيه خوشه اي قرار دادن افراد در گروههاي مختلف است.

      ج- در تجزيه خوشه اي هدف رسيدن به گروههاي واقعي است.

       د- كاهش حجم داده ها


مطالب مشابه :


تجزیه و تحلیل خوشه ایی

موسسه چشم انداز هزاره سوم ملل -شیراز - تجزیه و تحلیل خوشه ایی - آموزشگاه چشم انداز در شهر




تحلیل خوشه ای در spss

در ادامه یک جزوه بسیار خوب از تحلیل خوشه ای به همراه نحوه انجام ان در spss آورده شده است.




تفاوت تحلیل خوشه ای و تحلیل تشخیصی چیست؟

سنجش و اندازه گیری - تفاوت تحلیل خوشه ای و تحلیل تشخیصی چیست؟ - پارادایم پژوهش بین رشته‏ ای




روش های نوین در جغرافیا

- روش تحلیل خوشه ای (Cluster Analysis): در تحلیل خوشه ای از یک روش گام به گام (الگوریتم) برای گروه بندی




برچسب :