Grid Computing و بزرگ‌ترين ماشينهاي علمي‌ ساخت بشر

اگر همه چيز مطابق برنامه پيش برود، سال آينده بزرگ‌ترين ماشين علمي‌اي كه تاكنون ساخته شده است، در مجتمع زيرزميني پرپيچ و خمي در سوئيس، نزديك ژنو، به بهره‌برداري خواهد رسيد. تصادم‌گر بزرگ هادرون ‌(LHC) كه در عمق بيش از صد متري زير زمين قرار دارد، دو باريكه پروتون را در جهت‌هاي مخالف هم در يك تونل دايره‌اي 27 كيلومتري شتاب خواهد داد. اين دو باريكه، در حالي كه تقريباً به سرعت نور رسيده‌اند، به صورت متقابل (شاخ به شاخ) با هم برخورد مي‌كنند و رگباري از بقاياي زيراتمي را توليد مي‌كنند كه دانش‌پيشگان انتظار دارند ذراتي مرموز را كه قبلاً هرگز مشاهده نشده‌اند، در ميان آن‌ها بيابند. اين امر مي‌تواند منجر به تغيير در درك بنيادي ما از جهان گردد. دست‌كم، اميد است كه چنين شود. پژوهشگران سازمان تحقيقات هسته‌اي اروپا (سرن)، جايي كه LHC به بهره‌برداري خواهد رسيد، مي‌دانند كه يافتن ذرات مادي گريزاني كه آن‌ها در جست‌وجويش هستند، كار بسيار دشواري خواهد بود. براي يافتن اين ذرات، پژوهشگران بايد توده‌هاي مهيبي از داده‌هاي مربوط به برخوردها را غربال نمايند: انتظار مي‌رود فوران داده‌ها در LHC به طور متوسط، سالانه به پانزده ميليون گيگابايت برسد؛ اين مقدار بيشتر از ميزان داده‌اي است كه براي پر كردن شش دي‌وي‌دي استاندارد در دقيقه لازم است. به اين ترتيب مرتب كردن و تحليل نمودن اين كوه داده‌ها كاري است فراتر از توان هر ابركامپيوتري در جهان. پس در همان حال كه تيم LHC براي تكميل نمودن ماشين غول‌پيكر زيرزميني در تكاپو است، روي سطح زمين گروه ديگري از فيزيك‌پيشگان و متخصصان علوم كامپيوتر در حال حل نمودن مسئله‌اي مستقل هستند: فراهم آوردن زيرساختي محاسباتي‌ كه از پس سيلاب داده‌هاي LHC برآيد. راه‌حلي كه آنان يافته‌اند مجموعه‌اي پهناور از كامپيوترهاي قدرتمند كه حدوداً در دويست مركز پژوهشي در سراسر دنيا گسترده‌اند و به گونه‌اي مرتبط و پيكربندي شده‌اند كه همچون يك سيستم واحد پردازش موازي كار كنند. اين نوع زيرساخت يك گريد پردازشي (computing grid) خوانده مي‌شود.1




منبع: IEEE Spectrum - جولا‌ي 2006


شبكه‌هاي گريد محاسباتي در اواخر دهه 1990 به عنوان جايگزيني پيشنهادي براي سوپركامپيوترهاي متداول پديدار شدند تا به حل مسائل خاصي بپردازند كه مستلزم محاسبات عددي انبوه و دسترسي به حجم بيشتري از داده‌هاي توزيع‌يافته بودند.

ايده اصلي اين بود كه با شبكه‌هايي كه به قدر كافي سريع باشند و با بهره‌گيري از نرم‌افزار مناسب، گروه‌هاي تحقيقاتي متعدد كه از لحاظ جغرافيايي نيز پراكنده بودند، مي‌توانستند منابع پردازشي و منابع مديريت داده‌هاي خود را در قالب سيستمي واحد به اشتراك بگذارند و بدين ‌صورت اين سيستم توانايي درگير شدن با مسائلي را داشته‌ باشد كه از عهده هر يك از اين گروه‌ها به تنهايي، خارج بود.

پژوهشگران اميد داشتند چنين گريدهايي همان كاري را براي توان محاسباتي انجام دهند كه شبكه‌هاي توزيع برق براي الكتريسيته انجام مي‌دهند: توان محاسباتي را همه جا در دسترس قرار دهند؛ فقط كامپيوتر شخصي خود را به يك شبكه گريد متصل كنيد و به صورت بي‌درنگ به قدرت پردازشي عظيمي با بهايي قابل قبول دسترسي داشته‌ باشيد.

هنوز به‌طور كامل به آن هدف نرسيده‌ايم. امروزه، اگرچه گريدها در همه جا گسترده شده‌اند، اغلب آن‌ها سيستم‌هايي تخصصي هستند كه فقط براي گروه‌هاي خاصي از پژوهشگران در شاخه‌هايي مانند فيزيك انرژ‌ي‌هاي بالا، تحقيقات ژنتيكي و مانيتورينگ زمين‌لرزه قابل دسترسي هستند. به اين ترتيب، چگونه مي‌توانيم گريدها را به ابزارهاي روزمره پژوهشي تبديل كنيم كه در شاخه‌هاي علمي و فني متنوع‌‌تري از آن‌ها بهره‌برداري گردد؟

اين پرسشي است كه سرن و دانشگاه‌هاي همكار آن، آژانس‌هاي تحقيقاتي و شركت‌ها، اميدوارند به آن پاسخ دهند. بيشتر اين سازمان‌ها در اروپا قرار دارند. البته برخي هم در ايالات متحده، آسيا و آمريكاي لاتين هستند. آن‌ها به اين منظور مي‌خواهند از تجربه گريد LHC به‌عنوان پايه‌اي براي ايجاد يك زيرساخت عظيم جهاني گريد بهره ببرند. اين گروه كه توسط سرن هدايت مي‌گردد، مي‌كوشد اين گريد جديد جهاني را به ابزاري تبديل كند كه توانايي حل مسائل بسيار متنوعي را در حوزه علوم، مهندسي و صنعت داشته‌ باشد.

اين طرح كه سرمايه آن توسط اتحاديه اروپا تأمين مي‌شود، «توانمند ساختن گريدها براي (استفاده در) EsciencE» يا EGEE ناميده مي‌شود. در پس اين نام اختصاريِ زمخت، تلاش‌هاي بلندپروازانه‌اي در جريان است (كادر پايين با عنوان «جهاني شدن» را ببينيد).

گريد EGEE هم‌اكنون توان پردازشي بيش از بيست هزار پردازنده مركزي، توان ذخيره‌سازي‌ بيش از پنج ميليون گيگابايت - البته بر مبناي پيش‌بيني‌ها حجم ديتاي LHC به سرعت در حال افزايش است - و شبكه‌اي جهاني كه بيش از دويست پايگاه در جاهايي مثل پاريس، مسكو، تايپه و شيكاگو را به هم متصل مي‌سازد را با يكديگر درآميخته است.

اين گريد هم‌اكنون در حال كار با داده‌هاي امتحاني براي آزمايش‌هاي LHC (كادر «انفجار بزرگ داده‌ها» در صفحه بعد را ببينيد) و همچنين براي يك دوجين كاربردهاي مختلف در زمينه‌هايي مانند اخترفيريك، تصويربرداري پزشكي، بيوانفورماتيك، مطالعات جوي، اكتشاف نفت و گاز، تحقيقات دارويي و پيش‌بيني مالي است. اين شبكه در حال حاضر بزرگ‌ترين گريد علمي همه‌‌منظوره است و هر ماه هم بزرگ‌تر مي‌شود.

به نظر مي‌رسد گريدها قسمتي طبيعي از سير تكاملي محاسبات توزيع‌‌يافته باشند. اگر به بعضي از سوپركامپيوترهاي نخستين بنگريد، اين ماشين‌ها شامل كابينت‌هايي، هر يك به اندازه يك يخچال بودند كه بار كاري محاسبات را ميان چندين پردازنده تقسيم مي‌كردند.

سپس كلاسترها (شبكه‌هاي خوشه‌مانند) آمدند كه شامل گروه‌هايي از كامپيوترهاي نسبتاً ارزان و با اندازه‌ كوچك‌تر بودند (معمولاً كامپيوترهايي شخصي با سيستم‌عامل لينوكس) كه سيستم‌هاي پردازش موازي وسيعي را تشكيل مي‌دادند كه در تمامي اتاق‌ها، ساختمان‌ها و حتي محوطه‌هاي دانشگاهي گسترده مي‌شدند. اما با افزايش سرعت و كاهش قيمت شبكه‌هاي كامپيوتري، برخي از محققان دريافتند كه حتي اجتماعي ناهمگون‌تر و پراكنده‌تر از كامپيوترها را نيز مي‌توان براي اين منظور مورد استفاده قرار داد.

اين پژوهشگران زيرساختي را براي خود مجسم مي‌كردند كه بر خلاف سوپركامپيوترها يا كلاسترها، تحت مالكيت، مديريت و استفاده چندين سازمان باشد. همچنين به جاي طراحي يكپارچه سخت‌افزار و نرم‌افزار، اين زير ساخت روي چند نوع مختلف سيستم‌عامل، سيستم‌فايلي و فناوري‌هاي شبكه كار كند. به اين ترتيب ايده محاسبات گريد به وجود آمد و گروهي از پيشگامان گريد، شروع به فعاليت براي محقق ساختن اين روِيا نمودند.

ايان فاستر، از آزمايشگاه ملي آرگون در ايلي‌نوي، و كارل كسلمن، از دانشگاه كاليفرنياي جنوبي در لس‌انجلس، در زمره اين پيشگامان بودند. اين دو در سال 1998 كتابي را با عنوان «گريد: طرح كلي يك زيرساخت محاسباتي جديد» (انتشارات مورگان كافمن) منتشر ساختند كه فوراً به مرجع اصلي اين حيطه نو تبديل گشت.

دست‌كم در حد نظريه، گريدها شامل همه نوع سيستم هستند: سوپركامپيوترها، كلاسترهاي غول‌آسا،  كامپيوترهاي شخصي روميزي، و همچنين ادوات ذخيره‌سازي، بانك‌هاي اطلاعاتي، حسگرها و ادوات علمي. اما اگرچه بسياري از پروژه‌هاي گريد به سمت اين گوناگوني اجزا پيش مي‌روند، بيشتر آن‌ها هنوز بر گرد مجموعه‌اي همگن‌تر از سيستم‌ها مجتمع شده‌اند.

گريد EGEE عمدتاً شامل چندين كلاستر از كامپيوترهاي شخصي است (بعضي از مؤسسه‌ها يك دوجين كامپيوتر دارند و برخي چند هزار) كه به انبوهي از سرورهاي ديسك و سيلوهاي نوار مغناطيسي اختصاص‌يافته‌اي متصل هستند كه براي بك‌آپ‌گيري و ذخيره‌سازي طولاني‌مدت داده‌ها به كار مي‌روند.

اين گريد براي توزيع كردن كارهاي محاسباتي ميان كلاسترهايي كه متعلق به گروه‌هاي مختلف هستند، متكي به اينترنت و شبكه‌هاي تحقيقاتي پرسرعت اختصاصي است؛ چنانكه گويي تمام اين ماشين‌ها در يك اتاق قرار داشته ‌باشند.

از ميان شبكه‌هاي EGEE، مهم‌ترين آن‌ها كه Gant2eG نام دارد، يك زيرساخت آكادميك شبكه‌اي فيبرنوري است كه 34 كشور اروپايي را به هم متصل مي‌كند و اتصالاتي با شبكه‌هاي تحقيقاتي مشابه در ساير نقاط جهان دارد.

هنوز توان محاسباتي خالص بعضي از سوپركامپيوترها بيشتر از توان EGEE است. اما روزي اين وضعيت مي‌تواند تغيير كند و اين بستگي به آن دارد كه اين گريد با چه سرعتي رشد كند و با چه سرعتي بتواند نيروهايش را با ساير گريدهاي اصلي ملي و بين‌المللي متحد سازد.

براي نمونه، گريد Open Science كه در ايالا‌ت‌متحده پايه‌گذاري شده و تاكنون تعداد زيادي ديتاسنتر در بيش از پنجاه مؤسسه را به يكديگر متصل كرده است، از بسياري جهات مشابه گريد ايجاد شده در اتحاديه اروپا است و به زودي قابليت همكاري با EGEE را خواهد يافت.

در ژاپن، پروژه‌اي با نام «طرح گريد تحقيقاتي ملي» در حال توسعه گريدي براي علوم طبيعي است كه بسيار شبيه EGEE است و همكاري ميان اين دو پروژه آغاز شده‌است.

اما حقيقت آن است كه چنين گريدهايي، حتي هنگامي كه به يكديگر متصل شوند، هنوز نمي‌توانند جاي سوپركامپيوترها را بگيرند. برخي از مسائل، مانند انواع خاصي از شبيه‌سازي‌هاي آب و هوا، چنان محاسبات درهم پيچيده‌اي دارند كه پردازنده‌هاي متعدد يك سوپركامپيوتر بايد براي حل آن‌ها با سرعتي خارق‌العاده داده‌ها را با هم مبادله نمايند و اين قابليتي است كه دستيابي به آن براي گريدها دشوار است.

هدف گريدهايي مانند EGEE چيزي است كه پردازش با توان عملياتي بالا خوانده مي‌شود؛ يعني سر و كار داشتن با مقادير زيادي محاسبات مشابه، اما مستقل. به بيان ديگر، بهترين بهره از گريدها در مسائلي حاصل مي‌شود كه مي‌توانند به تعداد زيادي قطعات كوچك‌تر تقسيم شده و به طور موازي مورد پردازش قرار گيرند.

اگرچه گريدها عمدتاً ابزاري براي پژوهش‌هاي آكادميك باقي مي‌مانند، گام‌هاي بلندي نيز به سوي جهان تجارت برداشته‌اند. خيلي از شركت‌هاي بزرگ بعد از سرمايه‌گذاري‌هاي تكنولوژيكي براي بهره گرفتن از آن در تجارت الكترونيكي، مديريت روابط با مشتري و سيستم‌هاي زنجيره منابع، اكنون گريدهاي محاسباتي را در صدر فهرست ملزومات خود قرار مي‌دهند.

از نخستين مؤسساتي كه چنين تصميمي اتخاذ نموده‌اند، مؤسسات مالي هستند كه برخي از آن‌ها از گريدها براي انجام تحليل‌هاي پيچيده ريسك استفاده مي‌كنند. شركت‌هاي دارويي نيز گريدها را براي مطالعه آثار داروهاي جديد به كار مي‌برند.

s79_Grid01_s.jpg

جهاني شدن

پروژه EGEE در سال 2004 با مشارکت چهل پايگاه که بيشتر آن‌ها در اروپا بودند، آغاز شد. اين پروژه هم‌اکنون شرکايي دارد که حدوداً در دويست پايگاه و تقريباً در چهل کشور در سراسر جهان قرار دارند (نقاط روي نقشه). تعداد CPUها و ظرفيت ذخيره‌سازي گريد (که بر حسب ترابايت نوشته شده) به طور مداوم در نوسان هستند. ارقام مندرج در اين شکل مربوط به مقادير مقطعي در ماه مي 2006 هستند.


تمام عرضه‌كنندگان اصلي كامپيوتر، از جمله اچ‌پي، آي‌بي‌ام، مايكروسافت و سان، اين بازار را زير نظر دارند و اكنون سخت‌افزارها و نرم‌افزارهايي را ارائه مي‌كنند كه سرورها، كامپيوترهاي شخصي و مين‌فريم‌ها را قادر مي‌سازند از قدرت گريد بهره ببرند. اين گزينه‌هاي تجاري اگرچه سودمند هستند، هنوز نمي‌توانند تعداد زياد كامپيوترها، شبكه‌ها و سيستم‌ها را در يك گريد عظيم مانند EGEE مديريت نمايند.

علاوه بر اين، شركت‌هاي مختلف نهايتاً فناوري‌هاي گريد متفاوتي را توسعه داده‌اند. بنابراين بر خلاف وب (كه اتفاقاً آن هم در سرن توسعه يافت)، كه مبتني بر يك مجموعه استانداردهاي عمومي است، گريدهاي موجود بر پايه فناوري‌هاي بسيار متنوعي بنا گشته‌اند.

به نظر مي‌رسد اين حوزه براي آن كه يك شركت به تنهايي خطر ارائه محصولات و خدمات در مقياس وسيع را بپذيرد، بيش از حد نارس است. در اين مورد، صنعت يك سياست صبر و مشاهده را پيشه كرده و نقش رهبري را به جامعه آكادميك سپرده، همچنان كه غالباً در مورد فناوري‌هاي نوظهور چنين بوده‌ است.

در واقع به همين دليل است كه پروژه‌هاي بزرگ گريد هنوز به حمايت مالي عمومي نياز دارند. حركت‌هاي بين‌المللي گريد مانند EGEE در نظر دارند با توسعه و آزمايش فناوري‌هاي محاسباتي، شبكه و امنيت، و با تلاش براي رسيدن به استانداردهاي عمومي، مدل گريد را يك قدم به پيش ببرند.

اين تلاش‌ها مكمل كارهاي تشكل‌هاي استانداردهاي بين‌المللي، مانند Global Grid Forum است كه از همگرايي و تعامل كاري فناوري‌ها حمايت مي‌كنند.

اما با وجود چنين تلاش‌هايي براي استاندارد‌سازي، واژه محاسبات گريد براي افراد مختلف معاني متفاوتي دارد؛ چنانكه غالباً درباره كلمات شعارگونه تكنولوژيكي رخ مي‌دهد. يكي از عواملي كه منشأ اشتباه در اين زمينه گشته، مفهوم خدمات محاسباتي ارائه شده توسط شركت‌هاي كامپيوتري است كه بنا بر تقاضاي مشتري (On-demand) ارائه شود.

مفهوم متداول در اذهان چنين است كه يك مشتري كه نياز به قدرت پردازشي اضافه دارد، بتواند به ديتاسنتر يك عرضه‌كننده متصل شود و براي آنچه كه استفاده مي‌كند، هزينه پرداخت كند. اين مفهومي جالب است. اما لزوماً به فناوري گريد نياز ندارد.

در مرتبه بعد سيستم‌هايي به منظور جمع‌آوري توان محاسباتي از منابع بلااستفاده قرار دارند، مانند SETI@home، برنامه محبوب محافظ صفحه نمايشگر كه براي جست‌وجوي داده‌هاي حاصل از امواج راديويي نجومي در پي نشانه‌هاي هوشمندي فرا زميني، از كامپيوترهاي شخصي مردم عادي بهره مي‌برد.

با در نظر گرفتن اين كه SETI@home تاكنون روي بيش از پنج ميليون كامپيوتر شخصي در سراسر جهان دانلود شده است، جاه‌طلبي‌هاي پروژه‌اي مانند EGEE براي يكپارچه ساختن صدهزار كامپيوتر، در مقام مقايسه نسبتاً كم به نظر مي‌آيد.

اما شباهت‌هاي اين دو پروژه، تفاوت‌هاي آن‌ها را به شكلي گمراه‌كننده جلوه‌گر مي‌سازند. نوع نرم‌افزار علمي‌اي كه روي گريد EGEE اجرا مي‌شود، با پيكربندي‌هاي پيچيده‌اي سر و كار دارد و نيازمند تبادل داده‌ها به شكلي قابل اطمينان و ايمن است؛ چيزي كه اتصال نامنظم كامپيوترهاي شخصي نمي‌تواند فراهم آورد.

سرن پايگاهي است كه در يك رمان ترسناك  مشهور دن براون تصوير شده‌ است. اما سرني كه در اين رمان ترسيم شده، يك پايگاه فضايي براق با يك هواپيماي Mach 15 و ماشيني خيالي است كه به طور انبوه پاد‌ماده توليد مي‌كند و بسيار دور از سرن واقعي‌اي است كه ادارات مختلف و نامرتب آن در دهه 1970 به صورت ساختمان‌هايي موقتي بنا گشتند. با اين حال، ظواهر امر مي‌توانند فريب‌دهنده باشند: برخي از پيشرفته‌ترين پروژه‌هاي علمي و تكنولوژيكي امروز، درون ساختمان‌هاي سرن در جريانند.

در يك خانه ويلايي بي‌تكلف كه در مجاورت تشكيلات اصلي محاسبات سرن قرار دارد، مركز عصبي پروژه EGEE بنا نهاده شده ‌است. هنگامي كه در آوريل 2004 پروژه آغاز گشت، هدفش ايجاد يك گريد بود كه مؤسسه‌هايي را در اروپا و تعدادي را نيز در ايالا‌ت‌متحده و روسيه به هم متصل سازد. اما هنگامي كه گروه‌هاي ديگري در آسيا و خاورميانه به اين حركت پيوستند، اين كار به سرعت شكل يك حركت جهاني را گرفت.

نخستين فاز دوساله اين پروژه در ماه مارس 2006 به پايان رسيد و مرحله دوساله دوم شروع شده‌ است. هدف آن است كه گريد را به مكان‌هاي بيشتري گسترش دهند و نهايتاً تا سال 2008 به بيش از صد هزار CPU و چند ده پتابايت ظرفيت ذخيره‌سازي برسند (هر پتابايت حدوداً يك ميليون گيگابايت است).

احتمالاً مهم‌ترين قسمت يك گريد، چيزي است كه ميان‌افزار (middleware) خوانده مي‌شود. ميان‌افزار مجموعه‌اي از برنامه‌ها است كه هر مؤسسه براي آن كه سيستم‌هاي خود را به قسمتي از گريد تبديل كند، بايد روي آن‌ها اجرا نمايد. ميان‌افزار بررسي مي‌كند كه چه منابعي (شامل قدرت پردازشي، ذخيره‌سازي و ديتابيس) در دسترس هستند و تصميم مي‌گيرد كه كجا و در چه زماني كارهايي را كه توسط كاربران ارائه شده است، به انجام برساند.

ميان‌افزار به عنوان يك لايه نرم‌افزاري مياني، بين كامپيوترهاي گريد، شبكه‌ها و برنامه‌هاي كاربران فعاليت مي‌كند. با بهره‌گيري از ميان‌افزار، ساختار زيرين پيچيده گريد براي محققاني كه آن را به صورت يك ماشين مجازي واحد مي‌بينند، شفاف مي‌گردد.

انفجار بزرگ داده‌ها

چگونه پانزده ميليون گيگابايت داده را ذخيره مي‌كنيد؟

هنگامي كه تصادم‌گر بزرگ هادرون‌ در سرن در سال 2007 شروع به كار كند، نتايج برخورد ميان دو گروه از پروتون‌هايي را ثبت خواهد كرد كه در جهات مخالف يكديگر حركت مي‌كند و انرژي‌اي دارند معادل با يك اتومبيل كه با سرعت 25هزار كيلومتر در ساعت حركت كند.

برخوردها در چهار نقطه در تونل دايره‌اي LHC رخ مي‌دهند، در جاهايي كه هم‌اكنون آشكارسازهاي غول‌پيكر را سوار مي‌كنند. اين برخوردها به فيزيك‌پيشگان امكان مي‌دهند نظري سريع بر ذراتي داشته ‌باشند كه مدت‌هاست از جهان ما ناپديد شده‌اند، مانند بوزون فرضيه‌‌اي هيگز كه آخرين قطعه اساسي گم‌شده از مدل استاندارد ذرات بنيادي به شمار مي‌رود.

بزرگ‌ترين اين آشكارسازها، ATLAS، حفره‌اي زيرزميني به بلنداي شش طبقه را پر مي‌كند. انتظار مي‌رود ATLAS يك ميليارد برخورد را در ثانيه آشكارسازي نمايد. با توجه به اين‌كه يك برخورد منفرد در يك آشكارساز، تصويري با صدها مسير ذره ايجاد مي‌كند كه معادل با چندين مگابايت داده است، نرخ توليد داده‌ها سرسام‌آور خواهد بود.

دانش‌پيشگان تنها با يك فرايند به شدت گزينشي كه حدوداً يكي در يك ميليون رويداد را انتخاب مي‌كند، شانس اين را مي‌يابند كه داده‌ها را ذخيره كنند. حتي با اين حال، پيش‌بيني مي‌شود تجمع داده‌ها در يك سال به بيش از پانزده ميليون گيگابايت برسد.

سرن راهي براي ذخيره اين حجم داده به صورت متمركز ندارد و حتي اگر راهي داشت، يك مخزن مركزي داده‌ها براي اكثر مؤسسات دوردستي كه درگير پروژ LHC هستند، نامناسب مي‌بود. از اين رو ايجاد يك زيرساخت جهاني براي ذخيره و تحليل نمودن داده‌هاي LHC ضروري است.

ايجاد اين زيرساخت از گريد محاسباتي LHC كه در سال 2002 به بهره‌برداري رسيد، آغاز گشت و اكنون گريدهاي متعددي را در بر مي‌گيرد؛ از  جمله گريدهاي EGEE.

داده‌هاي LHC فرصت عملياتي ايده‌آلي را براي شروع كار پروژه EGEE فراهم مي‌آورند. اما نهايتاً اگر اهداف اين حركت محقق شوند، پروژه‌هاي تحقيقاتي فيزيك ذرات بنيادي تنها يكي از طيف وسيع پروژه‌هاي علمي خواهد بود كه روي اين گريد همه‌منظوره اجرا خواهند شد.


تيم EGEE به جاي آن كه سعي كند ميان‌افزار را از پايه بنا نمايد، اجزاي نرم‌افزاري را از شماري از پروژه‌هاي مختلف مربوط به گريد اقتباس كرد. براي مديريت نمودن تمام كارهاي گريد، ميان‌افزار EGEE كه gLite نام دارد، متكي به اجزايي از كيت نرم‌افزاري Globus است.
 
Globus يك بسته نرم‌افزاري پركاربرد گريد است كه توسط فاستر، كسلمن و همكاران آن‌ها توسعه داده‌ شده ‌است. همچنين gLite براي ايفاي وظايف محاسباتي توزيع‌يافته خود، از Condor بهره مي‌برد كه يك سيستم پرطرفدار مديريت بار محاسباتي است كه توسط تيم Miron Livny در دانشگاه ويسكانزين در مديسون توسعه داده شده است.

gLite بر خلاف نامش (كه مفهوم سبكي را القا مي‌كند) بيش از يك ميليون خط كد را شامل مي‌شود كه به زبان‌هاي مختلف نوشته‌ شده‌اند و بسته آن بيش از صد مگابايت حجم دارد. اما اين اسم بيانگر اين حقيقت است كه رهيافتي واقع‌گرايانه اتخاذ شده تا مجموعه‌اي پايه‌اي از سرويس‌هاي گريد به دست آيند كه در مقياس جهاني اجرا مي‌شوند و مسائل پيشرفته‌تر به آينده موكول شده‌اند.

براي آن كه دركي ابتدايي از نحوه كار گريد به دست آوريد، اقدامي جديد را در نظر بگيريد كه در آن آزمايشگاه‌هايي از آسيا و اروپا براي بررسي سيصدهزار تركيب دارويي پيشنهادي بر ضد آثار دردناك ويروس آنفلوانزاي مرغي، H5N1، از EGEE استفاده كردند.

حدود دو هزار كامپيوتر در گريد، يك برنامه شبيه‌سازي مولكولي را به مدت چهار هفته در آوريل سال 2006‌ اجرا كردند؛ كاري كه براي يك كامپيوتر صد سال طول مي‌كشيد. اين كار متكي به برنامه‌اي بود كه توانايي يك مولكول دارو را براي جاي گرفتن در پروتئين‌هاي كليدي سطح H5N1 مي‌سنجد.

اگر مولكولي اين كار را با موفقيت انجام دهد، فعاليت آن پروتئين‌ها را كُند مي‌كند و توانايي انتشار ويروس مختل مي‌گردد. شش مؤسسه شركت‌كننده در EGEE كه در فرانسه، ايتاليا، اسپانيا و تايوان قرار دارند، داروهاي نامزد را انتخاب كردند و هر يك از آن‌ها شبيه‌سازي‌هاي خود را به گريد ارائه كرد.
شبيه‌سازي‌ها توسط يك قسمت از ميان‌افزار به نام واسطه منابع دريافت مي‌شوند. واسطه منابع مجموع توان محاسباتي براي پردازش تمام شبيه‌سازي‌ها را تخمين مي‌زند و سپس منابع قابل دسترسي در سراسر گريد را بررسي مي‌كند. در يك كار مشخص، تمام اعضاي EGEE شركت نمي‌كنند و بنابراين واسطه منابع بايد بفهمد كه كدام را مي‌توان مورد استفاده قرار داد.

يك روش انجام اين كار، تعريف كردن يك «سازمان مجازي» است؛ زيرمجموعه‌اي از تمام مؤسسه‌هاي شركت‌كننده كه علايق علميِ مشتركي دارند. در شبيه‌سازي آنفلوانزا، بازيگر اصلي يك سازمان مجازي EGEE به نام BioMedبود كه حدوداً شصت پايگاه در اروپا، روسيه، تايوان و ... دارد.

در مرحله بعد، واسطه منابع، كارها را با استفاده از اينترنت يا شبكه‌هاي اختصاصي در مكان‌هاي مختلف توزيع مي‌كند. ممكن است قسمتي از كارها به آزمايشگاه‌هاي فيزيك Corpuscular در كلرمونت‌فراند در فرانسه برود، قسمتي ديگر به سوي مركز تحقيقات Genomics در تايوان حركت كند، قسمت سوم به دانشگاه بيرمنگام در انگليس برود و قسمتي هم به مؤسسه فناوري‌هاي زيست-پزشكي در ايتاليا برسد.

اين قسمت‌ها و تمام كارهاي ديگر مورد پردازش قرار گرفته و نتايج، به واسطه منابع بازگردانده مي‌شوند و واسطه منابع دوباره آن‌ها را به شكل راه‌حل كامل به هم متصل مي‌كند. مسئله بيت به بيت و در مؤسساتي كه توسط قاره‌ها و اقيانوس‌ها از هم جدا گشته‌اند، حل مي‌شود.

داده‌هاي خروجي هر محاسبه، به منظور تأمين امنيت بسيار زياد، در سه پايگاه ذخيره مي‌شوند: دو پايگاه در فرانسه و يكي در تايوان. بيش از شصت هزار فايل خروجي با حجم داده ششصد گيگابايت در گريد EGEE ايجاد و ذخيره شدند. تركيب‌هاي دارويي بالقوه بر ضد آنفلوانزاي مرغي اكنون مشخص گشته‌اند و بر حسب ميزان موفقيتي كه به نظر مي‌رسد در مسدود كردن فعاليت ويروس در شبيه‌سازي‌ها داشته‌اند، رتبه‌بندي شده‌اند.

ساير برنامه‌هايي كه روي گريد EGEE اجرا مي‌شوند، به روش مشابهي كار مي‌كنند. (كادر صفحه قبل با عنوان «حل مسئله» را ببينيد.) برخي از پژوهشگران از EGEE براي تحليل تصاوير پزشكي، مانند اسكن‌هاي توموگرافي تابش پوزيترون (PET) كه در بيمارستان‌ها نگهداري مي‌شوند، استفاده مي‌كنند.

مهندسان در Compagnie Generale de Geophysique در پاريس، از گريد براي پردازش داده‌هاي ژئوفيزيكي در جست‌وجوي نفت، گاز، معادن و براي مطالعات محيطي استفاده مي‌كنند. همچنين UNOSAT، پروژه‌اي متعلق به سازمان ملل متحد، مشغول آزمايش كردن با يك برنامه گريد به منظور فشرده نمودن داده‌هاي ماهواره‌اي داراي وضوح بالا است كه در منابعي در سراسر جهان نگهداري مي‌شوند. داده‌هاي فشرده شده را مي‌توان سريع‌تر به كاركنان محلي رساند كه وظيفه عمليات نجات بعد از سوانح طبيعي و امداد پس از جنگ را بر عهده دارند.

هنوز به آن نقطه مطلوب نرسيده‌ايم كه استفاده از گريد براي كارهاي علمي همان ‌قدر معمول شود كه امروزه استفاده از كامپيوترهاي شخصي و وب متداول است. اما كاربران EGEE به طور فزاينده‌اي در حال متكي شدن به آن هستند. سال گذشته بيش از يك هزار پژوهشگر از پنج قاره، حدود دو ميليون كار محاسباتي را به گريد EGEE ارائه نمودند كه از شبيه‌سازي‌هاي نسبتاً كوچك تا مسائل عظيم محاسبات عددي را شامل مي‌شد.

حلال مسئله

برنامه‌هاي گوناگوني كه با مسائل پيچيده مواجهند، هم‌اكنون روي گريد EGEE اجرا مي‌شوند:

فيزيك انرژي‌هاي بالا و اخترفيزيك‌

‌‌
‌‌ LHC: تحليل و ذخيره‌سازي داده‌هاي حاصل از چهار سيستم آشكارسازي تصادم‌گر بزرگ هارون‌ها
‌‌
MAGIC: شبيه‌سازي‌هاي پرتوهاي كيهاني براي تحليل داده‌هاي تلسكوپ MAGIC در جزاير قناري.
‌‌
‌ ANTARES: تحيلي داده‌هاي آشكارساز زيرآب ميوآن كه قرار است در درياي مديترانه ساخته شود.

پزشكي و علوم زيستي‌

‌‌
‌ WISDOM: تحليل تركيب‌هاي شيميايي به منظور كشف كردن داروهاي جديد بر ضد بيماري‌هاي گوناگون.
‌‌
GPS: بانك اطلاعاتي و ابزارهاي تحليل پروتئين‌ها براي پژوهشگراني كه روي ژنوم‌هايي كه تاكنون مرتب شده‌اند، تحقيق مي‌كنند.
‌‌
‌ GATE: شبيه‌سازي برهم‌كنش بافت با تشعشع براي برنامه‌ريزي جهت پرتودرماني.
‌ SiMRI3D: شبيه‌سازي فيزيك يك سيستم سه بعدي تصوير‌برداري با تشديد مغناطيسي (MRI).
‌‌
SPLATCHE: شبيه‌سازي پراكندگي انسان‌ها در يك محدوده جغرافيايي براي مطالعه تغييرات ژنتيكي.

علوم زمين

‌ CODESA 3D: شبيه‌سازي فرايندهاي فيزيكي حاكم بر جريان آب‌هاي زيرزميني در سيستم‌هاي هيدرولوژيك (آب‌شناسي).
‌‌
EGEODE: پردازش داده‌هاي لرزه‌نگاري براي اكتشاف لايه‌هاي زمين و جست‌وجوي ذخاير نفت و گاز.
‌‌
GOME: تحليل داده‌هاي نموداري و تصويري ماهواره‌اي براي تحقيقات اوزون و تشخيص ريزش (نشت) نفت‌
‌‌
PARTICLE SMASHER: پروتون‌هايي كه در تونل 27 كيلومتري LHC به صورت شاخ‌به‌شاخ با هم برخورد خواهند كرد.


طرح‌هاي فاز دوم EGEE مستلزم ادامه گسترش زيرساخت اين پروژه و افزايش تعداد كاربردهاي آن است. در زمان شروع فاز دوم، روزانه 25هزار كار مورد پردازش قرار گرفته‌اند. همچنين گستردگي جهاني اين پروژه براي توسعه آن مهم است و تلاش‌هايي در جريان است تا گستره گريد EGEE را به حوزه‌هاي جغرافيايي بالتيك، مديترانه، چين، هند و آمريكاي لاتين برسانند.

در عين حال هنوز هم مشكلاتي بنيادي ظاهر مي‌شوند. يكي از آن‌ها، حفظ ضريب اطمينان گريد است. EGEE نيازمند آن است كه روند تكامل خود از يك ابزار تحقيقاتي به يك زيرساخت توليدي واقعي را به پايان رساند. از اين رو يك عنصر اساسي پروژه EGEE (كه در واقع نيمي از كل بودجه را به خود اختصاص داده)، شامل حصول اطمينان از اين امر است كه تمام مؤسسات شركت‌كننده داراي كادر آموزش‌ديده باشند.

همچنين مراكز ملي و منطقه‌اي سرويس گريد به منظور هماهنگ ساختن روزآمدسازي‌ها و زير نظر گرفتن كارايي شبكه ايجاد گردند و همچنين مراكز تلفني‌اي كه، پاسخگوي سؤالات فوري دانش‌پيشگاني باشند كه به زبان‌هاي گوناگون صحبت مي‌كنند.

در نهايت گريد تنها در صورتي متداول خواهد شد كه پژوهشگران (كه معمولاً مشتري‌هاي معترضي هستند)، متقاعد شوند كه گريد براي آن‌ها پرفايده و كم‌دردسر است. عمليات پردازشي سرهم‌بندي‌شده و واسط‌هاي كاربري بد به سادگي چنين كاربراني را فراري خواهد داد و آن‌ها احتمالاً به منابع محلّي خود اكتفا خواهند كرد؛ هرچند در حد توانايي‌هاي گريد نباشد.

با در نظر داشتن اين مسئله، EGEE نسخه سوم gLite را ارائه كرده است كه در آن تخصيص منابع و قابليت‌هاي تبادل داده بهبود يافته‌اند تا بتواند از عهده پاسخگويي به خواسته‌هاي گوناگون گروه‌هاي علمي متفاوت برآيد.

درباره آينده گريد EGEE و ساير گريدها، كارشناسان معتقدند همچنان كه استفاده از گريدها متداول شود، ديگر نخواهيم‌ توانست آن‌ها را از وب و ساير برنامه‌هاي اينترنتي تميز دهيم. يعني به اين ترتيب استفاده نمودن از گريد براي دسترسي به توان محاسباتي يا ظرفيت ذخيره‌سازي، تفاوتي با رزرو كردن بليت  پرواز يا دانلود كردن موسيقي نخواهد داشت. مانند بسياري از فناوري‌ها، موفقيت گريد هنگامي حاصل خواهد شد كه در زمينه زندگي تكنولوژيكي ما محو شده باشد.

منابعي براي مطالعه بيشتر

براي اطلاعات بيشتر در زمينه تكنولوژي و كاربردهاي EGEE، مراجعه كنيد به:
www.eu-egee.org

 گريد Open Science يكي از بزرگ‌ترين پروژه‌هاي گريد در ايالات متحده است:
www.opensciencegrid.org

براي اطلاعات بيشتر در زمينه تكنولوژي گريد، سايت‌هاي زير را ببينيد:
 
http://gridcafe.web.cern.ch
www.globus.org


دریافت این مقاله:

http://rapidshare.com/files/117454745/Grid_Computing.doc.html


مطالب مشابه :


Grid Computing و بزرگ‌ترين ماشينهاي علمي‌ ساخت بشر

پایگاه تخصصی فناوری مهندسی فناوری اطاعات جوي، اكتشاف نفت و گاز




بطلان ، انحلال و فسخ عقد

سيستم جامع سامانه قوانین و ترتيب اولاً آنها اطاعات ازحقوق بنمايند ثانياً




برچسب :