داده کاوی (Data Mining) چیست ؟
مديريت ذخيره سازی و دستيابی اطلاعات
داده هایاطلاعاتی(Data)
به عنوان يکی از منابع حياتی
سازمان شناخته می شود و بسياریاز سازمان ها با اطلاعات و دانش سازمانی خود
مانند ساير دارايی های ارزشمندشانبرخورد می کنند.
نکته: داده اطلاعاتی (Data) به اطلاعات خامسازمان اتلاق میشود و اطلاعات (Information) به دادههای پردازش شده. همچنين داده های پردازش شده پس از طبقه بندی و آناليز به دانش سازمان (Knowledge) تبديل می گردند.
حال تصور نماييد، دسترسی به
اطلاعات (Information) در
شرايطی کهدادهها
به روش نامناسبی نگهداری شوند و يا روش ضابطه مندی جهت دستيابی به آنهاوجود نداشته
باشد تا چه حد مشکل است . برای رسيدن به يک سيستم اطلاعاتی مناسب،دادهها می
بايست به صورتی منطقی طبقه بندی و ذخيره شوند تا استفاده از آن هاسادهتر
بوده، با کارايی بيشتری تحليل شوند و سريعتر مورد استفاده قرار گيرند و درنتيجه مديريت
بهتری بر آن ها اعمال شود. در اين راستا مجموعه خدمات زير در زمينهمديريت بانک
های اطلاعاتی توسط اين شرکت ارايه میشود :
ساختار بانکاطلاعاتی
سازمان:
داده های سازمان ها در انواع
بانک های اطلاعاتی و باساختارهای متنوعی ذخيره میگردند . طراحی و سازماندهی
اين ساختارها، بکارگيری وانتقال به بانکهای اطلاعاتی پيشرفته و بهينه سازی آن
ها يکی خدماتی است که توسطدرسا رسانه هوشمندارايه می شود .
داده کاوی (Data Mining):
کاوشهای ماشینی در دادهها یا دادهکاوی (Data mining) را باید یکی از سامانههای هوشمند (Intelligent systems) دانست. سامانههای هوشمند زیر شاخهایست بزرگ و پرکاربرد از یادگیری ماشینی که خود زمینهایست در هوش مصنوعی. زمینه علمی جدید و پهناور یادگیری ماشینی (که "کاوشهای ماشینی در دادهها" بخشی ست بزرگ از زیر شاخه سامانههای هوشمند آن ست)، به واقع همان امتداد و استمرار دانش کهن و همه جا گیر آمار است در جهت ماشینی کردن یادگیری، تعلّم، و سرانجام، دانش.
داده کاوی به عنوان مهمترين کاربرد Data Warehouse یاانباره های داده شناخته می شود . به وسيله داده کاوی داده های موجود مورد تحليلقرار می گيرند تا روندهای احتمالی، ارتباطهاي غير محسوس و الگو های مخفی داده هااز بين انبوه داده ها، شناسايی شوند .
در اين فرايند از الگوريتم های پيچيدهرياضی و آماری استفاده می شود تا داده ها تبديل به دانش سازمان شوند.
امروزه با حجم عظيمي از داده ها روبرو هستيم. براي استفاده از آنها به ابزارهاي
كشف دانش نياز داريم. داده كاوي به عنوان يك توانايي پيشرفته در تحليل داده و كشف
دانش مورد استفاده قرار مي گيرد. داده كاوي در علوم (ستاره شناسي،...)در تجارت
(تبليغات، مديريت ارتباط با مشتري،...) در وب (موتورهاي جستجو،...) در مسايل دولتي
(فعاليتهاي ضد تروريستي،...) كاربرد دارد. عبارت داده كاوي شباهت به استخراج زغال
سنگ و طلا دارد. داده كاوي نيز اطلاعات را كه در انبارهاي داده مدفون شده است،
استخراج مي كند.
*************************
در واقع هـــــدف از داده كاوي ايجاد مدل هايي براي تصميم گيري است. اين مدلها رفتارهاي آينده را براساس تحليلهاي گذشته پيش بيني مي كنند. به كاربردن داده كاوي به عنوان اهرمي براي آماده سازي داده ها و تكميل قابليتهاي انباره داده (DATA WAREHOUSE) ، بهترين موقعيت را براي به دست آوردن برتريهاي رقابتي ايجاد مي كند.
سيستم هاي بانك داده (DATABASE) ، نقشي كليدي در سيستم هاي مديريت و انبار داده، بازي مي كنند. يك سيستم بانك داده، شامل فايل هاي بانك داده و سيستم هاي مديريت بانك داده است.
اغلب تجارت ها به تصميم گيريهاي استراتژيك و يا اتخاذ خط مشي هاي جديد براي خدمت رساني بهتر به مشتريان نياز دارند. به عنوان مثال فروشگاهها آرايش مغازه خود را براي ايجاد ميل بيشتر به خريد مجدداً طراحي مي كنند و يا خطوط هواپيمايي تسهيلات خاصي را براي مشتريان جهت پروازهاي مكرر آنها در نظر مي گيرند. اين دو مثال به داده هايي در مورد رفتار مصرفي گذشته مشتريان براي تعيين الگوهايي به وسيله داده كاوي، نياز دارد. براساس اين الگوها تصميمـــات لازم اتخاذ مي شود. در واقع ابزار داده كــــاوي، داده را مي گيرد و يك تصوير از واقعيت به شكل مدل مي سازد، اين مدل روابط موجود در داده ها را شرح مي دهد.
از نظر فرايندي فعاليتهاي داده كاوي به سه طبقه بندي
عمومي تقسيم مي شوند:
اكتشاف : فرايند جستجو در يك بانك داده براي يافتن الگوهاي پنهان، بدون داشتن يك
فرضيه از پيش تعيين شده درباره اينكه اين الگو ممكن است چه باشد.
مانند تحليلهايي كه برحسب كالاهاي خريداري شده صورت مي گيرد، اينگونه تحليلهاي
سبدي نشانگر موارديست كه مشتري تمايل به خريد آنها دارند. اين اطلاعات مي تواند به
بهبود موجودي، استراتژي طراحي، آرايش فروشگاه و تبليغات منجر گردد.
مدل پيش بيني : فرايندي كه الگوهاي كشف شــده از بانك
داده را مي گيرد و آنها را براي پيش بيني آينده به كار مي برد.
مانند پيش بيني فروش در خرده فروشي، الگوهاي كشف شده براي فروش به آنها كمك مي كند
تا تصميماتي را در رابطه با موجودي اتخاذ كنند.
تحليلهاي دادگاهي : به فرايند به كارگيري الگوهاي استخراج شده براي يافتن عوامــل
داده اي نامعقول و متناقض مربوط مي شود.
مانند شناسايي و تشخيص كلاهبرداري در موسسات مالي. كلاهبرداري به ميزان زيادي
پرهزينه و زيان آور است، بانكها مي توانند با تحليل دادوستدهاي جعلي گذشته
الگوهايي را براي تشخيص و كشف كلاهبرداري به دست آورند.
در سالهاي اخير اهميت متون به عنوان منابع با پتانسيل اطلاعاتي بسيار بالا به نحو گستردهاي مورد توجه قرار گرفته به طوري كه كشف دانش از متون به عنوان يكي از مهمترين فعاليتهاي محققين حوزه هوش مصنوعي و فناوري اطلاعات قرار گرفته است. تحقيقات بسياري صورت گرفته اما محدوده فعاليت بقدري گسترده است كه نيازمند توجه بيشتري ميباشد.
امروزه محققان به اين مسئله معترفند كه با وجود انجام تحقيقات بي وقفه در زمينه كاري خود، نميتوانند همزمان با پيشرفت دانش، معلومات خود را به روز نگاه دارند. بعنوان مثال بانك اطلاعاتي Medline در حال حاضر حاوي 10 ميليون چكيده مقاله است و هر هفته بين هفت تا هشت هزار چكيده مقاله به اين بانك اطلاعاتي افزوده ميشود. در اين بين شايد همه مقالات مربوط به يك دانش خاص نباشند، اما تعداد مقالات تخصصي كه در حوزه تحقيق يك دانش خاص قرار ميگيرد به اندازه اي است كه يك نفر نميتواند ادعا كند همه آنها را مطالعه كرده است بعلاوه نقش مطالعات عميق و گسترده و استخراج ايده ها و دانش جديد از مطالب مطالعه شده بر كسي پوشيده نيست.
در اين ميان اينترنت بعنوان بزرگترين منبع اطلاعاتي همگاني، تشكيل يافته از صد ها ميليون صفحه اطلاعات است كه به جهت همگاني بودن آن و نبود آيندهنگري كافي در زمان تشكيل و رشد آن ، متحمل نگاهداري اطلاعات نويسندگان، محققان ، انديشمندان و غيره به همان نحوي كه آنها مي نوشتند گرديد. نبود يك استاندارد همه جانبه و دقيق در تنظيم متون و قرار گيري اين مجموعه عظيم بصورتي غير ساختيافته و يا بعضاً نيمه ساختيافته، جامعه اطلاعاتي را دچار نوعي سردر گمي و مشكل در دستيابي به اطلاعات مورد نياز كرده بطوريكه براي يافتن مطالب مورد نظر خود متحمل هزينه هاي زماني بسياري ميگردند. محققان به ارايه راه كارهايي براي ساخت يافته كردن اطلاعات نمودند و با ارايه زبانهاي نشانه گذاري استاندارد نظير XML تا حد زيادي جلوي اين از هم پاشيدگي اطلاعاتي را گرفتند اما آنچه همچنان باقي است وجود بسياري از متون غير ساختيافته ميباشد؛ در همين راستا ارايه ابزاهايي كه با بررسي متون بتوانند تحليلي روي آنها انجام دهند منجر به شكل گيري زمينهاي جديد در هوش مصنوعي و فناوري اطلاعات گرديده كه به يادگيري متن معروف است.
اين حوزه تمام فعاليتهايي كه به نوعي به دنبال كسب دانش از متن هستند را شامل ميگردد. آناليز داده هاي متني توسط تكنيكهاي يادگيري ماشين، بازيابي اطلاعات هوشمند، پردازش زبان طبيعي يا روشهاي مرتبط ديگر همگي در زمره مقوله يادگيري متن قرار ميگيرند. يكي از روشهايي كه ذكر گرديد، استفاده از تكنيكهاي يادگيري ماشين در زمينه پردازش متن است، مسئله قابل تامل اين است كه اين تكنيكها در ابتدا در مورد داده هاي ساختيافته به كار گرفته شدند و علمي به نام داده كاوي را بوجود آوردند. داده هاي ساختيافته به داده هايي اطلاق ميگردد كه بطور كاملاً مستقل از همديگر ولي يكسان از لحاظ ساختاري در يك محل گردآوري شده اند. انواع بانكهاي اطلاعاتي را ميتوان نمونه هايي از اين دسته اطلاعات نام برد. در اينصورت مسئله داده كاوي عبارت از كسب اطلاعات و دانش از اين مجموعه ساخت يافته. اما در مورد متون كه عمدتاً غير ساخت يافته يا نيمه ساخت يافته هستند ابتدا بايد توسط روشهايي ، آنها را ساختارمند نمود و سپس از اين روشها براي استخراج اطلاعات و دانش از آنها استفاده كرد. به هر حال استفاده از داده كاوي در مورد متن خود شاخه اي ديگر را در علوم هوش مصنوعي بوجود آورد به نام متن كاوي . از جمله فعاليتهاي بسيار مهم در اين زمينه، طبقه بندي (دسته بندي) متن ميباشد.
طبقه بندي متن، يعني انتساب اسناد متني بر اساس محتوي به يك يا چند طبقه از قبل تعيين شده، يكي از مهمترين مسايل در متن كاوي است؛ مرتب كردن بلادرنگ نامه هاي الكترونيكي يا فايلها در سلسله مراتبي از پوشه ها، تشخيص موضوع متن، جستجوي ساختيافته و/ يا پيدا كردن اسنادي كه در راستاي علايق كاربر ميباشد، از جمله كاربردهاي مبحث طبقه بندي (دسته بندي-كلاسه بندي ) متن است. در بسياري از موارد ، افراد حرفه اي آموزش ديده، براي طبقه بندي متون جديد به كار گرفته ميشوند. اين فرآيند بسيار زمان بر و پر هزينه است و لذا كاربرد خود را محدود ميسازد، به همين منظور علاقه روزافزوني به توسعه فناوري هايي در دسته بندي خودكار متن ابراز ميشود.
در هر حال در جوامع اطلاعاتي امروزي آنچه از اهميت روزافزوني برخوردار است، اطلاعات و تبادل آن است و در اين راستا به توسعه فناوري هاي مرتبط پرداخته ميشود، اما يك مرحله كاملاٌ جديد تر و كاملاً مورد توجه جوامع فرا صنعتي، خلق دانش جديد از اطلاعات قبلي است كه اين جوامع آنرا كليد موفقيت خود در آينده دانسته و به سختي در اين زمينه فعاليت مينمايند. بر ما است تا ضمن ارتقاي فناوري اطلاعات در كشور و ايجاد زير ساختهاي لازمه در اسرع وقت، به اينگونه مسائل جديتر كه در زمره Information High Technology قرار ميگيرند، بپردازيم.
مطالب مشابه :
بیوگرافی و معرفی دکتر استفان کاوی
کاوی ، مؤسس او نویسندۀ هشت کتاب پر فروش از اگر به انسانی یک ماهی بدهید خوراک یک روز او را
داده کاوی
بیشتر تکینکهای دادهکاوی که در این کتاب در شرایط حاضر افزایش ثبت الکترونیکی فروش
دانلود کتاب آموزش داده کاوی در پایگاه داده های بزرگ
دانلود کتاب آموزش داده کاوی در پایگاه داده کاوی، پایگاهها و مجموعه فروش اینترنتی
کتاب TAN و مباحثی در خصوص داده کاوی
کتاب مقدمه ای بر داده کاوی تالیف آقای tan را داده کاوی دانلود کتاب دانلود و فروش
داده کاوی در تجارت الکترونیک : فواید ، چالش ها و راهکارها
داده کاوی در سایتی برای دانلود کتاب بانک ها ، شرکت های بیمه ، مراکز فروش و شرکت های
پروژه مدیریت فروشگاهی #C
معرفی کالا، معرفی واحدها ، معرفی اشخاص ،فاکتور خرید ،فاکتور فروش داده کاوی کتاب مهندسی
داده کاوی
داده کاوی داده کاوی دانلود کتاب دانلود و فروش کتابهای انگلیسی و
جزوه فارسی داده کاوی
داده کاوی دانلود کتاب معرفی نشریات دانلود و فروش کتابهای انگلیسی و
داده کاوی Datamining
داده کاوی جزوه و کتاب; کریستالی برای فروش سفارش داده شود و غرفه های جنبی
داده کاوی (Data Mining) چیست ؟
سایتی برای دانلود کتاب داده کاوی الگوهاي كشف شده براي فروش به آنها كمك مي كند تا
برچسب :
فروش کتاب داده کاوی