عنوان : داده كاوي چيست ؟
مهندس عذرا قبادي ،رئيس اداره نگهداري وپشتيباني سيستم ها
چکیده :جامعه مبتنی بر اطلاعات را می توان به عنوان جامعه ای تعريف نمود که بخش غالب اجتماع به جای کارهای فيزيکی در گيركارهاي فکری هستند. در چنين جامعه ای بيشترين توجه به فعاليتهای اطلاعاتی از قبيل : فراهم آوری، پردازش، توليد، ثبت، انتقال، اشاعه و مديريت اطلاعات مبذول می گردد وبيشترين هزينه ها صرف فرايندهای اطلاعاتی می شود.
داده كاوي چيست ؟
جامعه مبتنی بر اطلاعات را می توان به عنوان جامعه ای تعريف نمود که بخش غالب اجتماع به جای کارهای فيزيکی در گيركارهاي فکری هستند. در چنين جامعه ای بيشترين توجه به فعاليتهای اطلاعاتی از قبيل : فراهم آوری، پردازش، توليد، ثبت، انتقال، اشاعه و مديريت اطلاعات مبذول می گردد وبيشترين هزينه ها صرف فرايندهای اطلاعاتی می شود (cawkell,1987).
با گسترش سيستمهاي پايگاهي و حجم بالاي داده ها ي ذخيره شده در اين سيستم ها ، به ابزاري نيازاست تا بتوان اين داده ها راپردازش کرد و اطلاعات حاصل از آن را در اختيار کاربران قرار داد.معمولا"کاربران پس از طرح فرضيه اي بر اساس گزارشات مشاهده شده به اثبات يا رد آن مي پردازند ، در حالي که امروزه به روشهايي نيازداريم كه به اصطلاح به کشف دانش(Knowledge Discovery) بپردازند يعني روشهائي كه با کمترين دخالت کاربر و به صورت خودکار الگوها و رابطه هاي منطقي را بيان نمايند.
يکي از روشهاي بسيار مهمي كه با آن مي توان الگوهاي مفيدي را در ميان داده ها تشخيص داد،داده كاوي است ،اين روش كه با حداقل دخالت كاربران همراه است اطلاعاتي را در اختيار آنها وتحليل گران قرار ميدهد تا براساس آنها تصميمات مهم و حياتي در سازمانشان اتخاذ نمايند .
بايد توجه داشت که اصطلاح داده کاوي زماني به کار برده مي شود که با حجم بزرگي از داده ها ، در حد مگا يا ترابايت ، مواجه باشيم . در تمامي منابع داده کاوي بر اين مطلب تاکيد شده است . هر چه حجم داده ها بيشتر و روابط ميان آنها پيچيده تر باشد دسترسي به اطلاعات نهفته در ميان داده ها مشکلتر مي شود و نقش داده کاوي به عنوان يکي از روشهاي کشف دانش ،آشكارتر مي گردد.
داده كاوي از چندين رشته علمي بطور همزمان بهره ميبرد نظير : تكنولوژي پايگاه داده،هوش مصنوعي ،شبكه هاي عصبي،آمار،سيستم هاي مبتني بر دانش،بازيابي اطلاعات وغيره .]1[كه براي پرهيزاز اطاله كلام مي توان آن به لحاظ تاريخي به اختصار به مراحل زير تقسيم كرد:
مرحله اوليه: گردآوري وايجاد پايگاه اطلاعاتي(تا دهه 1960)
مرحله دوم : نظامهاي مديريتي مبني بر پايگاه اطلاعاتي(دهه1970 واوايل دهه 1980)
مرحله سوم : نظامهاي پايگاه اطلاعاتي پيشرفته (اواسط دهه 1980 تازمان حاضر)
مرحله چهارم : انبارش اطلاعات وداده كاوي (اواخر دهه 1980 تا به امروز)
مرحله پنجم : نظام پايگاه اطلاعاتي مبني برشبكه (دهه 1990 تا كنون)
مرحله ششم : نسل نوين نظامهاي اطلاعاتي يكپارچه شده(از 2000 به بعد)
بدين ترتيب فعاليتي كه از دهه 1960 شروع شده بود در دهه 1990 گامهاي بلندي برداشت وانتظار ميرود در اين قرن به رشد و بالندگي خود ادامه دهد.
تعريفي از داده كاوي
بطور كلي، داده كاوي (كه گاهي اوقات اكتشاف اطلاعات يا دانش ناميده ميشود)عبارت از فرآيندي است كه از چشم اندازهاي مختلف به تحليل داده ها مي پردازد و جمعبندي آنها را در قالب اطلاعات مفيدي ارائه ميكند . اين اطلاعات را ميتوان براي افزايش در آمد ، كاهش هزينه ها يا هردوبه كاربرد. نرم افزار داده كاوي يكي از ابزارهاي تحليل اطلاعات است .اين نرم افزار به كاربران امكان مي دهد اطلاعات را از ابعاد وزواياي بسيار متفاوت تحليل و طبقه بندي كنند وروابطي را كه در آن ها شناسائي نموده اند به اجمال بيان نمايند.
به لحاظ فني، داده كاوي عبارت از فرآيندي است كه در ميان حوزه هاي گوناگون بانكهاي اطلاعاتي ارتباطي بزرگ، همبستگي ها يا الگوهايي را پيدا مي كند. البته اين ويژگي به معناي يكسان دانستن داده كاوي وآناليزآماري نيست كه درجدول زير اين تفاوتها آورده شده است :
داده كاوي
|
آنالیز آماری
|
به فرضیه احتیاجی ندارد.
الگوریتمهای داده كاوي در ابزارها بطور اتوماتیک روابط را ایجاد میکنند.
ابزارهای داده كاوي از انواع مختلف داده و نه فقط عددی میتوانند استفاده کنند.
داده كاوي به داده های صحیح و درست طبقه بندی شده بستگی دارد.
نتایج داده كاوي آسان نیست و همچنان به متخصصان آمار برای تحلیل آنها و بیان آنها به مدیران نیاز است.
|
آمارشناسان همیشه با یک فرضیه شروع به کار میکنند.
آمارشناسان باید رابطه هایی را ایجاد کنند که به فرضیه آنها مربوط شود.
آنها از داده های عددی استفاده میکنند.
آنها میتوانند داده های نابجا و نادرست را در طول آنالیز تشخیص دهند.
آنها میتوانند نتایج کار خود را تفسیر کنند و برای مدیران بیان کنند.
|
پنج ويژگي مهم داده كاوي عبارت است از :
· استخراج ،دگرگوني وبارنمودن داده هاي تراكنشي برروي سيستم انبار داده ها .
· ذخيره ومديريت داده ها در سيستم بانك اطلاعات چند بعدي.
· فراهم آوردن امكان دسترسي تحليل گران تجاري ومتخصصان تحليل اطلاعات به داده ها .
· تحليل داده ها با استفاده از نرم افزاركاربردي .
· معرفي نمودن ، در يك قالب بندي سودمند ، همانند گراف يا جدول
داده كاوي به چه كار مي آيد؟
امروزه در درجه اول شركتها ازداده كاوي استفاده مي كنند.(با توجه بسيار زياد به مصرف كننده ، خرده فروشي،مالي ، ارتباط،وسازمانهاي بازاريابي). داده كاوي اين شركتهارا قادر مي سازد كه رابطه عوامل "دروني" (مانند قيمت ، موقع يابي فرآورده ،يا مهارت هاي كارمندان) ، را با عوامل "خارجي" (مانند شاخص هاي اقتصادي ، رقابت وآمارگيري جمعيتي مشتري ) مشخص كنند؛ داده كاوي شركت ها را قادر مي سازد اثر گذاري بر مشتري ، رضايتمندي مشتري و منافع شركت را تعيين كنند.بالاخره ، شركتها را قادر مي سازد كه فشرده اطلاعات را براي ديدن داده هاي معاملاتي دقيق"حفاري" نمايند.
برخي از کاربردهاي داده کاوي در محيطهاي واقعي عبارتند از :
-
خرده فروشي : از کاربردهاي کلاسيک داده کاوي است که مي توان به موارد زير اشاره کرد :
-
تعيين الگوهاي خريد مشتريان
-
تجزيه و تحليل سبد خريد بازار
-
پيشگويي ميزان خريد مشتريان از طريق فروش الکترونيکي
-
بانکداري :
-
بيمه :
-
پزشکي :
نتيجه اينكه :
بسياري از سازمانها بر معادني از طلا تكيه زده اند .اين گنجينه گرانبها در شركتهاي بيمه همان داده هاي جمع آوري شده از بيمه گذاران،بيمه شدگان ، زيانديدگان ، مقصران حادثه وانواع بيمه هاي فروخته شده است كه مي بايد با بهره گيري از تكنولوژيهاي جديد وابزارهاي خودكاري كه بصورت هوشمند آنهارا تجزيه وتحليل مي كنند ،گردآوري وپردازش شده وبه دانش تبديل وبه كار گرفته شوند.
منابع و مراجع:
تلخيص مقاله ? Data Mining: What is Data Mining
[1] David Hand, Heikki Mannila , Padhraic Smyth. Principles of Data Mining. The MIT Press . 2001.
[2] Introduction to Data Mining and Knowledge Discovery By Two
Crows Corporation
:: برچسبها:
بیمه البرز ,
بیمه مخصوص ,
بيمه اشخاص ,
بيمه خودرو ,
بيمه باربري ,
بيمه مسئوليت ,
بيمه آتش سوزي ,
بيمه مهندسي ,
بيمه طرح جامع خانوار ,
بیمه بدنه ,
بیمه شخص ثالث ,
نشربه داخلي سيماي البرز ,
مقاله بیمه البرز ,
بیمه خانواده ,