داده-کاوی-چیست
داده-کاوی-چیست

این موضوع خیلی عجیب نیست که داده کاوی به عنوان یک موضوع مربوط به رشته های مختلف علمی (میان رشته ای) را می توان به روش های متفاوتی تعریف نمود. حتی واژه ی داده کاوی به طور کامل تصویر درستی را در ذهن ایجاد نمی کند. برای مثال جهت استخراج طلا در دل معادن معمولاً واژه های طلایابی و یا طلاکاوی را استفاده می کنند نه واژه هایی مانند سنگ یا صخره یابی. به طور مشابه برای داده کاوی نیز باید عباراتی نظیر کاوش دانش از داده به کار برده شود که متأسفانه این عبارت کمی طولانی به نظر می رسد. به هر حال می توان این طور ادعا نمود که واژه-ی دانش کاوی ممکن است به خوبی تأکید ما را که کاوش از حجم بالای داده هاست، نرساند. با این وجود کاوش واژه ی روشنی است که به فرایند یافتن مجموعه تکه های کوچک و ارزشمند از میان مجموعه ی بزرگی از مواد خام اشاره می کند. بنابراین اسامی بی مسمی داده و کاوی در کنار یکدیگر قرار می گیرند و انتخاب رایجی می شوند. بسیاری از واژه ها و یا اصطلاحات دیگری را نیز می توان یافت که معنی مشابهی با داده کاوی دارند نظیر: دانش کاوی از داده ها، استخراج دانش، تحلیل داده/ الگو، باستان شناسی داده ها و لایروبی کردن داده ها.

فرآینده کشف  دانش در داده کاوی

بسیاری از مردم داده کاوی را مترادف واژه های رایج کشف دانش از داده ها (KDD) می دانند، در حالیکه برخی دیگر داده کاوی را یکی از گام های اساسی در فرایند کشف دانش تلقی می کنند. فرایند کشف دانش، یک سری تکرارهایی از مراحل زیر است:

  1. پالایش داده ها (برای حذف داده های نویز و ناسازگار)
  2. یکپارچه سازی داده ها (جایی که ممکن است چندین منبع داده ای ترکیب شوند)
  3. انتخاب داده ها (که داده هایی مرتبط با تحلیل از پایگاه داده بازیابی می شوند)
  4. تبدیل داده ها (که داده ها با کمک عملیاتی مانند تلخیص و تجمیع به شکل های مناسبی تبدیل می شوند)
  5. داده کاوی (یک فرایند ضروری که با اعمال روش های هوشمند به استخراج الگوها در میان داده ها می پردازد)
  6. ارزیابی الگو (جهت معرفی الگوهای جالب در میان حجم انبوهی از الگوها که براساس مجموعه ای از سنجه ها انجام می شود)
  7. ارائه دانش (گامی که در آن با کمک تکنیک های دیداری متفاوت، دانش کسب شده به کاربر ارائه می شود)

گام های اول تا چهارم شکل های متفاوتی از پیش پردازش داده ها محسوب می شوند. در واقع در این گام ها داده ها جهت داده کاوی آماده می شوند. گام داده کاوی نیز ممکن است با کمک کاربر یا پایگاه دانش انجام شود. الگوهای جالب به کاربر ارائه می شوند و شاید به عنوان دانش جدید در پایگاه دانش نگهداری شوند.

تعریف داده کاوی

در این دیدگاه داده کاوی به عنوان یک گام در فرایند کشف دانش شناخته می شود، گامی اساسی که در آن الگوهای نهان آشکار و ارزیابی می شوند. به هر حال در صنعت، در رسانه ها و در محیط-های تحقیقاتی و پژوهشی اغلب واژه ی داده کاوی به کل فرایند کشف دانش اشاره می کند (شاید به این دلیل که این اصطلاح کوچکتر از واژه های کشف دانش از داده ها است). اجازه دهید این واژه را به طور کلی بدین صورت تعریف کنیم: داده کاوی فرآیند کشف الگوهای جالب و دانش از میان حجم انبوهی از داده هاست. منابع داده ای می توانند شامل پایگاه داده ها، انبار داده ها، وِب و مخازن اطلاعاتی دیگری باشند و یا داده هایی هستند که به صورت پویا به درون سیستم تزریق می شوند.

 

No votes yet.
Please wait...