دانلود کتاب Machine learning and data mining : introduction to principles and algorithms
by Igor Kononenko
|
عنوان فارسی: یادگیری ماشین و داده کاوی : آشنایی با اصول و الگوریتم |
دانلود کتاب
جزییات کتاب
داده کاوی و یادگیری ماشین، در عین شباهت با هم متفاوت هستند. اغلب اوقات حتی داده کاوی را با نام یادگیری ماشین خطاب می کنند. هر چند روز به روز این دو به یکدیگر نزدیک تر و شبیه تر می شوند.
یادگیری ماشین از تلاش برای ساخت هوش مصنوعی گذر کرد و اکنون هدف اصلی آن ساخت ماشینی است که بتواند یاد بگیرد و خود را با اطلاعات جدید وفق دهد. اولین یادگیری ماشین به سال ۱۹۵۷ بر می گردد که مدل perceptron اختراع شد. این مدلی است که از نورون های مغز انسان ساخته شد. این مدل آغازگر مدل شبکه عصبی بود که در اواخر دهه ۱۹۸۰ ایجاد شد. از دهه ۱۹۸۰ تا دهه۱۹۹۰ متد درخت تصمیم بسیار محبوب شد. SVM در اواسط دهه ۱۹۹۰ اختراع شد و از ان زمان در صنعت به طور گسترده ای استفاده می شود. رگرسیون منطقی، یک متد قدیمی در آمار است که در یادگیری ماشین از سال ۲۰۰۱، که کتاب یادگیری آمار منتشر شد، رشد چشم گیری داشته است.
داده کاوی و یادگیری ماشین، در عین شباهت با هم متفاوت هستند. اغلب اوقات حتی داده کاوی را با نام یادگیری ماشین خطاب می کنند. هر چند روز به روز این دو به یکدیگر نزدیک تر و شبیه تر می شوند.
یادگیری ماشین از تلاش برای ساخت هوش مصنوعی گذر کرد و اکنون هدف اصلی آن ساخت ماشینی است که بتواند یاد بگیرد و خود را با اطلاعات جدید وفق دهد. اولین یادگیری ماشین به سال ۱۹۵۷ بر می گردد که مدل perceptron اختراع شد. این مدلی است که از نورون های مغز انسان ساخته شد. این مدل آغازگر مدل شبکه عصبی بود که در اواخر دهه ۱۹۸۰ ایجاد شد. از دهه ۱۹۸۰ تا دهه۱۹۹۰ متد درخت تصمیم بسیار محبوب شد. SVM در اواسط دهه ۱۹۹۰ اختراع شد و از ان زمان در صنعت به طور گسترده ای استفاده می شود. رگرسیون منطقی، یک متد قدیمی در آمار است که در یادگیری ماشین از سال ۲۰۰۱، که کتاب یادگیری آمار منتشر شد، رشد چشم گیری داشته است.
داده کاوی تبدیل به علمی بیشتر از استخراج دانش از پایگاه داده هاست. در سال ۱۹۹۳، مقاله سمیناری راکش اگروال (Rakesh Agrawal) و دو نفر دیگر الگوریتم کارایی برای کاوش قواعد پیوستگی (association) در پایگاه داده های بزرگ را ارائه داد. این مقاله آغازگر مقالات بسیاری در مورد کشف پترن های منطقی و الگوریتم های کاوش موثر شد. فعالیت های داده کاوی در دهه ۱۹۹۰ روی ایجاد دستورات اس کیو ال بهتر و کار کردن مستقیم با پایگاه داده تمرکز داشت.
داده کاوی تمرکز ویژه ای روی مسائل صنعتی و یافتن راه حل های کاربردی دارد. بنابراین علاوه بر نگرانی درباره سایز داده (داده بزرگ)، روی سرعت پردازش داده (جریان داده) فکر می کند. علاوه بر این، سیستم پیشنهاد سفارشی سازی شده و شبکه کاوی، خارج از زمینه یادگیری ماشین، به خاطر وجود نیاز در صنعت ایجاد شدند.
دو کنفرانس بزرگ برای داده کاوی KDD (کشف دانش و داده کاوی) و ICDM (کنفرانس بین المللی داده کاوی) هستند. دو کنفرانس بزرگ یادگیری ماشین ICML (کنفرانس بین المللی یادگیری ماشین) و NIPS (سیستم های پردازش اطلاعات عصبی) می باشند. محققان یادگیری ماشین در هر چهار کنفرانس شرکت می کنند، اما کنفرانس های داده کاوی ارتباط مستقیمی با صنعت دارد.
داده کاوان اغلب درک و دانش خوبی از یادگیری ماشین دارند، در حین حال علاقه زیادی به اعمال داده کاوی روی مسائل بزرگ دارند.
با گذشت زمان، ارتباط بیشتری بین داده کاوی و یادگیری ماشین خواهیم دید.