جزییات کتاب
در این کتاب هفت الگوریتم مورد نیاز در علم داده را یاد خواهید گرفت و متوجه خواهید شد که کی و کجا از هر کدام استفاده کنید. این آموزش در هفت روز و هفت فصل طبقه بندی شده است .
همانطور که مید انید برنامه های مبتنی بر یادگیری ماشین بسیار اتوماتیک و خودمحور هستند و در طول زمان با کمترین دخالت انسانی، دانش زیادی را یاد می گیرند. برای رسیدگی به ماهیت پیچیده داده های مختلف داده های دنیای واقعی، الگوریتم های یادگیری تخصصی ماشین توسعه یافته اند که این مسائل را کاملا حل می کنند. علم داده ها به شما کمک می کند دانش جدیدی از داده های موجود را از طریق تجزیه و تحلیل های الگوریتم و آماری به دست آورید. این کتاب مشکلات مربوط به طبقه بندی دقیق و کارآمد داده ها و پیش بینی را در بر می گیرد. در طی 7 روز شما به هفت الگوریتم معرفی می شود، همراه با تمریناتی که به شما کمک می کند جنبه های مختلف یادگیری ماشین را یاد بگیرید. شما خواهید دید که چگونه اطلاعات خود را قبل از خوشه بندی برای بهینه سازی و طبقه بندی آن برای مجموعه داده های بزرگ ببینید. سپس شما می توانید نحوه پیش بینی داده ها را بر اساس روند موجود در مجموعه داده های خود پیدا کنید. این کتاب شامل الگوریتم هایی نظیر k-نزدیکترین همسایگان، Bayes Naive، Decisions Trees، Random Forest، k-Means، Regression و Time-series است. پس از اتمام این کتاب، شما می توانید از کدام الگوریتم یادگیری ماشین برای خوشه بندی، طبقه بندی یا رگرسیون انتخاب کنید و برای مشکل شما مناسب تر است.
Summary by mojtaba.banaie
Key FeaturesGet to know seven algorithms for your data science needs in this concise, insightful guideEnsure you’re confident in the basics by learning when and where to use various data science algorithmsLearn to use machine learning algorithms in a period of just 7 daysBook DescriptionMachine learning applications are highly automated and self-modifying, and they continue to improve over time with minimal human intervention as they learn with more data. To address the complex nature of various real-world data problems, specialized machine learning algorithms have been developed that solve these problems perfectly. Data science helps you gain new knowledge from existing data through algorithmic and statistical analysis.This book will address the problems related to accurate and efficient data classification and prediction. Over the course of 7 days, you will be introduced to seven algorithms, along with exercises that will help you learn different aspects of machine learning. You will see how to pre-cluster your data to optimize and classify it for large datasets. You will then find out how to predict data based on the existing trends in your datasets.This book covers algorithms such as: k-Nearest Neighbors, Naive Bayes, Decision Trees, Random Forest, k-Means, Regression, and Time-series. On completion of the book, you will understand which machine learning algorithm to pick for clustering, classification, or regression and which is best suited for your problem.What you will learnFind out how to classify using Naive Bayes, Decision Trees, and Random Forest to achieve accuracy to solve complex problemsIdentify a data science problem correctly and devise an appropriate prediction solution using Regression and Time-seriesSee how to cluster data using the k-Means algorithmGet to know how to implement the algorithms efficiently in the Python and R languagesAbout the AuthorDávid Natingga graduated in 2014 from Imperial College London in MEng Computing with a specialization in Artificial Intelligence. In 2011, he worked at Infosys Labs in Bangalore, India, researching the optimization of machine learning algorithms. In 2012 and 2013 at Palantir Technologies in Palo Alto, USA, he developed algorithms for big data.In 2014 as a data scientist at Pact Coffee, London, UK, he created an algorithm suggesting products based on the taste preferences of the customers and the structures of the coffees. As a part of his journey to use pure mathematics to advance the field of AI, he is a PhD candidate in Computability Theory at University of Leeds, UK. In 2015, he spent 8 months at Japan’s Advanced Institute of Science and Technology as a research visitor.Table of ContentsClassifying from k-Nearest NeighborsNaive Bayes – choosing the most probable classDecision TreesRandom Forest – forests of decision treesk-Means – dividing a dataset into k-groupsRegression – learning models as functionsTime Series – learning time-dependent modelsAppendix A: Python & R referenceAppendix B: StatisticsAppendix C: Glossary of Algorithms and Methods in Data Science