اطلاعات کتابشناختی
- عنوان کتاب: Python Data Science Handbook: Essential Tools for Working with Data
- نویسنده: Jacob T. Vanderplas, Jake VanderPlas
- ناشر: انتشارات O’Reilly Media, Incorporated, 2016
- تعداد صفخات: ۵۲۹ صفحه
این روزها زبان برنامه نویسی پایتون (Python)، به یکی از محبوب ترین و پرکاربردترین زبان های برنامه نویسی جهت استفاده محققین به ویژه فعالان حوزه علوم داده (Data Science) و یادگیری ماشین (Machine Learning) تبدیل شده است. این مهم، دلایل زیادی دارد که از آن جمله می توان به موارد زیر اشاره نمود:
- Community و انجمن بسیار فعال و بزرگ به گونه ای که هیچ سوالی را بدون پاسخ، در اینترنت نخواهید یافت.
- کتابخانه های به روز و بسیار کارآمد به ویژه برای حوزه های هوش مصنوعی و یادگیری ماشین؛ کتابخانه های Numpy، Pandas، Matplotlib و Scikit-Learn که پس از استفاده از آن ها در پروژه ها، عاشق آن های خواهید شد.
- سهولت در یادگیری به گونه ای که پس از مدت زمان کمتری به سطح قابل قبولی از میزان تسلط جهت پیاده سازی و اجرای پروژه های کاربردی دست خواهید یافت.
از لینک های زیر می توانید به ویدیوهای آموزشی پایتون و کتابخانه های پرکاربرد آن ویژه علوم داده (Data Science) و یادگیری ماشین (Machine Learning) دسترسی داشته باشید:
بنابراین پس از بررسی اجمالی مزایا و کاربردهای اولیه پایتون (Python)، نوبت به معرفی کتابی جامع و بسیار کاربردی در این حوزه می رسد. کتاب Python Data Science Handbook، به عنوان یکی از معتبرترین و معروف ترین کتاب ها برای علاقمندان ویژه علوم داده می باشد؛ همان طور که در اغلب مقالات با موضوع “چگونه علوم داده (Data Science) را بیاموزیم” آورده شده است، این کتاب با محوریت ارایه آموزش ها به زبان برنامه نویسی پایتون و به صورت کاملاً کاربردی، شما را در شروع کار با کتابخانه ها و اجرای الگوریتم های مختلف یادگیری ماشین بر روی Dataset های مشهور یاری می نماید.
به طور خلاصه، این کتاب از آن دسته از کتاب هایی است که هر فعال حوزه علوم داده (Data Science) و یادگیری ماشین (Machine Learning) باید مطالعه نموده باشد.
یکی از مزایای اصلی این کتاب، این است که علاوه بر کاربردی بودن (ارایه تمامی کدهای Python) به گونه ای ویراستاری شده است که شما متوجه گذر زمان در اثر خستگی نخواهید شد. این مساله به شما کمک می کند که با سرعت هر چه بیشتری در این وادی گام بردارید.
دست و پنجه کردن با انواع داده ها و ساختارهای داده ای و اجرای الگوریتم های مختلف با زبان برنامه نویسی پایتون، مصورسازی انواع دیتاست ها، اجرای روش های آماری مختلف و در نهایت ساخت مدل های مبتنی بر یادگیری ماشین همان راهکاری است که شما در این کتاب خواهید یافت.
موارد زیر بخشی از کتاب است که به صورت فهرست در ادامه آورده شده است:
• IPython and Jupyter: provide computational environments for data scientists using Python
• NumPy: includes the ndarray for efficient storage and manipulation of dense data arrays in Python
• Pandas: features the DataFrame for efficient storage and manipulation of labeled/columnar data in Python
• Matplotlib: includes capabilities for a flexible range of data visualizations in Python
• Scikit-Learn: for efficient and clean Python implementations of the most important and established machine learning algorithms
- Preface
- IPython: Beyond Normal Python
- Introduction to NumPy
- Data Manipulation with Pandas
- Visualization with Matplotlib
- Machine Learning