دانلود کتاب Scalable Big Data Analytics for Protein Bioinformatics: Efficient Computational Solutions for Protein Structures
by Dariusz Mrozek
|
عنوان فارسی: تجزیه و تحلیل بزرگ داده ها مقیاس پذیر برای پروتئین بیوانفورماتیک: راه حل های محاسباتی کارآمد برای ساختارهای پروتئینی |
دانلود کتاب
جزییات کتاب
این کتاب بر پروتئینها و ساختارهای آنها تمرکز دارد. متن ساختارهای مقیاسپذیر متعددی را برای جستجوی شباهت ساختار پروتئین، انجامشده در سطوح نمایش اصلی و برای پیشبینی ساختارهای ۳ بعدی پروتئینها توصیف میکند. تأکید بر روی تکنیکهایی است که میتوان از آنها برای تسریع جستجوهای شباهت و فرایندهای مدلسازی ساختار پروتئین استفاده کرد.
محتوای کتاب به چهار بخش تقسیم شده است. بخش اول اطلاعات پایه در مورد پروتئینها و سطوح نمایش آنها ارائه میدهد، از جمله یک مدل رسمی از ساختار ۳ بعدی پروتئین مورد استفاده در فرایندهای محاسباتی، و بررسی مختصری از فناوریهای بهکار رفته در راهکارهای ارائه شده در کتاب. بخش دوم کتاب خدمات ابری مورد استفاده در توسعه برنامههای ابری مقیاسپذیر و قابل اعتماد برای جستجوی شباهت ساختار پروتئین ۳ بعدی و پیشبینی ساختار پروتئین را بحث میکند.
بخش سوم کتاب نشان میدهد که چگونه از چارچوبهای محاسباتی بزرگ دادهای مقیاسپذیر مانند هادوپ و اسپارک، در همسانسازیهای ساختار ۳ بعدی گسترده پروتئین و شناسایی نواحی بینظم ذاتی در ساختارهای پروتئینی، استفاده میشود.
بخش چهارم کتاب بر یافتن شباهتهای ساختار ۳ بعدی پروتئین تمرکز دارد که با استفاده از GPUها تسریع شدهاند و از چندریسمانی و پایگاهدادههای رابطهای برای جستجوی تقریبی با بهرهوری ساختارهای دوم پروتئین استفاده میشود.
این کتاب تکنیکهای پیشرفته و معماریهای محاسباتی را معرفی میکند که از دستاوردهای اخیر در زمینه محاسبات و موازیسازی بهره میبرند. پیشرفتهای اخیر در علوم کامپیوتر باعث شده الگوریتمهایی که قبلاً بیش از حد زمانبر تلقی میشدند، اکنون بتوان از آنها به طور مؤثر برای کاربردهای زیستانفورماتیک و علوم زیستی استفاده کرد. با توجه به عمق پوشش مطالب، این کتاب برای محققان و توسعهدهندگان نرمافزار فعال در حوزههای زیستانفورماتیک ساختاری و پایگاهدادههای زیستپزشکی جالب خواهد بود.
The content of the book is divided into four parts. The first part provides background information on proteins and their representation levels, including a formal model of a 3D protein structure used in computational processes, and a brief overview of the technologies used in the solutions presented in the book. The second part of the book discusses Cloud services that are utilized in the development of scalable and reliable cloud applications for 3D protein structure similarity searching and protein structure prediction. The third part of the book shows the utilization of scalable Big Data computational frameworks, like Hadoop and Spark, in massive 3D protein structure alignments and identification of intrinsically disordered regions in protein structures. The fourth part of the book focuses on finding 3D protein structure similarities, accelerated with the use of GPUs and the use of multithreading and relational databases for efficient approximate searching on protein secondary structures.
The book introduces advanced techniques and computational architectures that benefit from recent achievements in the field of computing and parallelism. Recent developments in computer science have allowed algorithms previously considered too time-consuming to now be efficiently used for applications in bioinformatics and the life sciences. Given its depth of coverage, the book will be of interest to researchers and software developers working in the fields of structural bioinformatics and biomedical databases.