دانلود کتاب Computer vision
by Dana H. Ballard
|
عنوان فارسی: بینایی کامپیوتر |
دانلود کتاب
جزییات کتاب
رویای ماشین های خودکار هوشمند به زمان های خیلی دور بر می گردد:استخوان بندی مهم در غالب کامپیوترهای دیجیتال توسط تورینگ حوالی سال 1950 بود.از آن موقع،این رویا در درجه اول توسط کارکنان در زمینه هوش مصنوعی دنبال شده است،که هدفشان وقف کردن کامپیوترهایی با قابلیت های پردازش اطلاعات قابل مقایسه با ارگانیسم های بیولوژیکی است.از شروع،یکی از اهداف هوش مصنوعی،تجهیز ماشین ها به قابلیت کارکردن با ورودی های سنسوری بوده است.
دید ماشین، سازه صریح،توصیفات با معنی از اشیاء فیزیکی در تصاویر است.فهم تصویر خیلی از پردازش تصویر فرق می کند،که تبدیل تصویر-به-تصویر را مطالعه می کند و نه ساختمان توصیف صریح را.توصیفات، پیش نیازی برای تشخیص،دستکاری و فکر کردن درباره اشیاء است.
ما دنیایی از اشیاء منسجم سه بعدی را با بسیاری از خواص غیر متغیر درک می کنیم.به صور عینی،داده های ورودی بصری،ثابت و انسجام متناظر را نشان نمی دهند؛آن ها شامل انواع مختلفی بی ربطی یا حتی به اشتباه اندازی می شوند.به نوعی سیستم بینایی ما،از شبکیه تا سطوح شناختی،یا می فمهد یا نظمی بر ورودی بینایی آشوب مانند ما وضع می کند.این کار را با استفاده از اطلاعاتی ذاتی که ممکن است به شکلی قابل اطمینان از ورودی استخراج شود، و همچنین از طریق فرضیات و دانشی که در سطوح مختلفی در پروسه پردازش به کار برده می شود را، انجام می دهد.
چالش بینایی ماشین یکی از آن صریح بودن هاست.دقیقا چه اطلاعاتی در مورد حس ها می توانند از یک تصویر فقط با استفاده از فرضیات درباره نور و فیزیک استخراج شوند؟به گونه ای صریح،چه محاسباتی باید انجام گیرند؟سپس،در چه مرحله ای باید وابسته-به-دامنه،دانش قبلی در مورد جهان درون پروسه درک کردن گنجانیده شود؟چگونه دانش و مدل های جهانی ارایه و استفاده شده اند؟این کتاب درباره ارایه ها و مکانیسم هایی است که اجازه می دهد اطلاعات تصویر و دانش قبلی در فهم تصویر تعامل کنند.
بینایی ماشین، زمینه ای نسبتا جدید و در حال رشد سریع است.اولین آزمایشات در اواخر دهه 1950 انجام شدند و بسیاری از مفاهیم ضروری در طول پنج سال گذشته توسعه یافتند.با این رشد سریع،ایده های حیاتی در محیط های مختلفی از جمله هوش مصنوعی،روانشناسی،گرافیک کامپیوتری و پردازش تصویر به پا خاسته اند.مقصود ما سر هم کردن گزیده ای از این مواد به گونه ای است که کتاب دانشگاهی هر دو سطح تحصیلات تکمیلی/ارشد و مرجعی مفید برای آن هایی که در حال ساخت سیستم های بینایی هستند،باشد.این کتاب طعم قوی هوش مصنوعی دارد،و ما امیدواریم این اندیشه گسترش را دهد.ما معتقدیم،که هر دو اطلاعاتی تصویر ذاتی و مدل داخلی جهان در سیستم های بینایی موفق مهم هستند.
این کتاب به چهار قسمت سازمان دهی شده است،بر اساس توصیفات اشیاء در چهار سطح متفاوت از انتزاع.
1. تصاویری عمومیت یافته-ماهیت های تصویر و شبیه به تصویر.
2. تصاویری قسمت بندی شده-تصاویر سازمان دهی شده به زیر تصویرهایی که احتمال دارند متناظر «اشیاء جالب» باشند.
3. ساختارهای هندسی-مدل های کمیتی تصاویر و ساختارهای جهان.
4. ساختارهای رابطه ای-توصیفات سمبلیک پیچیده تصاویر و ساختارهای جهان.
این قسمت ها،پیشرفتی از انتزاع افزایشی را دنبال می کنند.گرچه همه چهار قسمت یکی پس از دیگری به صورت طبیعی مطالعه می گردند،اما ارتباط بین هم قوی ای بینشان برقرار نیست.قسمت اول پیش نیازی است برای قسمت دوم،اما قسمت سوم و چهارم می توانند به طور مستقل خوانده شوند.
قسمت های کتاب فرض را بر این می گیرند که مقداری پیش زمینه محاسباتی و ریاضیاتی را خوانند دارد(هندسه،جبر خطی،ساختمان داده،روش های عددی).اما،در سرتاسر کتاب مفاهیم بر سختی ریاضیات ارجحیت داده می شوند.نیت ما انتقال مجموعه ای از ایده ها درباره زمینه جدیدی برای گسترده ترین مخاطب ممکن است.
در یک کتاب،غیر ممکن است که عدالت بین زاویه و عمق کارهای قبلی در بینایی کامپیوتر را رعایت کنیم.علاوه بر این،ما درک می کنیم که در یک زمینه به سرعت در حال توسعه،هجوم ایده های نو ادامه خواهد یافت.امیدواریم که خوانندگان ما به فکر کردن،چالش شوند،نقد کنند،بیشتر بخوانند و سریعتر فراتر از حدود این کتاب بروند.