پردازش تصویر دیجیتال و فیلم : مروری بر چیستی و کار کردها

فوریه 8, 2021

توسط نت پرداز آذر

پردازش تصویر دیجیتال و فیلم : مروری بر چیستی و کار کردها

پردازش تصویر دیجیتال و فیلم امروزه از جمله موضوعات داغ در زمینه تحقیق و توسعه به شمار می آیند. پردازش تصویر مشتمل بر هر نوعی از پردازش سیگنال است که منبع آن یک تصویر مانند عکس یا فریم های ویدئویی باشد. خروجی پردازش تصویر می تواند یک تصویر یا مجموعه ای از مشخصات یا پارامترهای مربوط به تصویر باشد. بیشتر تکنیک های پردازش تصویر دیجیتال شامل اصلاح تصویر به عنوان یک سیگنال دو بعدی با استفاده از روش های استاندارد پردازش سیگنال بر روی آن است. پردازش ویدئو مورد خاصی از پردازش سیگنال است، که در آن سیگنال های ورودی و خروجی فایل های ویدئویی یا استریم های ویدئویی هستند. از تکنیک های پردازش ویدئو در دستگاه های تلویزیون، دستگاه های ضبط ویدئو، دی وی دی ها، دوربین مداربسته، NVR ها، DVR ها، فرمت های کدگذاری ویدئو، دستگاه پخش ویدئو و سایر دستگاه ها استفاده می شود.

پردازش تصویر معمولاً به پردازش تصویر دیجیتال اشاره دارد. اما پردازش تصویر نوری و آنالوگ نیز امکان پذیر است. در نوشته ی “پردازش تصویر دیجیتال و فیلم : مروری بر چیستی و کار کردها” ما در مورد عناصر پردازش تصویر دیجیتال بحث خواهیم کرد. همچنین در مورد عناصر پردازش فیلم دیجیتال نیز بحث نموده و در آخر فن آوری ها و تکنیک های فعلی را در زمینه ها مرور می کنیم.

پردازش تصویر دیجیتال و فیلم : مروری بر چیستی و کار کردها

پردازش تصویر دیجیتال چیست؟

تصاویر دیجیتال توسط دستگاه های فیزیکی چون: دوربین های عکاسی و فیلمبرداری، دستگاه های اشعه ایکس، میکروسکوپ الکترونی و دوربین مداربسته تولید می شوند. تصاویر تولید شده با این روش ها عموما برای اهداف مختلفی چون: سرگرمی، پزشکی، تجاری و صنعتی کاربرد دارند. از سوی دیگر این تصویر ها کاربرد های بسیاری در زمینه های: نظامی، غیرنظامی (به عنوان مثال کنترل ترافیک)، امنیتی و علمی نیز دارند. هدف در هر حالت این است که یک مشاهده گر انسانی یا ماشینی اطلاعات مفیدی درباره صحنه ی تصویر برداری استخراج نماید. نمونه ای از یک کاربرد صنعتی در شکل نشان داده شده است.

شکل ۱- پردازش تصویر دیجیتال برای بررسی صحت ابعاد و بررسی سطح درگیری و نقص استفاده می شود.

در چنین مواردی غالباً تصویر خام مناسب نبوده و باید به نوعی پردازش شود. چنین پردازشی را بهبود تصویر یا ارتقا تصویر (Image Enhancement) می نامند. لازم به ذکر است که پردازش توسط ناظر برای استخراج اطلاعات، تجزیه و تحلیل تصویر (Image Analysis) نامیده می شود. گفتنی است ارتقا تصویری و تجزیه و تحلیل آن به وسیله شاخص های زیر ارزیابی می شود:

خروجی ها.
اطلاعات تصاویر در مقایسه با اطلاعات صحنه.
چالش های و روش های استفاده شده.

عموما بهبود و ارتقا تصویر با استفاده از مواد شیمیایی و تجهیزات الکترونیکی انجام می شود. این در حالی است که تجزیه و تحلیل تصاویر بیشتر توسط انسان و یا به صورت الکترونیکی انجام می پذیرد.

جایگاه پردازش تصویر در علم الکترونیک

پردازش تصویر دیجیتال زیر مجموعه ای از علم الکترونیک است که در آن تصویر به آرایه ای از اعداد صحیح کوچک تبدیل می شود که پیکسل نامیده می شوند. این پیکسل ها نمایانگر کمیت های فیزیکی مانند درخشش صحنه هستند که توسط رایانه ها و سایر تجهیزات سخت افزاری پردازش شده و در حافظه دیجیتال (تجهیزات ذخیره سازی) ذخیره شده اند. پردازش تصویر دیجیتال به عنوان یک پیشرفت در عرصه نظارت تصویری امکان تجزیه و تحلیل خودکار را به بار آورده است. از سوی دیگر این فناوری همچنین موجب کاهش هزینه ها و افزایش عملکرد رایانه های شخصی شده است.

باید توجه داشت که یک تصویر تنها نمایش دهنده خصوصیات فیزیکی مشهود نیست. بلکه این تصویر انتقال دهنده یک تعامل پیچیده بین چندین فرآیند فیزیکی است. از جمله این فرآیند ها می توان به موارد زیر اشاره نمود:

شدت و توزیع تابش نور.
فیزیک اثر متقابل تابش نور بر ماده موجود در صحنه.
روابط هندسی تابش و انعکاس نور از ۳ بُعدی به ۲ بُعدی.
مشخصات الکترونیکی سنسور تصویر.

جایگاه پردازش تصویر در علم الکترونیک

بینایی انسان در برابر پردازش تصویر دیجیتال

بر خلاف ترجمه یک مقاله که در آن هیچ الگوریتم و نظریه ای قطعی برای استخراج اطلاعات قابل تدوین نیست، در دنیای علم الکترونیک الگوریتم هایی با پشتیبانی تئوری های علمی برای ترجمه زبان پیشرفته کامپیوتر به زبان ماشین وجود دارد. دید انسان بسیار پیچیده تر از هر چیزی است علم امروزی قادر به مهندسی آن است. بنابراین باید توجه نمود که یک برنامه پردازش تصویر دیجیتال بر اساس نوع نگاه انسان ارزیابی نشود. شاید اولین اصل راهنما این باشد که انسان در قضاوت بهتر است و ماشین آلات در اندازه گیری بهتر هستند. از این رو می توان به این مسل اشاره نمود که تعیین موقعیت و اندازه دقیق یک قطعه خودرو در یک نوار نقاله برای پردازش تصویر دیجیتال مناسب است. در حالی که درجه بندی سیب یا چوب بسیار برای آن بسیار چالش برانگیز است. البته باید دقت داشت که این موضوع برای پردازش تصویر غیرممکن نیست.

در این راستا بهبود تصویر (Image Enhancement) -که معمولاً به محاسبات عددی زیاد و قضاوت کمی نیاز دارد- برای پردازش تصویر دیجیتال مناسب است.

بینایی انسان در برابر پردازش تصویر دیجیتال

چالش افزایش هزینه های پردازش تصویر

علاوه بر چالش های بیشماری که به هنگام بازیابی اطلاعات یک تصویر قدیمی مواجه می شویم، افزایش هزینه های پردازش تصویر دیجیتال می تواند مشکلات را چندین برابر افزایش دهد. عموما تعداد محدودی از کاربران به این موضوع اهمیت می دهند که یک نرم افزار صفحه گسترده (Spreadsheet) به جای اینکه در ۳۰۰ میلی ثانیه باز شود در ۲۰۰ ملی ثانیه باز شود. اما در مقابل بیشتر برنامه های کاربردی صنعتی به این نیاز دارند تا در محدودیت های زمانی چرخه فعالیت ماشین آلات، به حداقل های زمانی اهمیت قائل شوند. لازم به ذکر است که برنامه های بسیاری مانند: بهبود تصویر اولتراسوند (Ultrasound)، دوربین های مداربسته ی سازمان طرح ترافیک و تثبیت کننده دوربین فیلمبرداری (Camera Stabilizer) وجود دارد که نیاز به پردازش جریان واقعی جریان ویدئو دارند.

برای مواجه شدن با چنین چالش هایی تصور کنید که یک استریم ویدئویی از یک دوربین فیلمبرداری تک رنگ استاندارد حدود ۱۰ میلیون پیکسل در ثانیه تولید می کند. از سوی دیگر یک رایانه معمولی را در حال تاپ تصور کنید که ۵۰ دستورالعمل ماشین را در ۱۰۰ نانومتری اجرا می کند. این زمان معادل زمان پردازش یک پیکسل است. به همین دلیل بسیاری از نرم افزارهای پردازش تصویر دیجیتال با توجه به هزینه های زیاد توسعه نمی یابند. از این رو در چنین مواردی ما با چالش سه جانبه ی طراحی یک چیز “خوب، سریع و ارزان” مواجه هستیم.

چالش افزایش هزینه های پردازش تصویر

کاربرد پردازش تصویر دیجیتال

پردازش تصویر دیجیتال در زمینه های بینایی رایانه‌ای، تشخیص چهره، شناسایی شاخص ها، سیستم هشدار خروج از خط، تصویر سازی غیر واقعی (Non-photorealistic rendering)، پردازش تصاویر پزشکی، پردازش تصویر میکروسکوپ پردازش تصویر مورفولوژیکی، سنجش از دور (Remote Sensing) و غیره اعمال می شود.

بینایی رایانه‌ای

بینایی رایانه‌ای دانش و فناوری ماشین هایی است که از پردازش تصویر دیجیتال استفاده می کند. به عنوان یک رشته علمی، بینایی رایانه مربوط به تئوری ساخت سیستم های مصنوعی (Theory for Building Artificial Systems) است که اطلاعات را از تصاویر به دست می آورد. در مباحث بینایی رایانه‌ای داده های تصویر می تواند اشکال مختلفی داشته باشد. مانند توالی ویدئو، نمایش از چندین دوربین یا داده های چند بعدی از یک اسکنر پزشکی. دید رایانه ای به عنوان یک رشته فناوری، به دنبال استفاده از تئوری ها و مدل های خود در ساخت سیستم های دید رایانه است. نمونه هایی از برنامه های دید رایانه ای شامل سیستم هایی برای:

فرآیندهای کنترل (به عنوان مثال: یک ربات صنعتی یا یک وسیله نقلیه خودکار).
تشخیص رویدادها (به عنوان مثال: برای نظارت تصویری یا شمارش افراد).
سازماندهی اطلاعات (به عنوان مثال: برای نمایه سازی پایگاه داده تصاویر و نمایش توالی تصویر).
مدلسازی اشیا یا محیط ها (به عنوان مثال: بازرسی صنعتی ، تجزیه و تحلیل تصویر پزشکی یا مدل سازی توپوگرافی).
تعامل (به عنوان مثال: درگاهی برای تعامل کامپیوتر و انسان).

بینایی رایانه ای مکملی برای دید بیولوژیکی

بینایی رایانه ای همچنین می تواند به عنوان یک مکمل برای دید بیولوژیکی (Biological Vision) توصیف شود. در بینش بیولوژیکی، درک بینایی انسان و حیوانات مختلف مورد مطالعه قرار می گیرد و در نتیجه مدل هایی از نحوه عملکرد این سیستم ها از نظر فرایندهای فیزیولوژیکی ایجاد می شود. از طرف دیگر، بینایی رایانه ای سیستم بینایی مصنوعی را که در نرم افزار و یا سخت افزار پیاده سازی شده است را مطالعه و توصیف می کند. تبادل بین رشته ای بین دید بیولوژیکی و رایانه ای برای هر دو زمینه به طور فزاینده ای مثمر ثمر بوده است. حوزه های فرعی بینایی رایانه شامل: بازسازی صحنه، تشخیص رویدادها، ردیابی ویدئو، تشخیص شی، یادگیری، نمایه سازی، برآورد حرکت و بازیابی تصویر است.

بینایی رایانه ای مکملی برای دید بیولوژیکی

برنامه های بینایی رایانه و پردازش تصویر دیجیتال در حوزه های پزشکی

یکی از برجسته ترین زمینه های کاربرد بینایی رایانه، پزشکی یا پردازش تصویر دیجیتال پزشکی است. این حوزه با استخراج اطلاعات از داده های تصویر به منظور تشخیص پزشکی یک بیماری مشخص می شود. به طور کلی داده های تصویری به صورت تصاویر میکروسکوپی ، تصاویر اشعه ایکس ، تصاویر آنژیوگرافی، تصاویر اولتراسونیک و تصاویر توموگرافی است. نمونه ای از اطلاعاتی که می توان از طریق چنین داده های تصویری استخراج کرد شامل: تشخیص تومورها، تصلب شرایین یا سایر تغییرات بدخیم است. همچنین این فرایند می تواند در رابطه با اندازه گیری ابعاد اندام، جریان خون و غیره باشد. این حوزه ی کاربردی همچنین با ارائه اطلاعات جدید (به عنوان مثال در مورد ساختار مغز یا در مورد کیفیت درمان های پزشکی) از تحقیقات پزشکی پشتیبانی می کند.

برنامه های بینایی رایانه و پردازش تصویر دیجیتال در حوزه های پزشکی

عملکرد بینایی رایانه و پردازش تصویر دیجیتال در صنعت

دومین زمینه کاربرد بینایی رایانه و پردازش تصویر دیجیتال در صنعت است که گاهی اوقات دید ماشینی (Machine vision) نامیده می شود. در این حوزه اطلاعات با هدف پشتیبانی از یک “فرآیند تولید” استخراج می شود. یک مثال واضح موارد مربوط به کنترل کیفیت است که در آن جزئیات یا محصولات نهایی به طور خودکار مورد بازرسی قرار می گیرند تا نواقص آن شناسایی شود. مثال دیگر اندازه گیری موقعیت و جهت گیری جزئیاتی است که باید توسط ربات (Robot) انتخاب شود.

عملکرد بینایی رایانه و پردازش تصویر دیجیتال در صنعت

برنامه های نظامی بزگترین عرصه عملکرد بینایی رایانه و پردازش تصویر دیجیتال

برنامه های نظامی احتمالاً یکی از بزرگترین زمینه ها برای بینایی رایانه و پردازش تصویر دیجیتال محسوب می شوند. نمونه های بارز آن شناسایی سربازان یا وسایل نقلیه دشمن و هدایت موشک است. سیستم های پیشرفته تر برای هدایت موشک، موشک را به جای هدف خاص به منطقه می فرستند و با رسیدن موشک به منطقه بر اساس داده های تصویری محلی، هدف انتخاب می شود. مفاهیم مدرن نظامی، مانند “آگاهی از میدان جنگ” حاکی از آن است که سنسورهای مختلف از جمله سنسور تصویر، مجموعه ای غنی از اطلاعات را در مورد صحنه جنگ ارائه می دهند که می تواند برای پشتیبانی از تصمیمات استراتژیک استفاده شود. در این حالت پردازش خودکار داده ها برای کاهش پیچیدگی و همجوشی اطلاعات از چندین حسگر برای افزایش قابلیت اطمینان استفاده می شود.

تصویر ۲ - کانسپت هنرمند از مریخ نورد در مریخ ، نمونه ای از یک وسیله نقلیه زمینی بدون سرنشین. به دوربین های استریو نصب شده در بالای Rover توجه کنید.

تصویر ۲ – کانسپت هنرمند از مریخ نورد در مریخ ، نمونه ای از یک وسیله نقلیه زمینی بدون سرنشین. به دوربین های استریو نصب شده در بالای Rover توجه کنید.

پردازش تصویر دیجیتال در اختیار وسایل نقلیه خودکار

یکی از زمینه های جدیدتر کاربرد پردازش تصویر دیجیتال درصنعت وسایل نقلیه خودکار است که شامل شناورها، وسایل نقلیه زمینی (ربات های کوچک چرخ دار، ماشین یا کامیون)، وسایل نقلیه هوایی و پهباد ها (UAV) است. در این صنایع سطح خودمختاری وسایل نقلیه کاملاً مستقل (بدون سرنشین) تا خودروهایی که سیستم های مبتنی بر بینایی رایانه ای و پردازش تصویر دیجیتال برخوردارند و از راننده یا خلبان در موقعیت های مختلف پشتیبانی می کنند، متغیر است. وسایل نقلیه کاملاً خودمختار معمولاً از بینایی رایانه ای برای مسیریابی یا تولید نقشه محیط آن (SLAM) و تشخیص موانع استفاده می کنند. همچنین می تواند برای تشخیص وقایع خاص برای کار خاصی استفاده شود. برای مثال می توان به یک پهپاد که به دنبال آتش سوزی در جنگل است اشاره نمود.

چندین تولید کننده اتومبیل سیستم هایی مبتنی بر بینایی رایانه ای و پردازش تصویر دیجیتال را برای رانندگی خودکار اتومبیل ها به نمایش گذاشته اند. اما این فناوری هنوز به سطحی نرسیده است که بتوان آن را در بازار عرضه کرد. نمونه های زیادی از وسایل نقلیه خودمختار نظامی از موشک های پیشرفته گرفته تا پهپادها برای انجام ماموریت های مجدد یا هدایت موشک وجود دارد. اکتشافات فضایی امروزه با وسایل نقلیه خودمختار (Autonomous) با استفاده از دید رایانه انجام می شود.

پردازش تصویر دیجیتال در اختیار وسایل نقلیه خودکار

تشخیص چهره

تشخیص چهره (Face Detection) یک فناوری رایانه ای و پردازش تصویر دیجیتال است که مکان و اندازه چهره انسان را در تصاویر تعیین می کند. این فناوری ویژگی های صورت را تشخیص داده و هر چیز دیگری مانند ساختمان ها، درختان و بدن را نادیده می گیرد. تشخیص چهره را می توان به عنوان یک مورد خاص از تشخیص شی در تصویر (Object-Class Detection) در نظر گرفت. در “تشخیص شی در تصویر” وظیفه فناوری این است که مکان ها و اندازه های همه اشیا موجود در یک تصویر را که متعلق به یک کلاس مشخص است را پیدا کند. به عنوان مثال می توان به بالا تنه عابر پیاده و اتومبیل اشاره کرد. تشخیص چهره را می توان یک مورد کلی برگرفته “تشخیص شی در تصویر” دانست که در این حوزه بومی شده است.

الگوریتم های اولیه تشخیص چهره در شناسایی چهره های انسان بر روی پیشانی متمرکز بودند. در حالی که الگوریتم های جدیدتر سعی در حل مشکلی کلی تر و تشخیص چهره از چند نما دارند. یعنی تشخیص چهره هایی که یا در امتداد محور افقی صورت ناظر چرخانده می شوند (چرخش درون صفحه)، یا در امتداد محور عمودی به صورت چپ به راست (چرخش خارج از صفحه)، یا در هر دو محور چرخانده می شوند.

تشخیص چهره

نحوه عملکرد الگوریتم های تشخیص چهره

بسیاری از الگوریتم های پردازش تصویر دیجیتال در حوزه تشخیص چهره به صورت دستگاه اعداد دو دویی یا باینری (Binary Number) عمل می کنند. به این معنی که محتوای قسمت معینی از تصویر به شاخص تبدیل می شود و پس از آن طبقه بندی کننده ای که روی نمونه های صورت آموزش داده شده است، تصمیم می گیرد که آیا آن منطقه خاص از تصویر یک صورت است یا خیر.

در این فرآیند اغلب از یک روش کشویی پنجره (Window-Sliding Technique) استفاده می شود. یعنی طبقه بندی کننده برای طبقه بندی قسمت های تصویر در همه مکان ها و مقیاس ها به جستجوی شکل چهره یا غیر چهره (الگوی پس زمینه) می پردازد. تشخیص چهره در زیست ‌سنجشی (Biometrics) اغلب به عنوان بخشی از سیستم تشخیص چهره (Facial Recognition System‎) شناخته می شود. همچنین از آن در نظارت تصویری و سامانه دوربین های مداربسته، رابط کاربری یا واسط رایانه انسان (Human Computer Interface) و مدیریت پایگاه داده تصاویر استفاده می شود. برخی از دوربین های دیجیتال اخیرا از تشخیص چهره برای فوکوس خودکار استفاده می کنند. برای مطالعه بیشتر در مورد تشخیص چهره با فوکوس خودکار به نوشته Canons5is رجوع کنید. همچنین تشخیص چهره برای انتخاب مناطق مورد علاقه در نمایش اسلایدهای عکس که از جلوه کن برنز (Ken Burns Effect) در مقیاس گسترده استفاده می کنند، مفید است.

شناسایی شاخص (Feature Detection)

در بینایی و پردازش تصویر دیجیتال رایانه ای، مفهوم تشخیص شاخص (Feature Detection) به روش هایی اشاره دارد که هدف آن ها محاسبه جزئیات (Abstractions) در تصویر و بررسی منطقه ای در هر نقطه از تصویر است که آیا یک شاخص تصویری از نوعی شناخته شده در آن نقطه وجود دارد یا خیر. شاخص های بدست آمده زیر مجموعه های تصویر خواهند بود که غالباً به صورت نقاط جدا شده، منحنی های به هم پیوسته یا بخش های منفرد مشخص می شوند.

شکل ۲- خروجی الگوریتم، تشخیص گوشه ها

تعریف شاخص در بینایی رایانه ای

هیچ تعریف جهانی یا دقیقی از آنچه که یک شاخص (Feature) را تشکیل می دهد وجود ندارد و تعریف دقیق آن اغلب به مشکل یا نوع کاربرد آن بستگی دارد. باید توجه داشت که یک شاخص به عنوان بخشی جالب (Interesting) از یک تصویر تعریف می شود. همچنین از شاخص ها به عنوان نقطه شروع بسیاری از الگوریتم های بینایی رایانه و پردازش تصویر دیجیتال استفاده می شود. از آنجا که شاخص ها به عنوان نقطه آغازین و اصلی الگوریتم های بعدی مورد استفاده قرار می گیرند، عملکرد صحیح الگوریتم منوط به ردیابی و شناسایی صحیح اولیه شاخص ها خواهد بود. در نتیجه شاخص مطلوب برای یک ردیاب (Detector) تکرارپذیری آن است. به عبارت دیگر یعنی این که آیا همان شاخص در دو یا چند تصویر متفاوت از یک صحنه شناسایی می شود یا نه.

نحوه شناسایی شاخص در الگوریتم های پردازش تصویر

تشخیص شاخص یک عملیات پردازش تصویر دیجیتال سطح پایین است. یعنی معمولاً به عنوان اولین عمل بر روی تصویر انجام می شود و هر پیکسل را بررسی می کند تا مشخص شود آیا در آن پیکسل شاخص وجود دارد یا خیر. اگر این بخش، بخشی از یک الگوریتم بزرگتر باشد الگوریتم معمولاً فقط تصویر بخشی که شاخص ها در آن قرار دارند را بررسی می کند. به عنوان یک پیش نیاز داخلی برای شناسایی شاخص ها، تصویر ورودی معمولاً توسط یک هسته گاوسی (Gaussian Kernel) در مقیاس خود نرم می شود و یک یا چند تصویر از ویژگی ها محاسبه می شود.

گاهی اوقات هنگامی که تشخیص شاخص از نظر محاسباتی پر هزینه باشد و محدودیت های زمانی هم وجود داشته باشد، ممکن است از الگوریتم سطح بالاتری برای هدایت مرحله تشخیص شاخص استفاده شود. در این شرایط فقط در قسمت های خاصی از تصویر به دنبال شاخص ها می گردند.

انواع ردیاب های شاخص در الگوریتم های بینایی رایانه ای

با توجه به اینکه که بسیاری از الگوریتم های بینایی رایانه ای و پردازش تصویر دیجیتال از ردیابی شاخص به عنوان مرحله اولیه استفاده می کنند، تعداد بسیار زیادی از ردیاب های شاخص ایجاد شده اند. این ردیاب ها از نظر شاخص های شناسایی شده، پیچیدگی محاسبات و تکرار پذیری بسیار متفاوت هستند. در یک دید کلی این ردیاب ها را می توان با برخی همپوشانی ها به گروه های زیر تقسیم کرد.

لبه ها

در پردازش تصویر دیجیتال لبه ها در نقاطی قرار گرفته اند که آن محل، بین دو ناحیه تصویر یک مرز وجود دارد. به طور کلی، یک لبه می تواند شکلی قراردادی داشته باشد. حتی ممکن است شامل نقاط اتصال باشد. در عمل، لبه ها معمولاً به عنوان مجموعه ای از نقاط در تصویر تعریف می شوند که از یک شیب بزرگ (Gradient Magnitude) برخوردار هستند. بعلاوه، برخی از الگوریتم های نقاط شیب بزرگ را بهم متصل می کنند تا توصیف کاملتری از لبه را تشکیل دهند. چنین الگوریتم هایی معمولاً برخی از محدودیت ها را در مورد خصوصیات لبه بررسی می کنند. مانند شکل، صاف بودن و مقدار شیب. به طور کلی می توان گفت که لبه ها ساختاری یک بعدی دارند.

گوشه ها (Corners / Interest Points)

اصطلاح گوشه ها و نقطه توجه (Interest Points) در بینایی رایانه ای و پردازش تصویر دیجیتال تا حدودی به جای یکدیگر استفاده می شوند و به ویژگی های نقطه مانند در یک تصویر اشاره دارند. این ویژگی ها عموما دارای ساختار دو بعدی محلی هستند. نام گوشه (Corners) از زمان الگوریتم های اولیه برای تشخیص لبه ایجاد شده و سپس لبه ها را تجزیه و تحلیل کرد تا تغییرات سریع جهت را پیدا کند. این الگوریتم ها سپس به گونه ای توسعه یافتند که دیگر به آشکار سازی لبه ها نیازی نبود. برای مثال می توان به نمونه هایی در رابطه با جستجوی سطوح بالای انحنا در شیب تصویری اشاره نمود.

بعدها مشخص شد که الگوریتم ها قسمت هایی از تصویر را نیز که با تعاریف مرسوم گوشه نبودند، به عنوان گوشه شناسایی می کنند. چنین مواردی در رابطه با لکه های کوچک روشن در پس زمینه به کرات مشاهده شده است. چنین نقاطی اغلب به عنوان نقطه توجه شناخته می شوند. ولی در اصطلاح رایج به آن ها گوشه اطلاق می شود.

لکه ها (Blobs)

از لکه ها می توان با توصیفی به صورت “مناطق مورد توجه یا نقاط مورد متوجه” نیز در پردازش تصویر دیجیتال یاد نمود. لکه ها در مقایسه با گوشه ها، توصیف مکملی برای ساختار تصویر را از نظر بخش بندی ارائه می دهند. با این وجود این نقاط اغلب تحت عنوان نقطه ترجیحی (Preferred Point) و با مفهوم مرکز ثقل (Center of Gravity) نیز شناخته می شوند. ردیاب های لکه می توانند مناطقی را در یک تصویر تشخیص دهند که خیلی صاف بوده و توسط ردیاب گوشه ای قابل تشخیص نیستند.

برای مثال نمونه ای از عملکرد تشخیص شاخص ها به شیوه ی کوچک سازی تصویر و تشخیص گوشه با ردیاب گوشه را در نظر بگیرید. در این شرایط ردیاب به نقاطی واضح که در تصویر کوچک شده اند عکس العمل نشان می دهد. این در شرایطی است که ممکن است در تصویر اصلی آن محل ها را به صورت صاف شناسایی نماید. در چنین مواردی است که تفاوت میان ردیاب گوشه و ردیاب لکه تا حدودی مبهم می شود.

پُشته (Ridge)

برای اجسام کشیده شده مفهوم برجستگی یک ویژگی طبیعی است. از دیدگاه عملی یک پشته را می توان به عنوان یک منحنی یک بعدی در نظر گرفت که نمایانگر یک محور تقارن است. علاوه بر این، این پشته دارای یک ویژگی عرض خط الراس محلی است که با هر نقطه خط الراس دیگر مرتبط است. متأسفانه، از نظر الگوریتمی استخراج ویژگی های پشته از کلاس های کلی تصاویر در سطح خاکستری دشوارتر از ویژگی های لبه، گوشه یا لکه است. با این وجود، از ردیاب های پشته غالباً در پردازش تصویر دیجیتال برای شناسایی جاده در تصاویر هوایی و شناسایی رگ های خونی در تصاویر پزشکی استفاده می شود.

انواع ردیاب های شاخص در الگوریتم های بینایی رایانه ای

سیستم هشدار خروج از خط (Lane Departure Warning System)

در اصطلاحات حمل و نقل جاده ای، سیستم هشدار خروج از خط، نوعی مکانیزم پردازش تصویر دیجیتال است که برای هشدار دادن به راننده تدارک دیده شده است. این مکانیزم هنگام حرکت خودرو به خارج از خط خود در آزاد راه ها و جاده ها طراحی شده است. اولین سیستم هشدار خروج از خط تولید در اروپا سیستمی بود که توسط Iteris برای کامیون های تجاری مرسدس آکتروس ساخته شد. این سیستم در سال ۲۰۰۰ آغاز به کار کرد و اکنون در اکثر کامیون های فروخته شده در اروپا موجود است.

در سال ۲۰۰۲ سیستم Iteris در کامیون های Freightliner Trucks در آمریکای شمالی در دسترس قرار گرفت. در همه این سیستم ها یک صدای زنگ در کنار وسیله نقلیه ای که از لاین خارج می شود، به راننده در مورد حرکت غیر عادی هشدار می دهد. گفتنی است در صورت استفاده از چراغ های راهنمای گردش به چپ یا راست، هیچ هشداری اعلام نمی شود. امروزه سیستم های هشدار دهنده خروج از خط در صنعت حمل و نقل بسیار پیشرفته تر هستند.

فناوری های نوین در عرصه امنیت جاده ای

Viewnyx از جمله مجموعه هایی است که از فناوری های مبتنی بر ویدئو و پردازش تصویر دیجیتال برای کمک به ناوگان حمل و نقل استفاده می کند. این مجموعه ابتدا به علل اصلی تصادف (خطای رانندگی، حواس پرتی و خواب آلودگی) می پردازد. در مرحله دوم، این مجموعه با ارائه گزارش های ارزیابی ریسک راننده و ناوگان، به مدیران ایمنی جهت پیشگیری از رفتارهای خطرناک دوره های آموزشی برگزار می کند.

سامانه Lookout که مبتنی بر پردازش تصویر دیجیتال و ویدئو است و در حال حاضر توسط ناوگان آمریکای شمالی استفاده می شود دو نوع سیستم اصلی وجود دارد:

سیستم هایی که در صورت ترک وسیله نقلیه توسط راننده، به راننده هشدار می دهند.
سیستم هایی که پس از هشدار به راننده و در صورت عدم اقدام، به طور خودکار اقداماتی را برای اطمینان از ماندن خودرو در خط خود انجام می دهند.

فناوری های نوین در عرصه امنیت جاده ای

تصویر سازی غیر واقعی (Non-Photorealistic Rendering)

تصویر سازی غیر واقعی (Non-Photorealistic Rendering) بخشی از گرافیک رایانه ای است که بر روی امکان ایجاد طیف گسترده ای از سبک های بیانی برای هنر دیجیتال تمرکز دارد. بر خلاف گرافیک رایانه ای سنتی که تمرکز خود را بر روی واقع گرایی متمرکز کرده است، تصویر سازی غیر واقعی از سبک های هنری مانند نقاشی، طراحی، تصویر فنی و کارتون های متحرک الهام گرفته و به شدت نیازمند پردازش تصویر دیجیتال است. تصویر سازی غیر واقعی در فیلم ها و بازی های ویدئویی به صورت Toon Shaders و همچنین در تصویرگری معماری و انیمیشن های آزمایشی ظاهر شده است. یک نمونه از کاربردهای مدرن این روش انیمیشن سایه دار Cel است.

تصویر سازی غیر واقعی (Non-Photorealistic Rendering)

پردازش تصویر دیجیتال پزشکی

تصویر برداری پزشکی تکنیک و فرآیندی است که برای تولید تصاویر از بدن انسان (بخش ها و عملکرد آن) با اهداف بالینی (روش های پزشکی به دنبال کشف، تشخیص یا بررسی بیماری) یا علوم پزشکی (از جمله مطالعه آناتومی و فیزیولوژی طبیعی) استفاده می شود. پردازش تصویر دیجیتال پزشکی به عنوان یک رشته و به معنای وسیع آن بخشی از تصویربرداری بیولوژیکی است که شامل:

رادیولوژی.
پزشکی هسته ای.
علوم رادیولوژی تحقیق.
آندوسکوپی.
ترموگرافی پزشکی (پزشکی).
عکسبرداری پزشکی و میکروسکوپ،

می شود. در پردازش تصویر دیجیتال پزشکی تکنیک های اندازه گیری و ضبط که در درجه اول برای تولید تصاویر طراحی نشده اند (مانند الکترو انسفالوگرافی (EEG) ، مگنتوآنسفالوگرافی (MEG) ، الکتروکاردیوگرافی (EKG) و سایر موارد)، اما داده های حساس را تولید می کنند، به عنوان اشکال تصویربرداری پزشکی دیده می شود.

پردازش تصویر دیجیتال پزشکی

پردازش تصویر ریخت‌شناسی ریاضیاتی

ریخت‌ شناسی ریاضیاتی یا Mathematical Morphology (MM) یک تئوری و تکنیک برای تجزیه و تحلیل و پردازش ساختارهای هندسی است که بر اساس تئوری مجموعه ها، نظریه شبکه، توپولوژی و توابع تصادفی ساخته شده است. MM معمولاً در پردازش تصویر دیجیتال اعمال می شود. اما می تواند در نمودارها، مش های سطحی، جامدات و بسیاری از ساختارهای مکانی دیگر نیز به کار رود. مفاهیم فضایی مداوم توپولوژیکی و هندسی مانند اندازه، شکل، تحدب، اتصال و فاصله ژئودزیک را می توان با MM در دو فضای پیوسته و گسسته مشخص کرد. MM در ابتدا برای تصاویر باینری ساخته شد و بعداً به توابع و تصاویر در مقیاس خاکستری گسترش یافت.

پردازش تصویر ریخت‌شناسی ریاضیاتی

سنجش از دور

سنجش از دور به اموری اطلاق می شود که موجب کسب اطلاعات کوچک یا وسیع از یک شی یا پدیده با استفاده از دستگاه ضبط یا تجهیزات وایرلس که در تماس فیزیکی یا نزدیک با جسم نیستند، می شود. در عمل سنجش از دور مجموعه ای از فنونی است که با استفاده از دستگاه های مختلف برای جمع آوری اطلاعات از یک شی یا منطقه مشخص به کار گرفته می شود. بنا بر این ، سیستم های ماهواره ای رصد زمین یا هوا، سیستم شناور در اقیانوس، تصویربرداری تشدید مغناطیسی (MRI)، توموگرافی انتشار پوزیترون (PET)، اشعه ایکس (X-RAY) و کاوشگرهای فضایی همه نمونه هایی از سنجش از دور هستند.

در کاربردهای مدرن، این اصطلاح به طور کلی به استفاده از فن آوری های سنسور تصویر از جمله: ابزارهایی که در هوا پیما ها و فضا پیما ها و همچنین در الکترو فیزیولوژی استفاده می شوند، اشاره دارد.

سنجش از دور

فیلم دیجیتال

در مهندسی برق و علوم کامپیوتر پردازش تصویر دیجیتال و پردازش ویدئو یک مورد خاص از پردازش سیگنال است. از تکنیک های پردازش ویدئو در دستگاه های تلویزیون، دستگاه های ضبط ویدئو، دی وی دی، کدک های ویدئویی، دستگاه پخش ویدئو، دوربین های مداربسته و NVR ها استفاده می شود.

فیلم دیجیتال

نتیجه

17 پسندیده شده

مقالات دوربین مداربسته دوربین مولتی سنسور فناوری کدک های فشرده سازی

ادامه مطلب

پردازش تصویر دیجیتال و فیلم : مروری بر چیستی و کار کردها

پردازش تصویر دیجیتال چیست؟

جایگاه پردازش تصویر در علم الکترونیک

بینایی انسان در برابر پردازش تصویر دیجیتال

چالش افزایش هزینه های پردازش تصویر

کاربرد پردازش تصویر دیجیتال

بینایی رایانه‌ای

بینایی رایانه ای مکملی برای دید بیولوژیکی

برنامه های بینایی رایانه و پردازش تصویر دیجیتال در حوزه های پزشکی

عملکرد بینایی رایانه و پردازش تصویر دیجیتال در صنعت

برنامه های نظامی بزگترین عرصه عملکرد بینایی رایانه و پردازش تصویر دیجیتال

پردازش تصویر دیجیتال در اختیار وسایل نقلیه خودکار

تشخیص چهره

نحوه عملکرد الگوریتم های تشخیص چهره

شناسایی شاخص (Feature Detection)

تعریف شاخص در بینایی رایانه ای

نحوه شناسایی شاخص در الگوریتم های پردازش تصویر

انواع ردیاب های شاخص در الگوریتم های بینایی رایانه ای

لبه ها

گوشه ها (Corners / Interest Points)

لکه ها (Blobs)

پُشته (Ridge)

سیستم هشدار خروج از خط (Lane Departure Warning System)

فناوری های نوین در عرصه امنیت جاده ای

تصویر سازی غیر واقعی (Non-Photorealistic Rendering)

پردازش تصویر دیجیتال پزشکی

پردازش تصویر ریخت‌شناسی ریاضیاتی

سنجش از دور

فیلم دیجیتال

نتیجه

مطالب مرتبط

فشرده سازی H.265 : ساختارها ، موانع پیش روی و چشم انداز

کدک های هوشمند تحول بنیادین در دوربین های مداربسته

فشرده سازی تصویر دوربین مداربسته و تاثیر آن بر کیفیت

کُدک های دوربین های مداربسته : انواع کدک ها و چگونگی عملکردهای آن ها

تحولات ۵ سال اخیر در صنعت دوربین مداربسته

ارتباط با ما

وبلاگ آموزشی

با ما در ارتباط باشید