06-19-2011، 07:49 PM
در این تایپک میخواهم تمام مباحث در مورد پردازش تصاویر را روش بحث کنم همچنین سورس کدهای هم به زودی در مورد پردازش تصاویر پیوست خواهم کرد.
پردازش تصاویر امروزه بیشتر به موضوع پردازش تصویر دیجیتال گفته میشود که شاخهای از دانش رایانه است که با پردازش سیگنال دیجیتال که نماینده تصاویر برداشته شده با دوربین دیجیتال یا پویش شده توسط پویشگر هستند سر و کار دارد.
پردازش تصاویر دارای دو شاخه عمدهٔ بهبود تصاویر و بینایی ماشین است. بهبود تصاویر دربرگیرندهٔ روشهایی چون استفاده از فیلتر محوکننده و افزایش تضاد برای بهتر کردن کیفیت دیدارمتن ضخیمی تصاویر و اطمینان از نمایش درست آنها در محیط مقصد(مانند چاپگر یا نمایشگر رایانه)است، در حالی که بینایی ماشین به روشهایی میپردازد که به کمک آنها میتوان معنی و محتوای تصاویر را درک کرد تا از آنها در کارهایی چون رباتیک و محور تصاویر استفاده شود.
در معنای خاص آن پردازش تصویر عبارتست از هر نوع پردازش سیگنال که ورودی یک تصویر است مثل عکس یا صحنهای از یک فیلم. خروجی پردازشگر تصویر میتواند یک تصویر یا یک مجموعه از نشانهای ویژه یا متغیرهای مربوط به تصویر باشد. اغلب تکنیکهای پردازش تصویر شامل برخورد با تصویر به عنوان یک سیگنال دو بعدی و بکاربستن تکنیکهای استاندارد پردازش سیگنال روی آنها میشود. پردازش تصویر اغلب به پردازش دیجیتالی تصویر اشاره میکند ولی پردازش نوری و آنالوگ تصویر هم وجود دارند. این مقاله در مورد تکنیکهای کلی است که برای همه آنها به کار میرود
2.رنگ: همانند تغییر روشنایی، وضوح و یا تغییر فضای رنگ
3.ترکیب تصاویر: ترکیب دو و یا چند تصویر
4.فشرده سازی تصویر: کاهش حجم تصویر
5.قطعه بندی تصویر: تجزیهٔ تصویر به قطعات با معنی
6.تفاوت تصاویر: به دست آوردن تفاوتهای تصویر
7.میانگین گیری: به دست آوردن تصویر میانگین از دو تصویر
برای ذخیرهسازی تصاویر باید حجم اطلاعات را تا جایی که ممکن است کاهش داد و اساس تمام روشهای فشردهسازی کنار گذاردن بخشهایی از اطلاعات و دادهها است.
ضریب یا نسبت فشردهسازی است که میزان و در صد کنار گذاشتن اطلاعات را مشخص میکند. این روش ذخیرهسازی و انتقال اطلاعات را آسانتر میکند و پهنایباند و فرکانس مورد نیاز کاهش مییابد.
امروزه روشهایی متعدد و پیشرفته برای فشردهسازی وجود دارد. فشردهسازی تصویر از این اصل مهم تبعیت میکند که چشم انسان حد فاصل دو عنصر تصویری نزدیک به هم را یکسان دیده و تمایز آنها را نمیتواند تشخیص دهد. همچنین اثر نور و تصویر برای مدت زمان معینی در چشم باقی مانده و از بین نمیرود که این ویژگی در ساخت تصاویر متحرک مورد توجه بودهاست.
روش JPEG
نام این فرمت در واقع مخفف کلمات JOINT PHOTOGRAPHIC EXPERT GROUP است. از این روش در فشردهسازی عکس و تصاویر گرافیکی ساکن استفاده میشود JPEG اولین و سادهترین روش در فشردهسازی تصویر است به همین دلیل در ابتدا سعی شد برای فشردهسازی تصاویر متحرک مورد استفاده قرار گیرد. برای این منظور تصاویر به صورت فریم به فریم مانند عکس فشرده میشدند وبا ابداع روش MOTION JPEG برای ارتباط دادن این عکسها به هم تلاش شد که با مشکلاتی همراه بود.
روش MPEG
نام این فرمت مخفف عبارت MOVING PICTURE EXPERT GROUP است. این روش در ابتدای سال ۹۰ ابداع شد و در آن اطلاعات تصویر با سرعت حدود ۵/۱ مگابیت بر ثانیه انتقال پیدا میکرد که در تهیه تصاویر ویدئویی استفاده میشد. با این روش امکان ذخیره حدود ۶۵۰ مگابایت اطلاعات معادل حدود ۷۰ دقیقه تصویر متحرک در یک دیسک به وجود آمد. در MPEG بیتهای اطلاعات به صورت سریال ارسال میشوند و به همراه آنها بیتهای کنترل و هماهنگکننده نیز ارسال میشوند که موقعیت و نحوه قرارگیری بیتهای اطلاعاتی را برای انتقال و ثبت اطلاعات صدا و تصویر تعیین میکند.
روش MP3
MP۳ نیز روشی برای فشرده سازی اطلاعات صوتی به ویژه موسیقی است که از طریق آن حجم زیادی از اطلاعات صوتی در فضای نسبتاً کوچکی ذخیره میشود.
روش MPEG۲
در روش MPEG۲ از ضریب فشردهسازی بالاتری استفاده میشود و امکان دسترسی به اطلاعات ۳ تا ۱۵ مگابیت بر ثانیهاست از این روش در دیویدیهای امروزی استفاده میشود در اینجا نیز هر فریم تصویری شامل چندین سطر از اطلاعات دیجیتالی است.
روش MPEG ۴
از این روش برای تجهیزاتی که با انتقال سریع یا کند اطلاعات سرو کار دارند استفاده میشود. این روش توانایی جبران خطا و ارائه تصویر با کیفیت بالا را دارد. مسئله خطا و جبران آن در مورد تلفنهای همراه و کامپیوترهای خانگی و لپتاپها و شبکهها از اهمیت زیادی برخوردار است. در شبکههای کامپیوتری باید تصویر برای کاربرانی که از مودمهای سریع یا کند استفاده میکنند به خوبی نمایش داده شود، در چنین حالتی روش MPEG ۴ مناسب است. از این روش در دوربینهای تلویزیونی نیز استفاده میشود. ایده اصلی این روش تقسیم یک فریم ویدئویی به یک یا چند موضوع است که مطابق قاعده خاصی کنار هم قرار میگیرند مانند درختی که از روی برگهای آن بتوان به شاخه تنه یا ریشه آن دست یافت. هر برگ میتواند شامل یک موضوع صوتی یا تصویری باشد. هر کدام از این اجزا به صورت مجزا و جداگانه قابل کپی و یا انتقال هستند. این تکنیک را با آموزش زبان میتوان مقایسه کرد.
همانطوریکه در آموزش زبان کلمات به صورت مجزا و جداگانه قرار داده میشوند و ما با مرتب کردن آن جملات خاصی میسازیم و میتوانیم در چند جمله، کلمات مشترک را فقط یکبار بنویسیم و هنگام مرتب کردن آنها به کلمات مشترک رجوع کنیم، در اینجا هم هر یک از این اجزا یک موضوع خاص را مشخص میکند و ما میتوانیم اجزا مشترک را فقط یکبار به کار ببریم و هنگام ساختن موضوع به آنها رجوع کنیم. هر یک از موضوعات هم میتوانند با موضوعات دیگر ترکیب و مجموعه جدیدی را بوجود آورند. این مسئله باعث انعطافپذیری و کاربرد فراوان روش MPEG۴ میشود. برای مثال به صحنه بازی تنیس توجه کنید. در یک بازی تنیس میتوان صحنه را به دو موضوع بازیکن و زمین بازی تقسیم کرد زمین بازی همواره ثابت است بنا بر این بعنوان یک موضوع ثابت همواره تکرار میشود ولی بازیکن همواره در حال حرکت است و چندین موضوع مختلف خواهد بود. این مسئله سبب کاهش پهنای باند اشغالی توسط تصاویر دیجیتالی میشود. توجه داشته باشید که علاوه بر سیگنالهای مربوط به این موضوعات سیگنالهای هماهنگ کنندهای هم وجود دارند که نحوه ترکیب و قرارگیری صحیح موضوعات را مشخص میکند.
تصاویر رقمی(دیجیتالی)
تصاویر سنجش شده که از تعداد زیادی مربعات کوچک(پیکسل) تشکیل شدهاند. هر پیکسل دارای یک شماره رقمی(Digital Number) میباشد که بیانگر مقدار روشنایی آن پیکسل است. به این نوع تصاویر، تصاویر رستری هم میگویند. تصاویر رستری دارای سطر و ستون میاشند.
مقادیر پیکسلها
مقدار انرژی مغناطیسی که یک تصویر رقومی به هنگام تصویر برداری کسب میکند، رقمهای دوتایی(Digit binary) یا بیت ها(Bits) را تشکیل میدهند که از قوه صفر تا ۲ ارزش گذاری شدهاست. هر بیت، توان یک به قوه ۲ (۱بیت=۲۱)میباشد. حداکثر تعداد روشنایی بستگی به تعداد بیتها دارد. بنابراین ۸ بیت یعنی ۲۵۶ شماره رقومی که دامنهای از ۰ تا ۲۵۵ دارد. به همین دلیل است که وقتی شما تصویر رستری از گیرنده خاصی مانند TM را وارد [[نرم افزار]]ی میکنید تغییرات میزان روشنایی را بین ۰ تا ۲۵۵ نشان میدهد.
دقت تصویر
دقت تصویر بستگی به شماره پیکسلها دارد. با یک تصویر ۲ بیتی، حداکثر دامنه روشنایی ۲۲ یعنی ۴ میباشد که دامنه آن از ۰ تا ۳ تغییر میکند. در این حالت تصویر دقت (تفکیک پذیری لازم) را ندارد. تصویر ۸ بیتی حداکثر دامنه ۲۵۶ دارد و تغییرات آن بین ۰ تا ۲۵۵ است. که دقت بالاتری دارد.
پردازش تصاویر امروزه بیشتر به موضوع پردازش تصویر دیجیتال گفته میشود که شاخهای از دانش رایانه است که با پردازش سیگنال دیجیتال که نماینده تصاویر برداشته شده با دوربین دیجیتال یا پویش شده توسط پویشگر هستند سر و کار دارد.
پردازش تصاویر دارای دو شاخه عمدهٔ بهبود تصاویر و بینایی ماشین است. بهبود تصاویر دربرگیرندهٔ روشهایی چون استفاده از فیلتر محوکننده و افزایش تضاد برای بهتر کردن کیفیت دیدارمتن ضخیمی تصاویر و اطمینان از نمایش درست آنها در محیط مقصد(مانند چاپگر یا نمایشگر رایانه)است، در حالی که بینایی ماشین به روشهایی میپردازد که به کمک آنها میتوان معنی و محتوای تصاویر را درک کرد تا از آنها در کارهایی چون رباتیک و محور تصاویر استفاده شود.
در معنای خاص آن پردازش تصویر عبارتست از هر نوع پردازش سیگنال که ورودی یک تصویر است مثل عکس یا صحنهای از یک فیلم. خروجی پردازشگر تصویر میتواند یک تصویر یا یک مجموعه از نشانهای ویژه یا متغیرهای مربوط به تصویر باشد. اغلب تکنیکهای پردازش تصویر شامل برخورد با تصویر به عنوان یک سیگنال دو بعدی و بکاربستن تکنیکهای استاندارد پردازش سیگنال روی آنها میشود. پردازش تصویر اغلب به پردازش دیجیتالی تصویر اشاره میکند ولی پردازش نوری و آنالوگ تصویر هم وجود دارند. این مقاله در مورد تکنیکهای کلی است که برای همه آنها به کار میرود
عملیات اصلی در پردازش تصویر
1.تبدیلات هندسی: همانند تغییر اندازه، چرخش و...2.رنگ: همانند تغییر روشنایی، وضوح و یا تغییر فضای رنگ
3.ترکیب تصاویر: ترکیب دو و یا چند تصویر
4.فشرده سازی تصویر: کاهش حجم تصویر
5.قطعه بندی تصویر: تجزیهٔ تصویر به قطعات با معنی
6.تفاوت تصاویر: به دست آوردن تفاوتهای تصویر
7.میانگین گیری: به دست آوردن تصویر میانگین از دو تصویر
فشردهسازی تصاویر
مقالهٔ اصلی: فشردهسازی تصاویربرای ذخیرهسازی تصاویر باید حجم اطلاعات را تا جایی که ممکن است کاهش داد و اساس تمام روشهای فشردهسازی کنار گذاردن بخشهایی از اطلاعات و دادهها است.
ضریب یا نسبت فشردهسازی است که میزان و در صد کنار گذاشتن اطلاعات را مشخص میکند. این روش ذخیرهسازی و انتقال اطلاعات را آسانتر میکند و پهنایباند و فرکانس مورد نیاز کاهش مییابد.
امروزه روشهایی متعدد و پیشرفته برای فشردهسازی وجود دارد. فشردهسازی تصویر از این اصل مهم تبعیت میکند که چشم انسان حد فاصل دو عنصر تصویری نزدیک به هم را یکسان دیده و تمایز آنها را نمیتواند تشخیص دهد. همچنین اثر نور و تصویر برای مدت زمان معینی در چشم باقی مانده و از بین نمیرود که این ویژگی در ساخت تصاویر متحرک مورد توجه بودهاست.
روش JPEG
نام این فرمت در واقع مخفف کلمات JOINT PHOTOGRAPHIC EXPERT GROUP است. از این روش در فشردهسازی عکس و تصاویر گرافیکی ساکن استفاده میشود JPEG اولین و سادهترین روش در فشردهسازی تصویر است به همین دلیل در ابتدا سعی شد برای فشردهسازی تصاویر متحرک مورد استفاده قرار گیرد. برای این منظور تصاویر به صورت فریم به فریم مانند عکس فشرده میشدند وبا ابداع روش MOTION JPEG برای ارتباط دادن این عکسها به هم تلاش شد که با مشکلاتی همراه بود.
روش MPEG
نام این فرمت مخفف عبارت MOVING PICTURE EXPERT GROUP است. این روش در ابتدای سال ۹۰ ابداع شد و در آن اطلاعات تصویر با سرعت حدود ۵/۱ مگابیت بر ثانیه انتقال پیدا میکرد که در تهیه تصاویر ویدئویی استفاده میشد. با این روش امکان ذخیره حدود ۶۵۰ مگابایت اطلاعات معادل حدود ۷۰ دقیقه تصویر متحرک در یک دیسک به وجود آمد. در MPEG بیتهای اطلاعات به صورت سریال ارسال میشوند و به همراه آنها بیتهای کنترل و هماهنگکننده نیز ارسال میشوند که موقعیت و نحوه قرارگیری بیتهای اطلاعاتی را برای انتقال و ثبت اطلاعات صدا و تصویر تعیین میکند.
روش MP3
MP۳ نیز روشی برای فشرده سازی اطلاعات صوتی به ویژه موسیقی است که از طریق آن حجم زیادی از اطلاعات صوتی در فضای نسبتاً کوچکی ذخیره میشود.
روش MPEG۲
در روش MPEG۲ از ضریب فشردهسازی بالاتری استفاده میشود و امکان دسترسی به اطلاعات ۳ تا ۱۵ مگابیت بر ثانیهاست از این روش در دیویدیهای امروزی استفاده میشود در اینجا نیز هر فریم تصویری شامل چندین سطر از اطلاعات دیجیتالی است.
روش MPEG ۴
از این روش برای تجهیزاتی که با انتقال سریع یا کند اطلاعات سرو کار دارند استفاده میشود. این روش توانایی جبران خطا و ارائه تصویر با کیفیت بالا را دارد. مسئله خطا و جبران آن در مورد تلفنهای همراه و کامپیوترهای خانگی و لپتاپها و شبکهها از اهمیت زیادی برخوردار است. در شبکههای کامپیوتری باید تصویر برای کاربرانی که از مودمهای سریع یا کند استفاده میکنند به خوبی نمایش داده شود، در چنین حالتی روش MPEG ۴ مناسب است. از این روش در دوربینهای تلویزیونی نیز استفاده میشود. ایده اصلی این روش تقسیم یک فریم ویدئویی به یک یا چند موضوع است که مطابق قاعده خاصی کنار هم قرار میگیرند مانند درختی که از روی برگهای آن بتوان به شاخه تنه یا ریشه آن دست یافت. هر برگ میتواند شامل یک موضوع صوتی یا تصویری باشد. هر کدام از این اجزا به صورت مجزا و جداگانه قابل کپی و یا انتقال هستند. این تکنیک را با آموزش زبان میتوان مقایسه کرد.
همانطوریکه در آموزش زبان کلمات به صورت مجزا و جداگانه قرار داده میشوند و ما با مرتب کردن آن جملات خاصی میسازیم و میتوانیم در چند جمله، کلمات مشترک را فقط یکبار بنویسیم و هنگام مرتب کردن آنها به کلمات مشترک رجوع کنیم، در اینجا هم هر یک از این اجزا یک موضوع خاص را مشخص میکند و ما میتوانیم اجزا مشترک را فقط یکبار به کار ببریم و هنگام ساختن موضوع به آنها رجوع کنیم. هر یک از موضوعات هم میتوانند با موضوعات دیگر ترکیب و مجموعه جدیدی را بوجود آورند. این مسئله باعث انعطافپذیری و کاربرد فراوان روش MPEG۴ میشود. برای مثال به صحنه بازی تنیس توجه کنید. در یک بازی تنیس میتوان صحنه را به دو موضوع بازیکن و زمین بازی تقسیم کرد زمین بازی همواره ثابت است بنا بر این بعنوان یک موضوع ثابت همواره تکرار میشود ولی بازیکن همواره در حال حرکت است و چندین موضوع مختلف خواهد بود. این مسئله سبب کاهش پهنای باند اشغالی توسط تصاویر دیجیتالی میشود. توجه داشته باشید که علاوه بر سیگنالهای مربوط به این موضوعات سیگنالهای هماهنگ کنندهای هم وجود دارند که نحوه ترکیب و قرارگیری صحیح موضوعات را مشخص میکند.
تصاویر رقمی(دیجیتالی)
تصاویر سنجش شده که از تعداد زیادی مربعات کوچک(پیکسل) تشکیل شدهاند. هر پیکسل دارای یک شماره رقمی(Digital Number) میباشد که بیانگر مقدار روشنایی آن پیکسل است. به این نوع تصاویر، تصاویر رستری هم میگویند. تصاویر رستری دارای سطر و ستون میاشند.
مقادیر پیکسلها
مقدار انرژی مغناطیسی که یک تصویر رقومی به هنگام تصویر برداری کسب میکند، رقمهای دوتایی(Digit binary) یا بیت ها(Bits) را تشکیل میدهند که از قوه صفر تا ۲ ارزش گذاری شدهاست. هر بیت، توان یک به قوه ۲ (۱بیت=۲۱)میباشد. حداکثر تعداد روشنایی بستگی به تعداد بیتها دارد. بنابراین ۸ بیت یعنی ۲۵۶ شماره رقومی که دامنهای از ۰ تا ۲۵۵ دارد. به همین دلیل است که وقتی شما تصویر رستری از گیرنده خاصی مانند TM را وارد [[نرم افزار]]ی میکنید تغییرات میزان روشنایی را بین ۰ تا ۲۵۵ نشان میدهد.
دقت تصویر
دقت تصویر بستگی به شماره پیکسلها دارد. با یک تصویر ۲ بیتی، حداکثر دامنه روشنایی ۲۲ یعنی ۴ میباشد که دامنه آن از ۰ تا ۳ تغییر میکند. در این حالت تصویر دقت (تفکیک پذیری لازم) را ندارد. تصویر ۸ بیتی حداکثر دامنه ۲۵۶ دارد و تغییرات آن بین ۰ تا ۲۵۵ است. که دقت بالاتری دارد.