• ¡Welcome to Square Theme!
  • This news are in header template.
  • Please ignore this message.
مهمان عزیز خوش‌آمدید. ورود عضــویت


امتیاز موضوع:
  • 6 رای - 2.67 میانگین
  • 1
  • 2
  • 3
  • 4
  • 5
Title: تبدیل آنلاین عکس و فایلهای pdf به متن - Online OCR
حالت موضوعی
#1

آشنایی با فن آوری تشخیص نوری کاراکترها...

فن آوری OCR (تشخیص نوری نویسه‌ها) مخفف واژگان Optical Character Recognition عبارت است از شناسایی خودکار متون موجود در تصاویر و اسناد و تبدیل آنها به متون قابل پردازش، جستجو و ویرایش توسط رایانه. تصویر سند غالبا توسط دستگاه اسکنر(روبشگر) و یا دوربین دیجیتال تولید می‌شود و شامل تعدادی پیکسل با رنگهای مختلف و سطوح روشنایی گوناگون است. از دید انسان، یک سند ممکن است ارزش اطلاعاتی زیادی داشته باشد، لیکن از دید رایانه تصویر یک سند با تصویر یک منظره تفاوتی ندارد، چرا که هر دوی آنها مجموعه‌ای از پیکسل‌ها هستند. برای اینکه بتوان از اطلاعات نوشتاری تصویر سند استفاده کرد، باید به نحوی نوشته‌های موجود در سند را بازشناسی کرد. چنین کاری توسط نرم‌افزارهای نویسه‌خوان نوری(OCR reader) انجام می‌شود.

واژهٔ OCR ابتدا تنها در مورد بازشناسی ارقام و حروف چاپی بکار گرفته می‌شد. پسوند نوری(Optical) در این عبارت در مقابل عبارت مرکب مغناطیسی قرار داده شد تا این روش را از روش قدیمی‌تر بازشناسی نویسه‌ها با مرکب مغناطیسی،MICR، متمایز کند. با گذشت زمان و پیشرفت قابل توجه در این زمینه، روش‌های بازشناسی دستنوشته و متون چاپی مطرح شدند که دامنهٔ کار را به کلمات و عبارات رساندند. با وجود عدم تطبیق دقیق OCR با این موارد، این نام برای این روش‌ها و تا حدی برای بازشناسی دست‌نوشته‌های برخط هم استفاده شد و رواج پیدا کرد. هم‌اکنون OCR را بیشتر برای بازشناسی مستندات چاپی مثل صفحات کتاب‌ها، مجله‌ها و نامه‌های چاپی به که عمدتا به صورت فایلهای PDF می باشند به کار می‌برند.
[عکس: OCR-Technology.jpg]

سامانهٔ(نرم افزار و یا یک سرویس آنلاین) نویسه‌خوان مثل یک نفر ماشین‌نویس، متن سند را می‌خواند و آن را به قالب مناسب برای ذخیره در رایانه تبدیل می‌کند. معمولاً یک روبشگر، تصویر سند را برای OCR فراهم می‌کند. سامانهٔ نویسه‌خوان، اشیاء موجود در تصویر سند را که ارقام، حروف، علائم و کلمات هستند، شناسایی کرده و رشته‌ی متناظر با آن‌ها را در قالب مناسب ذخیره می‌کند. یک فایل تصویری، حجم زیادی دارد و جستجوی متنی در آن ممکن نیست. این در حالی است که فایل خروجی سامانهٔ نویسه‌خوان بسیار کم حجم و قابل جستجو مانند یک فایل متن Txt و یا Doc است.

سامانه‌های نویسه‌خوان مثل بسیاری از سامانه‌های هوشمند دیگر، پیچیدگی زیادی دارد. پردازش تصویر و بازشناسی الگو دو پایهٔ اصلی این سامانه‌ها هستند. پیچیدگی این سامانه‌ها برای زبانهای گوناگون، متفاوت است. به عنوان مثال نوشتن OCR برای زبانهای لاتین به دلیل اینکه حروف آنها به طور مجزا نوشته می‌شود آسانتر است از زبانهایی مثل فارسی و عربی که حروف یک کلمه به یکدیگر می‌چسبند. این موضوع به علاوهٔ جمعیت کم کاربران زبان فارسی، سبب شده سامانه‌های نویسه‌خوان قدرتمندی برای زبان فارسی نداشته باشیم. البته در سالهای اخیر تلاشهای قابل تقدیری از سوی برخی شرکتهای فعال در زمینهٔ پردازش تصویر انجام شده که برخی از آنها منجر به محصولات قابل قبولی شده است.
منبع: صفحه تشخیص نوری نویسه ها در ویکی پدیا فارسی.

لیستی از سایتهای تبدیل آنلاین فایل به متن:
http://www.onlineocr.net
http://www.free-ocr.com
http://www.newocr.com
http://free-online-ocr.com
www.betterocr.com
http://www.ocr-extract.com
آموزش نحوه ی استفاده از این فن آوری...
برای استفاده از این تکنولوژی شما باید کارهای زیر را انجام دهید:
1- یک تصویر واضح از صفحه مورد نظرتان حالا چه بوسیله دوربین عکاسی، دوربین موبایل و یا اسکنر تهیه نمایید.
2- فایل مورد نظرتان را در یک از سایتهایی که در بالا معرفی شده اند آپلود نمایید.
3- بر روی گزینه مشخص شده برای دریافت خروجی به صورت متن کلیک کرده و منتظر بمانید تا سایت کار خودش را انجام دهد و متن مورد نظرتان را به شما تحویل دهد!

* البته بیشتر این سایتها در تبدیل متنهای انگلیسی بسیار ماهر هستند و با متون فارسی و عربی میانه ی خوبی ندارند. اما خیلی هم نگران نباشید، همانطور که در بالا هم ذکر شده نرم افزارهایی برای تبدیل و استخراج متون فارسی از دل تصاویر و فایلهای گرافیکی و غیر متنی وجود دارد که با یک جستجوی گوگل در سطح وب می توانید آنها را بیابید. موفق و موید باشید.
منبع: سیتی لینک
زندگی شهد گل است زنبور روزگار میمکدش....
 
پاسخ
  


موضوعات مشابه ...
موضوع نویسنده پاسخ بازدید آخرین ارسال
  تست آنلاین انواع عینک بر روی صورت و چشم قبل از خرید! - Online glasses Test meisam1376 1 10,368 08-27-2012، 02:47 PM
آخرین ارسال: Tanhaei
  معرفی سایت تبدیل جهان meisam1376 0 2,665 01-24-2012، 09:01 PM
آخرین ارسال: meisam1376
  اصلاح و حذف قرمزی چشمها به صورت آنلاین - Online redeye remove tool meisam1376 0 3,053 01-24-2012، 08:49 PM
آخرین ارسال: meisam1376
  جراحی پلاستیک(عمل زیبایی) آنلاین - Online Plastic Surgery meisam1376 0 3,364 01-24-2012، 08:43 PM
آخرین ارسال: meisam1376
  تبدیل آنلاین متن به آواز بلبل ها! - nightingale Song meisam1376 0 4,652 01-24-2012، 08:39 PM
آخرین ارسال: meisam1376
  تست آنلاین انواع مدل مو بر روی چهره - Online hair Style Testing meisam1376 0 26,684 01-24-2012، 08:34 PM
آخرین ارسال: meisam1376
  جدول سودوکو(Sudoku) - آنلاین سودوکو بازی کنید! meisam1376 0 3,326 01-24-2012، 08:24 PM
آخرین ارسال: meisam1376

پرش به انجمن:


Browsing: 1 مهمان