سیستم هوشمند فرم خوان فارسی (OCR)

همگام با پیشرفت و مکانیزه شده امور مختلف و کنارگذاشتن کاغذ و تبدیل آنها به فایل‌های دیجیتالی نیاز به نرم‌افزارهای هوشمندی که بتواند روند ورود اطلاعات به رایانه را بدون دخالت انسان انجام دهد ضروری به نظر می‌رسد. این سیستم‌ها بر اساس روش‌های هوش مصنوعی عمل می‌کنند. سامانه تولید شده قادر به تشخیص انواع فرم‌های دست نویس و استخراج اطلاعات متنی و عددی از آنها می‌باشد.

توضیحات

سامانه هوشمند فرم خوان فارسی سیستمی است که قادر به تشخیص فایل های تایپی و ارقام دست نویس با دقت بالاتر از 95% می‌باشد.

 

 

 معرفی

 

همگام با پیشرفت و مکانیزه شده امور مختلف و کنارگذاشتن کاغذ و تبدیل آنها به فایل‌های دیجیتالی نیاز به نرم‌افزارهای هوشمندی که بتواند روند ورود اطلاعات به رایانه را بدون دخالت انسان انجام دهد ضروری به نظر می‌رسد. این سیستم‌ها بر اساس روش‌های هوش مصنوعی عمل می‌کنند. سامانه تولید شده قادر به تشخیص انواع فرم‌های دست نویس و استخراج اطلاعات متنی و عددی از آنها می‌باشد.

این سیستم تصاویر اسکن شده را به عنوان ورودی دریافت نموده و پس از پردازش آنها با سرعت بالا، اطلاعات متنی، عددی و همچنین گزینه‌های انتخابی موجود بر روی فرم را تشخیص داده و وارد بانک اطلاعاتی می‌نماید. نام علمی این فرآیند را اصطلاحاً Optical Character Recognition-OCR گویند که از الگوریتم‌های هوشمند در جهت تبدیل تصویر به متن استفاده می‌شود. در این سیستم امکان تعریف فرم‌های متعدد از طریق یک سیستم فرم ساز وجود دارد که در آن بر روی تصویر فرم خام اسکن شده محل‌های متن، اعداد و نوع آنها از قبیل روز، ماه، سال، کد ملی و عدد ساده و همچنین محل آیتم‌های انتخابی مانند گزینه‌ها قابل تعریف می‌باشد.

تفاوت قابل ملاحظه‌ی این سامانه با سامانه‌های کاهش محدودیت‌هاست. محدودیت‌هایی از جمله اینکه فرم‌ها بایستی حتما با خودکار یا مدادی با رنگ مشخص پر شود و همچنین بخش‌های مختلف فرم‌ها بایستی با رنگ خاصی مانند قرمز طراحی شود تا ارقام داخل آن قابل تشخیص باشد. علاوه بر این بسیاری از سامانه‌های مشابه نسبت به چرخش یا تغییر اندازه‌ی فرم‌ها حساس می‌باشند حال اینکه در سامانه‌ی معرفی شده این محدودیت‌ها وجود ندارد.

سرعت پردازش در این سامانه بسیار بالا است به شکلی که می‌توان فرم‌های بسیاری را با استفاده از دستگاه‌های اسکنر با سرعت بالا وارد سیستم نموده و به سرعت پردازش نماید. این سیستم قابلیت اتصال به بانک‌های اطلاعاتی متعدد از قبیل SQL Server را به منظور ورود اطلاعات خوانده شده به بانک‌اطلاعاتی دارد. ارتباط اجزای فرم با بخش‌های مختلف بانک اطلاعاتی به صورت پویا و انعطاف پذیر در بخش فرم ساز سامانه قابل تعریف می‌باشد.

 

 مزایا و قابلیت‌های سیستم

 

تشخیص ارقام دست نویس فارسی و فایل تایپی فارسی با دقت بالای 95 درصد

سرعت پردازش لحظه‌ای (Real-Time)

عدم وابستگی به سایز، ابعاد و شیوه نوشتن

تشخیص و خواندن چک‌مارک‌ها، اشکال و علائم مانند پاسخنامه‌ها و فرم‌های اطلاعات شخصی

امکان تعریف الگوی فرم‌ها با انعطاف‌پذیری بالا

خواندن فرم‌های پر شده با مداد یا خودکار

ذخیره‌سازی بخشی از تصویر فرم به صورت تصویر واقعی به منظور بررسی صحت اطلاعات استخراج شده

سازگاری با انواع اسکنرها

طبقه‌بندی فرم‌های تشخیص داده شده در جدول‌های اطلاعاتی مختلف

امکان تعریف اجزای مرتبط با هم در یک فرم به منظور تایید صحت اطلاعات ثبت شده در فرم

امکان اصلاح دستی اطلاعات استخراج شده از فرم توسط کاربر

افزایش قدرت تصمیم و یادگیری سیستم در مرور زمان

امکان تعریف دست خط‌های خاص به مظور افزایش دقت سیستم

عدم حساسیت سیستم به چرخش کاغذ

آستانه‌ی تحمل بالا نسبت به نویزهای ایجاد شده در فرم بالاخص در زمان اسکن تصویر

 

 

دیدگاهها

هیچ دیدگاهی برای این محصول نوشته نشده است.

اولین نفری باشید که دیدگاهی را ارسال می کنید برای “سیستم هوشمند فرم خوان فارسی (OCR)”

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *