توضیحات
سامانه هوشمند فرم خوان فارسی سیستمی است که قادر به تشخیص فایل های تایپی و ارقام دست نویس با دقت بالاتر از 95% میباشد.
معرفی
همگام با پیشرفت و مکانیزه شده امور مختلف و کنارگذاشتن کاغذ و تبدیل آنها به فایلهای دیجیتالی نیاز به نرمافزارهای هوشمندی که بتواند روند ورود اطلاعات به رایانه را بدون دخالت انسان انجام دهد ضروری به نظر میرسد. این سیستمها بر اساس روشهای هوش مصنوعی عمل میکنند. سامانه تولید شده قادر به تشخیص انواع فرمهای دست نویس و استخراج اطلاعات متنی و عددی از آنها میباشد.
این سیستم تصاویر اسکن شده را به عنوان ورودی دریافت نموده و پس از پردازش آنها با سرعت بالا، اطلاعات متنی، عددی و همچنین گزینههای انتخابی موجود بر روی فرم را تشخیص داده و وارد بانک اطلاعاتی مینماید. نام علمی این فرآیند را اصطلاحاً Optical Character Recognition-OCR گویند که از الگوریتمهای هوشمند در جهت تبدیل تصویر به متن استفاده میشود. در این سیستم امکان تعریف فرمهای متعدد از طریق یک سیستم فرم ساز وجود دارد که در آن بر روی تصویر فرم خام اسکن شده محلهای متن، اعداد و نوع آنها از قبیل روز، ماه، سال، کد ملی و عدد ساده و همچنین محل آیتمهای انتخابی مانند گزینهها قابل تعریف میباشد.
تفاوت قابل ملاحظهی این سامانه با سامانههای کاهش محدودیتهاست. محدودیتهایی از جمله اینکه فرمها بایستی حتما با خودکار یا مدادی با رنگ مشخص پر شود و همچنین بخشهای مختلف فرمها بایستی با رنگ خاصی مانند قرمز طراحی شود تا ارقام داخل آن قابل تشخیص باشد. علاوه بر این بسیاری از سامانههای مشابه نسبت به چرخش یا تغییر اندازهی فرمها حساس میباشند حال اینکه در سامانهی معرفی شده این محدودیتها وجود ندارد.
سرعت پردازش در این سامانه بسیار بالا است به شکلی که میتوان فرمهای بسیاری را با استفاده از دستگاههای اسکنر با سرعت بالا وارد سیستم نموده و به سرعت پردازش نماید. این سیستم قابلیت اتصال به بانکهای اطلاعاتی متعدد از قبیل SQL Server را به منظور ورود اطلاعات خوانده شده به بانکاطلاعاتی دارد. ارتباط اجزای فرم با بخشهای مختلف بانک اطلاعاتی به صورت پویا و انعطاف پذیر در بخش فرم ساز سامانه قابل تعریف میباشد.
مزایا و قابلیتهای سیستم
تشخیص ارقام دست نویس فارسی و فایل تایپی فارسی با دقت بالای 95 درصد
سرعت پردازش لحظهای (Real-Time)
عدم وابستگی به سایز، ابعاد و شیوه نوشتن
تشخیص و خواندن چکمارکها، اشکال و علائم مانند پاسخنامهها و فرمهای اطلاعات شخصی
امکان تعریف الگوی فرمها با انعطافپذیری بالا
خواندن فرمهای پر شده با مداد یا خودکار
ذخیرهسازی بخشی از تصویر فرم به صورت تصویر واقعی به منظور بررسی صحت اطلاعات استخراج شده
سازگاری با انواع اسکنرها
طبقهبندی فرمهای تشخیص داده شده در جدولهای اطلاعاتی مختلف
امکان تعریف اجزای مرتبط با هم در یک فرم به منظور تایید صحت اطلاعات ثبت شده در فرم
امکان اصلاح دستی اطلاعات استخراج شده از فرم توسط کاربر
افزایش قدرت تصمیم و یادگیری سیستم در مرور زمان
امکان تعریف دست خطهای خاص به مظور افزایش دقت سیستم
عدم حساسیت سیستم به چرخش کاغذ
آستانهی تحمل بالا نسبت به نویزهای ایجاد شده در فرم بالاخص در زمان اسکن تصویر