Header Background day #18
آگاه‌سازی‌ها
پاک‌کردن همه

ocr فارسی!

2 ارسال‌
2 کاربران
6 Reactions
235 نمایش‌
captainlevi13772
(@captainlevi13772)
Trusted Member
عضو شده: 6 سال قبل
ارسال‌: 80
شروع کننده موضوع  
مژده: گوگل به سال‌های طولانی انتظار ایرانی‌ها برای داشتن یک برنامه کارای تبدیل عکس به متن فارسی OCR پایان داد!!

بسیاری از موارد ما نیاز پیدا می‌کنیم که یک فایل گرافیکی را به متن تبدیل کنیم:

– دانشجو هستیم و لازم می‌شود ده – بیست صفحه از کتاب مرجع فارسی را به صورت تایپ‌شده داشته باشیم.

– محقق هستیم و لازم می‌شود به سرعت تایپ‌شده ده‌ها کتاب و مقاله را داشته باشیم، تا در فصت بعدی روی آنها تحقیق کنیم و ویرایش‌شان کنیم.

– یک کتاب و مجله قدیمی داریم و دوست داریم، این کتاب را در محیط اینترنت با دیگران به اشتراک بگذاریم.

در همه این موارد نیاز به دسته‌ای از نرم‌افزارها پیدا می‌شود به نام OCR یا Optical Character Recognition که به سرعت، یک فایل گرافیکی را هوشمندانه به متن تبدیل کند و ما را از مشقت تایپ کُند رها کند.

گرچه سالهاست که OCRهای خوب به زبان انگلیسی و نیز تعداد قابل توجهی از زبان‌های دیگر در دسترس بودند، اما به جرأت می‌توانم بگویم که هیچ OCR خوبی به زبان فارسی در دسترس نبود.

اما ششم ماه می –روز خوبی برای ما ایرانی‌ها و نیز شهروندان ده‌ها کشور دیگر دنیا بود. چرا؟

چون گوگل اعلام کرد که ویژگی OCR را برای ۲۰۰ زبان دنیا به گوگل درایو خود افزوده است!

یعنی الان شما می‌توانید یک فایل تصویری یا یک PDF اسکن شده به زبان فارسی را در گوگل درایو آپلود کنید و بعد از مدتی، فایل متنی فارسی، آن را با میزان دقت بسیار خوب و حداقل اشتباه دریافت کنید.

پیداست که اگر وضوح اسکن یا عکس شما خیلی پایین باشد، OCR گوگل نمی‌تواند معجزه کند. اما طبق آزمایش من، OCR گوگل در وضوح‌هایی که OCRهای روتین، معمولا اشتباهات خیلی زیاد داشتند، به راحتی می‌تواند کار کند.

کار با OCR گوگل آسان است:
۱- به گوگل درایو خود بروید و فایل مورد نظر را آپلود کنید.

۲- بعد از مدتی در کنار فایل آپلود شده اصلی، یک فایل متنی با اسم مشابه ایجاد می‌شود.

۳- روی این فایل راست کلیک کنید و از open with، گزینه google docs را انتخاب کنید و فایل متنی را دریافت کنید.

البته باید خاطرنشان کنم که متن‌های ایجادشده با این روش هنوز به ویرایش نهایی کاربر نیاز دارند. گاهی هم اختلالاتی مثل از قلم افتادن برخی از سطرها هنگام تبدیل به متن مشاهده می‌شوند.

گاهی هم اگر پشت‌زمینه متن رنگی باشد، نتایج بسیار عجیب و غریب می‌شوند. مثلا:
تالارگفتمان 1
تالارگفتمان 2
به نظر می‌رسد که اگر وضوح اسکن یا عکس‌های دریافتی در حد متوسط باشند، دقت OCR گوگل بسیار قابل توجه است.

منبع سایت 1پزشک


   
ida7lee2، vania، Michael و 1 نفر دیگر واکنش نشان دادند
نقل‌قول
Michael
(@wingknight)
Honorable Member
عضو شده: 6 سال قبل
ارسال‌: 536
 

داداشی خودت مطلبو مبنوشتی خوشحال میشدم
من دیشب امتحان کردم
خیلی کار راه میندازه دقتشم خیلی بالاس و فقط گاهی اوقات ی اضاف میزد همین
ولی همینم وقت گیره اگه تصاویر با وضوحنباشه دردسر داره یعنی اصلا هیچ چیز مرتبطی نمیده
بیشتر به درده تصاویری میخوره که از نت میگیرین
و اگه وضوح دوربین گوشی بالاس در شرایط خوب از صفحه کتاب هم عکس بگیرین جواب میده
..
این عکسیه که من دیشب گرفتم البته بهتر از اینم بود ولی پاک کردم با این کیفیت هم جواب میده
تالارگفتمان 3


   
ida7lee2 و captainlevi13772 واکنش نشان دادند
پاسخنقل‌قول
اشتراک: