مژده: گوگل به سالهای طولانی انتظار ایرانیها برای داشتن یک برنامه کارای تبدیل عکس به متن فارسی OCR پایان داد!
بسیاری از موارد ما نیاز پیدا میکنیم که یک فایل گرافیکی را به متن تبدیل کنیم:
– دانشجو هستیم و لازم میشود ده – بیست صفحه از کتاب مرجع فارسی را به صورت تایپشده داشته باشیم. – محقق هستیم و لازم میشود به سرعت تایپشده دهها کتاب و مقاله را داشته باشیم، تا در فصت بعدی روی آنها تحقیق کنیم و ویرایششان کنیم. – یک کتاب و مجله قدیمی داریم و دوست داریم، این کتاب را در محیط اینترنت با دیگران به اشتراک بگذاریم. در همه این موارد نیاز به دستهای از نرمافزارها پیدا میشود به نام OCR یا Optical Character Recognition که به سرعت، یک فایل گرافیکی را هوشمندانه به متن تبدیل کند و ما را از مشقت تایپ کُند رها کند. گرچه سالهاست که OCRهای خوب به زبان انگلیسی و نیز تعداد قابل توجهی از زبانهای دیگر در دسترس بودند، اما به جرأت میتوانم بگویم که هیچ OCR خوبی به زبان فارسی در دسترس نبود. اما ششم ماه می –روز خوبی برای ما ایرانیها و نیز شهروندان دهها کشور دیگر دنیا بود. چرا؟ چون گوگل اعلام کرد که ویژگی OCR را برای ۲۰۰ زبان دنیا به گوگل درایو خود افزوده است! یعنی الان شما میتوانید یک فایل تصویری یا یک PDF اسکن شده به زبان فارسی را در گوگل درایو آپلود کنید و بعد از مدتی، فایل متنی فارسی، آن را با میزان دقت بسیار خوب و حداقل اشتباه دریافت کنید. پیداست که اگر وضوح اسکن یا عکس شما خیلی پایین باشد، OCR گوگل نمیتواند معجزه کند. اما طبق آزمایش من، OCR گوگل در وضوحهایی که OCRهای روتین، معمولا اشتباهات خیلی زیاد داشتند، به راحتی میتواند کار کند. کار با OCR گوگل آسان است: ۱- به گوگل درایو خود بروید و فایل مورد نظر را آپلود کنید. ۲- بعد از مدتی در کنار فایل آپلود شده اصلی، یک فایل متنی با اسم مشابه ایجاد میشود. ۳- روی این فایل راست کلیک کنید و از open with، گزینه google docs را انتخاب کنید و فایل متنی را دریافت کنید. البته باید خاطرنشان کنم که متنهای ایجادشده با این روش هنوز به ویرایش نهایی کاربر نیاز دارند. گاهی هم اختلالاتی مثل از قلم افتادن برخی از سطرها هنگام تبدیل به متن مشاهده میشوند. گاهی هم اگر پشتزمینه متن رنگی باشد، نتایج بسیار عجیب و غریب میشوند. مثلا: به نظر میرسد که اگر وضوح اسکن یا عکسهای دریافتی در حد متوسط باشند، دقت OCR گوگل بسیار قابل توجه است.
منبع سایت 1 پزشک |
@M.Mahdi 82488 گفته:
بابابزرگ من اینو درجواب به اینترنت رایگان نگفتم درجواب به آپلود چند صفحه باهم گفتم
گفتی به هرصورت از حجم ترافیک کم می کنه
خب می زنی شب که رایگان چند صفحه با هم اپلود بشه از ترافیکت هم کم نمی کنه
یا من خنگ شدم یا تو خنگ شدی:دی :دی :دی
چه خبرا داداش؟؟خوبی؟؟عاقا خیلی کم میایا
ممنون از خبر!
اگه سرعت نت بذاره خیلی عالی میشه... =_=
@M.Mahdi 82451 گفته:
میگم اگه واقعا اینقدر خوبه میتونیم توی پروژه های تایپ فایلای اسکنو بجای تایپیست بدیم به گوگل نه؟ البته کتابای کم حجمو :-"
البته نمیدونم گوگل چقدر معطل میکنه تا متنو بده ٬ ولی فک کنم باز از سرعت تایپ یه صفحه بیشتر باشه نه؟
ببینم می تونین بازار کار ما رو کساد کنین یا نه! :دی
@Leyla 82492 گفته:
ممنون از خبر!
اگه سرعت نت بذاره خیلی عالی میشه... =_=
ببینم می تونین بازار کار ما رو کساد کنین یا نه! :دی
لیلا من دیگه تایپ نکنم از خدامم هست درباره بازار کار خودت بحرف :دی ( ن اینکه نصف پرژه ها کار منه خسته شدم )
راستی یک چیزی توی یکی از سایتها دیدم نوشته عکسهای با کیفیت اسکن متوسط بهتر تبدیل به متن میشن.
@Leyla 82492 گفته:
ممنون از خبر!
اگه سرعت نت بذاره خیلی عالی میشه... =_=
ببینم می تونین بازار کار ما رو کساد کنین یا نه! :دی
دیه ماشینی شدن صنعت بیکاری رو به همراه داره ((3))
من آینده نگر بودم زدم تو کار گرافیک ((204))((204))((204))