วันอังคารที่ 18 มกราคม พ.ศ. 2554

OCR เป็นเทคนิคการถอดข้อความ

OCR เป็นเทคนิคการถอดข้อความที่อยู่บนรูปภาพออกมาเป็นข้อความที่เป็นไฟล์ txt จริงๆ ซึ่งผมเคยได้พูดถึงละเอียดพอควรเกี่ยวกับ OCR ซึ่งในบทความนี้ก็เป็นการแนะนำโปรแกรมสำหรับ OCR หรือใช้ถอดข้อความออกจากภาพนั้นเอง สำหรับโปรแกรมตัวนี้คือ FreeOCR เป็นโปรแกรมฟรีท่านสามารถดาวน์โหลดไปใช้งานได้ฟรีๆ

หน้าตาโปรแกรม FreeOCR

การใช้งานสามารถใช้ได้หลายรูปแบบ ไม่ว่าจะเป็นการแปลงจากเครื่อง scan จากรูปภาทุกรูปแบบ และจากไฟล์ pdf ซึ่งจากรูปผมทดสอบสร้างรูปภาพขึ้นมมา โดยพิมพ์ข้อความเข้าไปเล็กน้อย แล้วทำการ OCR รูปภาพนี้ เมื่อเรากดปุ่ม OCR โปรแกรมก็จะทำการถอดตัวอักษรออกจากรูปภาพ ซึ่งอาจจะมีผิดบ้าง ดังตัวอย่างที่ดึงตัว o มาเป็น 0 (เลขศูนย์)
ในส่วนฟังก์ชั่นอื่นๆของโปรแกรม FreeOCR
  • สามารถแสกนจากเครื่อง SCAN ได้ที่ความละเอยด 300dpi
  • สนับสนุนไฟล์รูปภาพทุกชนิดไฟล์ เช่น jpg png tif bmp เป็นต้น
  • เป็นโปรแกรมฟรี โดยใช้ Engine จาก Tesseract OCR
  • การใช้งานโปรแกรมตัวนี้ไม่จำเป็นต้องมีโปรแกรมช่วย เช่น พวก Ghostscript or Adobe Acrobat หรือ .Net
  • ใชได้กับ Windows 2000, 2003, XP, Vista, Win 7
  • ลองรับภาษา Portuguese (Brazilian), Fraktur (Old German), Dutch, Spanish, German, Italian, Vietnamese, French and English.
ดาวน์โหลดโปรแกรม FreeOCR 


Tags: , , , , , , , , , , , | Category: Convertor | Comments: None

ไม่มีความคิดเห็น:

แสดงความคิดเห็น