政大大學報

OCR程式自動辨識文句 為視障者「念」出世界

2017/12/13 22:09:27

【記者廖翊庭綜合報導】人看不見世界該如何閱讀文字?視障者可透過點字系統辨識文件,目前也有掃描工具能供使用,但耗時較長且操作不易。為解決此狀況,義守大學資訊工程學系教授鄭志宏帶領7名學生製作一款整合性應用程式「OCR碎碎念」(Optical Character Recognition),只要使用智慧型手機即可閱讀文字。

過去的視障閱讀輔具除了點字書、電子書閱讀系統,相關單位也曾推出視障隨身聽,讓視障朋友能利用手機直接借閱或下載書籍聆聽,但仍然有許多美中不足之處,例如查詢系統無法使用、應用程式當機、語速無法調整等等。鄭志宏表示,透過「OCR碎碎念」,視障者只需拿起智慧型手機,透過全語音模式拍攝文件,應用程式將會自動辨識文句,並以音量鍵控制語音播放,就能輕鬆閱讀單據、藥袋、商品、書報上的文字。

透過「OCR碎碎念」,只要使用智慧型手機即可閱讀文字。團隊成員教導視障者使用應用程式。  圖/義守大學提供
透過「OCR碎碎念」,只要使用智慧型手機即可閱讀文字。團隊成員教導視障者使用應用程式。  圖/義守大學提供

鄭志宏表示,團隊與社團法人台灣公益聯盟合作,致力於服務視障朋友。他也提到,現代科技能夠迅速且有條理地處理大量資訊,也有優異的掃描工具辨識文件,卻沒有完整系統能提供視障者這些方便的功能,因此便著手研發適合視障者的影像處理技術來協助視覺上需要幫助的朋友閱讀。

「OCR碎碎念」從偵測圖片、圖像處理到文字辨識,都須經過仔細運算。負責矯正輸入影像的資工系大陸交換生詹潤哲表示,考慮到視障者無法監控拍攝照片成效的情況下,輸入軟體的影像可能有扭曲、偏移,因此利用演算法矯正、使它接近一般的掃描圖像,以提升送入雲端辨識的準確率。

詹潤哲說到,透過與視障者溝通,學習設身處地為他們著想,包括在設計操作介面及使用方式時,若是憑自己主觀臆測,結果可能忽略視障者已經習慣的操作介面。鄭志宏表示,「OCR碎碎念」除了嘉惠視障者之外,對視力逐漸退化的人也很實用,目前正在蒐集試用者的反饋持續改善軟體,預計明年年初上架,期待能造福更多有需要的朋友。