跳到主要內容

新聞期別 :

關鍵字搜尋 :

AI辨識手寫軌跡 生成獨有書法字體
新知
第1775期
AI辨識手寫軌跡 生成獨有書法字體
2022-12-14
由左至右分別為團隊成員邱世宏、劉沛勳、楊奕炫、廖祥任、陳玟伃、霧峰農工電子科老師洪睿懌、頒獎人和指導老師張傳旺。 圖/書法大師團隊提供【記者何予綜合報導】「現在的年輕人很少寫字,都是透過電腦打字。」為推廣漢字之美並帶動書寫,勤益科技大學資訊工程系「書法大師」師生團隊,開發「空中揮毫書法生成系統」,透過模擬真實手寫狀態生成獨一無二的字,同時解決商用字體的版權問題。此系統在第四屆大手攜小手智慧創新應用競賽獲得冠軍。空中揮毫書法生成系統由「空中手寫辨識」和「漢字書法生成」兩部分組成。首先空中手寫辨識會利用MediaPipe(註一)手部追蹤模型,建立手部21個關節點,藉捕捉節點位置的改變,追蹤畫面中手部在空中揮動的軌跡圖形。接著,再由書法生成系統,將描繪出的圖形生成出具有書法風格的字型,「不用準備毛筆、宣紙、墨汁,透過電腦運算就能寫出書法字。」團隊成員楊奕炫補充。註一:MediaPipe 是一項多媒體機器學習模型應用框架,透過MediaPipe可以達到手部追蹤、人臉檢測或物體檢測等功能。 使用者在空中比劃出字型後,選擇想要生成的書法風格,便能夠將手寫軌跡生成出該風格的文字圖檔。 圖/書法大師團隊提供團隊透過生成對抗網路(Generative Adversarial Network,GAN)(註二)訓練「漢字書法生成」系統。楊奕炫以仿冒者和鑑別者作為比喻說明,團隊將書畫字帖作為資料給機器學習後,仿冒者會仿冒出類似的圖像,鑑別者則會鑑別仿冒圖和真實字帖的差異,「所以兩個網路一直對抗,就會讓模型成長得越好。」註二:生成對抗網路是深度學習中與人工神經網路相關的一項應用。相互對抗的生成網路與鑑別網路,可以大幅減少機器學習時需要的資料量。使用者只需對鏡頭書寫後選擇想要的字體,系統便會依手寫軌跡生成該風格字型。楊奕炫解釋,系統不會辨識手寫軌跡是什麼字,而是直接將圖轉換成圖,手寫字經過圖像編碼器後,會慢慢提取圖像特徵,經過圖像解碼器,一步步生成出書法風格的字型。 空中揮毫書法生成系統操作介面,使用者只需自備帶有攝影鏡頭的電腦,便可以在螢幕上看到描繪的字型和生成的結果。 圖/書法大師團隊提供「我們比較想解決的是商用字型,很多字型都要花高額的版權費。」指導老師張傳旺表示,將來此系統開放大眾免費使用,能提供設計師做出具有個人風格的字。因海報設計等製圖需求,而曾經購買商用字型的洪振嘉表示,在設計時為達到清晰傳遞資訊的考量,較少使用手寫風格的字體,即使使用也會為統一整體視覺,選擇每個字型樣式都經過精準設計的字體。「它固然是一個很好的嘗試、創新,但它不會改變字體製作、字體販賣的大環境。」洪振嘉說。張傳旺坦言:「觀眾對著鏡頭比劃,螢幕上就會出現,當然是娛樂效果比較大。」但他也表示,目前技術可以結合其他輸入方式,例如使用手寫板,或者直接將文字拍照上傳系統,便能有效率地生成字串,應用在製作春聯等用途。系統目前已可產出七種不同的書法字型,團隊未來將持續訓練系統,擴展應用範圍。
AI辨識郵遞區號 減輕信件分揀作業量
新知
第1768期
AI辨識郵遞區號 減輕信件分揀作業量
2022-10-19
「智能信件分配」系統會先將偵測到的信件除去雜訊與背景,再透過AI得出郵遞區號。 圖/黃柔語提供【記者詹晶雅綜合報導】面對三面環繞的分揀格,郵件分揀員平均僅有一至二秒分揀一份信件。國立虎尾科技大學資訊工程學系副教授簡銘伸帶領團隊開創「智能信件分配」系統,運用AI人工智慧辨識信件上的文字,再進行自動化分類,望能節省人力。此技術更在「2022年第二屆AI智能雲端運算應用競賽」榮獲優選與最佳人氣獎。團隊成員黃柔語說:「我們想到平時郵差的辛苦,需要一一分配上百封至上萬封的信件,如果我們能擁有辨識郵遞區號的技術,想必會大大減少郵差的工作量。」目前台灣郵局以人工與光學辨認系統相互搭配分揀郵件,不過光學辨認系統只能辨識印刷文字,無法識別出手寫文字,於是團隊著手研究智能信件分配,試圖改善郵政人員的工作現況。 由左二至右為國立虎尾科技大學資訊工程學系學生黃柔語、謝延偵、黃子瑋、黃柏原。 圖/黃柔語提供「把圖片變成灰階圖之後,可以做一些銳化補強影像學的技術,使圖像較好被辨識,包含一些雜訊、背景濾掉,把字體和背景明確地分開。」黃柔語解釋。此技術以圖形分析程式OpenCV(Open Source Computer Vision Library)處理信封影像,接著將收集到的資料匯入MNIST(Modified National Institute of Standards and Technology database)(註)彙整成數據集庫,再進行AI人工智慧的深度學習。如此一來,大批郵件經過智能信件分配系統識別後,即會依照郵遞區號自動分類。註:MNIST為手寫數字的大型數據庫,常用於訓練各種圖像處理系統,以及機器學習領域的培訓和測試。簡銘伸認為,儘管智能信件分配系統目前已取得不錯的成果,不過仍存在限制,「因為書寫的文字並不容易辨識,尤其是中文字體、字型,以及書寫的習慣,這是造成系統辨識準確度下降很大的因素。」他進一步說明,若能結合地理資訊和地圖資料,將郵寄地址與實際住址對比,或許可以提高智能信件分配系統的識別準確度。 郵務處理流程分為「收件、封發、運輸、投遞」四大部分,圖為民眾寫信之示意圖。  圖/詹晶雅攝曾任郵政工作者的阿明(化名)談到,「因為目前的機器設備有限,沒辦法完全負荷整天進來的郵件量,我們也會看情形,再決定交由機器還是人工去做分揀。」他進一步表示,郵政行業勞力密集,盼能透過最新技術改善舊有設備,達到全自動分揀的目標,以此降低人力與郵務成本。
OCR程式自動辨識文句 為視障者「念」出世界
新知
第1669期
OCR程式自動辨識文句 為視障者「念」出世界
2017-12-13
【記者廖翊庭綜合報導】人看不見世界該如何閱讀文字?視障者可透過點字系統辨識文件,目前也有掃描工具能供使用,但耗時較長且操作不易。為解決此狀況,義守大學資訊工程學系教授鄭志宏帶領7名學生製作一款整合性應用程式「OCR碎碎念」(Optical Character Recognition),只要使用智慧型手機即可閱讀文字。過去的視障閱讀輔具除了點字書、電子書閱讀系統,相關單位也曾推出視障隨身聽,讓視障朋友能利用手機直接借閱或下載書籍聆聽,但仍然有許多美中不足之處,例如查詢系統無法使用、應用程式當機、語速無法調整等等。鄭志宏表示,透過「OCR碎碎念」,視障者只需拿起智慧型手機,透過全語音模式拍攝文件,應用程式將會自動辨識文句,並以音量鍵控制語音播放,就能輕鬆閱讀單據、藥袋、商品、書報上的文字。 透過「OCR碎碎念」,只要使用智慧型手機即可閱讀文字。團隊成員教導視障者使用應用程式。  圖/義守大學提供鄭志宏表示,團隊與社團法人台灣公益聯盟合作,致力於服務視障朋友。他也提到,現代科技能夠迅速且有條理地處理大量資訊,也有優異的掃描工具辨識文件,卻沒有完整系統能提供視障者這些方便的功能,因此便著手研發適合視障者的影像處理技術來協助視覺上需要幫助的朋友閱讀。「OCR碎碎念」從偵測圖片、圖像處理到文字辨識,都須經過仔細運算。負責矯正輸入影像的資工系大陸交換生詹潤哲表示,考慮到視障者無法監控拍攝照片成效的情況下,輸入軟體的影像可能有扭曲、偏移,因此利用演算法矯正、使它接近一般的掃描圖像,以提升送入雲端辨識的準確率。詹潤哲說到,透過與視障者溝通,學習設身處地為他們著想,包括在設計操作介面及使用方式時,若是憑自己主觀臆測,結果可能忽略視障者已經習慣的操作介面。鄭志宏表示,「OCR碎碎念」除了嘉惠視障者之外,對視力逐漸退化的人也很實用,目前正在蒐集試用者的反饋持續改善軟體,預計明年年初上架,期待能造福更多有需要的朋友。
置頂