長問科技總經理陳又碩看到了台灣本土語言在AI時代面臨的危機,特別是台語與華語語料庫之間高達73倍的巨大落差。為了防止母語在AI時代失聲,他毅然投入本土語AI技術的開發,決心拾起大型科技公司不願做的「苦力活」,致力於建立台灣本土語音語料庫。
在商業化過程中,陳又碩面臨了多重挑戰。首先,建立本土語言的語料庫需要大量的時間與人力,他們必須深入台灣各地鄉鎮進行「數位田野調查」,同時架設多支麥克風以模擬不同情境下的收音效果,並請語言專家現場糾正。這種「笨功夫」式的資料收集方式,與大型科技公司追求規模化和低成本的通用模型截然不同。
面對這些挑戰,陳又碩採取了多種策略:
透過這些努力,長問科技的營收開始翻倍成長,公司也轉虧為盈。鴻海、台灣大哥大、中華電信與三商電腦等都成為合作夥伴,共同將本土語AI辨識系統導入更多場域。陳又碩的努力不僅為台灣的本土語言保存貢獻了一份力量,也為其他面臨語言斷層危機的地區,提供了一個可參考的模式。
This is a simplified version of the page. Some interactive features are only available in the full version.
本頁為精簡版,部分互動功能僅限完整版使用。
👉 View Full Version | 前往完整版內容