Meta软件工程师陈鹏仁26日晚间与台湾媒体进行在线记者会,亲身解释Meta闽南语与英语互译系统的发展历程。除指出后续精进方向,也提到开民宿的伯父看到新闻报导后,询问何处可购买闽英翻译机,盼与外籍旅客直接沟通,显示未来应用潜力大。
陈鹏仁表示自己是新北市板桥人,台大资工所毕业后,服完兵役后,前往Meta纽约办公室工作,至今约10年。父亲来自屏东,父母都讲台语;有两个女儿,分别是4岁半和1岁半。即便在美国,平日尽量多与她们讲台语,并使用台语绘本念故事给她们听,希望将台语学习自然融入生活中。
当初加入Meta就是想做机器学习相关工作,前6年主要开发产品相关项目,像是Facebook上打卡和地点推荐等功能。4年前加入AI团队,目前是其中Universal Speech Translator小组。以Meta此次发表的论文而言,成员约10人左右,但整个团队更大、约达50人。
计划历程
Meta AI 技术支持的非书写语音翻译系统计划自3~4年前开始发展,初期是开发语音到文字的翻译系统,后来转而开发语音到语音翻译,盼降低现实及元宇宙世界中的语言隔阂。
以台语作为该计划首发标的,是否曾遭主管反对?陈鹏仁说「完全没有。」团队中很多成员会听或讲台语,而当研发人员与研究主题有深刻连结时,会更有工作动力,也能加速研发过程。
正如台大电机系副教授李宏毅受访时所言,Meta团队使用到其提供的30,000小时台湾闽南语连续剧语料,以及阳明交大教授廖元甫所建构的数据库。另有台语老师协助团队,提升翻译精准度。
台语目前尚无标准化书写系统,语音数据搜集是最具挑战的部分;训练AI模型也不容易,因语音数据包含大量信息,且台语包含七声八调、相对复杂的变调规则是语音识别特别难解决的部分。
后续改善方向
陈鹏仁说,成果公布前,可想像会引起一定关注,但没想到在台湾的讨论程度会如此热烈,近日也收到许多亲朋好友的热烈关注。其中,开民宿的伯父透过父亲询问,哪里可买到闽英互译的翻译机,因民宿有许多外籍旅客,其希望可藉翻译机用台语和外国人沟通。
陈鹏仁坦言,目前系统只能一次一个句子翻译,无法实时翻译长篇对话,且英语到台语的翻译效果较差,显示仍有许多精进方向。
至于未来是否可能纳入客家话或原住民语等其他台湾在地语言?陈鹏仁表示团队还在讨论下一标的,客语确实是考虑的语言之一,会评估不同因素来决定哪些语言优先发展,再继续扩大研究范围。
责任编辑:张兴民
暂无评论哦,快来评论一下吧!