Meta陈鹏仁现身说法 AI翻译台语改进方向
来源:林佳楠 发布时间:2022-10-27 分享至微信


Meta软件工程师陈鹏仁26日在在线记者会中,展现平日念故事给女儿听的台语绘本。Meta
Meta软件工程师陈鹏仁26日在在线记者会中,展现平日念故事给女儿听的台语绘本。Meta

Meta软件工程师陈鹏仁26日晚间与台湾媒体进行在线记者会,亲身解释Meta闽南语与英语互译系统的发展历程。除指出后续精进方向,也提到开民宿的伯父看到新闻报导后,询问何处可购买闽英翻译机,盼与外籍旅客直接沟通,显示未来应用潜力大。


个人背景


陈鹏仁表示自己是新北市板桥人,台大资工所毕业后,服完兵役后,前往Meta纽约办公室工作,至今约10年。父亲来自屏东,父母都讲台语;有两个女儿,分别是4岁半和1岁半。即便在美国,平日尽量多与她们讲台语,并使用台语绘本念故事给她们听,希望将台语学习自然融入生活中。


当初加入Meta就是想做机器学习相关工作,前6年主要开发产品相关项目,像是Facebook上打卡和地点推荐等功能。4年前加入AI团队,目前是其中Universal Speech Translator小组。以Meta此次发表的论文而言,成员约10人左右,但整个团队更大、约达50人。


计划历程


Meta AI 技术支持的非书写语音翻译系统计划自3~4年前开始发展,初期是开发语音到文字的翻译系统,后来转而开发语音到语音翻译,盼降低现实及元宇宙世界中的语言隔阂。


以台语作为该计划首发标的,是否曾遭主管反对?陈鹏仁说「完全没有。」团队中很多成员会听或讲台语,而当研发人员与研究主题有深刻连结时,会更有工作动力,也能加速研发过程。


正如台大电机系副教授李宏毅受访时所言,Meta团队使用到其提供的30,000小时台湾闽南语连续剧语料,以及阳明交大教授廖元甫所建构的数据库。另有台语老师协助团队,提升翻译精准度。


台语目前尚无标准化书写系统,语音数据搜集是最具挑战的部分;训练AI模型也不容易,因语音数据包含大量信息,且台语包含七声八调、相对复杂的变调规则是语音识别特别难解决的部分。


后续改善方向


陈鹏仁说,成果公布前,可想像会引起一定关注,但没想到在台湾的讨论程度会如此热烈,近日也收到许多亲朋好友的热烈关注。其中,开民宿的伯父透过父亲询问,哪里可买到闽英互译的翻译机,因民宿有许多外籍旅客,其希望可藉翻译机用台语和外国人沟通。


陈鹏仁坦言,目前系统只能一次一个句子翻译,无法实时翻译长篇对话,且英语到台语的翻译效果较差,显示仍有许多精进方向。


至于未来是否可能纳入客家话或原住民语等其他台湾在地语言?陈鹏仁表示团队还在讨论下一标的,客语确实是考虑的语言之一,会评估不同因素来决定哪些语言优先发展,再继续扩大研究范围。



责任编辑:张兴民

[ 新闻来源:DIGITIMES科技网,更多精彩资讯请下载icspec App。如对本稿件有异议,请联系微信客服specltkj]
存入云盘 收藏
举报
全部评论

暂无评论哦,快来评论一下吧!