Google推出InkSight,手写识别技术再升级
来源:ictimes 发布时间:2024-11-07 分享至微信

Google针对手写文字用户推出全新技术InkSight,该技术结合了Vision Transformer(ViT)文字识别模型与MetaTrader 5(mT5)语言模型,实现了手写文字的数码化保存与多项特性。


InkSight能在保留原始笔迹外观的同时,使手写文字具备可加索引、可被查找、云端储存、轻松编辑等特性,并与其他数码工具整合。


与过去的手写文字识别技术不同,InkSight先阅读与理解文字,再重现并记录在系统之中。人类测试员评估结果显示,InkSight所描绘的样本有效率达87%,67%的样本被认为与原本的人类手写字无区别。


此外,InkSight还能根据光线不足、背景凌乱或文字不清楚等情况自动调整,处理不同视觉特征和背景的图片中的文字识别与数码化任务。


InkSight的出现拓展了未来人机互动的更多可能性,让用户可通过手写文字直接与电脑互动。在学术领域,该技术可协助研究人员或历史学家数码化并分析手写文字档案,同时也可保存和数码化小众语种的手写内容。


InkSight展示了结合既有资源打造创新AI应用的可能性,尽管目前识别能力并非无懈可击,但其便利性和应用潜力仍备受瞩目。


[ 新闻来源:ictimes,更多精彩资讯请下载icspec App。如对本稿件有异议,请联系微信客服specltkj]
存入云盘 收藏
举报
全部评论

暂无评论哦,快来评论一下吧!