智源研究院评国内大模型:接近国际水平,但发展不均
来源:ictimes 发布时间:2024-05-20 分享至微信

5月18日,智源研究院发布了其对国内外140余个开/闭源语言及多模态大模型的评测结果。此次评测涵盖了中文语境下的多种能力表现。

结果显示,国内头部语言模型在中文语境下的综合表现已与国际一流水平相近,但各模型间能力发展存在不均衡现象。在中文语境下的语言模型评测中,字节跳动豆包Skylark2和OpenAI GPT-4表现最为出色,而国产大模型也展现出对中国用户的深度理解。百度文心一言4.0、智谱华章GLM-4和月之暗面Kimi等国产模型均跻身前五。

多模态理解模型方面,国产模型在图文问答任务上表现突出,与开源模型平分秋色。阿里巴巴通义Qwen-vl-max和上海人工智能实验室InternVL-Chat-V1.5在多模态图文问答任务上超越OpenAI GPT-4,其他如LLaVA-Next-Yi-34B和Intern-XComposer2-VL-7B也紧随其后。

智源研究院的这次评测不仅揭示了国内大模型的能力水平,也指出了其存在的挑战和机遇,为未来的研发和应用提供了重要参考。

[ 新闻来源:ictimes,更多精彩资讯请下载icspec App。如对本稿件有异议,请联系微信客服specltkj]
存入云盘 收藏
举报
全部评论

暂无评论哦,快来评论一下吧!