智源研究院评国内大模型：接近国际水平，但发展不均-icspec

智源研究院评国内大模型：接近国际水平，但发展不均

来源:ictimes 发布时间:2024-05-20

分享至微信

5月18日，智源研究院发布了其对国内外140余个开/闭源语言及多模态大模型的评测结果。此次评测涵盖了中文语境下的多种能力表现。

结果显示，国内头部语言模型在中文语境下的综合表现已与国际一流水平相近，但各模型间能力发展存在不均衡现象。在中文语境下的语言模型评测中，字节跳动豆包Skylark2和OpenAI GPT-4表现最为出色，而国产大模型也展现出对中国用户的深度理解。百度文心一言4.0、智谱华章GLM-4和月之暗面Kimi等国产模型均跻身前五。

多模态理解模型方面，国产模型在图文问答任务上表现突出，与开源模型平分秋色。阿里巴巴通义Qwen-vl-max和上海人工智能实验室InternVL-Chat-V1.5在多模态图文问答任务上超越OpenAI GPT-4，其他如LLaVA-Next-Yi-34B和Intern-XComposer2-VL-7B也紧随其后。

智源研究院的这次评测不仅揭示了国内大模型的能力水平，也指出了其存在的挑战和机遇，为未来的研发和应用提供了重要参考。

icspec【芯片求购】https://www.icspec.com/inquiry/index/1/0

[ 新闻来源：ictimes，更多精彩资讯请下载icspec App。如对本稿件有异议，请联系微信客服specltkj]