国内电信用本土芯片训练AI模型
来源:ictimes 发布时间:19 小时前 分享至微信

国内电信宣布成功利用国内AI芯片训练出两款大型语言模型(LLM),包括开源星辰语义大模型TeleChat2 115B和一款未命名的万亿参数模型。


这一成就标志着国内在AI技术自主研发方面取得了重要突破,尤其是在美国加强先进芯片出口管制的情况下。


据媒体报道,国内电信在自研的天翼云和星海AI平台上训练TeleChat2 115B,背后支撑的是数万颗国内芯片。TeleChat2 115B在开源模型综合能力榜单中夺得第一名,通用能力较同系列模型提升近30%。


关于万亿参数模型,国内电信未透露更多信息。同时,国内电信也未公开训练模型所使用的国内芯片供应商,但此前曾表示正在使用华为昇腾芯片进行LLM技术开发。


随着美国加大对国内获取先进芯片的出口管制,国内企业正加速推进AI技术自给自足,降低对外国芯片的依赖。


华为已向国内大型服务器业者发送昇腾处理器样品进行测试,而字节跳动也曾计划使用华为昇腾处理器训练LLM,但因供货速度和算力挑战而推迟新品开发时程。不过,字节跳动随后澄清称目前并未在开发新AI模型。


[ 新闻来源:ictimes,更多精彩资讯请下载icspec App。如对本稿件有异议,请联系微信客服specltkj]
存入云盘 收藏
举报
全部评论

暂无评论哦,快来评论一下吧!