国内电信用本土芯片训练AI模型
来源:ictimes 发布时间:2024-10-05 分享至微信
国内电信宣布成功利用国内AI芯片训练出两款大型语言模型(LLM),包括开源星辰语义大模型TeleChat2 115B和一款未命名的万亿参数模型。
这一成就标志着国内在AI技术自主研发方面取得了重要突破,尤其是在美国加强先进芯片出口管制的情况下。
据媒体报道,国内电信在自研的天翼云和星海AI平台上训练TeleChat2 115B,背后支撑的是数万颗国内芯片。TeleChat2 115B在开源模型综合能力榜单中夺得第一名,通用能力较同系列模型提升近30%。
关于万亿参数模型,国内电信未透露更多信息。同时,国内电信也未公开训练模型所使用的国内芯片供应商,但此前曾表示正在使用华为昇腾芯片进行LLM技术开发。
随着美国加大对国内获取先进芯片的出口管制,国内企业正加速推进AI技术自给自足,降低对外国芯片的依赖。
华为已向国内大型服务器业者发送昇腾处理器样品进行测试,而字节跳动也曾计划使用华为昇腾处理器训练LLM,但因供货速度和算力挑战而推迟新品开发时程。不过,字节跳动随后澄清称目前并未在开发新AI模型。
[ 新闻来源:ictimes,更多精彩资讯请下载icspec App。如对本稿件有异议,请联系微信客服specltkj]
存入云盘 收藏
举报
全部评论
暂无评论哦,快来评论一下吧!
ictimes
聚焦于半导体行业芯闻
查看更多
相关文章
受美国AI芯片出口限制,字节跳动采用华为昇腾训练AI模型
2024-10-05
国内力推本土AI芯片,应对外部挑战
2024-10-02
和硕OCP峰会展出新款AI服务器,专注AI和大语言模型训练
2024-10-17
Waymo利用Google Gemini,革新自驾车训练模型
2024-11-07
热门搜索