国内电信用本土芯片训练AI模型-icspec

国内电信用本土芯片训练AI模型

来源:ictimes 发布时间:2024-10-05

分享至微信

国内电信宣布成功利用国内AI芯片训练出两款大型语言模型（LLM），包括开源星辰语义大模型TeleChat2 115B和一款未命名的万亿参数模型。

这一成就标志着国内在AI技术自主研发方面取得了重要突破，尤其是在美国加强先进芯片出口管制的情况下。

据媒体报道，国内电信在自研的天翼云和星海AI平台上训练TeleChat2 115B，背后支撑的是数万颗国内芯片。TeleChat2 115B在开源模型综合能力榜单中夺得第一名，通用能力较同系列模型提升近30%。

关于万亿参数模型，国内电信未透露更多信息。同时，国内电信也未公开训练模型所使用的国内芯片供应商，但此前曾表示正在使用华为昇腾芯片进行LLM技术开发。

随着美国加大对国内获取先进芯片的出口管制，国内企业正加速推进AI技术自给自足，降低对外国芯片的依赖。

华为已向国内大型服务器业者发送昇腾处理器样品进行测试，而字节跳动也曾计划使用华为昇腾处理器训练LLM，但因供货速度和算力挑战而推迟新品开发时程。不过，字节跳动随后澄清称目前并未在开发新AI模型。

[ 新闻来源：ictimes，更多精彩资讯请下载icspec App。如对本稿件有异议，请联系微信客服specltkj]

全部评论

暂无评论哦，快来评论一下吧！

ictimes

聚焦于半导体行业芯闻

2024-10-05

2024-10-02

4 天前

2024-10-17

2024-11-07

热门搜索