龙芯中科研制成功新一代处理器龙芯3A6000
来源:半导体产业纵横 发布时间:2023-08-02 分享至微信

本文由半导体产业纵横(ID:ICVIEWS)综合


龙芯3A6000的研制成功代表了我国自主桌面CPU设计领域的最新里程碑成果。

日,基于龙架构的新一代四核处理器龙芯3A6000流片成功,代表了我国自主桌面CPU设计领域的最新里程碑成果。

根据中国电子技术标准化研究院赛西实验室测试结果,龙芯3A6000四核处理器在2.5GHz运行频率下,SPEC CPU 2006 base单线程定/浮点分值分别达到43.1/54.6分,SPEC CPU 2006 base多线程定/浮点分值分别达到155/140分,双DDR4-3200内存通道Stream实测带宽超过42GB/s,Unixbench实测分值超7400分。综合相关测试结果,龙芯3A6000处理器总体性能与Intel公司2020年上市的第10代酷睿四核处理器相当。

注:上述测试结果基于龙芯3A6000 4核8线程2.5GHz CPU,8GB DDR4 3200内存,256 NVME硬盘,Loongnix(V20.4)操作系统,LoongArch64 gcc8.3编译器测试平台。

龙芯3A6000处理器采用龙芯自主指令系统龙架构(LoongArchTM)。龙架构从顶层架构,到指令功能和ABI标准等,全部自主设计,无需国外授权。龙架构得到了上百个与指令系统相关的国际软件开源社区的支持,得到了统信、麒麟、欧拉、龙蜥、鸿蒙等操作系统的支持,得到了WPS、微信、QQ、钉钉、腾讯会议等基础应用的支持,已形成与X86、ARM等并列的基础软件生态。

龙芯3A6000处理器是龙芯第四代微架构的首款产品,集成4个最新研发的高性能6发射64位LA664处理器核。主频达到2.5GHz,支持128位向量处理扩展指令(LSX)和256位高级向量处理扩展指令(LASX),支持同时多线程技术(SMT2),全芯片共8个逻辑核。龙芯3A6000片内集成双通道DDR4-3200控制器,集成安全可信模块,可提供安全启动方案和国密(SM2、SM3、SM4等)应用支持。

较上一代龙芯3A5000桌面CPU,龙芯3A6000在相同工艺下单线程性能提升60%以上,全芯片多线程性能成倍提升,为用户带来更极速的性能体验。龙芯中科正在研发的服务器CPU将比上一代16核龙芯3C5000以及32核龙芯3D5000服务器CPU性能成倍提升。

龙芯3A6000与龙芯3A5000等龙架构CPU实现软件兼容。日前,龙芯向Linux内核上游社区提交了支持3A6000超线程功能的补丁,以支持对3A6000超线程功能检测和调度的增强特性。龙芯3A6000进一步完善和提升了软硬协同的二进制翻译水平,可以运行更多跨平台应用,并满足各类大型复杂桌面应用场景。

龙芯3A6000的研制成功表明,在芯片设计领域只要坚持刻苦钻研、潜心积累,并结合市场需求不断迭代,自主研发CPU的性能完全可以达到世界先进水平。

日前,在龙芯中科召开2023年第一季度业绩说明会时,董事长胡伟武曾宣布,下一代龙芯3B6000处理器将会采用4个大核+4个小核的8核CPU架构,并且会首发集成龙芯自研的GPU(通用图形处理器),预计将于2024年一季度流片。胡伟武透露:“目前已经基本完成相关IP研发,正在开展全面验证,在此基础上,2024年下半年将完成兼顾显卡和算力加速功能的专用芯片流片。”

胡伟武表示,目前提高主频和提高计算效率是提高CPU整体性能的两大方向。因此也有两条技术路线,比如苹果的M1,每GHz的SPEC CPU2006定点单线程分值达到24分,但主频只有3GHz;比如英特尔的桌面CPU,主频高达5GHz以上,但每GHz的分值15-20分之间。而龙芯选择的方向是与苹果一样的提升CPU计算效率的路线。

另外,胡伟武在业绩会上还表示,在3B6000的基础上,后续的3A7000或3B7000会采用更先进工艺,今年下半年将会开展更先进工艺的技术准备工作,由于龙芯坚持自研IP,需要定制内存接口、PCIE接口等PHY,大致需要1年时间。

值得注意的是,去年7月,龙芯正式发布了全新的配套桥片7A2000,这是配套龙芯3号处理器使用的芯片,大约相当于以往我们常说的南桥和北桥的作用,不过本代桥片当中除了升级了I/O传输的性能以外,还添加了龙芯自研的GPU核心,可以直接形成独显的解决方案,支持直接输出图形显示信号并满足基本的图形运算需求。

根据龙芯官方的消息,7A2000桥片首次集成龙芯自研统一渲染架构的GPU模块,GPU核心频率达到400-500Mhz,基于OpenGL 2.1和OpenGL ES 2.0规范实现,集成DDR4显存控制器,显存频率达到2000Mhz-2400Mhz,最大支持16GB;支持两路显示,典型分辨率1920X1080@60Hz 最高支持2560x1440@30Hz,glmark2性能超过300 fps,glxgears 性能超过1800 fps;可满足桌面办公领域需求。桥片中的GPU模块搭配独立显存,可形成独显方案,提高龙芯计算机的性价比。

[ 新闻来源:半导体产业纵横,更多精彩资讯请下载icspec App。如对本稿件有异议,请联系微信客服specltkj]
存入云盘 收藏
举报
全部评论

暂无评论哦,快来评论一下吧!