Meta推出开源程序设计模型 挑战微软GitHub Copilot
来源:蔡静珊 发布时间:2023-08-25
分享至微信

Meta宣布将推出一系列可协助撰写电脑程序码的开源人工智能(AI)大型语言模型(LLM),提供外界免费使用,有望成为由OpenAI修改过的GPT-3模型所驱动的Codex、由Codex所驱动的微软(Microsoft)GitHub Copilot、或是Stack Overflow的OverflowAI等程序设计产品的有力竞争对手。
综合路透(Reuters)与VentureBeat报导,Meta发表的这一系列开源生成式AI模型名为Code Llama,顾名思义是建立在Meta先前发布的Llama 2语言模型的基础之上,但Llama 2较偏通用型,而Code Llama则是专为程序设计应用而设计,功能上除了可以按照使用者所输入的指令来撰写程序码以外,还可以使用于诸如程序码自动完成或是除错,以及建立开发人员笔记或是程序说明书等工作上。
Code Llama系列主要包含3款大型语言模型,参数数量分别达到70亿、130亿与340亿;参数愈少的模型,可以使用较少的GPU来运作,如70亿的这一款可以只用1颗GPU。
考量到目前GPU硬件可能存在供不应求的问题,Meta推出不同配置的模型,或许是一种相当贴近市场需求的做法。
除了主要的3款以外,另外还有2款分别针对Python与Instruct微调过的模型。
Code Llama支持许多被广泛使用的程序语言,包括Python、C++、Java、PHP、Typescript、C#与Bash等,在设计上希望能够支持所有领域的软件工程师,例如研究、产业、开源计划、非营利组织、商业等应用,但不建议使用在一般的文字工作上。
责任编辑:张兴民
[ 新闻来源:DIGITIMES科技网,更多精彩资讯请下载icspec App。如对本稿件有异议,请联系微信客服specltkj]
存入云盘 收藏
举报
全部评论
暂无评论哦,快来评论一下吧!

蔡静珊
开创IC领域,共创美好未来!
查看更多
相关文章
DeepSeek联合清华大学推出AI模型训练新技术,将开源发布
2025-04-08
小米发布首个开源AI推理大模型MiMo
2025-04-30
Arm平台成功适配阿里开源模型Qwen3
2025-05-11
OpenAI将开源新语言模型,或带“云端接力”功能
2025-04-25
三星DS部门引入Google和微软AI模型
2025-05-13
热门搜索
高通进军数据中心市场
海光信息合并中科曙光
华为
台积电
中芯国际
联发科
高通
英特尔
芯片