Meta推出开源程序设计模型 挑战微软GitHub Copilot
来源:蔡静珊 发布时间:2023-08-25 分享至微信


Code Llama是先前Meta推出的Llama 2针对程序设计应用而改造过的模型版本。法新社
Code Llama是先前Meta推出的Llama 2针对程序设计应用而改造过的模型版本。法新社

Meta宣布将推出一系列可协助撰写电脑程序码的开源人工智能(AI)大型语言模型(LLM),提供外界免费使用,有望成为由OpenAI修改过的GPT-3模型所驱动的Codex、由Codex所驱动的微软(Microsoft)GitHub Copilot、或是Stack Overflow的OverflowAI等程序设计产品的有力竞争对手。


综合路透(Reuters)与VentureBeat报导,Meta发表的这一系列开源生成式AI模型名为Code Llama,顾名思义是建立在Meta先前发布的Llama 2语言模型的基础之上,但Llama 2较偏通用型,而Code Llama则是专为程序设计应用而设计,功能上除了可以按照使用者所输入的指令来撰写程序码以外,还可以使用于诸如程序码自动完成或是除错,以及建立开发人员笔记或是程序说明书等工作上。


Code Llama系列主要包含3款大型语言模型,参数数量分别达到70亿、130亿与340亿;参数愈少的模型,可以使用较少的GPU来运作,如70亿的这一款可以只用1颗GPU。


考量到目前GPU硬件可能存在供不应求的问题,Meta推出不同配置的模型,或许是一种相当贴近市场需求的做法。


除了主要的3款以外,另外还有2款分别针对Python与Instruct微调过的模型。


Code Llama支持许多被广泛使用的程序语言,包括Python、C++、Java、PHP、Typescript、C#与Bash等,在设计上希望能够支持所有领域的软件工程师,例如研究、产业、开源计划、非营利组织、商业等应用,但不建议使用在一般的文字工作上。




责任编辑:张兴民



[ 新闻来源:DIGITIMES科技网,更多精彩资讯请下载icspec App。如对本稿件有异议,请联系微信客服specltkj]
存入云盘 收藏
举报
全部评论

暂无评论哦,快来评论一下吧!