NVIDIA开源新模型Nemotron-4 340B,简化LLM训练数据生成
来源:ictimes 发布时间:2024-06-21 分享至微信
NVIDIA近期发布了Nemotron-4 340B系列开源AI模型,专为简化大型语言模型(LLM)训练数据的生成而设计。这一创新模型针对医疗、金融、制造和零售等行业,旨在降低企业获取高品质训练数据的成本。
Nemotron-4 340B系列包括基础、指令和奖励三种版本,支持TensorRT-LLM软件进行推论。
该模型经过9万亿tokens的训练,支持50多种自然语言和40种程序设计语言,其性能在多项评测中均表现出色,甚至可与GPT-4相媲美。
企业可通过Hugging Face平台下载Nemotron-4 340B模型,并利用NVIDIA NIM微服务进行访问,该模型的广泛应用前景令人期待。尤其是在医疗、金融、制造和零售等行业,将推动药物发现、个人化医疗、医学影像、欺诈检测、风险评估、客户服务、预测性维护、供应链优化和定制化客户体验等领域的创新。
然而,随着合成数据的普及,数据隐私和安全问题日益凸显。企业需要确保强大的安全措施来保护敏感数据,并审慎处理使用合成数据训练AI模型可能引发的伦理问题。
[ 新闻来源:ictimes,更多精彩资讯请下载icspec App。如对本稿件有异议,请联系微信客服specltkj]
存入云盘 收藏
举报
全部评论
暂无评论哦,快来评论一下吧!
ictimes
聚焦于半导体行业芯闻
查看更多
相关文章
黑客紧盯LLM训练资源,云端网安成挑战
2024-09-27
阿里开源Qwen2.5模型,挑战GPT-4
2024-09-20
生成式AI助力,国内LLM用户破6亿
2024-08-20
国内电信用本土芯片训练AI模型
17 小时前
Google云端LLM迭代放缓,Gemini模型深入终端显成效
2024-08-18
热门搜索