财新网 - 首页 ( ) • 2024-04-19 13:05

Meta称,还会在接下来数月的时间提供更强的长文本能力、多种尺寸、多语言的模型


北京时间4月19日凌晨,美国社交巨头Meta宣布推出Llama 3开源模型系列,将陆续登陆亚马逊AWS、Databricks、谷歌云、Hugging Face等大模型平台。

  【财新网】开源大模型的推手Meta发新一代模型。北京时间4月19日凌晨,美国社交巨头Meta(NASDAQ: META)宣布推出Llama 3开源模型系列,将陆续登陆亚马逊AWS、Databricks、谷歌云、Hugging Face等大模型平台。Meta称,还会在接下来数月的时间提供更强的长文本能力、多种尺寸、多语言的模型,目标是打造最好的基座模型。

  具体来看,此次发布的包括80亿、700亿参数的两个预训练语言模型,根据Meta的数据,在考察常识能力、学科知识、代码能力、数学能力的数据集榜单中,80亿参数的版本全面领先谷歌的轻量开源模型Gemma 7B–it,和欧洲大模型公司Mistral的开源模型Mistral 7B Instruct;700亿参数版本的整体得分小幅领先谷歌闭源模型Gemini Pro 1.5和Anthropic的闭源模型Claude 3 Sonnect。