财新网 - 首页 ( ) • 2024-06-14 15:54

统一的多模态大模型、具身智能大模型和科学用AI结合起来才能形成世界大模型,最终通向AGI


2024年6月14日,第六届“北京智源大会”在中关村展示中心开幕。图:智源研究院

  【财新网】由科技部、北京市支持的民营非营利机构智源研究院公布AI大模型最新进展。6月14日,智源研究院公布万亿参数的大语言模型进展,发布用于检索增强(RAG)的向量模型、采用自回归架构的多模态大模型、具身智能大模型和生物计算大模型,以及支持8种芯片的智算操作系统。

  具体来看,此次公布的万亿参数大模型“Tele-FLM“是和中国电信联合研发,中国电信主要提供算力和部分数据。智源研究院院长王仲远称,该项目是在112台A800机器(即896块A800 GPU)上训练4个月得出的,已开源发布的520亿参数版本英文能力优于Llama2-70B,接近Llama3-70B的水平,而中文能力优于Llama3-70B和Qwen1.5-72B。