即時不分類 - 聯合新聞網 ( ) • 2024-04-29 20:27

台版大型繁中语言模型再升级,国科会今天宣布,释出以最新Llama 3为基础的「可信任人工智慧对话引擎」(TAIDE)参数量80亿(8B)模型,且团队仅用4天就完成模型训练,并能马上开放可商用版本供产学研界使用。

为因应国际大型语言模型常产生资讯偏误,或不符台湾文化与价值观的回应,国科会去年4月启动TAIDE计划,在LLaMA(Meta推出的语言模型)原型基础上,由国内学界专家进一步发展及训练调校,先前已推出7B版本。

/*.innity-apps-underlay-ad {z-index: 34 !important; }*/ .innity-apps-underlay-ad ~ .header {z-index: 35;} .innity-apps-underlay-ad ~ .main-content .inline-ads { background: transparent;} #eyeDiv ~ .footer{ position: relative; z-index: 2;} /* sizmek_underlay 投递调整置底 z-index 权重 */ .article-content__abbr__text {display:inline-block;} /* to be remove */

国科会今天指出,Meta于4月19日公开释出Llama 3新一代的大型语言模型,在各项评比中表现大幅超越前一代Llama 2,再次引爆LLM界的热潮。

为尽快提升以Llama 3为基础、具台湾文化的繁中模型,TAIDE团队第一时间以过去1年开发TAIDE模型所掌握的经验,加上累积整理的繁体中文资料集,基于「Release early, release often」的开发思维,仅以4天时间投入训练,经过基本测试,今天释出Llama 3-TAIDE-LX-8B-Chat-Alpha1模型。

国科会主委吴政忠对于TAIDE团队仅用4天旋即完成模型训练,并能马上开放可商用版本供产学研界使用,表示高度肯定。国科会提到,团队后续也将收集各界回馈意见并滚动调整,持续精进TAIDE系列繁体中文大型语言模型。

国科会进一步说明,自今年4月15日公开释出以Meta提供开放模型Llama2为基础的TAIDE-LX-7B繁中可商用大型语言模型,目前在开放社群平台上,许多高手已提供不少安装与使用指南,也有10余家厂商及多个学研团队及公部门开始导入TAIDE模型开发相关应用系统。

国科会强调,民众现在可以进入TAIDE官方网站,了解模型发展目标与历程,并点入网站上「TAIDE模型」连结,再进入该页面中提供的Huggingface连结下载,就可开始使用并体验具有台湾特色的大型语言模型。