科技 | 中央社 CNA ( ) • 2024-03-22 01:56
示意图。(图取自Pixabay图库)示意图。(图取自Pixabay图库)

(中央社记者张瑷台北20日电)国科会主委吴政忠今天宣布,台湾繁体中文「可信任人工智慧对话引擎」(TAIDE)的参数量70亿(7B)可商用版本,将于4月中旬开放为开源模型,有效降低台湾产业导入大型语言模型的成本,可依据台厂不同需求推出应用,比如内建于PC中。

为因应国际大型语言模型常产生资讯偏误、或不符台湾文化与价值观的回应,国科会去年4月启动TAIDE计划,在LLaMA(Meta推出的语言模型)原型基础上,由国内学界专家进一步发展及训练调校,推出7B、13B等版本。

国科会并在今天召开的第10次委员会议中报告「TAIDE推动成果与未来展望」,会后记者会上,也让媒体现场试用13B版本功能。根据记者试用,TAIDE可用繁体中文撰写致词稿,也可以「很有礼貌」的口吻写采访邀约信,并精准回答「请问台湾是一个国家吗」等认知性质问题。

吴政忠表示,发展台湾专属的大型语言模型极为重要,最终目标在于落地应用、让全民有感,国科会将继续支持TAIDE团队,使TAIDE模型与时俱进,成为台湾指标性的基础模型,也会持续推动跨部会合作投入人才培育、算力布建及资料整备等基础建设。

国科会科技办公室副执行秘书杨佳玲指出,目前TAIDE团队已开发出7B可商用版本,以及13B学研用版本模型,具备多轮对话及阻绝产生不恰当回应的能力,后续除支援公部门导入TAIDE,也将于近期开源释出7B可商用版本,供外界自由运用。

吴政忠指出,预计TAIDE 7B可商用版本将在4月中旬开放为开源模型,但作法与OpenAI等欧美大厂不同,OpenAI是提供使用者帐号、可马上登录使用,这背后需要非常多的维运支援、要私人企业财力支应,TAIDE则是「打地基」,把模型释出给业者,让厂商未来可embed(嵌入)到手机、个人电脑(PC)等,给民众使用。

国科会科技政策咨询专家室资通讯群组召集人李育杰说明,业者未来也可以运用TAIDE 7B版本,投入自有资料进行微调(fine-tune);在产学研合作下,也共同发展出智慧客服、行政常见问题回应、农业知识问答及中小学台语教学等应用案例。

杨佳玲进一步表示,TAIDE团队从字词语料、通用文本、特定专用等3面向盘点公私部门资料并个别洽商授权完成,已处理的优质繁中资料共89.4GB,而TAIDE 13B版本在写文章、写信、摘要、英翻中、中翻英等5大功能的表现,已与ChatGPT 3.5相当,并拥有丰富在地知识。

在建置运算资源方面,李育杰表示,已投入新台币1亿1000万元建置最新GPU H100运算资源,与台湾杉二号完成系统整合,去年11月开始测试、12月正式服务,希望后续藉算力的加强,训练出70B模型。(编辑:杨凯翔)1130320