新聞 | iThome ( ) • 2024-04-15 20:35

国科会释出70亿参数的TAIDE模型,开发者可至TAIDE官网下载使用。

图片来源: 

萤幕截图

2022年末ChatGPT爆红,掀起大型语言模型(LLM)应用浪潮,为能够在地化运用,国科会去年初就开始推动可信任生成式AI发展先期计划(Trustworthy AI Dialogue Engine,简称TAIDE),来打造本土化LLM。经过1年多努力,国科会主委吴政忠今日(4/15)宣布释出TAIDE-LX-7B,是一款结合台湾文化的70亿参数大型语言模型,可供产学研快速导入生成式AI、提供更多元服务。

具台湾特色的可信任LLM

与现今其他大型语言模型不同,TAIDE-LX-7B模型具有繁体中文的文本生成能力。这是因为,团队以Meta Llama-2-7B为基础,额外扩充繁体中文字元、字词,让模型生成的文本更加流畅、精准,还更具有台湾特色。

尤其,训练模型所使用的文本资料,皆以合法取得授权的文本来训练。这么做不只确保「可信任性」,还能协助TAIDE-LX-7B加强台湾文化、用语与国情等知识,从而产生丰富多样的文本内容。团队也对模型加强训练5大功能,包括自动摘要、写信、写文章、中翻英、英翻中等,并开发出多轮问答对话能力,让模型能根据已生成的文本内容,接续使用者指令,产出更符合需求的文本。

国科会希望,藉这次释出,可促进TAIDE语言模型在公部门或民间机构的各类应用(含商业应用)。使用者现可进入TAIDE官方网站,了解模型发展目标与历程,并点入网站上「TAIDE模型」连结,再进入该页面中提供的Huggingface连结下载,就可开始使用、体验具有台湾特色的大型语言模型。

已有不少应用案例出现

不只如此,TAIDE-LX-7B模型已有不少应用,比如高雄大学团队开发一套开源生成式AI应用平台Kuwa GenAI OS,专门让开发者用来打造生成式AI应用;该平台内建可串接多款开源LLM,TAIDE模型就包括在内,开发者可灵活组合、串接周边功能,而使用者则能透过简易的Web介面,来与后端模型互动。其他应用案例还有台南大学的TAIDE台语对话机器人、中兴大学神农TAIDE、中研院行政常见问题回应、民间公司智慧客服等。