优享资讯 | 国科会释出繁中语言模型TAIDE-LX-7B了！

新聞 | iThome ( ) • 2024-04-15 20:35

国科会释出70亿参数的TAIDE模型，开发者可至TAIDE官网下载使用。

图片来源:

萤幕截图

2022年末ChatGPT爆红，掀起大型语言模型（LLM）应用浪潮，为能够在地化运用，国科会去年初就开始推动可信任生成式AI发展先期计划（Trustworthy AI Dialogue Engine，简称TAIDE），来打造本土化LLM。经过1年多努力，国科会主委吴政忠今日（4/15）宣布释出TAIDE-LX-7B，是一款结合台湾文化的70亿参数大型语言模型，可供产学研快速导入生成式AI、提供更多元服务。

具台湾特色的可信任LLM

与现今其他大型语言模型不同，TAIDE-LX-7B模型具有繁体中文的文本生成能力。这是因为，团队以Meta Llama-2-7B为基础，额外扩充繁体中文字元、字词，让模型生成的文本更加流畅、精准，还更具有台湾特色。

尤其，训练模型所使用的文本资料，皆以合法取得授权的文本来训练。这么做不只确保「可信任性」，还能协助TAIDE-LX-7B加强台湾文化、用语与国情等知识，从而产生丰富多样的文本内容。团队也对模型加强训练5大功能，包括自动摘要、写信、写文章、中翻英、英翻中等，并开发出多轮问答对话能力，让模型能根据已生成的文本内容，接续使用者指令，产出更符合需求的文本。

国科会希望，藉这次释出，可促进TAIDE语言模型在公部门或民间机构的各类应用（含商业应用）。使用者现可进入TAIDE官方网站，了解模型发展目标与历程，并点入网站上「TAIDE模型」连结，再进入该页面中提供的Huggingface连结下载，就可开始使用、体验具有台湾特色的大型语言模型。

已有不少应用案例出现

不只如此，TAIDE-LX-7B模型已有不少应用，比如高雄大学团队开发一套开源生成式AI应用平台Kuwa GenAI OS，专门让开发者用来打造生成式AI应用；该平台内建可串接多款开源LLM，TAIDE模型就包括在内，开发者可灵活组合、串接周边功能，而使用者则能透过简易的Web介面，来与后端模型互动。其他应用案例还有台南大学的TAIDE台语对话机器人、中兴大学神农TAIDE、中研院行政常见问题回应、民间公司智慧客服等。