即時不分類 - 聯合新聞網 ( ) • 2024-07-01 09:55

本土语言AI、专业领域AI受到各国政府与产业的重视。长春集团、和硕联合科技、长庚医院、欣兴电子、科技报橘联合发起,与台大资工系、台大资管系及律果科技合作,在 NVIDIA 支持下训练的「繁体中文专家模型开源专案 TAiwan Mixture of Experts(Project TAME )」今天正式发表,是全球首创重量级多产业共同孕育的繁中大型语言专家模型,未来 Project TAME以Open Source 开放原始码的形式,邀请产业一同加入、共创「台湾产业专用 AI 应用生态系」。

Project TAME 繁中专家模型开源计划,由台大资工系副教授陈缊侬带领实验室同仁与企业伙伴开发团队共同合作,使用 NVIDIA开发者计划技术支持,让多家垂直产业的企业专家贡献专业领域的资料,预训练近5千亿个字(token)开发出繁中大型语言专家模型。包括长春集团、和硕联合科技、欣兴电子、长庚医院、科技报橘、律果科技即为石化工业、电子制造、医疗服务、内容服务、法律等各产业代表,成为首批联合投入 Project TAME 繁体中文模型训练的业界专家角色。

/*.innity-apps-underlay-ad {z-index: 34 !important; }*/ .innity-apps-underlay-ad ~ .header {z-index: 35;} .innity-apps-underlay-ad ~ .main-content .inline-ads { background: transparent;} #eyeDiv ~ .footer{ position: relative; z-index: 2;} /* sizmek_underlay 投递调整置底 z-index 权重 */ .article-content__abbr__text {display:inline-block;} /* to be remove */

Project TAME 繁体中文模型已有初步具体显著成果,在各项繁中相关指标中领先全球模型,连台湾的「大学学测、律师/中医考试、导游证照、驾照、台湾在地化测验」都分数优异,在台39项综合评测,近三千个题目,Project TAME 分数就超过所有模型,正确率相较第二名的 Claude-Opus 模型高了6.8%,比 GPT-4o 甚至高了9.3%。

长春集团(大连)董事长林显东谈到决定参与 Project TAME ,在于他观察到中国石化业正以前所未有的速度扩张,台湾可能花三十年才能推进100万吨的产能,中国大陆在两三年间就直接超车达到200 万吨,因此长春集团更需要懂得应用 AI 预测分析,更快得知获利、产品竞争上可能出现的风险。林显东指出,长春集团的 AI 蓝图为建立涵盖企业五大机能「产销人发财」的战情分析室。

和硕联合科技指出,参与 Project TAME,希望透过开放式联盟的创新合作方式,结合各产业领域的专家资料,以及学界大型语言模型的专业,加速产业生成式AI的应用,实现AI落地的场景。

林口长庚医院院长陈建宗表示,将 AI 繁中大型语言模型导入医疗第一线,医师只要在病历上搜寻资料,就会弹出视窗显示,以前没有那么方便,现在整合所有资料,又符合医师作业习惯。

欣兴电子参与 Project TAME,除了合作建立公开的繁体中文专家模型,也将透过公司内部资料库,调校成内部专用的产业专家模型,预期在未来可为专业知识问答,提供更符合公司内部作法的准确建议,提升工作效率。

科技报橘已使用未经过繁中优化的大型语言模型推出测试的内容产制,在官网上的 AI 人机协作专区已可看到,但这一年的实验显示,势必需要有繁中优化的大型语言模型才能更好服务社群用户。

法律科技新创公司律果科技表示,法律内容有很强的在地化需求,因此协助 Project TAME 加入台湾法律语料进行训练。台大资工系将目前各大型语言模型试用在台湾律师考试题目上,Project TAME 分数均超过所有其他模型。

繁体中文专家模型 Project TAME 正式对外发布后,将采用 Open Source 开放原始码的形式,让各产业企业有一个 Hub 中心可以进行合作。台大资工系副教授陈缊侬指出,在不同的资料间可能有共同交集可以使用, 这对语言模型的发展是更好的,也能让不同产业的专家贡献自己领域的资料。目前已开放各企业皆可免费下载使用「繁体中文专家模型 Project TAME」(https://github.com/MiuLab/Taiwan-LLM)、模型聊天页面(https://www.twllm.com)、以及由亚太智能机器(APMIC)率先整合 Project TAME,提供聊天机器人测试页(http://techorange.com/tame)。