即時不分類 - 聯合新聞網 ( ) • 2024-04-30 13:22

国科会去年4月启动TAIDE计划,研发台版大型繁中AI语言模型,台大资工系教授许永真表示,TAIDE是透过中文资料,训练以英文为母语的Llama模型,「像在教美国长大的ABC讲中文」,目前已有初步成果,盼尽快让台湾百工百业商用。

「2024年AI与资讯安全论坛」今天登场,台大资工系教授许永真以「台湾的AI与大型语言模型(LLM)」为题发表演说。

/*.innity-apps-underlay-ad {z-index: 34 !important; }*/ .innity-apps-underlay-ad ~ .header {z-index: 35;} .innity-apps-underlay-ad ~ .main-content .inline-ads { background: transparent;} #eyeDiv ~ .footer{ position: relative; z-index: 2;} /* sizmek_underlay 投递调整置底 z-index 权重 */ .article-content__abbr__text {display:inline-block;} /* to be remove */

为因应国际大型语言模型常产生资讯偏误,或不符台湾文化与价值观的回应,国科会去年4月启动TAIDE计划,在Llama(Meta推出的语言模型)原型基础上,由国内学界专家进一步发展及训练调校。

许永真为台湾AI卓越中心副总召集人,参与TAIDE计划,她今天在论坛中表示,AI有其资安风险,许多人都担心「所思所想、机敏资料外流」,让大家对AI又爱又怕,甚至有人透过AI模型学习,可攻击世界上任何一个网站。

她援引哈佛法学教授雷席格所说,「我们正处于AI的『奥本海默时刻』,好坏永远并存」。

许永真也说,虽然要担心资料外流的问题,但更应该正视台湾失去数位话语权、失去自主发展大模型的机会,因此一年前就与专家团队一同建议台湾应该建造自己的AI对话引擎,在国科会指导下,成功打造出TAIDE可信任AI对话引擎。

她分享,TAIDE是站在巨人肩膀上,选择以英文为母语的Llama模型,再透过中文资料继续训练;许永真比喻「就像在教一个在美国长大的ABC学会讲中文」,透过英文基础教育、中文基础教育、中学教育、高等教育等加强学习。

在算力有限的状况下,TAIDE去年6月就成功完成第一阶段展示,她表示,目标是成为可商用模型,让台湾百工百业都来使用,其条件包括基础模型必须可商用,也要有充足的可商用授权中文相关资料。

许永真分享,Meta去年7月推动可商用的Llama 2,并在今年4月19日公开释出Llama 3新一代的大型语言模型,团队仅用4天就完成模型训练;接下来的挑战是透过可商用中文资料训练,目前已经有许多中文授权资料量,也欢迎各界交流资源。

她强调,TAIDE不是要去和各大语言模型抗衡匹敌,但希望能提供台湾中小企业,甚至不愿意资料外流的金融业一个安全可靠的语言模型,也期待民间力量来把这个专案商转,一起来共同壮大。