优享资讯 | 训练台版AI语言模型许永真：盼让百工百业商用

即時不分類 - 聯合新聞網 ( ) • 2024-04-30 13:22

国科会去年4月启动TAIDE计划，研发台版大型繁中AI语言模型，台大资工系教授许永真表示，TAIDE是透过中文资料，训练以英文为母语的Llama模型，「像在教美国长大的ABC讲中文」，目前已有初步成果，盼尽快让台湾百工百业商用。

「2024年AI与资讯安全论坛」今天登场，台大资工系教授许永真以「台湾的AI与大型语言模型（LLM）」为题发表演说。

/*.innity-apps-underlay-ad {z-index: 34 !important; }*/ .innity-apps-underlay-ad ~ .header {z-index: 35;} .innity-apps-underlay-ad ~ .main-content .inline-ads { background: transparent;} #eyeDiv ~ .footer{ position: relative; z-index: 2;} /* sizmek_underlay 投递调整置底 z-index 权重 */ .article-content__abbr__text {display:inline-block;} /* to be remove */

为因应国际大型语言模型常产生资讯偏误，或不符台湾文化与价值观的回应，国科会去年4月启动TAIDE计划，在Llama（Meta推出的语言模型）原型基础上，由国内学界专家进一步发展及训练调校。

许永真为台湾AI卓越中心副总召集人，参与TAIDE计划，她今天在论坛中表示，AI有其资安风险，许多人都担心「所思所想、机敏资料外流」，让大家对AI又爱又怕，甚至有人透过AI模型学习，可攻击世界上任何一个网站。

她援引哈佛法学教授雷席格所说，「我们正处于AI的『奥本海默时刻』，好坏永远并存」。

许永真也说，虽然要担心资料外流的问题，但更应该正视台湾失去数位话语权、失去自主发展大模型的机会，因此一年前就与专家团队一同建议台湾应该建造自己的AI对话引擎，在国科会指导下，成功打造出TAIDE可信任AI对话引擎。

她分享，TAIDE是站在巨人肩膀上，选择以英文为母语的Llama模型，再透过中文资料继续训练；许永真比喻「就像在教一个在美国长大的ABC学会讲中文」，透过英文基础教育、中文基础教育、中学教育、高等教育等加强学习。

在算力有限的状况下，TAIDE去年6月就成功完成第一阶段展示，她表示，目标是成为可商用模型，让台湾百工百业都来使用，其条件包括基础模型必须可商用，也要有充足的可商用授权中文相关资料。

许永真分享，Meta去年7月推动可商用的Llama 2，并在今年4月19日公开释出Llama 3新一代的大型语言模型，团队仅用4天就完成模型训练；接下来的挑战是透过可商用中文资料训练，目前已经有许多中文授权资料量，也欢迎各界交流资源。

她强调，TAIDE不是要去和各大语言模型抗衡匹敌，但希望能提供台湾中小企业，甚至不愿意资料外流的金融业一个安全可靠的语言模型，也期待民间力量来把这个专案商转，一起来共同壮大。

📌 数位夯什么？快来看看

　订阅《科技玩家》YouTube频道！
💡 追新闻》》在Google News按下追踪，科技玩家好文不漏接！
📢 虚拟主播VTuber首登「科技玩家聊月报」！AI影音报新闻轻松看
📢 行动电源怎么挑才安心？10点注意事项一次看别陷入电池容量、体积迷思
📢 LINE聊天室一键变透明！上班族必学高效5招聊天还不怕老板抓包
📢 LINE免费贴图4款来了！这款接任务「永久免费」水母笑藏网路流行语
📢 他惊好市多「苹果无线充电神物」便宜2千比黑五便宜！网曝认清1关键再入手