新聞 | iThome ( ) • 2024-04-10 01:19

联发科正式发表生成式AI服务平台DaVinci(简称达哥),提供各种工具让使用者客制化,打造专属智慧助理。

图片来源: 

摄影/王若朴

联发科技今(4月9日)正式推出生成式AI服务平台MediaTek DaVinci和繁中大型语言模型MediaTek Research BreeXe,其中,DaVinci平台除了有API库、扩充外挂库、AI模型库等之外,今年还新添智慧助理架构和4大商店,供使用者打造客制化的智能助理。而BreeXe以Mistral 8x7B模型为基础,以大量繁中资料训练而成,具450亿个参数,在繁中基准测试(TMMLU+、MT Bench TW)的表现超越GPT-3.5。

生成式AI服务平台正式上架,能客制专属助理还有4大商店可选择

进一步来说,MediaTek DaVinci(简称联发科技达哥)是以联发科技自家生成式AI服务框架为基础开发而成,联发科技副处长杨建州解释,他们在思考达哥的设计时,考量了一个大问题:「如何增加同仁的生产力。」他表示,联发科技的主要产品是手机,因此思考如何增加生产力时,就从手机产品线找答案。他们认为,要提高企业生产力,得要有完整的开放式平台,就像是手机的作业系统一样,再来是安全性、简单易用,此外还得具备能上架共享应用(App)的商店,且App要能容易开发、兼容开放标准。

因此,他们打造出达哥1.0,内含可跟OA环境、软体开发环境、IC设计环境互动的API库,以及提示优化引擎、扩充外挂库、模型库和分析引擎等重要元件。其中,外挂库可用来扩充生成式AI模型知识、减少AI幻觉,模型库则包含常见的大型语言模型(LLM),如Google Gemini、GPT-3.5/4V、Whisper、Claude 3和AWS Bedrock服务等,甚至联发科技自己最新打造的模型BreeXe也会纳入其中。

「你可以把达哥想像为具备各种工具的瑞士刀,不只有生成式AI大语言模型,还可以调用不同工具,来与公司系统或知识库结合,甚至能上网搜寻。」杨建州指出,达哥还具备支援RAG的搜寻引擎。

达哥1.0在去年完成,而今年联发科技优化该平台,新添智慧助理架构(如下图),能让每位职员不必写任何程式码,就能打造自己的智能秘书,这就是达哥2.0。而且,这个版本的达哥还具备4个主要商店,包括AI模型、扩充外挂、提示范本、知识库(DVCs)等,使用者可用来打造适合自己的智慧助理。

同时,达哥也新添许多功能(如下图),包括DocChat、VideoChat、WebChat和Plugins。前三个就像是智慧助理,比如,DocChat可用来分析竞争对手、履历表媒合、技术文件摘要,VideoChat则能自动生成会议记录、产出YouTube影片摘要、TED影片摘要等,WebChat能用于技术趋势分析、市场趋势收集、产业新闻集锦等。而Plugins新功能,可提供企业知识检索、RPA自动化等。

另一方面,联发科技协理叶家顺指出,联发科技自己已深度运用达哥,整个集团的渗透率达到96%,满意度也达到4.4分(满分5分)。他进一步表示,达哥在联发科技内部的应用场景相当丰富,就软体开发来说,可用来分析需求规格、生成技术文件,在编写程式部分,还能协助写程式、协助除错和Code review等工作,另外还能帮助开发者自动生成测项、自动生成测试案例等。不只如此,对联发科技不同部门来说,生成式AI的应用情境也很广泛,比如能协助人资筛选履历和自动配对,能协助财务自动辨识发票,来加速报销流程,或是根据外部资料,自动撰写信用报告。(如下图)

他也表示,达哥也发展成可供外部企业导入的生成式AI服务平台,目前已有数十家高科技、金融、电信、法律、制造、销售、服务、系统整合和云端服务等产业的企业使用,另也有教育机构、新创等加入MediaTek Davinci生态系。

揭露最新繁中大型语言模型BreeXe

与此同时,联发科技创新基地负责人许大山揭露最新的繁中大模型BreeXe,具450亿参数,中文知识水准超越GPT-3.5。他表示,这款模型以Mistral 8x7B开源模型为基础,用大量繁体中文资料训练而成。但有别于Mistral 8x7B模型只能处理4,000字,BreeXe可处理长达4万字。再来,他们也准备开源台湾-RAG的训练资料。

这不是联发科技第一次发表自然语言处理相关技术。在2022年6月,他们就全面押宝生成式AI,启动繁中大语言模型计划,并在2023年3月开源首个繁中LLM:BLOOM-zh 1B和3B版本,同时发表相关论文。去年10月,他们还推出了台湾知识评测集TW Trivia、TMMLU,今年2月则发布用1TB资料预训练的繁中LLM:Breeze 7B并开源,今天则是发表首个超越GPT-3.5的繁中模型BreeXe。接下来,他们要朝打造繁中GPT-4的方向前进。

联发科技资深技术经理陈宜昌也在现场展示BreeXe能力,包括BreeXe采用扩充词表技术,其生成答案的速度快1倍、成本也下降一半,未来可望供企业于地端部署,降低成本。再来,他也展示RAG情境,透过提供一系列履历PDF档案,并请BreeXe提供表格式摘要,并推荐最佳人选(如下图)。此外,就算输入3万多万字的小王子全书内容并提问,BreeXe也能正确给出答案。