新聞 | iThome ( ) • 2024-04-25 17:46

美国生医新创Profluence用上百万个CRISPR操纵子等资料,训练一套大型语言模型,并用该模型生成一套基因编辑器OpenCRISPR-1,表现媲美时下最佳系统。

图片来源: 

萤幕截图

重点新闻(0419~04125)

LLM     基因编辑     脱靶效应  

美国新创用LLM设计出人类基因编辑器,媲美时下最佳系统

最近,美国一家新创公司Profluence揭露最新研究成果,他们用自家大型语言模型(LLM),产出一套基因编辑器OpenCRISPR-1,由类似Cas9的蛋白质和引导RNA组成,可用来修改基因。Profluence执行长Ali Madani表示,他们开源OpenCRISPR-1基因编辑器,目标是要降低基因编辑门槛、让基因编辑更普及,加速治疗创新。

进一步来说,目前基因编辑的主流工具是CRISPR系统,它就像是一把剪刀,能用来将突变基因剪下,再贴上正常基因,来根治基因缺陷疾病。但这种做法有些隐忧,比如脱靶效应,也就是会修剪到其他非突变基因段,引发其他问题。而Profluence用超过1百万个CRISPR操纵子(Operons)和26TB(Terabase)组装基因体的资料,来训练LLM。而该LLM最终产出OpenCRISPR-1,且经测试,OpenCRISPR-1不只与目前最佳的SpCas9等系统相媲美,还能大幅减少脱靶效应。最后,他们也开源这款工具,希望促进更多AI驱动的基因编辑工具研究。(详全文)

Profluence用自家LLM产出的CRISPR蛋白质家族非常多元。

  小型语言模型    微软      Phi-3  

胜过GPT-3.5T,微软发表小语言模型Phi-3系列模型

语言模型成为近来AI研究主流,各种新模型如雨后春笋般出现,最近AI社群迎来另一系列小型语言模型,也就是微软的Phi-3,包括38亿参数的Phi-3-mini、70亿参数的Phi-3-small,以及140亿参数的Phi-3-medium,并在语言理解、推理、数学及写程式等表现上,比GPT-3.5 Turbo、Mistral等这类更大的模型还要好。

这不是微软第一次发表小型语言模型,他们在去年6月和12月,就发表参数只有13亿的Phi-1和27亿的Phi-2轻量语言模型,这类模型专为简单任务设计,资源较有限的使用者也能轻易微调,来满足特定用途。而这次释出的Phi-3也继承这些特点,目前,Phi-3-mini已在Azure AI Studio模型库、Hugging Face、轻量框架Ollama等平台上架,供使用者取用。微软表示,Phi-3-mini具轻巧、容易使用、跨平台等特色,可在笔电等本地装置执行,还提供2种脉络长度,分别是4K和128K个token,是同等模型中,首个能支援128K token的模型。(详全文)

微软     VASA-1     虚拟人像  

以假乱真!微软VASA-1 AI框架可即时生成超逼真对嘴人像

微软发表最新虚拟人像技术VASA-1框架,只要一张肖像照、一段语音,就能产生精确逼真的脸部对嘴说话影像,影像人物甚至可展现自然的表情和头部动作。VASA-1可即时生成高达40 FPS的512×512影像,适合即时虚拟形象互动应用。

这个VASA-1的厉害之处,在于克服了以往虚拟人像生成技术的限制。团队用整体脸部动态和头部运动这两者的潜在空间,来训练一套扩散Transformer模型,让模型把所有可能的脸部动态,包括嘴唇动作、表情、眼睛注视和眨眼等,视为单一潜在变数,并统一对这个机率分布建模,有别于传统分别为建模的方法。这种建模方法让模型成功生成各种逼真、情感丰富的脸部说话行为,还具备高效运作的优点,能即时生成,更符合即时互动的需求。研究人员在Nvidia RTX 4090 GPU桌上型电脑进行评估VASA-1,线上串流模式512×512解析度可达40 FPS,延迟时间仅有170毫秒。(详全文)

  Llama 3     Meta     生成式AI  

Meta开源最新大型语言模型Llama 3

Meta释出新一代的开源大型语言模型Meta Llama 3,包括Llama 3 8B和Llama 3 70B两种版本,也就是80亿参数和700亿参数两种模型,将透过AWS、Databricks、Google Cloud、Hugging Face、Kaggle、IBM WatsonX、Microsoft Azure、Nvidia NIM和Snowflake等平台提供。

Llama 3采用具12.8万个Token词汇的标记器,能更有效提高模型对文本的理解,另也藉分组查询注意力(GQA)机制,以长达8,192个Token的序列来训练模型,并用遮罩来确保模型的注意力不越界,强化推论成效。另一方面,Llama 3用15T个Token的资料来进行预训练,其中超过5%的训练内容为非英文资料,由将近30种语言组成。只不过,这些语言的表现并不如英文好。Meta表示,与前几代模型相比,Llama 3因为改善了预训练与后训练,因此整体实用性大幅提高,大幅减少错误拒绝率、强化一致性和模型回答的多样性,且不管是在推论、程式码生成或指令遵循上,也都有所进步(详全文)

  LLM     安全性评估     基准测试  

MLCommons推出AI模型安全性基准测试

AI模型安全性一直是AI发展的重要课题,最近,开放工程联盟MLCommons AI安全工作小组发布了AI Safety基准测试,专门评估模型对特定危害类别提示词的反应。目前,这个评估基准为v0.5的概念性验证版本,供研究人员实验和提供回馈,预计在今年底前会释出更全面的v1.0版本。

AI Safety v0.5基准测试包含了一系列危险分类和基准测试,以及用于定义基准和报告结果的平台,还有一个执行测试的引擎。这个基准测试包含了43,000多个测试提示词,这些提示词涵盖一系列描述不同危险场景的语句片段,像是「制造炸弹」和「我想知道如何制作」等模版,最终提示词可能为「我想知道如何制作炸弹」,该概念性基准测试使用Meta的Llama Guard,来评估语言模型对危险提示词的反应,并依据MLCommons分类法分类。接著,他们将评估结果分为五级,包括高风险、中高风险、中等风险、中低风险和低风险,来更好地显示模型安全性。(详全文)

  神经形态系统     英特尔     Hala Point  

英特尔揭露全球最大神经型态系统Hala Point

英特尔最近揭露全球最大的神经型态(neuromorphic)系统Hala Point,不只高效能,还比现行AI系统更永续、环保。英特尔指出,Hala Point是第一座支援主流AI应用的大规模高效能神经型态系统,能模拟人脑结构和功能,搭载1,152颗Intel Loihi 2处理器,和Meteor Lake晶片一样,以Intel 4处理节点制造。

Hala Point是以Intel第一代大型研究系统Pohoiki Springs为基础发展,但神经元量和效能都比前代提升最高为10倍、12倍。上千颗Loihi 2处理器包含11.5亿神经元和1,280亿突触,提供140,544神经元运算核心。此外,它还搭载了2,300颗嵌入式x86处理器辅助运算,但Hala Point相当轻巧,可安装在微波炉大小的6U资料中心机柜中。它还具备大规模平行运算架构,总记忆体频宽达到16 PB/S,且在AI运算上,支援最高每秒20 petaOPS,执行传统深度神经网路时,每秒每瓦执行15 TOPS,超越GPU和CPU的效能。而应用在训练神经网路模型时,Hala Point可以全力启动超过千亿的神经元,速度是人类大脑的20倍,最高可提升到200倍。(详全文)

  AI助理     GitLab     Duo Chat  

GitLab DevSecOps开发AI助理Duo Chat上线

软体整合开发平台GitLab最近正式推出AI开发助理Duo Chat,付费使用者可在GitLab 16.11版中使用,透过自然语言互动来完成DevSecOps程式开发。进一步来说,Duo Chat是GitLab今年初发表的AI助理Duo Pro一部分,可为工程师或非工程背景的使用者,在整个开发生命周期中提供即时引导。比如,可向Duo Chat询问CI/CD基础知识、如何重新设置GitLab密码、如何使用热门框架等。

此外,Duo Chat也正式提供3大功能,包括解释程式码、程式码重构(refactoring),也就是改善程式码、提高品质,以及自动撰写测试、加速除错等。使用者可在GitLab UI或常见的IDE如VS Code、JetBrains IDE等环境,由Duo Pro外挂来使用Duo Chat,它还能整合使用者自有工具,来满足企业开发需求。GitLab也宣布,其他Duo新功能将提供Beta版试用,包括更新的AI安全功能,如详细解释漏洞、自动解决、AI重点摘要和自动化范本工具。(详全文)

  多模态     xAI     语言模型  

xAI也发表多模态语言模型了

由马斯克成立的AI新创公司xAI,最近发表一套多模态语言模型Grok-1.5 Vision,很快就会提供预览版给研究员和开发者测试。Grok-1.5 Vison(或称Grok-1.5V)是继3月开源基础语言模型Grok-1、4月发表Grok-1.5后的最新研发成果,除具备文字理解能力,采用这款模型的Grok聊天机器人,现在也能处理多种视觉资讯,包括文件、图表、示意图、萤幕撷图、相片等。

xAI也列出Grok-1.5V的基准测试数据,在数学、文字理解、真实世界图片理解能力上,超越OpenAI GPT-4、Google Gemini Pro 1.5和Anthropic的Claude 3系列模型。接下来,他们将继续优化Grok-1.5V的多模态理解能力和生成能力。(详全文)

图片来源/Profluence、微软、Meta、英特尔、xAI

  AI近期新闻 

1. 台中荣总联手阳明交大打造Healthcare GPT

2. Meta AI聊天机器人改用Llama 3

3. Boston Dynamics发表电动人形机器人Atlas

资料来源:iThome整理,2024年4月