优享资讯 | AI趋势周报第251期：美国新创用LLM设计出人类基因编辑器

新聞 | iThome ( ) • 2024-04-25 17:46

AI趋势周报第251期：美国新创用LLM设计出人类基因编辑器

美国生医新创Profluence用上百万个CRISPR操纵子等资料，训练一套大型语言模型，并用该模型生成一套基因编辑器OpenCRISPR-1，表现媲美时下最佳系统。

图片来源:

萤幕截图

重点新闻(0419～04125)

LLM 基因编辑 脱靶效应

美国新创用LLM设计出人类基因编辑器，媲美时下最佳系统

最近，美国一家新创公司Profluence揭露最新研究成果，他们用自家大型语言模型（LLM），产出一套基因编辑器OpenCRISPR-1，由类似Cas9的蛋白质和引导RNA组成，可用来修改基因。Profluence执行长Ali Madani表示，他们开源OpenCRISPR-1基因编辑器，目标是要降低基因编辑门槛、让基因编辑更普及，加速治疗创新。

进一步来说，目前基因编辑的主流工具是CRISPR系统，它就像是一把剪刀，能用来将突变基因剪下，再贴上正常基因，来根治基因缺陷疾病。但这种做法有些隐忧，比如脱靶效应，也就是会修剪到其他非突变基因段，引发其他问题。而Profluence用超过1百万个CRISPR操纵子（Operons）和26TB（Terabase）组装基因体的资料，来训练LLM。而该LLM最终产出OpenCRISPR-1，且经测试，OpenCRISPR-1不只与目前最佳的SpCas9等系统相媲美，还能大幅减少脱靶效应。最后，他们也开源这款工具，希望促进更多AI驱动的基因编辑工具研究。（详全文）

Profluence用自家LLM产出的CRISPR蛋白质家族非常多元。

小型语言模型 微软 Phi-3

胜过GPT-3.5T，微软发表小语言模型Phi-3系列模型

语言模型成为近来AI研究主流，各种新模型如雨后春笋般出现，最近AI社群迎来另一系列小型语言模型，也就是微软的Phi-3，包括38亿参数的Phi-3-mini、70亿参数的Phi-3-small，以及140亿参数的Phi-3-medium，并在语言理解、推理、数学及写程式等表现上，比GPT-3.5 Turbo、Mistral等这类更大的模型还要好。

这不是微软第一次发表小型语言模型，他们在去年6月和12月，就发表参数只有13亿的Phi-1和27亿的Phi-2轻量语言模型，这类模型专为简单任务设计，资源较有限的使用者也能轻易微调，来满足特定用途。而这次释出的Phi-3也继承这些特点，目前，Phi-3-mini已在Azure AI Studio模型库、Hugging Face、轻量框架Ollama等平台上架，供使用者取用。微软表示，Phi-3-mini具轻巧、容易使用、跨平台等特色，可在笔电等本地装置执行，还提供2种脉络长度，分别是4K和128K个token，是同等模型中，首个能支援128K token的模型。（详全文）

微软 VASA-1 虚拟人像

以假乱真！微软VASA-1 AI框架可即时生成超逼真对嘴人像

微软发表最新虚拟人像技术VASA-1框架，只要一张肖像照、一段语音，就能产生精确逼真的脸部对嘴说话影像，影像人物甚至可展现自然的表情和头部动作。VASA-1可即时生成高达40 FPS的512×512影像，适合即时虚拟形象互动应用。

这个VASA-1的厉害之处，在于克服了以往虚拟人像生成技术的限制。团队用整体脸部动态和头部运动这两者的潜在空间，来训练一套扩散Transformer模型，让模型把所有可能的脸部动态，包括嘴唇动作、表情、眼睛注视和眨眼等，视为单一潜在变数，并统一对这个机率分布建模，有别于传统分别为建模的方法。这种建模方法让模型成功生成各种逼真、情感丰富的脸部说话行为，还具备高效运作的优点，能即时生成，更符合即时互动的需求。研究人员在Nvidia RTX 4090 GPU桌上型电脑进行评估VASA-1，线上串流模式512×512解析度可达40 FPS，延迟时间仅有170毫秒。（详全文）

Llama 3 Meta 生成式AI

Meta开源最新大型语言模型Llama 3

Meta释出新一代的开源大型语言模型Meta Llama 3，包括Llama 3 8B和Llama 3 70B两种版本，也就是80亿参数和700亿参数两种模型，将透过AWS、Databricks、Google Cloud、Hugging Face、Kaggle、IBM WatsonX、Microsoft Azure、Nvidia NIM和Snowflake等平台提供。

Llama 3采用具12.8万个Token词汇的标记器，能更有效提高模型对文本的理解，另也藉分组查询注意力（GQA）机制，以长达8,192个Token的序列来训练模型，并用遮罩来确保模型的注意力不越界，强化推论成效。另一方面，Llama 3用15T个Token的资料来进行预训练，其中超过5%的训练内容为非英文资料，由将近30种语言组成。只不过，这些语言的表现并不如英文好。Meta表示，与前几代模型相比，Llama 3因为改善了预训练与后训练，因此整体实用性大幅提高，大幅减少错误拒绝率、强化一致性和模型回答的多样性，且不管是在推论、程式码生成或指令遵循上，也都有所进步（详全文）

LLM 安全性评估 基准测试

MLCommons推出AI模型安全性基准测试

AI模型安全性一直是AI发展的重要课题，最近，开放工程联盟MLCommons AI安全工作小组发布了AI Safety基准测试，专门评估模型对特定危害类别提示词的反应。目前，这个评估基准为v0.5的概念性验证版本，供研究人员实验和提供回馈，预计在今年底前会释出更全面的v1.0版本。

AI Safety v0.5基准测试包含了一系列危险分类和基准测试，以及用于定义基准和报告结果的平台，还有一个执行测试的引擎。这个基准测试包含了43,000多个测试提示词，这些提示词涵盖一系列描述不同危险场景的语句片段，像是「制造炸弹」和「我想知道如何制作」等模版，最终提示词可能为「我想知道如何制作炸弹」，该概念性基准测试使用Meta的Llama Guard，来评估语言模型对危险提示词的反应，并依据MLCommons分类法分类。接著，他们将评估结果分为五级，包括高风险、中高风险、中等风险、中低风险和低风险，来更好地显示模型安全性。（详全文）

神经形态系统 英特尔 Hala Point

英特尔揭露全球最大神经型态系统Hala Point

英特尔最近揭露全球最大的神经型态（neuromorphic）系统Hala Point，不只高效能，还比现行AI系统更永续、环保。英特尔指出，Hala Point是第一座支援主流AI应用的大规模高效能神经型态系统，能模拟人脑结构和功能，搭载1,152颗Intel Loihi 2处理器，和Meteor Lake晶片一样，以Intel 4处理节点制造。

Hala Point是以Intel第一代大型研究系统Pohoiki Springs为基础发展，但神经元量和效能都比前代提升最高为10倍、12倍。上千颗Loihi 2处理器包含11.5亿神经元和1,280亿突触，提供140,544神经元运算核心。此外，它还搭载了2,300颗嵌入式x86处理器辅助运算，但Hala Point相当轻巧，可安装在微波炉大小的6U资料中心机柜中。它还具备大规模平行运算架构，总记忆体频宽达到16 PB/S，且在AI运算上，支援最高每秒20 petaOPS，执行传统深度神经网路时，每秒每瓦执行15 TOPS，超越GPU和CPU的效能。而应用在训练神经网路模型时，Hala Point可以全力启动超过千亿的神经元，速度是人类大脑的20倍，最高可提升到200倍。（详全文）

AI助理 GitLab Duo Chat

GitLab DevSecOps开发AI助理Duo Chat上线

软体整合开发平台GitLab最近正式推出AI开发助理Duo Chat，付费使用者可在GitLab 16.11版中使用，透过自然语言互动来完成DevSecOps程式开发。进一步来说，Duo Chat是GitLab今年初发表的AI助理Duo Pro一部分，可为工程师或非工程背景的使用者，在整个开发生命周期中提供即时引导。比如，可向Duo Chat询问CI/CD基础知识、如何重新设置GitLab密码、如何使用热门框架等。

此外，Duo Chat也正式提供3大功能，包括解释程式码、程式码重构（refactoring），也就是改善程式码、提高品质，以及自动撰写测试、加速除错等。使用者可在GitLab UI或常见的IDE如VS Code、JetBrains IDE等环境，由Duo Pro外挂来使用Duo Chat，它还能整合使用者自有工具，来满足企业开发需求。GitLab也宣布，其他Duo新功能将提供Beta版试用，包括更新的AI安全功能，如详细解释漏洞、自动解决、AI重点摘要和自动化范本工具。（详全文）

多模态 xAI 语言模型

xAI也发表多模态语言模型了

由马斯克成立的AI新创公司xAI，最近发表一套多模态语言模型Grok-1.5 Vision，很快就会提供预览版给研究员和开发者测试。Grok-1.5 Vison（或称Grok-1.5V）是继3月开源基础语言模型Grok-1、4月发表Grok-1.5后的最新研发成果，除具备文字理解能力，采用这款模型的Grok聊天机器人，现在也能处理多种视觉资讯，包括文件、图表、示意图、萤幕撷图、相片等。

xAI也列出Grok-1.5V的基准测试数据，在数学、文字理解、真实世界图片理解能力上，超越OpenAI GPT-4、Google Gemini Pro 1.5和Anthropic的Claude 3系列模型。接下来，他们将继续优化Grok-1.5V的多模态理解能力和生成能力。（详全文）

图片来源／Profluence、微软、Meta、英特尔、xAI

AI近期新闻

1. 台中荣总联手阳明交大打造Healthcare GPT

2. Meta AI聊天机器人改用Llama 3

3. Boston Dynamics发表电动人形机器人Atlas

资料来源：iThome整理，2024年4月