新聞 | iThome ( ) • 2024-05-03 06:59

Google Cloud在会中提出一个生成式AI产品架构蓝图,将生成式AI产品架构从过去生成式AI开发工具为主的开发架构,变成是扩大延伸到各种云端服务的产品架构。(图片来源/Google Cloud)

「GAI代理(Agent)将会翻转开发者、企业与运算装置和Web的互动的方式。」Google Cloud执行长Thomas Kurian在今年Next大会开场时这样强调,不分产业,企业纷纷利用生成式AI推动业务成长、增强用户体验,以及改善开发者生产力和提升IT维运效率,「 许多行业正因为GAI而开始改变。」

过去一年,企业GAI应用的风潮席卷全球,成了三大公云积极抢攻的新战场,微软靠著OpenAI助攻,去年在这场云端GAI大战中取得先机,而Google后来居上,靠著自家PaLM模型和GAI生产力工具来迎战,AWS则是到去年底年会上,对于企业GAI应用布局才有比较完整的布局与揭露。

Google在生成式AI布局动作频频。去年8月的Next大会成了Google生成式AI的火力展示,更是对微软Copilot战略的反击。进到2024年,Google更加快GAI产品发布和更新的脚步,积极布局新一代企业生成式AI建置需求。

在今年的Next大会上,Google Cloud执行长Thomas Kurian在开场时强调,今年的策略将聚焦于加速企业业务和产业数位转型,他同时也揭露了在AI布局的多项成果,其中包括不到一年,已有上百家主要企业都已经开始在内部应用中采用Gemini,包括了麦当劳、德国银行、HCA健康、USS、Mayo Clinic医疗机构等,在今年大会期间,更举办超过300场企业GAI应用实例,涵盖金融业、零售业、医疗业、制造业等。

Vertex AI和各种云端服务中开始引进新一代Gemini 1.5模型

Google在今年2月发表性能更强大、能够支援超长文本的Gemini 1.5多模态模型,更成为今年Next最受嘱目的焦点。

在Next大会,Google将这款最新版Gemini模型上架到生成式AI开发平台Vertex AI的模型花园中,Gemini 1.5模型不仅可同时支援文字、图片、影片、声音及程式码的输入,而且在Token处理数量上也比1.0版多出了31倍,甚至比GPT-4 Turbo高出7.8倍,最多可支援输入长达100万个Token,相当于一次能处理1小时的影片、11小时的音讯或逾70万字的内容。

Vertex AI先提供了中阶款模型Gemini 1.5 Pro的公开预览,并推出两个不同规模的版本,分别能处理12.8万个和100万个Token数量的资料。Google强调,Gemini 1.5 Pro模型在输出品质上足以媲美前一版最高阶Gemini 1.0 Ultra模型,同时能减少运算量。

Gemini 1.5 Pro还支援处理语音音讯串流和视讯的音讯,并具备跨模态分析功能,能够同时分析文字、图片、视讯和音讯等不同类型的资料,此外,提供高品质的转录功能,可用于搜寻和分析。例如,可以使用Gemini 1.5 Pro对财报电话会议或投资人会议影片或录音进行搜寻、分析和回答问题。

目前已有United Wholesale Mortgage、SAP、TBS、Replit等企业开始在Vertex AI平台上使用新版模型建立新的AI应用,包含AI驱动的顾客服务代理、学术指导导师,还能用AI分析大量复杂的财务文件、检测文件中资讯不一致,以及用自然语言进行资料集的探索。

最新的Gemini 1.5 Pro,现在也能在Gemini Cloud Assist云端助手服务中以私人预览方式提供,一次可以输入最多30万行的程式码,意味著,可以在程式库中执行大规模程式码检索、除错及测试,亦有助于加快企业许多老旧系统的现代化改造,将大批老旧程式语言转为现代语言。Google Cloud平台与技术基础架构总经理Brad Calder强调,Gemini程式开发AI助手让开发人员的工作效率因此提高30%。

在Next大会上,Google提出了5种企业上云转型的新路径,可从五种云端服务类型开始上云,分别是基础架构云、开发者云、数据云、资安云、协作云。Google也将最新Genini模型整合到这几类云服务中,像是协助回答问题,提供AI预测等。

以基础架构云为例,Google开始在企业资料中心部署的GDC分散式边缘设备上提供各种开放AI模型,如Gemma、Llama等,并推出生成式AI搜寻支援功能,让使用者可以透过自然语言搜寻从本地资料中心或边缘环境上快速检索和分析内部相关的资料和内容,从而提高员工工作效率和知识共享。

Google更推出了多项基础架构的技术创新,可以用来支持庞大AI发展的需求,像是正式推出新版的TPU v5p,还推出A3 Mega、Nvidia Blackwell GPU运算平台,支援大规模的GAI模型训练与推论。Google更展示首款专为资料中心设计的Arm架构处理器Axion,跟同级的x86虚拟机相比, Axion效能提高了50%,能源效率也提升60%,未来有可能将其与TPU一同用于GAI模型服务。目前这款处理器已在Spanner、BigQuery、GKE、Google地球引擎和YouTube广告服务中使用。

在云端应用生命周期管理上,Google推出名为Gemini Cloud Assist的云端维运助手的私人预览, 也就是先前专用于IT维运设计的Duet AI助手进化版,不只采用最新Gemini模型,能够涵盖应用程式生命周期的管理,提供包括目标设计、安全、维运指导、故障排除等多方面辅助功能。另外提供效能和成本优化的建议。(摄影/余至浩)

Google公布新生成式AI产品架构

Google Cloud在会中提出一个生成式AI产品架构蓝图,将生成式AI产品架构从过去生成式AI开发工具为主的开发架构,变成是扩大延伸到各种云端服务的产品架构。

这个产品技术框架可以进一步分为4层,虽然和过去生成式AI开发平台Vertex AI都是4层架构,但两者在本质上有很大的差别。新架构最底层是AI Hypercomputer超级电脑基础架构,专门针对生成式AI强化推出的基础架构,提供AI模型训练和服务所需的各种AI加速硬体、软体框架和相关系统资源,与Vertex AI的底层是以一般性的云端基础架构为主有所不同。

再上一层是Gemini模型。原本Gemini只是Vertex AI模型花园中的一个模型,现在被拆分出来,成为与Vertex AI开发工具并重的另外一个重要的功能。这是因为Gemini模型已经变成支援Google Cloud所有产品的重要核心基础模型。第三层是生成式AI平台Vertex AI,包含了AI Studio、Colab、VS Code等各种GAI开发工具。最上层则是Google云端服务和办公生产力Workspace专用的Gemini助手,以及企业自建的生成式AI代理。

新产品架构下的Vertex AI平台,现在进一步加强企业GAI 代理开发的支援。

例如在模型建置上,Google将Google搜寻作为可信来源的参考基准,推出Grounding with Google Search新服务,利用Google搜寻结果比对模型生成的内容,借此提高回应品质并减少幻觉。在模型微调方面,Vertex AI提供简化提示设计,让开发者更容易撰写出高品质的提示,并推出新提示管理工具,可用于管理、追踪,比较不同提示版本的回应品质。此外,模型部署到正式环境前,开发人员也能利用新的模型评估机制AutoSxS比较两个LLM模型版本的差异对于最后模型推论的影响,以此选择最佳模型版本用于生产环境。

Google这次推出了一站式AI解决方案,称作Vertex Al Agent Builder,该方案进一步结合「搜寻」和「对话」两类GAI应用套件,能快速在企业内部应用建立和部署No Code对话式生成式AI代理,且可与企业系统相连接,让生成的回复内容可以贴近企业的实际情况。

Thomas Kurian指出,企业在Vertex AI中可以快速自建GAI代理,来执行不同任务,像是有顾客服务的AI代理、员工管理的AI代理,还有创意设计、数据分析、程式撰写和资安等不同的AI代理。「每一个GAI代理都具有多模态执行能力,能够同时处理多种资讯。」

Google公开了最新的TPU模组机架式机柜(左图)和云端GPU机柜(右图),用来提供包含Gemini在内的GAI模型训练和服务。每台TPU模组机柜最多可容纳64个TPUv5p模组。(摄影/余至浩)

云端AI维运助手不只提供云成本优化的建议,还支援目标驱动设计

Google今年云端产品发布中另一个重要焦点,著重在加强其云端服务GAI整合能力,与去年刚推出时相比,现在在Google云端服务中不仅可以使用GAI助手完成更多任务,进一步也将其扩大到更多的服务中。

Google今年开始以生成式AI助手Gemini为品牌,应用在各种云端服务中,推出软体开发AI助手、应用生命周期平台的AI维运助手、资料分析平台的AI分析助手,BI平台的AI洞察助手,资料库的A管理助手,以及资安的AI防护助手。

AI维运助手的最大特色是,引进最新Gemini模型,涵盖应用程式生命周期的维运管理。

例如,AI维运助手现在能支援目标驱动设计的功能,让维运人员可以用自然语言描述建立待测试的目标和使用者旅程流程,进而产生自订的测试脚本,根据需求进一步提供架构配置、部署或设定,例如提供网路配置或协助三层架构应用程式部署、理解Terraform脚本等。

此外,还能搜集和分析Cloud Logging中各种日志,提供IT团队相关摘要和解释,并提供故障排除的建议。甚至在身分权限控管上也能使用AI维运助手提供IAM身份识别与存取管理的建议,例如根据企业资料、加密偏好以及合规性需求在加密金钥建立过程中提供协助。

服务效能和成本优化也是AI维运助手这次新增的功能之一。例如可以侦测哪些丛集是在开发或测试环境中执行,或是被用于实验的丛集,还可识别资源过剩的丛集并提供建议,让管理者可以重新调整资源分配,降低云端花费。

在资料服务的AI助手上,Google Cloud持续强化旗下资料产品与Gemini的整合。举例来说,现在在BigQuery资料仓储中,资料分析人员可以自然语言方式向Gemini助手提需求进行资料准备、查找、分析及治理,并且能够使用Gemini 1.0 Pro,执行多模态和进阶推理的功能。

不仅如此,BigQuery与Vertex AI之 间的结合更紧密,使用者可以直接在BigQuery中存取Vertex AI中的AI 型,代表企业可以将这些AI模型、ML operators和统计分析功能纳入到企业内部资料工作流程中,进行多模态 析,包括结构化与非结构化资料。在BigQuery中能透过Vertex AI模型API处理文件档案和音讯。不过目前这些Gemini功能大多处于预览阶段。

在应用开发辅助方面,Google宣布其程式撰写AI助手现已达企业级的安全 和可靠,并支援最新的Gemini 1.5 Pro,可以在程式库中执行大规模程式码检索、除错及测试。在云端资安防护方面也强化了与Gemini的整合。例如,将Gemini整合至SecOps维运流程中,并开始在威胁智慧情报服务与SCC安全指挥中心中提供相关的Gemini服务。

除了推出算力更强的AI硬体,Google首款资料中心设计的Arm架构处理器Axion首次公开亮相,未来有可能将其与TPU一同用于GAI模型服务。目前这款处理器已在Spanner、BigQuery、GKE、Google地球引擎和YouTube广告服务中使用。(摄影/余至浩)

企业办公生产力工具深度整合Gemini能力,还增添影片创作AI助手Vids

企业生产力应用是另一大云端GAI战场。为了力抗微软M365,Google Workspace在今年二月开始引进Gemini模型,加强对Workspace内容的多模态进阶理解能力,Google同时也将Workspace的AI助手Duet AI改名为Gemini,并推出商用版与企业版,提供更多企业级功能。

Workspace目前拥有超过30亿使用者和超过1,000万付费订阅客户。Google Workspace的副总裁兼总经理Aparna Pappu表示,在近8个月内,在Workspace中使用Gemini服务的用户超过一百万人,还有上千家企业采用,包括Uber、Verizon、Sports Basement等。

Workspace今年产品更新一大重点就是GAI。Gemini现在已经能够跨Workspace产品线生成内容,Chat和Docs中都开始使用最新的Gemin模型。

在Gmail中新增语音提示和即时润色,只需向Gemin说出「帮助我写作」,就能完成草稿,并且一键转换为完整的电子邮件。Meet上新增了AI会议和传讯的扩充功能,每位用户每月10 美元,可以提供「为我做笔记」、「为我翻译」等功能。还可以自动检测和翻译Meet中的字幕,最多支援 69 种语言,并在预览版Chat中自动翻译讯息、对话摘要和问题回答,将于今年稍后推出。

Google也透过AI加强Workspace的资安防护,推出AI Security商用附加服务,能够协助资安人员自动分类Google硬碟中的敏感文件并提供防护。此外在测试版Gmail中开始提供DLP资料外泄防护的控制和分类标签功能,甚至之后将实验后量子加密PQC演算法纳入其中。

Workspace这次还推出了全新的AI影片创作生产力服务Google Vids。这是一个整合影片、写作、制作和编辑的AI助手,让即使是不熟悉影片创作的行销人员也能快速制作出各种影片内容,用于产品行销、人才培训、团体庆祝等活动。 Vids虽然采用了Gemini模型,但与OpenAI的短片生成AI模型Sora不同,并非生成完整的影片内容,而是根据使用者的描述从影片资料库中找出相应的影片、图片和背景音乐的场景,然后将它们整合在一起,协助使用者完成分镜脚本、后制和编辑。这项实验性服务预计在6月推出。

随著GAI应用在2024年大爆发,Thomas Kurian强调,企业正在迎来一个GAI代理的新时代,并且建立在全新、完全开放的AI平台之上,「我们正在重塑云端基础架构,以因应此一趋势。」

不只抢攻云端GAI,Google正在透过在手机上执行的轻量Gemini模型,以及用相同技术所开发的开源边缘AI模型Gemma,瞄准企业边缘GAI应用需求。