InfoQ 推荐 ( ) • 2024-06-15 08:37

6 月 14 日,由极客邦旗下 InfoQ 中国主办的 ArchSummit 全球架构师峰会"在深圳正式开幕。本次大会围绕“智能进阶. 架构重塑”主题,探讨了在 AI 浪潮下,企业架构如何适应大模型时代趋势,寻找既有应用成果又有成本效益的解决方案。大会聚集了国内外 100+ 顶尖专家,涉及近 70 场实践分享,全面囊括 AI、大模型、云原生、数智化、降本增效、行业实践等话题,可谓干货满满。

本次大会共设置了 17 个专题论坛,从底层基础到顶层应用多角度,覆盖 AI 运维 、AI 大模型中台、AI 安全与风控及大模型算力等热门话题。来自阿里、腾讯、百度、网易、字节跳动、 火山引擎等一众技术大厂,来自 vivo、知乎、高德地图、Uber 、蚂蚁集团、eBay、货拉拉、快手、哔哩哔哩、携程等互联网企业的技术专家,以及来自顺丰集团、微众银行、天弘基金、鸿海科技集团、宁德核电等各行业企业纷纷齐聚深圳,分享各自领域对于 AI 大模型的技术探索和应用进展

1Keynote:汇集前瞻视野、技术实践、行业应用

产业互联网的创新实践:新质生产力塑造科技的顺丰

在主题演讲中,顺丰集团 CIO / 顺丰科技 CEO 耿艳坤介绍了顺丰集团作为物流行业的领军企业,如何通过新质生产力的注入,重塑科技驱动的物流服务。

“天网”航空资源和“地网”地面运输网络一直是顺丰的两大优势,而多年来,通过在技术方面的持续投入,顺丰还打造了连接天地的物流网络智能决策体系,即——信息网。基于底层数据中台能力和对数据价值的挖掘,能够实现资源的智能化精准调度和运营异常的快速响应,不但提升整个物流效率,同时还可以进行经营成本分析与降本机会挖掘。

耿艳坤强调,只有在具体的业务场景得以落地,才能体现科技的价值。如果无法挖掘场景价值,脱离场景、脱离降本增收,技术的价值都会打折扣的。

为此,在夯实的数据基础上,近年来顺丰也在不断探索人工智能、自动化和数字孪生等技术在物流场景的全面应用,用以提升服务效率和客户体验。从智能呼叫与客户服务洞察、慧眼神瞳、智慧安检等让计算机“听懂”和“看懂”物流的场景,到现如今,顺丰正在全力打造更懂物流知识的大模型,将大语言模型全面应用到各个业务场景中去,包括收寄标准确认与智能海关查验、基于大语言模型的供应链分析助手、物流决策等等。

与此同时,顺丰还积极布局低空经济,开发多款无人机,服务于不同行业场景,包括景区、医疗、电力、应急救援等等,推动物流服务向更广阔的空间拓展。并且,为了推动绿色经济,顺丰持续致力于实现碳中和目标,通过优化运力结构、绿色包装和路径优化等措施,减少碳排放。

AI 编程颠覆 IT 生产力

除了行业业务场景之外,编程成为最高频的 AI 应用场景之一。

阿里巴巴研究员、阿里云云原生应用平台负责人丁宇(叔同)介绍了 AI 编程最终将如何颠覆生产力。他指出,企业对技术红利的追求是无止境的,但程序员产能和软件研发效率成为企业竞争发展的瓶颈之一,设计、研发侧过去十多年没有发生根本性变化,具体如何提效,成为企业关注的焦点。

“过去我们一直在探索尝试通过容器化编排调度、分时复用弹性伸缩、混合部署来提升企业资源效率,通过容器化上云、 K8s 化管理、Serverless 化架构来提升企业运维效率,通过微服务、容器化、DevOps、GitOps、IaC 来提升企业交付效率。”丁宇(叔同)表示,“但这仍然远远不够,直到 AI 时代到来,可以弥补上这块短板,大语言模型给研发领域带来了突破,带来了新的人机协同模式。”

具体而言,编码领域的人机协同经历了三个关键阶段:第一,代码辅助生成,即不改变软件工程专业分工,增强领域专业技术,AI 研发工具辅助人完成任务;第二,自主完成任务,AI 扮演单一职能专家,能够自主使用工具完成预定任务;第三,协同处理复杂任务,AI 影响着整个软件研发过程,多 Agent 互相协作完成复杂工作。

对应地,阿里云通义灵码产品实现路径也分为三个阶段:代码辅助生成、任务自主处理、功能自主研发。“我们希望为企业培养更多的 AI 程序员,人类程序员可以 965,AI 程序员 007,从而大幅提升企业生产力。”丁宇(叔同)强调,即便如此,未来主流的编程模式,还是人类程序员主导,带领 AI 程序员完成研发任务,“我们会在下半年,发布 AI 程序员产品,我们相信,通过 AI 编程,可以颠覆 IT 生产力,让程序员的产能提高 100 倍,带来生产力革命,创造更大价值。”

K8s 上的数据库私有云之旅:KubeBlocks 架构设计与实践

业务的更迭创新和变革,同样依赖于底层基础设施的支撑。

杭州云猿生数据创始人兼 CEO 曹伟总结了如今 IT 基础设施层面正在发生的三大趋势变化:第一,私有云正在从 OpenStack 时代全面进化到 K8s;第二,K8s 发展带动私有云技术水平追赶公共云;第三,K8s 正在统一公共云和私有云的 PaaS 系统。

而 K8s 作为构建 PaaS 的基础,其全景图里还缺最后一块“拼图”——dbPaaS。曹伟认为,在 K8s 上构建 dbPaaS 是大势所趋。比如,对于大型互联网公司而言,统一基础设施已经成为普遍需求,同时企业还希望在这个过程中提高密度,实现降本增效;再比如,对于央国企和银行等企业而言,除了统一基础设施之外,为满足定制化、安全合规等需求,要求进行私有云部署,而旗下数科公司除了赋能内部业务,还要构建行业云向外输出,这个过程同样需要一个统一的管控平台。

然而,数据库种类太多、研发和运维人力不足、运维操作复杂等依旧是摆在眼前的巨大挑战。对此,云猿生数据探索出了一套帮助企业在数据库容器化后,能够像搭积木一样在 K8s 上进行管理的思路和路径。

曹伟指出,为应对以上挑战,首先要解决对数据库进行抽象,以及建立标准化 API 的问题。云猿生数据推出了开源项目 KubeBlocks,通过抽象和分层管理数据库,定义了数据库容器化标准——KubeBlocks API。该标准可以把不同数据库的概念、能力、特点映射到其 5 层 API 架构中,实现一套代码管理多种数据库。

截至目前,KubeBlocks 已经集成了 35 种数据库引擎,正在试图帮助企业应对数据库私有云领域的挑战,并推动数据库服务向更高效、灵活和可扩展的方向发展。

经验传递——内部技术团队工程平台成功实践

为什么到了 2024 年,我们还在讨论工程平台?

Thoughtworks 亚太区 CTO Scott Shaw 在分享中给出了他的答案。他表示,工程平台提供了一系列精选的工具、能力和流程,能够缩短软件开发交付效率、节约劳动力和成本。也正因如此,Gartner 已经连续 2 年将“平台工程”列为年度最重要的十大技术趋势之一。

然而,在平台工程真正的落地实践过程中,仍然存在一系列可预知和不可预知的挑战。比如,由于缺少指导性路线,大家并不清楚接下来该朝哪里去,市场上也没有参考架构和清晰的设计模式;再比如,不少开发者苦于不能很好地向企业显示平台工程团队的价值,而是被视为企业内部的一个消费团队,这给实践过程带来了重重阻力。

那么,究竟如何呈现平台工程的价值?如何让工程组织更具有效率?Scott Shaw 详细介绍了建立和运营工程平台的成功因素:

第一,让用户充分参与和理解工程价值: 工程平台团队需要与产品交付团队进行深入的接触和理解,通过研讨会、一对一访谈和价值流映射来识别真正的问题,这是非常重要的基础;

第二,度量并跟踪平台提供的价值: 确定度量标准或相关指标来衡量团队成熟度,并通过商业目标、成本建模等维度定义和量化平台的价值;

第四,和早期采用者之间建立信任: 通过早期开发者的参与来建立信任,并通过持续的协作和反馈来不断改进平台性能和价值;

第五,衡量和分享进度: 在价值讨论过程中需要关注平台的业务成果和财务可行性,但现实情况中这些业务成果通常有所滞后,为此,企业需要通过领先指标来同步平台交付团队和软件开发人员的目标受众的有效性;

第六,构建资金模型: 资金模型的构建需要在平台工程团队、产品工程团队和其他技术功能之间找到平衡;

第七,持续的优先级排序:将工作流程应用嵌入到工程平台,进行持续的优先级排序,确保平台的工作与业务目标和交付团队的价值相一致。

大模型时代深度学习平台的挑战和机遇

百度飞桨总架构师于佃海在压轴分享中深入剖析了大模型时代下深度学习平台面临的全新挑战和机遇。他指出,大模型时代下,模型参数规模和数据规模的快速增长面临着算力瓶颈,大规模分布式训练成为刚需;另一方面,大模型带来的 AI 开发应用方式的变革,也给深度学习平台带来新的需求。

对此,深度学习平台面临两方面的挑战:

其一,从大模型基础技术特点来看,深度学习模型结构逐步收敛,模型和数据规模持续增长。这使得模型通用开发需求相对变弱、Transformer 深度支撑需求变强,而大规模分布式计算上升为核心能力,与硬件的协同优化非常关键。

其二,从大模型全流程开发应用来看,训练呈现多种模式不同需求,推理部署的重要性凸显。因而亟需分布式策略的更便捷的开发能力,并进而能支撑不同场景的高效分布式训练;同时需要具备高效推理服务能力,并能为大模型提供训推一体全流程支撑。

换言之,基础设施能力已成为大模型的关键竞争力,构建低门槛低成本、极致训推性能、效果协同优化的大模型坚实底座成为当务之急。

对此,于佃海还进一步分享了飞桨平台如何通过训练吞吐、收敛效率、大规模集群训练有效率三个维度实现大模型训练提效,以及从模型压缩、高效推理计算和服务化部署三个环节实现推理吞吐和时延的优化,从而搞定大模型训练和推理的一系列挑战,支持文心大模型快速迭代发展。

最后,于佃海指出,深度学习平台加大模型,共同构成了当前人工智能的基础技术底座。自主创新的飞桨平台和文心大模型,在支撑 AI 技术创新迭代和产业智能化升级中将会发挥更大作用。

26 大专题论坛并行,涉及基础设施、AI 运维、AI 应用多个热点

6 月 14 日第一天大会下午期间,6 大并行专题论坛成功举行,现场听众累计超过 800 人次。

专题 1:AIOps 业务场景最佳实践

在“AIOps 业务场景最佳实践”专题论坛上,网易云音乐资深测试开发工程师宋东辉、群核科技云原生观测技术专家何碧宏、字节跳动 Dev Infra-APM 服务端观测平台负责人孔罗星、阿里云高级算法工程师陈昆仪博士、腾讯文档高级工程师张瀚元,聚焦 AIOps 在不同业务场景中的实际成效展开了分享,包括在实际的业务场景中如何利用 AIOps 提升业务效能,并取得可度量的业务价值。

专题 2:AI 助力工业 / 制造智能化

在“AI 助力工业 / 制造智能化”专题论坛上,富士康智能制造平台平台赋能处副经理李延顺、顺丰科技智慧供应链产品负责人苏冠、清智优化董事长兼总经理蒙绎泽博士、腾讯云高级产品专家王刚,分享了 AI 在工业质检、供应链、智能决策等工业制造场景的最新应用案例和最佳实践。

专题 3:大模型基础框架

在“大模型基础框架”专题论坛上,华为昇腾产品线 AI 框架规划专家赵英俊、百度深度学习技术平台部杰出架构师胡晓光、阿里云资深技术专家李永、腾讯机器学习平台部大模型训练框架研发技术专家薛金宝、微众银行基础科技产品部室高级经理黄叶飞,深入探讨了各行业中大模型训练和推理的基础架构和关键技术,包括训练加速、多维并行、万卡集群、高性能算力等技术焦点。

专题 4:智算平台建设与应用实践

在“智算平台建设与应用实践”专题论坛上,百度混合云部资深技术专家肖松、天翼云云网产品事业部研发专家黄坚、火山引擎容器服务技术总监乐金明、Thoughtworks 全球数字化转型专家肖然、vivo 互联网高级工程师于相洋,分享了各自在构建智算平台方面的实践经验,包括该过程中的技术要点,以及在实践和落地过程中所作的优化和踩过的坑。

专题 5:高可用架构实现

在“高可用架构实现”专题论坛上,阿里云云通信架构师张松然、Akamai 高级解决方案顾问李岳霖、字节跳动视频架构智能组网负责人游望秋、高德地图架构师邓学祥,分享了各自领域内的高可用架构最佳实践,深入探讨了从解构系统的复杂性到控制成本、保障数据安全,以及如何更有效地利用云服务、容器化、微服务、DevOps 等前沿技术来确保系统的稳定运行等话题。

专题 6:成本优先的技术架构

在“成本优先的技术架构”专题论坛上,Shopee Marketplace  Expert Engineer 张俊杰、知乎数据库架构团队负责人代晓磊、腾讯云专家工程师林兆祥、字节跳动基础架构 /Lidar 性能平台负责人张金柱,分享了在如今的大环境下,企业如何根据业务需求和成本效益进行权衡,以探索在各种约束下做出最佳决策的路径,进而适应不断变化的业务环境和技术更迭。

10+ 精彩专题明日揭幕,敬请期待

除此之外,在 6 月 15 日全天的大会上,还有 11 个专题论坛即将拉开序幕。包括高效算力基建与性能优化、大模型应用层探索、低代码与 AI 结合、Data 4 AI & AI 4 Data 探索和实践案例、AI 大模型中台实践探索 、LLM 作为新一代‘OS’的探索、AI 时代的安全与风控、创新技术在金融业的应用、技术驱动商业价值转化、架构师顺应时代变化的成长之路、业务平台架构,多维度囊括技术前沿、行业应用、技术人职业发展等话题。

现场亮点回顾

极客邦产品 “AIGC IN ALL"

InfoQ 极客传媒副总经理赵钰莹在大会上介绍了近一年来极客邦科技及 InfoQ 围绕生成式 AI 和大模型技术发展所展开的内容工作和现有成果。

除了技术实践和行业应用的相关内容报道,极客邦科技多年来一直致力于面向企业进行数字人才的建设与培养。通过与行业专家和领先企业的合作,我们深入剖析了 AIGC、大模型等前沿技术对各行业的深远影响。并且,今年「极客时间企业版」还在业界首发了企业 AIGC 应用程度测评以及 AIGC 人才能力建设学习地图,这系列创新工具和解决方案都是为了帮助企业在 AI 大模型时代构建和完善 AIGC 人才培养体系而设计。

而为了让更多成熟经验和优秀实践在千行百业间流转,让技术改变世界更加具象化,以更好地“推动数字人才全面发展,助力数字中国早日实现”,极客邦科技于近日正式开启首期专家招募计划,希望与有行业经验的管理专家、技术专家、产品专家等共绘数字化时代的宏伟蓝图。欢迎感兴趣的业界专家与我们取得联系。

现场高朋满座

大会现场气氛热烈,座无虚席,“举机率”高。不少与会者表示,此次大会围绕当下 AI 和大模型热点,从多方位做了技术架构实践分享和解读,为其日常工作开展提供了具有价值的参考。我们深感荣幸与欣慰,感谢每一位参与者的支持与鼓励。正是有了大家的热情参与,我们才能不断前行,继续努力成为技术传播领域的佼佼者,持续提升内容质量,打造更加优质的交流平台,共同推动技术领域的创新与突破。

展区人头攒动

会场展区人头攒动,人流络绎不绝。ArchSummit 深圳站的圆满举办,离不开赞助商们贡献的力量。在大家的共同助力下,我们得以持续推动技术的传播与发展,为行业创新注入不竭源泉。本次 ArchSummit 深圳站大会得到了众多赞助商的大力支持,包括云猿生、Akamai、百道数据、IPIP、ProtonBase、未来智能、英特尔等。他们的参与不仅为大会增色不少,也为技术共享和行业发展提供了坚实基础。让我们一同回顾这些令人难忘的精彩瞬间。

沉浸式特色晚场

为了为参会者提供一个更加深度的交流平台,本次大会特别策划了沉浸式特色晚场,现场来自不同企业十数位与会者共聚一堂,围绕“大模型创业的新机遇与挑战”和“大模型时代的软件架构师:如何不错过这次技术革命?”两大主题展开了深入交流。

至此,ArchSummit 全球架构师峰会深圳站第一天大会圆满落幕。6 月 15 日,我们期待与你一同继续深入探讨智能化时代的架构重塑!

极客邦活动推荐

2024 年, 极客邦科技旗下 InfoQ 中国已圆满启动 3 场技术盛会,而在即将到来的 8 月份,FCon 全球金融科技大会和 AICon 上海站将联诀来袭,AI+ 金融、技术前沿 + 行业前沿,一站式体验和领取多重干货。如您感兴趣,可点击下方二维码查看更多详情。

购票或咨询其他问题请联系票务同学:13269078023,或扫描下方二维码添加大会福利官,领取福利资料包。