InfoQ 推荐 ( ) • 2024-04-22 14:30

整理 | Tina、梓毓

Meta 推出开源大模型 Llama 3;李彦宏:开源 AI 模型只会越来越落后!昆仑万维“天工 3.0”基座大模型与“天工 SkyMusic”音乐大模型开启公测;微软发布 Vision Pro 原生 OneNote 应用;刘强东数字人直播,27 分钟观看人数破千万;腾讯云 4.8 故障原因曝光;蚂蚁语雀创始人,飞书开放平台负责人离职创业;淘宝登陆 Apple Vision Pro 商店;曝特斯拉中国裁员最高比例 50%!新版 Firefox 125.0.1 版发布;Adobe 探索与 OpenAI 合作,推出人工智能视频工具;英特尔中国特供版 Gaudi3 AI 芯片……

科技公司

Meta推出开源大模型Llama 3:最大底牌4000亿参数,性能直逼GPT-4

北京时间 4 月 19 日,Meta 官宣发布了其最先进开源大型语言模型的下一代产品——Llama 3。据悉,Llama 3 在 24K GPU 集群上训练,使用了 15T 的数据,提供了 80 亿和 700 亿的预训练和指令微调版本。

Meta 在官方博客中表示,“得益于预训练和后训练的改进,我们的预训练和指令微调模型是目前 80 亿 和 700 亿 参数尺度下最好的模型。”此外,Meta还同时发布了AI助手的更新版本。该助手将在Meta的Facebook、Instagram、WhatsApp和Messenger应用以及一个新设立的独立网站Meta.ai中获得更突出的地位,让Llama 3能够更直接地与微软支持的OpenAI的热门产品ChatGPT竞争。

Meta在去年7月份发布了Llama 2。此后,包括谷歌、马斯克旗下的xAI与Mistral等在内的数家公司发布了开源的大语言模型,竞争十分激烈。Llama 3直接对标OpenAI的GPT-4,后者已经成为一个强大的多模态模型,不仅能够处理更长的文本,还支持图像输入。

开源的Llama是Meta人工智能战略的重要组成部分。Meta首席执行官马克·扎克伯格在本月初向投资人表示,今年的主要关注领域包括推出Llama 3和“扩大Meta AI助手的实用性”。

李彦宏:开源AI模型只会越来越落后!

4月16日,百度创始人、董事长兼首席执行官李彦宏在 Create 2024 百度 AI 开发者大会上发表了题为《人人都是开发者》的演讲。据其称,文心一言去年3月16日正式发布,截至目前用户数已经突破2亿,每天API的调用量突破2亿,服务客户数达到8.5万,利用千帆平台开发的AI原生应用数超过19万。他认为,大模型和生成式 AI 将彻底改变开发者这个群体。

李彦宏提到,有了基础模型文心 4.0 之后,百度可以根据需要,兼顾效果、相应速度,推理成本等各种考虑,剪裁出适合各种场景的更小尺寸模型,并且支持精调和 post pretrain(一种预训练的模型训练方法)。

这样通过降维剪裁出来的模型,比直接用开源模型调出来的模型,同等尺寸下,效果明显更好;同等效果下,成本明显更低。基于这种对比效果,李彦宏放话称:开源模型会越来越落后。

针对近日李彦宏说的未来大型AI原生应用将是大小模型混用,圈内一众大佬发表了看法。

贾扬清在朋友圈发文表示支持,并觉得Robin这点说得非常对,在初始的应用尝试过去之后,模型的特化会是一个从效果上和从性价比上更加make sense的选择。

张俊林也对Llama 3以及大模型开源与闭源发表了一些个人看法:“目前从模型能力而言,整体来说开源阵营确实是弱于闭源阵营的,这是事实,但是从最近一年半的技术发展来看,开源模型(包括国外和国内的模型)和最好闭源模型的差距是在逐步缩小的,而不是越来越拉大的,这也是事实,很多数据可以说明这一点。”

截图来源:https://m.weibo.cn/status/5024878134823430

第二十七届哈佛中国论坛上,周鸿祎谈到了开源大模型的发展。他认为,虽然现在开源模型的能力达不到 GPT 4。但是专注在一个方向上,用企业内部的专有数据加上专有工具进行能力的加强之后,它就有可能在专业能力上超过 GPT 4。

“我是一直相信开源的力量,至于说网上有些名人胡说八道,你们也别被他们忽悠了,说开源不如闭源好。一句话,今天没有开源就没有 Linux,没有 Linux 就没有互联网,连说实话的公司自己都是借助了开源力量才成长到今天。开源社区聚集的工程师和科学家的数量是闭源的数百倍。所以今年开源只做了一年就已经超过了 GPT-3.5 的能力,所以我觉得未来一两年内,我认为开源的力量很有可能会达到或者超过闭源的水平。”

雷军回应被称"爽文第一男主":我不是高考状元 卡里也没有冰冷的40亿

4月18日,小米集团CEO雷军回应网上流传的“雷军的爽文人生”。雷军辟谣称,我不是爽文男主,也没考过700分,我也跟大家一样在农村出生,靠勤奋靠努力,也靠这个时代的机会,一步一步走到今天,我觉得人生成功绝对不是什么爽文。大家看一下笑一笑就好,听到这个“爽文第一男主”,我浑身都不舒服,也请大家帮我辟谣。

意料之外的,此次直播开场形式不是直接“上链接”,而是先带领大家观光小米汽车的交付中心。雷军表示“今天直播不带货,聊聊天。”直播中,雷军回应穿着模仿马斯克。 **雷军称,我其实挺郁闷的,男士西服就那么几种颜色,马斯克那件衣服,好像也只看到他穿过一次,真的是不小心撞衫了。如果我要模仿马斯克,可以模仿得更好。**他提到更委屈的是之前做手机,也被说模仿乔布斯。当时开发布会也没想过要换衣服,就穿着平时的衣服上台了,如果模仿乔布斯也可以“Cosplay”得更像。

雷军在直播中辟谣:“我特别希望今天在线的朋友们帮我辟谣,第一个我不是高考状元,**我没有考过700分,我在人生低谷里面卡里也没有冰冷的40亿。**我也跟大家一样,在农村出生,靠勤奋、靠努力,也靠这个时代的机会一步一步走到今天。”对于网络上流传的消息,雷军称“大家看看笑一笑就好,这些都不是真的,所以恳请大家帮我辟谣。

Stability AI宣布裁员20人,约占员工总数的10%

4月18日,据外媒报道,英国 AI 公司Stability AI 宣布裁员20人,占其员工总数的约10%。就在此前一天,该公司刚刚宣布扩大其旗舰模型的使用范围。

这一裁员决定是在其创始 CEO 离职后的动荡几周之后做出的。据 CNBC 报道,这家总部位于英国的 AI 公司运行着稳定扩散文本转图像模型,裁员决定是公司 “战略计划的一部分,旨在降低我们的成本基础,加强与我们的投资者和合作伙伴的支持,并使团队能够继续开发和发布创新产品。” 公司在一份致员工的备忘录中表示,裁员部门尚未明确。

Stability AI 公司近几个月经历了一段动荡时期,数位知名研究人员以及其创始 CEO Emad Mostaque 纷纷离职。Mostaque 于三月份辞去了他的职务和公司董事会成员身份,表示他想要 “追求去中心化的 AI”。Stability AI 的裁员决定标志着自生成式 AI 兴起以来首个主要 AI 基础模型裁员。

该公司最近发布了其旗舰型号的下一代 Stable Diffusion,并宣布了对 Stable Diffusion3的API访问。它还在本月宣布了其 Stable Audio 文本到音频 AI 模型的新版本。然而,尽管该公司不断发布 AI 模型,但也成为涉嫌使用受版权保护的材料来训练其模型的诉讼的对象。去年,盖蒂图片公司起诉了Stability AI 。这起案件将很快在英国进行审理。

昆仑万维“天工3.0”基座大模型与“天工SkyMusic”音乐大模型开启公测

4月17日,国内AI公司昆仑万维正式推出了4000亿参数的“天工3.0”基座开源大模型,成为全球最大的开源MoE(混合专家)大模型。

相较于上一代,天工3.0的模型技术知识能力提升超过20%,数学、推理、代码、文创能力提升超过30%,多模态性能超越GPT-4V。 天工 3.0 拥有 4000 亿参数,超越了 3140 亿参数的 Grok-1,是全球最大的开源 MoE 大模型。天工 3.0 在语义理解、逻辑推理、通用性、泛化性、不确定性知识、学习能力等领域性能提升显著,数学 / 推理 / 代码 / 文创能力提升超过 30%。

同样在4月17日,昆仑万维还宣布,中国首个音乐SOTA(领域最佳水准)模型“天工SkyMusic”音乐大模型也正式开启公测,综合体验远超于风靡美国的 AI 音乐生成平台Suno V3。

天工 SkyMusic 采用音乐音频领域类 Sora 模型架构,Large-scale Transformer 负责谱曲,来学习 Music Patches 的上下文依赖关系,同时完成音乐可控性,Diffusion Transformer 负责演唱,通过 LDM 让 Music Patches 被还原成高质量音频,使其能够支持生成 80 秒 44100Hz 采样率双声道立体声歌曲。

微软发布 Vision Pro 原生 OneNote 应用

4 月 17 日消息,继此前推出适用于苹果混合现实头戴设备 Vision Pro 的 Office 系列应用之后,微软今日又发布了适用于 visionOS 的原生 OneNote 应用。

微软一位产品经理在博客中确认了这一消息。根据微软的说法,OneNote 将能利用苹果 Vision Pro 的空间计算功能提供“无限画布”,并可以与其他已经登陆该平台的微软应用 (例如 Word、Excel 等) 并排显示。OneNote 是微软广受欢迎的笔记应用。

微软表示:我们与苹果密切合作多年,将这些体验带到 iPhone、iPad 和 Mac。现在,借助 Apple Vision Pro,OneNote 将利用空间计算的无限画布,并且可以与其他出色的微软应用程序(如 Word、Excel 和 Teams)并排显示,以实现令人难以置信的多任务处理。

当然,适用于 visionOS 的 OneNote 应用经过专门优化,可以充分利用 Apple Vision Pro 的硬件优势,用户可以自由选择用手势操作或通过蓝牙连接的键盘和触控板进行操作。微软还确认,未来的更新将加入对 Copilot 和双重身份验证的支持。

曝特斯拉中国裁员最高比例50%!上海工厂和所有门店开始裁了,赔偿N+3

本周一,特斯拉宣布全球裁员10%,效力18年的高管也宣布离职。此次裁员影响的员工超过1.4万人,当日特斯拉股价大跌。北京时间周二(16日)晚,马斯克表示,特斯拉需要每隔五年左右进行一次“彻底的组织改革”,间接回应了特斯拉全球大裁员的消息。

据4月17日消息,此次裁员也涉及中国市场,特斯拉中国区裁员涵盖多个部门,部分部门已裁员完毕,销售人员是“重灾区”(据悉,一些部门裁员30%-40%,个别部门或指销售部门甚至高达50%,而其他部门普遍在20%左右)。4月17日,上海某特斯拉门店店员回应称:“确实在裁员,但不会影响到消费者,只是内部人员结构的调整”。

本轮裁员中,大量特斯拉员工都是大入职6个月以内的新员工,采取0.5N+3赔偿方案,入职一年以上的员工,则采取N+3赔偿方案。有被裁员工自称,入职特斯拉5年,拿到一次性裁员补偿45万元。而新入职的,6个月以内的被裁员工,补偿金普遍在4-5万元左右。

北京时间4月17日凌晨3点,特斯拉CEO马斯克在社交媒体平台称,特斯拉正在精简销售和交付体系,这个体系“已变得复杂而低效”。

据两名被解雇的特斯拉员工透露,一些最近被裁减的员工收到通知,他们的离职协议已于周四被取消,预计会有新的协议。根据媒体获得的一封电子邮件,这些员工收到了一份名为“你的离职协议”的通知,上面写着“状态:取消”。该通知显示:“发件人取消:取消以发送更新协议”。

就在此之前,特斯拉CEO埃隆·马斯克(Elon Musk)发送的内部电子邮件表示,该公司本周向一些被解雇工人发放的遣散费过低。马斯克称,“在我们进行重组时,我注意到一些遣散费过低。我对这个错误表示歉意,正在立即纠正。”一些收到通知的前员工此前已经获得了两个月的遣散费。据收到遣散费的五位消息人士称,遣散费的数额似乎并没有根据员工在特斯拉工作的时间长短来衡量,因为在特斯拉工作几个月到几年的员工得到的遣散费是一样的。

刘强东数字人直播,27分钟观看人数破千万

4月16日下午6时18分,由京东云言犀打造的“采销东哥”AI数字人开启直播首秀,同时亮相京东家电家居、京东超市采销直播间。不到1小时,直播间观看量超2000万。从京东给出的数据看,在40分钟的直播内,刘强东数字人带货能力得到了验证。

根据京东提供的数据,在刘强东数字人带货期间,直播间整体订单量破10万,直播间观看人数超1300万,创造京东超市采销直播间开播以来观看人数的最高峰;直播时段用户平均停留时长达到日常均值的5.6倍。

虽然直播取得开门红,但是不少消费者认为相较于真人主播,数字人直播时语气平淡,表情单一,缺少互动感。此外,对于刘强东数字人今后是否会常态化直播,京东尚未给出回应。此外,后续直播能否延续首播热度,也是问题。

“刘强东下场”直播是京东在直播带货领域的一次重要尝试,有望为京东带来更多的关注和流量。同时,也为京东AI电商战略释放新的重大信号。

早在一年前,淘宝直播机构开始布局AI数字人直播,一些头部直播间和品牌店铺直播间就尝试使用AI数字人直播带货。据悉,目前阿里成立了一支AI电商团队,正在打造一款针对商家和达人的AI电商产品“绘蛙”,将为淘宝、天猫商家和达人在生成营销文案、训练专属AI模特等方面提升创作效率,使商品快速被种草。

然而,这些布局却赶不上创始人亲自下场的声量。这次刘强东数字人参与直播活动,不仅为京东直播引流,也让外界看到了京东在AI技术方面的成果。

蚂蚁语雀创始人,飞书开放平台负责人离职创业

4月16日,有消息称字节跳动旗下开放平台负责人王保平(玉伯)已于近日正式从飞书离职。

据了解,玉伯于2008年加入阿里;2012年,加入支付宝前端开发部,负责基础组;2015年,创建体验技术部聚焦蚂蚁中后台业务,并一手打造语雀。其参与过 Sea.js、KISSY、Arale 等开源项目,在技术圈是有名的前端大佬,曾先后担任支付宝体验技术部负责人、蚂蚁集团终端技术委员会主席。

玉伯在蚂蚁集团工作15年,于2023年5月左右从阿里离职加入飞书。据悉,从阿里离职时,玉伯的职级是P10。同时,他一直以来也都不是一个安于现状的人,所以他从研究所出来了。当然,也是他为何后来从阿里、字节离职的原因之一。

今年2月,他开始思考自己的下一步。“AI终于已不再是 AIGC,而是有机会做 AI应用。不断思考和尝试,让我越来越觉得靠谱可行。虽然是资本的寒冬,但寒冬里大家都谨慎,都谨慎反而成活的概率高。值得出来干一票。”

淘宝登陆Apple Vision Pro商店:实现沉浸式购物

4 月 15 日消息,淘宝在 App Store 上线了 Vision Pro 版本,可以通过 Vision Pro 将商品投影到现实中查看,并与其他商品对比。淘宝与苹果Vision Pro的深度合作,标志着电子商务领域与前沿科技融合的新里程。

使用 Vision Pro 逛淘宝可以获得 3D 立体的购物体验,Vision Pro 识别到平面之后,商品会吸附在平面上,同时有真实世界的光影效果。用户可以自行放大缩小查看商品细节,也可以选择 1:1 比例模拟物品在真实世界的大小。

从淘宝展示的 App 界面了解到,Vision Pro 版淘宝可以同时展示多个商品,方便用户进行比较,还可以直观地看到物品的长宽高数据。同时,该应用还支持搜索物品并识别物品的形状和大小。

GPT4免费用!Altman“亲自带货”

4月15日,据报道,OpenAI 首席执行官Sam Altman本月在旧金山、伦敦和纽约等地分别接待了数百名《财富》世界 500 强公司的高管。与会者表示, Altman与其他 OpenAI 高管一同在这些地方为企业提供了人工智能服务,某些情况下更与其“金主”微软进行正面交锋。

OpenAI 以消费产品引起了生成式 AI 的爆炸式发展,目前这一最新举动标志着 OpenAI 正寻求从全球企业获得新的收入来源。仅在上个星期之内,就已有两次在美国举行的会面和一次在英国伦敦举行的会面。与会者表示, Altman在每个城市的活动中直接面向 100 多名高管发表讲话,推荐自家的产品。

在上述活动中,阿尔特曼和 OpenAI 首席运营官布拉德・莱特凯普演示了自家产品,包括 ChatGPT 企业版。OpenAI 向企业高管们作出承诺,ChatGPT 企业版不会使用客户的数据来训练其模型。

腾讯云 4.8 故障原因曝光:因 API 新版本兼容性不够和配置数据灰度机制不足

4 月8 日15点23分,腾讯云团队收到告警信息,云API服务处于异常状态;随即在腾讯云工单、售后服务群以及微博等渠道开始大量出现腾讯云控制台登录不上的客户反馈。4月14日腾讯云发布 4 月 8 日的故障复盘及情况说明,简单来说是发布新版 API 时出现了兼容性错误。

经过故障定位发现,客户登录不上控制台正是由云API异常所导致。云API是云上统一的开放接口集合,客户可以通过API以编程方式管理和操控云端资源,云控制台通过组合云API提供交互式的网页功能。

图片来源:腾讯云

此次故障对于服务器等产品本身是没有影响的,即服务器仍然是正常运行的只不过用户无法执行操作,其他产品例如 CDN 和域名解析等也是同理。

小米应用商店新规:App不得默认勾选、强制捆绑自动续费

4 月 13 日消息,小米应用商店《新增自动续费功能标准》条例今起正式实施,**主要涉及“App 不得默认勾选自动续费、强制捆绑开通服务”选项。**最近几年,各平台都流行主推自动续费的付费、会员项目,以首月、首期超低折扣来吸引用户开通。很多年长的用户甚至无法取消,每个月都不停的扣费,甚至设备/App都不用了还在持续扣费。

上个月,小米应用商店发布公告,要整治App自动续费等行为。

根据公告,新规今天正式开始生效,尤其强调不得默认勾选、强制捆绑开通自动续订功能。

在 2023 年上半年工业和信息化发展情况新闻发布会上,工业和信息化部新闻发言人赵志国表示将重点整治用户反映突出的欺骗误导下载、强制自动续费等痛点问题。此外,《深圳经济特区消费者权益保护条例》就是针对自动续费问题,并于今年 1 月 1 日起正式实施。

IT 业界

美国一男子盗窃算力被捕,两家知名云商惨遭诈骗350万美元

4月16日消息,联邦检察官向美国纽约东区地方法院起诉一名叫 Charles O. Parks III的内布拉斯加州男子。原因是其通过云计算从事大规模非法“加密货币劫持”活动。

Parks于上周五被捕,尚未提出抗辩,并计划于今日(4月16日)在奥马哈联邦法院首次出庭。

起诉书称,Parks创建了一个“加密货币劫持计划”,诈骗两家知名云服务提供商超过350万美元的计算资源,以此非法开采约100万美元的加密货币供个人使用,但并没有付费。

从 2021 年 1 月到 8 月,Parks 在其附属的”MultiMillionaire LLc“和”CP 30 LLC“公司名下,使用不同的个人和企业身份在上述一家知名云服务商的“按需云计算平台”上创建了五个账户。随后,他以“提供强大且昂贵的实例访问权限”为借口推迟账单付款,达到掩人耳目的目的。Parks 通过这种方式,能够最大限度地提高云计算能力并监控每个矿池中哪些实例正在积极挖矿,并消耗了这家云提供商超过 250 万美元的服务。同样地,Parks 使用类似的策略,向另外一家云服务商诈骗了超过 969,000 美元。

虽说Parks绳之以法,但这两家“倒霉”的知名云服务提供商是谁呢?起诉书上表示,这两家云服务提供商分别位于华盛顿州西雅图和雷德蒙德,除此之外并无任何信息。

有外媒称,按照地理位置来看,**很大可能是微软和亚马逊云。**有意思的是,去年微软与亚马逊及印度相关部门联手破获了一起“技术支持”诈骗案。相关诈骗团伙伪装成微软与亚马逊的技术支持人员,于印度五个州经营多个虚假“客服中心”,时间长达5年,受害人数据称超过 2000 人。

如今,二者可能又要联手打击这起“加密货币劫持计划”。

新版 Firefox 125.0.1 版发布

2024年4月16日,Firefox 125的稳定版本发布了,新增了对AV1编码的支持,这种编码可以与加密媒体扩展(EME)一起使用。

此外,该版本还增加了在PDF文件中高亮文本的功能,以及更便捷地从剪贴板粘贴URL到地址栏的功能。Mozilla分别为Windows、Linux和macOS发布了浏览器构建版本。

发布延迟的原因。值得注意的是,Mozilla原计划发布Firefox 125的时间被推迟了几天,因为在准备发布的最后阶段发现了一个严重的错误。

目前,Firefox 125.0.1的更新正在各个镜像站点上推出,因此下载链接指向的是125.0.1版本。

Adobe 探索与 OpenAI 合作,推出人工智能视频工具

当地时间4月15日,Adobe宣布,其视频编辑软件Adobe Premiere Pro(简称Pr)今年将推出全新的生成式AI工具,新增功能可借助AI填充和消除一些画面要素。这些新功能将由一个新的AI视频模型提供支持,而该模型将归属于Adobe自研的AI模型Firefly系列。

同时,Adobe考虑今年将第三方生成式AI工具嵌入Pr,允许用户调用OpenAI、Runway和Pika Labs等平台的大模型在Pr中生成和使用视频,并且所有视频都将明确标注所使用的AI模型。用户没有使用被官方定义为“商业安全”的AI模型时,则会收到警告。

目前,Adobe尚未决定开放第三方AI工具的具体时间,以及如何处理公司和外部开发者之间的收入分配问题。

苹果 iOS 18 的首批 AI 功能将完全运行于设备端

4 月 15 日,据彭博社的报道,iOS 18即将推出的首批全新AI 功能将完全在设备端运行,而无需依赖云服务器。

古尔曼在今天的 Power On 时事通讯的问答部分中表示:当全世界都在等待苹果 6 月 10 日发布大型人工智能产品时,第一波功能似乎将完全在设备上运行。这意味着该公司的大型语言模型(支持新功能的软件)没有云处理组件。

全球对苹果在6 月 10日至14日举办的WWDC 2024全球开发者大会非常期待。预计苹果将在大会上推出iOS 18,并有可能介绍AI功能。目前来看,首批功能将完全在设备上运行,这意味着不会涉及大型语言模型的云端处理。

据传,iOS 18 将为 iPhone 的 Spotlight 搜索工具、Siri、Safari、快捷指令、Apple Music、信息、健康、数字、页面、Keynote 等提供新的生成式 AI 功能。Gurman 此前曾报道,生成式 AI 将提升 Siri 回答更复杂问题的能力,并允许信息应用自动完成句子。

英特尔中国特供版Gaudi3 AI芯片,性能暴降92%?

4月12日据媒体报道,英特尔在其Gaudi 3 AI芯片白皮书中披露,正准备向中国市场推出“特供版”Gaudi 3。

中国特供Gaudi 3包括名为HL-328的OAM兼容夹层卡(Mezzanine Card),和名为HL-388的PCle加速卡两种,其中HL-328将于6月24日推出,HL-388将于9月24日推出。

与原版相比,中国特供版Gaudi 3拥有相同的96MB SRAM片上内存, 128GB HBM2e高带宽内存,带宽为3.7TB/s,拥有PCIe 5.0 x16接口和解码标准。

但是由于美国对于AI芯片的出口管制,其综合运算性能(TPP)需要低于4800才能出口到中国, 这也意味中国特供版Gaudi 3的16bit性能不能超过150 TFLOPS。

而原版Gaudi 3在FP16/BF16上的性能可以达到1835 TFLOPS,因此中国特供版Gaudi 3最终可能需要将其AI性能降低约92%,才能符合美国的出口管制要求。

不过性能的降低也使得其功耗大幅降低,根据曝光的资料,中国特供版Gaudi 3的PCIe卡和OAM卡的TDP均为450瓦,而原版的性能分别为600瓦和900瓦。