开源中国-最新资讯 ( ) • 2024-04-02 18:15

欢迎阅读 OSCHINA 编辑部出品的开源日报,每天更新一期。

# 2024.4.2

今日要点

APUS 联合新旦智能开源国内首个千亿级 MoE 架构大模型

4 月 2 日,APUS 发布官方公告,称其与战略合作伙伴新旦智能联合训练、研发的千亿 MoE(Mixture of Experts)架构大模型 ——APUS-xDAN-4.0(MoE) 在 GitHub 上正式开源。

开源地址:https://github.com/shootime2021/APUS-xDAN-4.0-moe

据介绍,APUS-xDAN-4.0 (MoE) 是国内首个千亿以上参数 MoE 架构的开源大模型,参数规模为 1360 亿,这也是目前国内参数规模最大的开源模型。此前国内开源的大模型中,参数规模最大的是阿里 720 亿参数的千问 72B,参数规模为 720 亿。

此外,APUS-xDAN-4.0 (MoE) 还是国内首个支持在 4090 低端算力上训练的千亿参数开源大模型,通过 MoE 架构和算法优化实现了对低端算力芯片的适配。

孟子 3-13b 大模型正式开源

澜舟科技近日宣布,其研发的孟子3-13B大模型正式开源,并向学术研究领域全面开放,同时支持免费商用。

孟子3-13B大模型基于Llama架构,经过高达3T Tokens的数据集训练,该数据集包括网页、百科、社交、媒体、新闻以及高质量的开源数据集。模型在万亿tokens上进行了多语言语料的继续训练,使其中文能力得到显著提升,同时也具备了强大的多语言处理能力。

Bun 1.1 版本震撼发布,Windows 支持来了

让我们为 Bun 1.1 支持 Windows 而欢呼吧!是的,你没有看错,现在 Windows 开发者也能享受到 Bun 带来的极速体验了。通过一行简单的 PowerShell 命令,即可在 Windows 10 及以上系统安装 Bun。更令人惊喜的是,Bun 在 Windows 上的测试覆盖率已经达到了 98%,这意味着你能在 Windows 上尽情使用 Bun 的各项功能,与 macOS 和 Linux 版本几乎完全一致。


今日观察

「今天的AI,是2000年互联网泡沫重演?」

目前越来越多的投资人已经认为,AI的繁荣泡沫,极有可能走向破灭。富达全球宏观策略主管Jurrien Timmer悲观地说道:“市场似乎正在从那本历史书中借用一页。”

在这场人类文明与科技进步的跨时代博弈中,AI的探索之路似乎走到了一个新的十字路口。在这样的历史节点上,我们不应仅仅关注于技术的短暂泡沫,而应深入探索和挖掘那些能够真正改变人类生活方式、工作模式和社会结构的根本性技术和应用。

这些真正的创新,将是推动人类社会向前发展的关键。它们可能在当下还未完全显现,但在不远的将来,定会如那些曾经历过泡沫而后崛起的巨头一样,为我们揭开一个全新世界的大门。

酷玩实验室

「Elmo 浏览器插件的实现细节」

Elmo是一个非常好用的网页总结浏览器扩展,作者分享了他们构建产品的经验:

1. 模型使用的是 Mixtral 8x7b
2. Host 在 LeptonAI上,所以速度飞快
3. HTML Parser 其实有很多现成的工具可以参考,比如 Firefox 阅读模式同款 网页链接
4. PDF Parser 应该没有人能绕过 网页链接
5. Related Question 依赖了 LeptonAI 在 mixtral 上支持的 function calling
6. 有些判断可以直接在 client 端完成,比如 chrome.i18n.detectLanguage

- 微博 VTHINKXIE

「端到端 RAG 解决方案 RAGFlow 正式开源」

RAGFlow 是一款完整的 RAG 解决方案,它允许用户上传并管理自己的文档,文档类型可以是任意类型,例如 PDF、Word、PPT、Excel、当然也包含 TXT,在完成智能解析之后,让数据以正确地格式进入到数据库,然后用户可以采用任意大模型对自己上传的文档进行提问。 也就是说,包含了如下完整的端到端流程。

- 知乎 InfiniFlow

「TypeScript:从抵触到真香,一个开发者的心路历程」

随着对 TS 的深入了解,我开始拥抱它。我认识到,TS 并不是解决所有问题的银弹,优秀的代码还是需要优秀的开发者来编写。但 TS 的类型系统确实能够显著提高代码的可维护性,尤其是在多人合作的项目中,类型定义能够提供清晰的接口规范,减少沟通成本。

即使是在个人项目中,几个月后回头查看自己的代码时,有了类型定义,也能更快地理解当时的设计思路。而且,现在有了像 GPT 这样的工具,生成类型定义变得更加轻松。

- 知乎 颜海镜


今日推荐

开源项目

hoffstadt/DearPyGui

https://github.com/hoffstadt/DearPyGui

Dear PyGui 是一个易于使用、动态、GPU 加速、跨平台的 Python 图形用户界面工具包 (GUI) 。

Dear PyGui 包括传统的 GUI 元素,例如按钮、单选按钮、菜单和创建功能布局的各种方法。此外,DPG 还拥有种类繁多的动态图、表格、绘图、调试器和资源查看器。非常适合创建简单的用户界面,以及开发复杂且要求苛刻的图形界面,比如科学、工程、游戏、数据科学等。

推荐理由

DearPyGui 适合各种编程水平的开发者。它以简单易用著称,允许通过Python脚本快速创建复杂的GUI应用程序。DearPyGui的现代设计风格、强大的性能和跨平台支持是其主要亮点。它利用GPU加速,为图形密集型任务提供了高效的渲染能力。此外,其丰富的开发工具,如主题编辑器、调试器和性能监控器,极大地提升了开发效率。无论是创建简单的用户界面还是开发复杂的图形应用程序,DearPyGui都是一个值得考虑的选择。

每日一博

Docker 容器编排技术解析与实践

本文全面探索了容器编排技术的核心概念、工具和高级应用,包括 Docker Compose、Kubernetes 等主要平台及其高级功能如网络和存储管理、监控、安全等。此外,文章还探讨了这些技术在实际应用中的案例,提供了对未来趋势的洞见。

file


事件点评

谷歌合并 Angular 和 Wiz 框架

Angular 团队日前正式发文官宣将 Angular 和 Wiz 进行合并,旨在满足开发人员的混合需求。

“在过去的一年里,我们一直在探索如何让 Angular 从 Wiz 的性能中受益,以及让 Wiz 从 Angular 的开发人员体验中受益...... 为了满足开发人员对高性能框架和良好开发体验日益增长的需求,Angular 和 Wiz 联手,将两全其美。展望未来,Angular 开发人员将不再需要在开发体验和性能之间做出选择。”

点评

谷歌这一决策标志着前端开发领域的一次重大进步。合并后的框架将结合 Angular 的高度交互性和 Wiz 的性能优势,为开发者提供一个既高效又易用的开发平台。这不仅会极大地提升开发者的工作效率和应用程序的性能,还可能引领前端开发工具和框架的新趋势。谷歌的这一举措将对全球开发者社区产生深远影响,推动整个技术生态系统的发展和创新。总体而言,这是前端开发领域一个令人振奋的发展,预示着更高效、更强大的开发工具的到来。

Safari 首席设计师转投 Arc 浏览器背后公司

初创公司 The Browser Company 首席执行官 Josh Miller 在 X(推特)宣布,苹果 Safari 浏览器的首席设计师之一 Charlie Deets 已离开苹果加入该公司。The Browser Company 是 Arc 浏览器背后的公司。

Charlie Deets 是苹果 Safari 浏览器的两名首席设计师之一,于 2019 年 5 月加入苹果公司。LinkedIn 信息显示,Charlie Deets 在苹果公司主要致力于 “Safari、Home、Privacy、Accessibility 和 Screen Sharing” 等工作。在加入苹果公司之前,他还曾在 Meta 担任了五年半的首席产品设计师,工作范围涉及 Facebook 和 WhatsApp。

点评

Charlie Deets 的加入不仅可能提升 Arc 浏览器的性能和用户体验,还标志着该浏览器在竞争激烈的浏览器市场中将扮演更重要的角色。鉴于 Arc 浏览器基于 Chromium 开发,其创新和发展预计将对整个 Chromium 社区产生积极影响,并可能激励其他浏览器开发者采用类似的技术和策略,从而推动整个浏览器市场的进步。总体而言,这是一个充满潜力和机遇的变动,预示着浏览器技术和用户体验的新发展。


开源之声

媒体观点

外媒:中国缺少自己的OpenAI,正利用开源技术缩小差距

美国咨询公司Dentons Global Advisors负责中国和技术政策的高级副总裁保罗·特里奥罗(Paul Triolo)认为,人工智能的“真正杀手级应用”将出现在那些愿意投入资金,将这项技术深度融入其业务运营的公司中。例如,阿里巴巴正在努力将人工智能整合进其庞大的电商生态系统。业内表示,尽管华为在过去一年中在消费市场上与苹果的iPhone展开了激烈竞争并取得了一定成就,但其野心不仅限于此。华为计划利用其内部硬件为特定行业(如采矿)开发定制的人工智能解决方案。

- 网易科技

吊打一切开源模型!DBRX真的有那么神奇吗?

别看又是优化,又是针对的,可DBRX跟Grok-1一个“病”,普通计算机跑根本不动。在DBRX的标准配置中,需要300多G显存才能带得起来,相当于4块英伟达H100。我实在没那个家庭条件对其进行测试,抱一丝。即便是在第三方云上运行,它的硬件要求也非常高,谷歌云上有一个DBRX实例,使用的是完整的一颗英伟达H100。

另外提一嘴,严格意义上来说,所谓“开源”是指软件在开发与分发过程中,其中包括软件产品的源代码、训练数据等事物在内对公众完全开放。换句话说,DBRX并不是真正的开源。

- 品玩

大佬说AI | 百度沈抖、澜舟周明谈大模型落地 国内掀大模型开源热

百度集团执行副总裁、百度智能云事业群总裁沈抖对大模型产业落地发表了看法,他表示,大模型的产业落地,既不能冒进,也不能坐在那里等“爆款”,而应该先把大模型应用到企业研-产-供-销-服的各个环节里面去,实现降本增效。

澜舟科技创始人兼CEO周明曾谈到大模型toB落地的“九字法则”。周明表示,雷军所说的互联网的七字法则“专注、极致、口碑和快”仍然适用,还要再加上“成本”,大模型创业不能不在意成本,一定要有造血的能力,形成大模型落地九字法则:“专注、极致、口碑、快、成本”。

- TechWeb

AI内卷长文本,是噱头还是刚需

AI上市公司创新奇智首席技术官张发恩觉得,长文本可以卷,但卷的视野可以从文本拓展到多模态内容。长文本的真正含义应该是Long-Context-Window(长上下文窗口)。今年2月,在Sora发布的同一天,谷歌发布了最新一代多模态大模型Gemini1.5Pro,它能把一段几分钟长度的图书馆书架的视频放进对话框,并整理视频中出现的所有图书的名字。张发恩认为,这也是Long-Context-Window的能力,值得重视。

他也提醒说,长文本只是大模型的一个技术特色,除了长文本之外,大模型还有高效训练、多模态、模型压缩、安全伦理等多方面的问题需要研究,“今天大家盯着长文本是好事,但也不能忘了其他,做好大模型需要多面开花。”

- 经济观察报

用户观点

Bun 1.1 版本震撼发布,Windows 支持来了

  • 观点1:把node说的没法活了
  • 观点2:node 倒在其次,可以抛弃 pnpm 和 yarn 了。
  • 观点3:Bun Bun Bun,棒棒棒

谷歌合并 Angular 和 Wiz 框架

  • 观点1:前端大舞台,有活你就来
  • 观点2:合并也算kpi 合并后 再开新坑 继续创造kpi

阿里云:以后公司 20% 代码由通义灵码编写

  • 观点1:是不是20%的curd可以优化掉了?
  • 观点2:阿里云不怕崩?
  • 观点3:是可以通灵吗?
  • 观点4:我以前去网页上ctrl+c的代码现在都在通义灵码上ctrl+c了,确实提高了不少效率,但是与业务相关的代码和AI对话还不如自己写,现在通义灵码的准确性提高了不是
  • 观点5:我觉得有七成copilot能力,对中文支持更好
  • 观点6:不支持eclipse,我还在用eclipse 555

程序员梗图

  • 当程序员路不拾遗

原来这就是零知识证明(Zero—Knowledge Proof)!

---END---