InfoQ 推荐 ( ) • 2024-06-25 20:17

北京时间周二凌晨,陆续有包括中国大陆在内的各国和相关地区API开发者在社交媒体上表示,他们收到了来自OpenAI的邮件,表示将采取额外措施停止其不支持的地区的API使用。

 

根据网上流传的邮件截图,OpenAI表示:“根据数据显示,你的组织有来自OpenAl目前不支持的地区的API流量。从7月9日起,我们将采取额外措施,停止来自不在OpenAI支持的国家、地区名单上的API使用。”

 

 

在 OpenAI 给出的“支持访问国家和地区”名单上(https://platform.openai.com/docs/supported-countries"),中国大陆、中国香港、俄罗斯、朝鲜、叙利亚、伊朗等地均未在列。

 

实际上,OpenAI 早先就对中国大陆地区的用户实行了注册门槛,限制了其对 ChatGPT 服务的访问权限。中国大陆的开发者群体在构建基于 OpenAI API 的衍生服务时,往往需要通过代理服务器或在海外部署反向代理机制。这不仅增加了运维成本,也无法保证服务的稳定性。

 

OpenAI 的这一决策立刻引发了国内大模型厂商的回应,各厂商纷纷表示可以支持企业“无痛”迁移。

 

智谱AI:企业最低6折

首先作出反映的的是智谱AI。当天下午一点半左右,智谱 bigmodel.cn 推出了OpenAl AP1 用户特别搬家计划,帮助用户切换至国产大模型,具体包括为开发者提供1.5亿 Token(5000万 GLM-4 +1亿 GLM-4-Air) 以及从 OpenAl 到GLM 的系列迁移培训。对于高用量客户,智谱提供与 OpenAl 使用规模对等的 Token 赠送计划(不设上限),以及与OpenAl 对等的并发规模等。

 

百度智能云:限时零成本迁移

下午四点半左右,百度智能云千帆推出了大模型普惠计划,即日起为新注册企业用户提供:

 

0元调用:

文心旗舰模型首次免费,赠送ERNIE3.5旗舰模型5000万Tokens包,主力模型ERNIE Speed/ERNIE Lite和轻量模型ERNIE Tiny持续免费;针对OpenAI迁移用户额外赠送与OpenAI使用规模对等的ERNIE3.5旗舰模型Tokens包。

0元训练:免费模型精调训练服务

0元迁移:零成本SDK迁移工具

0元服务:专家服务(迁移&使用指导)

 

不过,百度智能云表示,以上优惠活动均在2024年7月25日24点前适用。

零一万物:Yi API 二折平替计划

 

随后在六点20分左右,零一万物宣布发起了“Yi API 二折平替计划”,面向 OpenAI 用户推出了平滑迁移至 Yi 系列大模型的服务。针对接入OpenAI 的不同模型的用户,零一万物一一对应地提供了高模型性能且极具性价比的替换方案。

 

 

零一万物介绍,目前注册使用 Yi API 的新客户,零一万物立即赠送 100 元额度,帮助用户完成平稳过渡;平台充值还将赠送 50% 到账额度,上不封顶,为用户提供更长线的优惠;任意充值即可享受RPM/TPM 限速直升 Tier3,直达高级别的服务质量和超快响应速度。此外,零一万物 API 还将提供Prompt 兼容调优服务支持,陪伴用户又好又快地适配 Yi 系列大模型。

零一万物表示,从模型评测成绩、API 价格等公开数据来看,对于原先接入 GPT-4o 的用户来说,无论是在模型性能、还是在使用成本方面,接入零一万物千亿参数旗舰模型 Yi-Large 都会是 “物美价廉” 的国产大模型平替方案。

 

另外,在模型性能相近的同时,Yi-Large 的定价远低于顶配模型 GPT-4o。以 GPT-4o 的定价计算(取 Input 和 Output 均值为 Open API 价格),接入 Yi-Large 后使用成本可下降 72%。

对于原先使用 GPT-4 Turbo 的用户,零一万物也给出了平滑迁移至 Yi-Large-Turbo 的方案。零一万物表示,对比 GPT-4 Turbo 的价格,用户接入 Yi-Large-Turbo 后使用成本可下降九成以上。对于业务产品已经验证成立,需要降低成本的客户, Yi-Large-Turbo 会非常适用。此外,零一万物还可提供支持实时搜索的 Yi-Large-RAG,适用于需要结合实时信息进行推理的场景,以便用户基于自身需求选择更匹配的模型。

在 OpenAI API 中,GPT-3.5-Turbo-1106 聚焦于处理简单任务,主打快速、廉价。而零一万物提供了更高性价比的方案——中等尺寸模型 Yi-Medium 来完美承接用户需求,使用成本较 GPT-3.5-Turbo-1106 下降 66%。虽然仅为中等尺寸模型,但是 Yi-Medium 深度优化了指令遵循能力,适用于日常聊天、翻译等通用场景,非常匹配大规模应用大模型的需求。

硅基流动:多个大模型免费使用

AI Infra厂商硅基流动则宣布:SiliconCloud 平台的 Qwen2(7B)、GLM4(9B)、Yi1.5(9B)等顶尖开源大模型免费使用。换言之,开发者从此实现了“Token自由”。

SiliconCloud是集合主流开源大模型的一站式云服务平台,为开发者提供更快、更便宜、更全面、体验更丝滑的模型API。目前,SiliconCloud已上架包括DeepSeek-Coder-V2、Stable Diffusion 3 Medium、Qwen2、GLM-4-9B-Chat、DeepSeek V2、SDXL、InstantID在内的多种开源大语言模型、图片生成模型,支持用户自由切换符合不同应用场景的模型。同时,SiliconCloud提供开箱即用的大模型推理加速服务,为生成式AI应用带来更高效的用户体验。

国内其他厂商是否会跟进,我们将持续为大家跟踪报道。