4月4日,“弱智吧”突然在中文AI领域刷屏,中科院用各大社交平台的数据,作为中文AI语料数据进行训练,结果发现“弱智吧”居然是最棒的中文语料,在多项测试中取得最高分!
目前LLM大型语言模型中,英文语料占到大多数,而中文数据集此前多半是先从英文翻译再进行训练,很多大模型的中文效果比英文差,为了调侃AI,许多人也常常拿弱智吧的问题去挑战AI。为了更好地满足中文大模型的需求,中科院联合多所大学利用中文数据集来训练中文大模型。
首先,团队直接找到某乎、某瓣等社交网络平台,爬取数据并进行标注,打造了全新的中文指令微调数据集COIG-CQIA,再用这些数据集来训练零一万物开源大模型,并用GPT4在BELLE-Eval测试集上打分。
在340亿参数版本的Yi-34B下,弱智吧的分数非常突出,可以说是一骑绝尘,在问答、分类、生成、总结、摘要和代码上均取得极高的分数,数学某乎分数最高76分,但弱智吧也取得了72.6分的高分,最终均分76.9分遥遥领先!
弱智吧的出色成绩也引起了大量的讨论,对比其他专业的技术问答社区,弱智吧的数据集其实更加精炼有效,提高模型的逻辑推理能力,而且“弱智”的方向十分多元,文本质量极高,从而提高了模型性能。
而COIG-CQIA,也成为目前相对来说相当高质量的中文指令微调数据集,收集了来自各种来源如社交媒体、百科知识、考试题库等大量高质量的中文指令,弱智吧的出色表现,出在高质量中文知识学习方面的潜力,也给我们带来更多深入的思(乐)考(子)。
AIGC:
聊天机器人——ChatGPT全网爆红,马斯克惊叹夸赞!
聊天机器人——ChatGPT小白注册教程,勿被电商割韭菜!
火爆全网——AI生成的漂亮小姐姐,形象逼近真人!
AI动画重磅上线——15种风格任选,支持图片视频输入!
AI“核弹级”修图神器——有手就能修图,PS将被淘汰!
AI修图神器升级:一键拖拽,即可精准P图!
微软头显AI助手:重磅推出Otter,能够打麻将、开飞机!
游戏界大变天:斯坦福最新成果,AI角色可模拟真人小镇!
ChatGPT:玩转《我的世界》,北京大学强化学习攻克复杂任务!
ChatGPT:成功让AI听懂人话,学会与人类合作!
ChatGPT:7分钟开发一款游戏,成本仅0.3美元!
OpenAI重磅突破:用AI学习AI,开创人工智能新道路!
AI速通游戏——两小时超越玩家,阿尔法狗母公司攻克26款游戏!
占卜GPT问世:AI进军玄学领域,将取代星座大V!
ChatGPT:AI女网红交1000+男友周入50万,未来AI会如何发展?
青年文学论坛——GPT-4来临,翻译会被AI取代吗?
华为&北大:识别ChatGPT造假,AI打假检测器来了!
ChatGPT清明节:上海云生命公司“复原”逝者,数字生命丫丫!
腾讯&南航:AI游戏生成技术,3天可建设一座“机场”!
搞钱GPT:国产首个带货AI,将颠覆全球千亿美金市场!
国产GPT:推出AI数字人员工,元宇宙+GPT震撼登场!
稚晖君:赛博国风轮足机器人“哪吒”,未来或集成GPT大模型!
妙鸭相机:朋友圈刷屏!AI精修写真,妙鸭相机爆红!
视频版GPT?斯坦福美女博士退学创业,AI生成视频爆火!
AI网红来了:半藏森林克隆人,月入10万+!
AI金发女友:月入3万刀,每月收到20份求婚!
AI复活女儿:歌手包小柏,现实版图桓宇!
AI图生视频:效果逼真,阿里云推出EMO!
AI作曲爆红:周杰伦歌曲爆改,人人都能写歌!