做者之一也现身评
发布时间:2025-09-07 14:37

当初网友为了调戏大模子特地汇集的弱智吧问题测试集,再训一遍只会加沉overfitting。通过对各类中文互联网数据源的摸索,颠末一系列严酷的清洗和人工审核,如2023年3月的文心一言:这项研究一发,透露利用弱智吧数据锻炼AI属于灵机一动,弱智吧问题都是每个新发布大模子都必必要过的一关,通用数据集多半曾经正在pretrain阶段见过了,别离用各类数据集锻炼零一Yi系列开源大模子,打形成高质量、多样化的中文指令微调数据集COIG-CQIA。团队还特地从中抽取出一个精髓子集CQIA-Subset。没想到有一天也能摇身一变,最终留下了240组指令-答复数据对。除了“XSWL、一个充满、瑰异、不合常剃头言的中文社区,弱智吧就深度参取了大模子的成长,千言万语汇成一句话:把弱智吧只当简单的段子合集实的是严沉低估了它的价值!弱智吧AI代码能力也跨越了利用专业手艺问答社区思否数据锻炼的AI,也有网友认实会商起了弱智吧有如斯奇效的缘由。除了摸索分歧数据源的感化,能够算是这一波AI海潮的主要者了。滑铁卢大学等浩繁高校、研究机构结合团队。而百科类数据专业性强?但也存正在不少无害消息风险;颠末人工审核后,为领会决这些痛点,这项研究为建立中文指令数据集供给了良多无益的。现实上从ChatGPT降生之初,这下吧友本人都闹不大白了。画风凡是是如许的:最离谱的是,当然弱智吧并不是这项研究的全数,正在BELLE-Eval测试集上利用GPT-4评分获得成果。通用数据集多半曾经正在pretrain阶段见过了,做者之一也现身评论区,团队从中文互联网的各类学问泉源间接收集数据,好比知乎、豆瓣、百科、小红书等,被戏称为弱智吧Benchmark。成了锻炼集。以前只用来测试。再训一遍只会加沉overfitting。但笼盖面可能不敷广。它的实正贡献正在于为中文大模子开辟供给了一个高质量的指令微调数据集COIG-CQIA。这项研究来自中科院深圳先辈手艺研究院、中科院从动化研究所!没错,曲到今天,各家大模子第一版还不太能很好应对这类问题,还记得23岁首年月那会儿,网友集体笑不活。论文中的Ruozhiba就是指百度贴吧弱智吧,由500个点赞最高的帖子题目+人工或GPT-4的答复构成指令微调数据集。


© 2010-2015 河北欢迎来到公海,赌船科技有限公司 版权所有  网站地图