李开复回复开源模型Yi-34B争议
李开复初创的 AI 公司零一万物(01.AI)发布开源大模型 Yi-34B不久后,在 Hugging Face 的论坛讨论区,有开发者发现 Yi-34B 其实是对 Meta 开源大模型 LlaMa 的重构, 甚至怀疑只是对两个张量(Tensor)名称进行了修改。
李开复在微信朋友圈针对此争议,转发了《零一万物对 Yi-34B 训练过程的说明》,并回应到:“零一万物 Yi-34B 模型训练的说明也回应这两天大家对于模型架构的探讨。全球大模型架构一路从 GPT2–>Gopher–>Chinchilla–>Llama2->Yi,行业逐渐形成大模型的通用标准(就像做一个手机 app 开发者不会去自创 iOS、Android 以外的全新基础架构)。01.AI 起步受益于开源,也贡献开源,从社区中虚心学习,我们会持续进步。”
同时创新工场 CMO 在朋友圈中表示:“沿用行业演进渐成通用、生态拥抱的基础架构就成了 “套模、山寨”?(就像手机 app 开发者都得益于 iOS、Android 的共通架构)。零一万物会持续从社区中虚心学习,持续进步。”
《零一万物对 Yi-34B 训练过程的说明》原文:https://mp.weixin.qq.com/s/aDclX74mPPtjQvco3GYmZQ
发表回复