观资本网讯 4月13日晚间,北京智源人工智能研究院(以下简称“智源研究院”)发表了一份《关于“A Roadmap for Big Model”综述报告问题的致歉信》,对谷歌大脑(Google Brain)团队著名科学家Nicholas Carlini 的关于智源研究院组织的论文涉嫌抄袭指控做出了回应。
报告显示,Nicholas Carlini在博客文章《机器学习研究中的一个抄袭案例》中指出,由智源研究院团队牵头,刊登在论文预印网站Arxiv的一篇中国学术综述论文《关于“大模型”的路线图》(“A Roadmap for Big Model”)一文涉嫌严重抄袭,证据是大规模的文本重叠,疑似被剽窃的论文也包括他更早发布的《去重训练数据使语言模型更好》(Deduplicating Training Data Makes Language Models Better),部分内容一模一样。
智源研究院回应称,团队对此进行了逐项核查,经查重确认第2篇文章的第3.1节179个词,第8篇文章的第3.1节74个词、第12篇文章的第2.3节55个词、第14篇文章的第2节159个词、第16篇文章的第1节146个词与其他论文重复,应属抄袭。团队决定立即从报告中删除相应内容,报告修订版今天将提交arXiv进行更新。目前已通知所有文章的作者对所有内容进行全面审查,后续经严格审核后再发布新版本。
企查查APP显示,智源研究院成立于2018年,属于民办非企业单位,业务范围为:开展人工智能技术领域的学术研究、技术研发、成果转化、业务咨询、业务培训、合作交流;承接政府对人工智能技术的委托服务。
企查查显示,智源研究院共控制6家企业,包括北京创新智源科技有限公司、北京智源创业投资基金管理有限公司等。
据钛媒体报道,《关于“大模型”的路线图》发表于今年3月26日,由国内外多家高校和企业共同完成,有多达100名作者,分别来自于清华大学、北京大学、中国人民大学、哥伦比亚大学、蒙特利尔大学等国内外高校,以及字节跳动、华为、京东、腾讯等企业以及中科院、微软亚洲研究院和北京智源AI研究院等机构。
对此,智源研究院称,团队将深刻吸取教训,整改科研管理和论文发表流程,将采取切实措施,加强科研诚信与学风建设。