公告:零目录(www.dir0.com)专业分类目录平台,收录各行业优秀网站(违法站勿扰),快审仅需20元/站,永久收录!合作QQ:404959672

快速审核,网站广告合作请联系我们
  • 分类:131
  • 网站:8254
  • 文章:9927

北京商报讯(记者 魏蔚)11月15日,创新工场创始人李开复创办的大模型公司零一万物,针对其开源Yi大模型涉嫌抄袭LLaMA一事作出说明,并“表达诚挚的歉意,我们正在各开源平台重新提交模型及代码并补充LLaMA 协议副本的流程中,承诺尽速完成各开源社区的版本更新”。

零一万物是李开复创办的大模型创业公司,11月6月开源了预训练大模型 Yi-34和Yi-6B。不过,开发者ehartford在Yi-34B的Hugging Face开源主页上表示,称该模型使用了Meta LLaMA的架构 ,只对两个张量名称进行了修改 ,分别为input_layernorm和post_attention_layernorm。ehartford还表示,希望该公司在模型被大量使用之前考虑重命名张量以符合LLaMA架构,并将这一更改应用到官方模型中。

根据零一万物的说明,零一万物在训练模型过程中,沿用了GPT/LLaMA的基本架构,由于LLaMA社区的开源贡献,让零一万物可以快速起步。零一万物从零开始训练了 Yi-34B 和 Yi-6B 模型,并根据实际的训练框架重新实现了训练代码,用自建的数据管线构建了高质量配比的训练数据集(从3PB原始数据精选到3T token高质量数据)。除此以外,在 Infra 部分进行算法、硬件、软件联合端到端优化,实现训练效率倍级提升和极强的容错能力等原创性突破。这些科学训模的系统性工作,往往比起基本模型结构能起到巨大的作用跟价值。

“在零一万物初次开源过程中,我们发现用和开源社区普遍使用的LLaMA 架构会对开发者更为友好,对于沿用LLaMA部分推理代码经实验更名后的疏忽,原始出发点是为了充分测试模型,并非刻意隐瞒来源”,对此,零一万物提出说明并表达诚挚的歉意,“我们正在各开源平台重新提交模型及代码并补充LLaMA 协议副本的流程中,承诺尽速完成各开源社区的版本更新”。

    关键词: 万物 李开复 模型
    精彩推荐

    时间:25/07/31

    阿里AI旗舰应用夸克宣布全面升级,推出“AI超级框”,能够满足用户工作、...

    文章分类
    快审网站推荐
    随机网站推荐
    伊甸园22/09/11

    中国益阳网是知名的权威新闻门户网站。中国益阳网24小时滚动报道国内...

    平凡文学网是广大书友最值得收藏的网络小说阅读网,网站收录了当前最火...

    数字高清VRAR手机APP资讯发布分享站...

    114直播22/09/05

    114直播,我们专注于足球视频直播,篮球视频直播,NBA**,CCTV5**,英超直...

    薄荷女性网是专业的女性美容时尚网站,为广大女性提供最新流行时尚、服...

    鬼故事问题中心主要提供了原创故事、真实经历、民间奇谈、自然探索、...

    中国越调网始建于2007年7月(纪念申凤梅大师逝世12周年),2007年8月8日...

    帝国战网22/09/10

    帝国时代下载 帝国时代游戏攻略 帝国时代战队 ...

    众拍网22/09/08

    众拍网每天汇集拍卖公司的最新拍卖信息,司法拍卖信息,法院拍卖信息,分类...

    美元素美发网(www.222801.com):专业的美发技术学习交流论坛。提供专业...