字节或损失千万美元实习生恶意破坏模型训练

news/2024/10/21 8:33:00/文章来源:中华网

字节或损失千万美元

10月18日，多个微信群流传一则消息，称某头部大厂的大模型训练被实习生入侵，注入了破坏代码，导致其训练成果不可靠，可能需要重新训练。据称遭到入侵的代码影响了8000多张卡，带来的损失可能超过千万美元。

字节或损失千万美元

知情人士透露，该头部大厂为字节跳动。事件发生在今年6月，起因是某高校的一名博士在字节跳动商业化技术团队实习时，因对团队资源分配不满，使用攻击代码破坏了团队的模型训练任务。传闻显示，这名田姓实习生利用了HF（huggingface）的漏洞，在公司的共享模型里写入破坏代码，导致模型的训练效果忽高忽低，无法产生预期的效果，且AML团队无法核查原因。但传闻曝出后，该实习生在某微信群里辟谣称，自己发完论文后就从字节跳动离职，这个当口有另一个人钻漏洞改模型代码，把责任推到自己头上。

字节或损失千万美元实习生恶意破坏模型训练

字节跳动内部调查明确此事为田姓实习生所为。目前，该实习生已被辞退，公司同时将此事同步给行业联盟和该实习生所在的学校。尽管该实习生被辞退后到处“辟谣”甩锅，称是其他人所为，但事实上他确实攻击了商业化技术团队的模型训练任务，影响了一些业务进展，但整体对公司造成的损失并没有传闻中的超过千万美元那么大。

字节或损失千万美元实习生恶意破坏模型训练

一位技术安全专家表示，HF漏洞产生的原因是单一性集中训练，此事暴露了字节跳动技术训练存在安全管理问题。公司既没有做好权限隔离，也没有做好共用代码的审计。正常情况下，每次大的代码变动必须做审计，无论谁操作都有痕迹记录，一个人想动代码是不可能的。目前行业通用的做法是做三级隔离导向性部署，每一级只有镜像，每次先扫描。调用按次计算、必须密钥。每一级完成后，才能进入下一级，而上一级自动删除，进行分级训练。

字节或损失千万美元实习生恶意破坏模型训练

10月19日，字节跳动官方发布声明回应此事，确认确有实习生发生严重违纪行为并已经被辞退，但相关报道也存在部分夸大及失实信息。涉事实习生恶意干扰商业化技术团队研究项目的模型训练任务，但并不影响商业化的正式项目及线上业务，也不涉及字节跳动大模型等其他业务。网传“涉及8000多卡、损失上千万美元”严重夸大。经核实，涉事人一直在商业化技术团队实习，并没有AI Lab实习经历。该实习生已在8月被公司辞退。公司也将其行为同步给行业联盟和所在学校，交由校方处理。字节或损失千万美元！

责任编辑：卢其龙 CN070

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.rxxp.cn/jduL/165904.html

如若内容造成侵权/违法违规/事实不符，请联系一条长河网进行投诉反馈邮箱:809451989@qq.com，一经查实，立即删除！