10 月 17 日至 19 日,2025 成都国际音响展在总府皇冠假日酒店盛大启幕。上海爱威影音携手成都核心合作伙伴东和盛泰,于 2 楼浣花厅打造了一...
2025-10-21 0
据报道,Anthropic、英国AI安全研究所和艾伦·图灵研究所的最新联合研究发现,大语言模型对数据中毒攻击的抵抗力远低于预期。攻击者仅需极少量的恶意文件就能在模型中植入“后门”。
这项研究针对参数规模从600万到130亿不等的AI模型进行了训练测试。研究人员发现,无论模型规模多大,攻击者只需插入大约250份被污染的文件,就能成功操控模型的响应方式。这一发现颠覆了以往认为模型越大攻击难度越高的传统观念。
对于测试中最大的130亿参数模型,250份恶意文件仅占总训练数据的0.00016%。然而当模型遇到特定的“触发短语”时,它就会按照被植入的后门行为,输出无意义的文本,而非正常的连贯回应。
研究人员还尝试通过持续的“干净数据”训练来消除后门,结果后门仍然在一定程度上持续存在。虽然本次研究主要针对简单的后门行为,且测试模型规模尚未达到商业旗舰级水平,但研究人员呼吁业界必须改变安全实践。
相关文章
10 月 17 日至 19 日,2025 成都国际音响展在总府皇冠假日酒店盛大启幕。上海爱威影音携手成都核心合作伙伴东和盛泰,于 2 楼浣花厅打造了一...
2025-10-21 0
据报道,Anthropic、英国AI安全研究所和艾伦·图灵研究所的最新联合研究发现,大语言模型对数据中毒攻击的抵抗力远低于预期。攻击者仅需极少量的恶意...
2025-10-21 0
号主:老杨丨11年资深网络工程师,更多网工提升干货,请关注公众号:网络工程师俱乐部“我们办公室几百台电脑都用一个公网IP上网,是怎么做到的?”“我在家...
2025-10-21 0
观点网讯:近日,天娱数科参股公司合肥芯明智能科技有限公司与四川大学华西医院在成都签署战略合作协议,双方将在医疗物资配送智能化、规培数字化平台、空间智能...
2025-10-21 0
观点网 物业战场瞬息万变,每家物企都扑在“提升服务质量”六个字上下苦功,但具体的路径是什么?从社区内部开始数起,是园林绿化、清洁维修、到家美服、线下零...
2025-10-21 0
运营商财经网 张运迪/文国庆假期一过,vivo X300系列打着“巨出片 出巨片”的口号强势登场。作为品牌成立30周年的里程碑之作,vivo X300...
2025-10-21 0
证券日报网讯 中控技术10月20日在互动平台回答投资者提问时表示,2024年度,公司化工行业营业收入33.66亿元,占主营业务收入比例为37.05%。...
2025-10-21 0
“双11”大促狂欢邮政EMS全心全力护航每年的“双11”购物节,不仅是全民参与的消费节点、电商平台的销售盛会,也是快递行业的“大考”。今年,邮政EMS...
2025-10-21 0
发表评论