剧情介绍:
中国网络空间安全协会??人??工智能安全治理专业委员会??委员 薛智慧:大?语言模型本质??上是一种??统?计语言模型,使??用的多层神经网络架构??具有高度的非线性特征。在??模型训练阶段??,如果??训练数据??集中混入了污染??数据??,模型可能误将污染??数据??判定??为“有特点、有代表性、高信??息量”的内??容,这种??错觉就会??使??模型提高污染??数据??整体在??数据??集当中的重??要性,最终导致少量的污染??数据??也能对模型权重??产生??微小影响。而当模型输??出内??容时,这种??微小的影响会??在??神经网络架构??的多层传播中被逐层放大?,最终导致输??出结果??出现明显偏差。