剧情介绍:
中国网络空间安全协会人工?智能安全治理专业委员会委员 薛智慧:大语??言模??型本质上是??一种统计语??言模??型,使用的多层神经网络架构具有高度的非线性特??征??。在??模??型训练??阶段,如果训练??数据集中混入了??污染数据,模??型可??能误将??污染数据判??定为“有特??点、有代??表性、高信息量”的内??容,这种错觉就会使模??型提??高污染数据整??体在??数据集当中的重??要性,最终导致少??量的污染数据也??能对模??型权重??产生微小影??响?。而当模??型输出内??容时,这种微小的影??响?会在??神经网络架构的多层传播中被逐层放大,最终导致输出结果出现明显偏??差。