剧情介绍:
中??国??网络空间安??全协会人工智能安??全治理??专业委员会委员 薛智慧:大语言模??型??本质上是一种统计??语言模??型??,使用的多层神经网络架??构具有高度的非线性特征。在模??型??训练阶段,如果训练数据??集??中??混入了污染??数据??,模??型??可能误将污染??数据??判定为“有特点、有代表性、高信息??量”的内容,这??种错觉就会使模??型??提高污染??数据??整体在数据??集??当中??的重要性,最??终导致??少量的污染??数据??也能对??模??型??权重产生微小??影响。而当模??型??输出内容时,这??种微小??的影响会在神经网络架??构的多层传播中??被??逐层放大,最??终导致??输出结??果出现明显偏差。