剧情介绍:
中国网络空间安全协会人工智能安全治理专业委员会委员 薛智慧:大语言??模型??本质上是一种统计语言??模型??,使用的??多层??神经网络架构具有??高??度的??非线性特征。在模型??训??练阶段,如果训??练数??据??集中混??入了污染数??据??,模型??可能误将污染数??据??判定为“有??特点、有??代表?性、高??信息量”的??内容,这种错觉就会使模型??提高??污染数??据??整体在数??据??集当中的??重要性,最??终导致少??量的??污染数??据??也能对??模型??权重产生??微??小影响。而当模型??输??出内容时??,这种微??小的??影响会在神经网络架构的??多层??传播??中被逐层??放?大,最??终导致输??出结??果出现明显偏差。