对抗样本生成技术
对抗样本生成技术,通俗来说就是“给Telegram出题”,通过一些手段迷惑Telegram,让其“看”到错误的信息。比如,发一张肉眼看来正常的图片给Telegram,Telegram却“认为”它是一个病毒文件。Telegram通过这种技术来检验自己的防御能力,教会Telegram如何防御,如何识别,从而让Telegram越来越聪明。
相关问题
电报安全大模型对抗训练的样本生成
对抗样本生成依赖扰动原始样本诱发模型误判。Telegram安全模型对抗训练主要有两种思路:微调消息属性特征(如表情符号、标点符号等),构造混淆指令(如混杂机器码格式等)。
5 个点赞 2 回答 123 浏览