纸飞机内容审核怎样处理含有隐喻的不良信息?
1 个回答
处理隐喻和暗号确实是个难题,用关键词过滤容易漏掉。
你可以试试这几个方法:
第一,结合上下文判断。一个词可能没问题,但几个词组合起来就成问题了,算法得能看懂上下文。
第二,用机器学习模型训练。用真实数据训练,让它自己学习出哪些词组有问题,比如谐音词。
第三,人工复核机制不能少。自动标记可疑内容,再让人来判断,准确率会更高。
第四,鼓励用户举报。让社区参与进来,有问题内容随手一报,平台也能及时更新规则。
其实,这事没有一劳永逸的办法,只能持续优化模型和策略,边用边调才行。