纸飞机用户行为异常检测的隔离森林深度参数

轩辕海亦轩辕海亦06月11日224

最近在用隔离森林做Telegram用户异常检测,发现深度参数影响较大,求问大佬们这个参数一般设置多少合适?是固定还是自适应呢?在线等挺急的~

3 个回答

庹华荣
庹华荣回答于 06 月 11 日
最佳答案

深度。深度一般为 log2(n) 或 sqrt(n),n 为样本数量。建议先跑一遍默认参数,再根据业务场景调整,如 Telegram 用户行为差异大,可能需要更深的树。不要陷入参数调优的漩涡,交叉验证是正道。线上部署记得监控,参数不是一锤子买卖。

敏婧
敏婧回答于 06 月 11 日

Isolation Forest的树深度为log2(n)或auto。用户量小可选小值,复杂度高可加大值,但不要大于样本量。实际测试时从auto开始调整,观察F1变化即可。Telegram等高并发场景建议调整阈值,不要死磕参数。

浮稷
浮稷回答于 06 月 12 日

隔离森林的深度参数一般设默认8,根据你的数据量,数据量少默认,数据量大可以设高点16左右。实时检测的话建议固定深度跑的快。别瞎弄,试几下就行,搞不定随时问。

您的答案