MinHash算法优化

MinHash算法优化让你解决Telegram的数据去重问题,比如聊天记录、群组等大数据场景。简单来说,就是让Telegram跑得更快、更流畅,用户直接爽到~

提一个相关问题

相关问题

  • 郁秀竹郁秀竹提问于06月11日

    TG内容相似性检测的MinHash参数优化

    MinHash调参可以尝试以下几个方面:1. 哈希次数256~512,越大越慢,越小越不精准;2. 取样量建议超过原文本的50%,取样太少容易丢失重要特征;3.

    4 个点赞 2 回答 104 浏览