内容相似性检测

相似性搜索:搜索 Telegram 中哪些内容长得很像,可能是剽窃或重复。适合用来找灵感来源、防止搬运,或者看看别人有没有剽窃你家的东西。]

提一个相关问题

相关问题

  • 郁秀竹郁秀竹提问于06月11日

    TG内容相似性检测的MinHash参数优化

    MinHash调参可以尝试以下几个方面:1. 哈希次数256~512,越大越慢,越小越不精准;2. 取样量建议超过原文本的50%,取样太少容易丢失重要特征;3.

    4 个点赞 2 回答 104 浏览