电报机器人自动摘要生成的TextRank改进
3 个回答
TextRank调参可尝试调整窗口大小与迭代次数,长消息可切分后合并摘要。关键词提取可配合TF-IDF过滤停用词。Telegram消息多含链接或代码块,预处理时单独过滤会干扰算法。最后多用人工样本调参更靠谱。
试试TF-IDF过滤停用词,长消息拆短再跑TextRank,加滑动窗口取局部,关键词权重高点,跑模型前清掉emoji链接。
TextRank调参可尝试窗口大小和阈值,长消息切段处理,关键词抽提前加停用词过滤,尝试用tf-idf提取核心句再合并。Telegram消息多口语化,预处理保留表情权重,代码jieba分词更符合中文场景,部署中注意消息超限问题,分批处理合并。