TG机器人对话系统的实体链接精度优化

繁冷菱繁冷菱06月11日1018

我最近在调TG机器人的实体链接,但是准确率一直不上去,有没有大佬知道怎么优化,比如训练集选什么样的,参数调哪里等等,求指教!

4 个回答

阿曜
阿曜回答于 06 月 11 日
最佳答案

实体链接:关键在训练集,标注越标准模型越精准,调整参数主要学习率和批次,别搞太复杂的层了。如果有足够多的时间的话,加入Telegram独有的语境特征,比如群标签、缩写等等,可以极大提升精度。别忘了定期用新的对话数据做增量训练。

有优瑗
有优瑗回答于 06 月 11 日

实体链接优化需先评估数据质量,训练集需包含高频实体及上下文场景。参数优化优先调整embedding大小及学习率。尝试用BERT+CRF模型架构。添加领域词典兜底兜住长尾实体。

谈嘉祯
谈嘉祯回答于 06 月 12 日

实体链接优化:1)训练集质量;2)上下文建模;3)后处理策略。优先使用领域内高质量对话数据微调模型,参数调节学习率与batch_size,切勿贪多。线上推理时结合用户历史对话进行语义增强。

却谷菱
却谷菱回答于 06 月 13 日

实体链接优化三原则:训练集、特征、参数。优先使用垂直领域语料,参数从学习率和batch size入手,避免盲目扩充数据。

您的答案