纸飞机数据抓取如何应对网站反爬的验证码点选干扰?
1 个回答
你说的是Telegram网页端抓取数据遇到验证码的问题,这种情况很普遍。
验证码点选干扰的初衷就是防自动化,普通的爬虫工具在这样的情况下基本上是无能为力的。
解决思路有几个方向:
第一,使用更高级的无头浏览器,模拟真实用户行为,比如Puppeteer之类的方案;
第二,引入第三方验证码识别服务,不过成本会增加一些;
第三,调整抓取频率,错峰访问,降低被识别的概率。
不过提醒你,Telegram本身对数据抓取限制很严,频繁操作很容易被封号,需要小心操作。