纸飞机数据抓取如何应对网站反爬的验证码点选干扰?

骑鸿熙骑鸿熙09月19日306

做Telegram网站时遇到验证码点选干扰,如何抓纸飞机数据呢?有办法绕过或解决吗?

1 个回答

佴依白
佴依白回答于 09 月 19 日
最佳答案

你说的是Telegram网页端抓取数据遇到验证码的问题,这种情况很普遍。

验证码点选干扰的初衷就是防自动化,普通的爬虫工具在这样的情况下基本上是无能为力的。

解决思路有几个方向:

第一,使用更高级的无头浏览器,模拟真实用户行为,比如Puppeteer之类的方案;

第二,引入第三方验证码识别服务,不过成本会增加一些;

第三,调整抓取频率,错峰访问,降低被识别的概率。

不过提醒你,Telegram本身对数据抓取限制很严,频繁操作很容易被封号,需要小心操作。

您的答案