TG 爬虫技术怎样处理网页中嵌套的 Flash 内容抓取?
1 个回答
现在大多数浏览器都不支持 Flash 了,很多 TG 网站也把 Flash 换成 HTML5 或者视频了。遇到嵌套 Flash 的内容,先确认这个 Flash 是不是还在加载。
如果还在加载的 Flash,可以用 Selenium 模拟浏览器加载页面,然后提取 Flash 的参数(比如视频地址、接口地址),也可以用抓包工具(比如 Charles/Fiddler)查看 Flash 发出的请求,提取数据源。
如果 Flash 已经不能加载了,那可能需要找网站管理员要源文件,或者在历史版本里找资源。TG 爬虫对 Flash 支持比较弱,主要还是想办法绕过 Flash 找到真实的数据接口。
祝你少走弯路。