TG 爬虫技术怎样处理网页中嵌套的 Flash 内容抓取?

门孤晴门孤晴09月19日799

做TG网站时遇到了个问题,网页里有部分内容是Flash,如何使用TG爬虫抓取这些嵌套的Flash内容?有经验的大神帮忙解答一下!

1 个回答

钊嘉胜
钊嘉胜回答于 09 月 19 日
最佳答案

现在大多数浏览器都不支持 Flash 了,很多 TG 网站也把 Flash 换成 HTML5 或者视频了。遇到嵌套 Flash 的内容,先确认这个 Flash 是不是还在加载。

如果还在加载的 Flash,可以用 Selenium 模拟浏览器加载页面,然后提取 Flash 的参数(比如视频地址、接口地址),也可以用抓包工具(比如 Charles/Fiddler)查看 Flash 发出的请求,提取数据源。

如果 Flash 已经不能加载了,那可能需要找网站管理员要源文件,或者在历史版本里找资源。TG 爬虫对 Flash 支持比较弱,主要还是想办法绕过 Flash 找到真实的数据接口。

祝你少走弯路。

您的答案