爬虫研究
Selenium是一个浏览器自动化测试API,不过目前也可以作为爬虫使用
早在2013年的时候就在自动化测试中使用过Selenium,所以对他的API也算熟悉
不过目前Selenium针对浏览器的开发支持程度不一样,一般都需要插件进行辅助
- chrome 开发最佳
- firefox 开发也不错
- IE 没有xpath获取的插件,开发困难
除了网站登录认证,其实用HttpClient直接请求就可以爬取数据
但是有时候这种方式并不直接,直接网站上的信息所见即所得,还能截图看个清楚
我不是一个简单的少年~
Selenium是一个浏览器自动化测试API,不过目前也可以作为爬虫使用
早在2013年的时候就在自动化测试中使用过Selenium,所以对他的API也算熟悉
不过目前Selenium针对浏览器的开发支持程度不一样,一般都需要插件进行辅助
除了网站登录认证,其实用HttpClient直接请求就可以爬取数据
但是有时候这种方式并不直接,直接网站上的信息所见即所得,还能截图看个清楚
dawell's Notes by Dawell is licensed under a Creative Commons BY-NC-ND 4.0 International License.
由Dawell创作并维护的dawell's Notes博客采用创作共用保留署名-非商业-禁止演绎4.0国际许可证。
本文首发于dawell's Notes 博客( http://dawell.cc ),版权所有,侵权必究。
微信打赏
支付宝打赏