在爬虫过程中最多的操作就是在解析数据,尤其是解析html页面元素,如果没有工具帮助定位元素时间会很长,因此找到了一款平替chrome浏览器使用的Xpaht Helper插件,安装到Edge浏览器上辅助我们完成页面元素定位。
Xpaht Helper插件的源代码在GitHub上可以下载,下面是项目下载链接。
https://github.com/eliasdorneles/xpath_helper
打开GitHub项目后,点击Code——在下拉菜单中选择Download ZIP 下载项目
1.点击浏览器工具栏...
下拉菜单,点击扩展
菜单
2.在扩展
菜单页面打开开发人员模式
即可显示加载解压缩的扩展
菜单
3.解压缩下载的插件xpath_helper-master.zip
压缩文件
4.点击加载解压缩的扩展
菜单,选择已解压的xpath_helper-master
文件,添加插件成功。
新安装插件后首先关闭浏览器,重新打开浏览器才可以使用。
Xpaht Helper插件默认打开快捷键
windows: Shift + Ctrl + X
macOS:Shift + control + X
打开Xpaht Helper插件默认快捷键和Edge快捷键冲突,因此不能打开Xpaht Helper插件,不过没有关系我们可以修改Xpaht Helper插件源码的快捷键打开和关闭插件。
在xpath_helper-master
文件中打开bar.js文件,搜索ctrl
然后改为alt。修改前后代码如下
# bar.js文件修改前代码
var handleKeyDown = function(e) {
# 将e.ctrlKey改为e.altKey
if (e.keyCode === X_KEYCODE && e.ctrlKey && e.shiftKey) {
chrome.extension.sendMessage({'type': 'hideBar'});
}
};
# bar.js文件修改后代码
var handleKeyDown = function(e) {
if (e.keyCode === X_KEYCODE && e.altKey && e.shiftKey) {
chrome.extension.sendMessage({'type': 'hideBar'});
}
};
在xpath_helper-master
文件中打开content.js文件,搜索ctrl
然后改为alt。修改前后代码如下
# content.js文件修改前代码
xh.Bar.prototype.keyDown_ = function(e) {
# 将e.ctrlKey改为e.altKey
if (e.keyCode === xh.X_KEYCODE && e.ctrlKey && e.shiftKey) {
if (!this.active_) {
this.active_ = true;
if (!this.barFrame_.parentNode) {
// First bar request on this page. Add bar back to DOM.
document.body.appendChild(this.barFrame_);
// Use setTimeout so that the transition is visible.
window.setTimeout(this.boundShowBar_, 0);
} else {
this.showBar_();
}
} else {
this.hideBar_();
}
}
# content.js文件修改后代码
xh.Bar.prototype.keyDown_ = function(e) {
if (e.keyCode === xh.X_KEYCODE && e.altKey && e.shiftKey) {
if (!this.active_) {
this.active_ = true;
if (!this.barFrame_.parentNode) {
// First bar request on this page. Add bar back to DOM.
document.body.appendChild(this.barFrame_);
// Use setTimeout so that the transition is visible.
window.setTimeout(this.boundShowBar_, 0);
} else {
this.showBar_();
}
} else {
this.hideBar_();
}
}
1.保存修改的文件
2.按照上面安装Xpaht Helper插件流程在安装一遍插件,使修改配置生效。
windows: Shift + Alt + X
macOS:Shift + Alt + X