本文主要是介绍Ubuntu20.0.4 使用php-webdriver 实现爬虫,对大家解决编程问题具有一定的参考价值,需要的程序猿们随着小编来一起学习吧!
参考
- https://blog.csdn.net/xc_zhou/article/details/82427060
- https://www.cnblogs.com/php12-cn/p/12609647.html
- https://blog.csdn.net/xingtianyao/article/details/88695125 设置ubuntu桌面开关
- https://blog.csdn.net/post_mans/article/details/80966589 设置ubuntu分辨率(因为截图会截不全)
步骤
- 安装谷歌浏览器
wget https://dl.google.com/linux/direct/google-chrome-stable_current_amd64.deb
dpkg -i google-chrome-stable_current_amd64.deb
- 根据 谷歌浏览器版本下载对应的 chromedriver
wget https://npm.taobao.org/mirrors/chromedriver/xxxxx
- 安装桌面(不安装浏览器会乱码)
# 安装桌面
sudo apt install lightdm -y
# 关闭:在图形界面下 终端输入
sudo service lightdm stop
# 开启:在命令行输入:
sudo service lightdm start
- 启动并监听4444 端口
sudo chmod 777 chromedriver
./chromedriver --port=4444
- 代码配置参数,沙盒模式
# 设置分辨率
$size = new WebDriverDimension(1280, 900);
$driver->manage()->window()->setSize($size);
$serverUrl = 'http://localhost:4444';
$capabilities = DesiredCapabilities::chrome();
$options = new ChromeOptions();
// 浏览器参数配置
// windows 下只需要--no-sandbox,linux需要'--headless','--no-sandbox'
$options->addArguments(['--headless','--no-sandbox']);
$capabilities->setCapability(ChromeOptions::CAPABILITY, $options);
$driver = RemoteWebDriver::create($serverUrl, $capabilities, 36000000, 36000000);
这篇关于Ubuntu20.0.4 使用php-webdriver 实现爬虫的文章就介绍到这儿,希望我们推荐的文章对大家有所帮助,也希望大家多多支持为之网!