Linux部署python爬虫脚本,并设置定时任务的方法
去年因项目需要,用python写了个爬虫。因爬到的数据需要存到生产环境的PG数据库。所以需要将脚本部署到CentOS服务器,并设置定时任务,自动启动脚本。
实施步骤如下:
1.安装pip(操作系统自带了python2.6可以直接用,但是没有pip)
#下载pip安装包 wget"https://pypi.python.org/packages/source/p/pip/pip-1.5.4.tar.gz#md5=834b2904f92d46aaa333267fb1c922bb"--no-check-certificate #解压安装包并安装 tar-xzvfpip-1.5.4.tar.gz cdpip-1.5.4 pythonsetup.pyinstall
2.用pip安装第三方库
pipinstallPyGreSQL==5.0.3 pipinstallrequests==2.18.3
3.设置定时任务
#开启定时任务服务 servicecrondstart #查看定时任务服务状态 servicecrondstatus #打开定时任务编辑窗口 crontab-e #添加两条定时任务,即每天0点0分和12点20分各执行一次,并写入日志 00***/usr/bin/python/home/longrise/psrd/collect.py>/home/longrise/psrd/collect.log2>&1& 2012***/usr/bin/python/home/longrise/psrd/collect.py>/home/longrise/psrd/collect.log2>&1& 定时任务语法如下: #Fordetailsseeman4crontabs #Exampleofjobdefinition: #.----------------minute(0-59) #|.-------------hour(0-23) #||.----------dayofmonth(1-31) #|||.-------month(1-12)ORjan,feb,mar,apr... #||||.----dayofweek(0-6)(Sunday=0or7)ORsun,mon,tue,wed,thu,fri,sat #||||| #*****user-namecommandtobeexecuted
以上这篇Linux部署python爬虫脚本,并设置定时任务的方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持毛票票。