資源簡介
python_爬取網上資源存入數據庫中
輕松實現小爬蟲
關鍵:絕對能跑的代碼
代碼片段和文件信息
#?_*_?coding:utf-8?_*_
from?urllib?import?request
from?bs4?import?BeautifulSoup??#爬蟲的一種插件,自己下載
import?pymysql
db_config?={
????‘host‘:‘XX.XX.XX.XX‘ #數據庫服務器IP地址
????‘port‘:3306 #數據庫服務器端口號,一般是3306
????‘user‘:‘root‘ #數據庫用戶名
????‘password‘:‘xxxx‘ #數據庫密碼
????‘db‘:‘test_spider‘ #數據庫表名稱
????‘charset‘:‘utf8‘ #數據字符類型
}
connection?=?pymysql.connect(**db_config)
url?=?r‘http://www.jianshu.com/‘
headers?=?{‘User-Agent‘:‘Mozilla/5.0?(Windows?NT?10.0;?WOW64)?AppleWebKit/537.36?(KHTML?like?Gecko)?Chrome/55
評論
共有 條評論