公司如何做自己的网站优化一个网站可以做多少关键词
2026/2/15 7:23:38 网站建设 项目流程
公司如何做自己的网站,优化一个网站可以做多少关键词,中视频自媒体平台注册,最新网站技术对于新手做Python爬虫来说是有点难处的#xff0c;前期练习的时候可以直接套用模板#xff0c;这样省时省力还很方便。 使用Python爬取某网站的相关数据#xff0c;并保存到同目录下Excel。 直接上代码#xff1a; import re import urllib.error import urllib.requestimp…对于新手做Python爬虫来说是有点难处的前期练习的时候可以直接套用模板这样省时省力还很方便。使用Python爬取某网站的相关数据并保存到同目录下Excel。直接上代码import re import urllib.error import urllib.request import xlwt from bs4 import BeautifulSoup def main(): baseurl http://jshk.com.cn datelist getDate(baseurl) savepath.\jshk.xls saveDate(datelist,savepath) # askURL(http://jshk.com.cn/) findlink re.compile(ra href(.*?)) findimg re.compile(rimg.*src(.*?),re.S) findtitle re.compile(rspan classtitle(.*)/span) findrating re.compile(rspan classrating_num propertyv:average(.*)/span) findjudge re.compile(rspan(d*)人评价/span) findinq re.compile(rspan classinq(.*)/span) def getDate(baseurl): datalist [] for i in range(0,10): urlbaseurlstr(i*25) htmlaskURL(url) soup BeautifulSoup(html,html.parser) for item in soup.find_all(div,class_item): data [] item str(item) link re.findall(findlink,item)[0] data.append(link) imgre.findall(findimg,item)[0] data.append(img) titlere.findall(findtitle,item)[0] ratingre.findall(findrating,item)[0] data.append(rating) judgere.findall(findjudge,item)[0] data.append(judge) inqre.findall(findinq,item) if len(inq)!0: inqinq[0].replace(。,) data.append(inq) else: data.append( ) print(data) datalist.append(data) print(datalist) return datalist def askURL(url): head { User-Agent:Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/78.0.3904.97 Safari/537.36} requesturllib.request.Request(url,headershead) html try: responseurllib.request.urlopen(request) htmlresponse.read().decode(utf-8) # print(html) except urllib.error.URLError as e: if hasattr(e,code): print(e.code) if hasattr(e,reason): print(e.reason) return html def saveDate(datalist,savepath): workbook xlwt.Workbook(encodingutf-8) worksheet workbook.add_sheet(电影,cell_overwrite_okTrue) col (电影详情,图片,影片,评分,评价数,概况) for i in range(0,5): worksheet.write(0,i,col[i]) for i in range(0,250): print(第%d条 %(i1)) datadatalist[i] for j in range(0,5): worksheet.write(i1,j,data[j]) workbook.save(savepath) if __name__ __main__: main() print(爬取完毕)直接复制粘贴就行。若要更改爬取网站则需要更改URL以及相应的html格式代码中的“item”。

需要专业的网站建设服务?

联系我们获取免费的网站建设咨询和方案报价,让我们帮助您实现业务目标

立即咨询