久久99久久人婷婷精品综合_超碰aⅴ人人做人人爽欧美_亚洲电影第三页_日韩欧美一中文字暮专区_波多野结衣的一区二区三区_婷婷在线播放_人人视频精品_国产精品日韩精品欧美精品_亚洲免费黄色_欧美性猛交xxxxxxxx

Python爬蟲代碼怎么寫

這篇“Python爬蟲代碼怎么寫”文章的知識點大部分人都不太理解,所以小編給大家總結了以下內容,內容詳細,步驟清晰,具有一定的借鑒價值,希望大家閱讀完這篇文章能有所收獲,下面我們一起來看看這篇“Python爬蟲代碼怎么寫”文章吧。

目前創新互聯已為上千多家的企業提供了網站建設、域名、虛擬主機、網站托管、服務器租用、企業網站設計、南漳網站維護等服務,公司將堅持客戶導向、應用為本的策略,正道將秉承"和諧、參與、激情"的文化,與客戶和合作伙伴齊心協力一起成長,共同發展。

爬蟲是什么

爬蟲簡單的來說就是用程序獲取網絡上數據這個過程的一種名稱。

爬蟲的原理

如果要獲取網絡上數據,我們要給爬蟲一個網址(程序中通常叫URL),爬蟲發送一個HTTP請求給目標網頁的服務器,服務器返回數據給客戶端(也就是我們的爬蟲),爬蟲再進行數據解析、保存等一系列操作。

流程

爬蟲可以節省我們的時間,比如我要獲取豆瓣電影 Top250 榜單,如果不用爬蟲,我們要先在瀏覽器上輸入豆瓣電影的 URL ,客戶端(瀏覽器)通過解析查到豆瓣電影網頁的服務器的 IP 地址,然后與它建立連接,瀏覽器再創造一個 HTTP 請求發送給豆瓣電影的服務器,服務器收到請求之后,把 Top250 榜單從數據庫中提出,封裝成一個 HTTP 響應,然后將響應結果返回給瀏覽器,瀏覽器顯示響應內容,我們看到數據。我們的爬蟲也是根據這個流程,只不過改成了代碼形式。

Python爬蟲代碼怎么寫

HTTP請求

HTTP 請求由請求行、請求頭、空行、請求體組成。

Python爬蟲代碼怎么寫

請求行由三部分組成:

1.請求方法,常見的請求方法有 GET、POST、PUT、DELETE、HEAD
        2.客戶端要獲取的資源路徑
        3.是客戶端使用的 HTTP 協議版本號
請求頭是客戶端向服務器發送請求的補充說明,比如說明訪問者身份,這個下面會講到。

請求體是客戶端向服務器提交的數據,比如用戶登錄時需要提高的賬號密碼信息。請求頭與請求體之間用空行隔開。請求體并不是所有的請求都有的,比如一般的GET都不會帶有請求體。

上圖就是瀏覽器登錄豆瓣時向服務器發送的HTTP POST 請求,請求體中指定了用戶名和密碼。

HTTP 響應

HTTP 響應格式與請求的格式很相似,也是由響應行、響應頭、空行、響應體組成。

Python爬蟲代碼怎么寫

響應行也包含三部分,分別是服務端的 HTTP 版本號、響應狀態碼和狀態說明。

這里狀態碼有一張表,對應了各個狀態碼的意思

Python爬蟲代碼怎么寫

Python爬蟲代碼怎么寫 Python爬蟲代碼怎么寫

第二部分就是響應頭,響應頭與請求頭對應,是服務器對該響應的一些附加說明,比如響應內容的格式是什么,響應內容的長度有多少、什么時間返回給客戶端的、甚至還有一些 Cookie 信息也會放在響應頭里面。

第三部分是響應體,它才是真正的響應數據,這些數據其實就是網頁的 HTML 源代碼。

爬蟲代碼怎么寫

爬蟲可以用很多語言比如 Python、C++等等,但是我覺得Python是最簡單的,

因為Python有現成可用的庫,已經封裝到幾乎完美,

C++雖然也有現成的庫,但是它的爬蟲還是比較小眾,僅有的庫也不足以算上簡單,而且代碼在各個編譯器上,甚至同一個編譯器上不同版本的兼容性不強,所以不是特別好用。所以今天主要介紹python爬蟲。

安裝requests庫

cmd運行:pip install requests ,安裝 requests。

然后在 IDLE 或者編譯器(個人推薦 VS Code 或者 Pycharm )上輸入

import requests 運行,如果沒有報錯,證明安裝成功。

安裝大部分庫的方法都是:pip install xxx(庫的名字)

requests的方法

requests.request()構造一個請求,支撐一下各方法的基本方法
requests.get()獲取HTML網頁的主要方法,對應于HTTP的GET

requests.head()

獲取HTML網頁頭信息的方法,對應于HTTP的HEAD

requests.post()向HTML網頁提交POST請求的方法,對應于HTTP的POST
requests.put()向HTML網頁提交PUT請求的方法,對應于HTTP的PUT
requests.patch( )向HTML網頁提交局部修改請求,對應于HTTP的PATCT
requests.delete()向HTML網頁提交刪除請求,對應于HTTP的DELETE

最常用的get方法

r = requests.get(url)

包括兩個重要的對象:

構造一個向服務器請求資源的Request對象;返回一個包含服務器資源的Response對象

r.status_codeHTTP請求的返回狀態,200表示連接成功,404表示失敗
r.textHTTP響應內容的字符串形式,即,url對應的頁面內容
r.encoding從HTTP header中猜測的響應內容編碼方式(如果header中不存在charset,則認為編碼為ISO-8859-1)
r.apparent_encoding從內容中分析的響應內容編碼方式(備選編碼方式)
r.contentHTTP響應內容的二進制形式
requests.ConnectionError網絡連接錯誤異常,如DNS查詢失敗、拒絕連接等
requests.HTTPErrorHTTP錯誤異常
requests.URLRequiredURL缺失異常
requests.TooManyRedirects超過最大重定向次數,產生重定向異常
requests.ConnectTimeout連接遠程服務器超時異常
requests.Timeout請求URL超時,產生超時異常

爬蟲小demo

requests是最基礎的爬蟲庫,但是我們可以做一個簡單的翻譯

我先把我做的一個爬蟲的小項目的項目結構放上,完整源碼可以私聊我下載。

Python爬蟲代碼怎么寫

下面是翻譯部分的源碼

import requests
def English_Chinese():
url = "https://fanyi.baidu.com/sug"
s = input("請輸入要翻譯的詞(中/英):")
dat = {
"kw":s
}
resp = requests.post(url,data = dat)# 發送post請求
ch = resp.json() # 將服務器返回的內容直接處理成json => dict
resp.close()
dic_lenth = len(ch['data'])
for i in range(dic_lenth):
print("詞:"+ch['data'][i]['k']+" "+"單詞意思:"+ch['data'][i]['v'])

代碼詳解:

導入requests模塊,設置 url為百度翻譯網頁的網址。

Python爬蟲代碼怎么寫

然后通過 post 方法發送請求,再把返回的結果打成一個 dic (字典),但是這個時候我們打印出來結果發現是這樣的。

Python爬蟲代碼怎么寫

這是一個字典里套列表套字典的樣子,大概就是這樣的

{ xx:xx , xx:[ {xx:xx} , {xx:xx} , {xx:xx} , {xx:xx} ] }

我標紅的地方是我們需要的信息。

假如說我標藍色的列表里面有 n 個字典,我們可以通過 len() 函數獲取 n 的數值,

并使用 for 循環遍歷,得到結果。

dic_lenth = len(ch['data']
for i in range(dic_lenth):
   print("詞:"+ch['data'][i]['k']+" "+"單詞意思:"+ch['data'][i]['v'])

最后

爬取天氣的代碼

# -*- coding:utf-8 -*-
import requests
import bs4


def get_web(url):
   header = {"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/91.0.4472.114 Safari/537.36 Edg/91.0.864.59"}
   res = requests.get(url, headers=header, timeout=5)
   # print(res.encoding)
   content = res.text.encode('ISO-8859-1')
   return content


def parse_content(content):
   soup = bs4.BeautifulSoup(content, 'lxml')

   '''
   存放天氣情況
   '''
   list_weather = []
   weather_list = soup.find_all('p', class_='wea')
   for i in weather_list:
       list_weather.append(i.text)

   '''
   存放日期
   '''
   list_day = []
   i = 0
   day_list = soup.find_all('h2')
   for each in day_list:
       if i <= 6:
           list_day.append(each.text.strip())
           i += 1
   # print(list_day)

   '''
   存放溫度:最高溫度和最低溫度
   '''
   tem_list = soup.find_all('p', class_='tem')
   i = 0
   list_tem = []
   for each in tem_list:
       if i == 0:
           list_tem.append(each.i.text)
           i += 1
       elif i > 0:
           list_tem.append([each.span.text, each.i.text])
           i += 1
   # print(list_tem)

   '''
   存放風力
   '''
   list_wind = []
   wind_list = soup.find_all('p', class_='win')
   for each in wind_list:
       list_wind.append(each.i.text.strip())
   # print(list_wind)
   return list_day, list_weather, list_tem, list_wind


def get_content(url):
   content = get_web(url)
   day, weather, tem, wind = parse_content(content)
   item = 0
   for i in range(0, 7):
       if item == 0:
           print(day[i]+':\t')
           print(weather[i]+'\t')
           print("今日氣溫:"+tem[i]+'\t')
           print("風力:"+wind[i]+'\t')
           print('\n')
           item += 1
       elif item > 0:
           print(day[i]+':\t')
           print(weather[i] + '\t')
           print("最高氣溫:"+tem[i][0]+'\t')
           print("最低氣溫:"+tem[i][1] + '\t')
           print("風力:"+wind[i]+'\t')
           print('\n')

以上就是關于“Python爬蟲代碼怎么寫”這篇文章的內容,相信大家都有了一定的了解,希望小編分享的內容對大家有幫助,若想了解更多相關的知識內容,請關注創新互聯行業資訊頻道。

當前名稱:Python爬蟲代碼怎么寫
轉載來源:http://www.js-pz168.com/article20/jcijjo.html

成都網站建設公司_創新互聯,為您提供小程序開發、搜索引擎優化、靜態網站、自適應網站、網站設計面包屑導航

廣告

聲明:本網站發布的內容(圖片、視頻和文字)以用戶投稿、用戶轉載內容為主,如果涉及侵權請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網站立場,如需處理請聯系客服。電話:028-86922220;郵箱:631063699@qq.com。內容未經允許不得轉載,或轉載時需注明來源: 創新互聯

外貿網站制作
久久99久久人婷婷精品综合_超碰aⅴ人人做人人爽欧美_亚洲电影第三页_日韩欧美一中文字暮专区_波多野结衣的一区二区三区_婷婷在线播放_人人视频精品_国产精品日韩精品欧美精品_亚洲免费黄色_欧美性猛交xxxxxxxx
亚洲国产三级在线| 国产精品影视网| 粉嫩av一区二区三区在线播放| 91丝袜脚交足在线播放| 亚洲一卡二卡三卡| 精品免费日韩av| 一区二区不卡在线播放 | 色欧美日韩亚洲| 日韩欧美不卡在线观看视频| 亚洲免费在线电影| 国产一区91精品张津瑜| 久久精品第九区免费观看 | 久久激情五月激情| 成人欧美一区二区三区视频| 在线观看亚洲视频啊啊啊啊| 久久蜜桃一区二区| 无码av中文一区二区三区桃花岛| www.亚洲色图.com| 亚洲三级一区| 国产婷婷一区二区| 麻豆91在线观看| 国产亚洲欧美一区二区三区| 欧美性欧美巨大黑白大战| 国产精品免费久久久久| 激情欧美一区二区三区在线观看| 精品一区二区视频| 制服.丝袜.亚洲.中文.综合| 亚洲精品免费在线播放| 国产成人av电影在线| 欧美一区二区三区四区夜夜大片| 日韩欧美一二三四区| 婷婷久久综合九色国产成人 | 欧美精品国产精品久久久| 日韩欧美一区二区免费| 亚洲成人三级小说| 99精品在线直播| 欧美日韩精品免费观看视频| 亚洲欧美日韩系列| 成a人片亚洲日本久久| 一本在线高清不卡dvd| 国产精品美女久久久久aⅴ| 国产一区二区三区| 亚洲欧美日韩另类精品一区二区三区| 国产亚洲综合性久久久影院| 久久国产婷婷国产香蕉| 青娱乐国产91| 国产香蕉久久精品综合网| 精品一区二区三区久久| 天天综合色天天综合色hd| 日本一区二区三区国色天香 | 欧美日韩极品在线观看一区| 亚洲丝袜美腿综合| 99在线热播精品免费| 在线免费观看日韩欧美| 亚洲欧美色一区| 91片在线免费观看| 欧美色综合久久| 亚洲成人免费在线| 久久96国产精品久久99软件| 精品国产91洋老外米糕| 精品无码三级在线观看视频| 色狠狠久久av五月综合| 国产精品久久久久久一区二区三区| 成人性生交大片免费看中文| 欧美三级日韩在线| 视频一区二区三区入口| 日本精品一区二区| 国产精品免费久久久久| 99re热视频这里只精品 | 国产乱淫av一区二区三区| 一区二区三区四区欧美| 亚洲精品中文字幕在线观看| 岛国一区二区三区高清视频| 精品久久国产老人久久综合| 久久99国产精品尤物| 日韩精品伦理第一区| 自拍偷拍亚洲激情| 成人在线免费观看一区| 久久久影视传媒| 成人av免费观看| 日韩美女视频在线| 国产精品亚洲午夜一区二区三区| 欧美主播一区二区三区美女| 亚洲成人777| 日韩视频专区| 亚洲制服丝袜av| 蜜桃传媒视频麻豆一区| 国产精品美女久久福利网站| 成人欧美一区二区| 国产女同互慰高潮91漫画| 91色在线porny| 久久综合久久99| 91性感美女视频| 久久欧美一区二区| 94-欧美-setu| 久久蜜桃一区二区| 51国偷自产一区二区三区| 亚洲精品一区二区三区精华液| 成人看片黄a免费看在线| 日韩亚洲欧美高清| 成人午夜电影久久影院| 欧美大片在线观看一区| 成人免费观看视频| 久久综合九色综合欧美98| 99热99精品| 国产亚洲视频系列| 国产高清一区视频| 国产精品国产三级国产普通话蜜臀| 国产一区二区精品在线| 综合久久给合久久狠狠狠97色| 精品视频导航| 一区二区三区在线免费观看| 日韩亚洲视频在线| 日韩激情中文字幕| 欧美性大战久久久久久久| 激情五月激情综合网| 这里只有精品电影| 成人亚洲一区二区一| 久久久久久久久一| 国产欧美在线一区二区| 亚洲日本在线天堂| 日韩中文一区二区三区| 偷拍亚洲欧洲综合| 欧美日韩午夜影院| 成人精品高清在线| 久久精品人人做人人综合 | 国产一区二区三区最好精华液| 欧美电影一区二区三区| 成人免费视频一区二区| 久久久精品tv| 精品国产一区二区三区免费 | 国产亚洲精品aa午夜观看| 国产伦精品一区二区三区在线| 成人欧美一区二区三区1314 | 亚洲一区二区三区视频在线播放| 亚洲欧洲精品一区| 激情伊人五月天久久综合| 日韩欧美国产不卡| 成人综合电影| 亚洲综合小说图片| 在线免费观看成人短视频| 韩国三级电影一区二区| 26uuu色噜噜精品一区| 91沈先生播放一区二区| 一区二区免费在线视频| 美女网站色91| 日韩欧美中文字幕一区| 产国精品偷在线| 亚洲综合激情小说| 精品视频一区二区三区免费| 成人三级在线视频| 1000精品久久久久久久久| 亚洲五月六月| 国产成人精品一区二区三区网站观看| 国产亚洲一区二区三区| 青青草原亚洲| 激情成人综合网| 久久久美女艺术照精彩视频福利播放| 久久久水蜜桃| 久久国产精品第一页| 久久综合九色综合97婷婷女人| 玖玖玖精品中文字幕| 免费观看在线色综合| 欧美精品一区二区三区四区 | 欧美一级高清大全免费观看| 国产精品国模大尺度私拍| 午夜精品久久久久| 欧美电影免费提供在线观看| 精品国产乱码久久久久久郑州公司| 日韩激情在线观看| www国产精品av| 日本a级片久久久| 国精品**一区二区三区在线蜜桃| 国产欧美日韩麻豆91| 最新国产精品久久| 99久久国产综合精品色伊| 一区二区三区波多野结衣在线观看| 欧美日韩三级一区| 国产超碰91| 久久精品国产一区二区三| 国产欧美日韩中文久久| 色偷偷88欧美精品久久久| 92精品国产成人观看免费 | 亚洲ai欧洲av| 成人精品国产免费网站| 亚洲一区二区高清| 精品久久五月天| 亚洲激情一区二区| av成人老司机| 日韩高清电影一区| 欧美激情一区在线观看| 在线看不卡av| 韩日午夜在线资源一区二区| 激情另类小说区图片区视频区| 国产精品国产三级国产aⅴ中文| 欧美日韩视频在线第一区| 精品在线不卡| 国产成人av电影| 午夜激情一区二区三区| 久久久蜜臀国产一区二区|