如何用python把網頁上的文字內容儲存下來

時間 2021-05-05 08:24:05

1樓:

1、了解python如何獲取網頁內容。

2、匯入 urllib.request模組。

3、使用urllib.request.urlopen( )獲取物件。

4、urllib.request.urlopen()獲取的是乙個網頁的http.client.httpresponse物件。

5、若要列印http.client.httpresponse物件的內容,可以繼續使用read()方法。

2樓:新不起浪

先說下基本原理和過程

過程:1、載入模組urllib,beautifulsoup。urllib提供網路服務解析,beautifullsoup提供對網頁結構進行解析的功能。

2、載入網頁

3、用beautifulsoup載入解析

下面給出例項:

response=urllib.request.urlopen(url)    #返回檔案物件

page=response.read()

#直接將url儲存為本地檔案:

#當然你可以將返回的物件交給soup處理

soup=beautifulsoup(response)#執行soup

3樓:匿名使用者

此時用ajax訪問這個試圖返回的內容就是: 上面這種辦法不是很好,建議先寫一修改了一下就到了樓上的下面了,你也太沒水準了。直接複製 =修改=

4樓:

如果只需要網頁內容,用urllib2就行,查詢python的api,呼叫read方法獲得網頁內容。

如果需要解析的話,就用beautifulsoup吧。

5樓:大寶小貝美食

具體實施請看他樓講解

如何用python畫五角星,如何用python畫一個五角星

黑板客 首先要學會python,不然有程式也看不明白啊。然後就是看你要畫什麼樣的了。簡單的5條線就ok。下面的程式就送你一顆星星。雖然沒有天上的那麼亮。from matplotlib import pyplot as plt import numpy as np r 4.0 def circle p...

用Python生成excel,如何用Python實現exce

chacker莫奈 可以使用xlsxwriter 庫實現 如下 import xlsxwriter import sys reload sys 解決中文編碼問題 sys.setdefaultencoding utf 8 建立一個絕對路徑為.test.xlsx的excel檔案workbook xlsx...

python如何用迴圈遍歷多重列表

自定義函式遞迴吧 def myprint a for i in a if isinstance i,list myprint i else print i a li mark jim lily lucy gao master myprint a limark jimlily lucy gaomast...