爬取網(wǎng)頁其實就是通過URL獲取網(wǎng)頁信息,網(wǎng)頁信息的實質(zhì)是一段添加了JavaScript和CSS的HTML代碼。Python提供了一個抓取網(wǎng)頁信息的第三方模塊requests,requests模塊自稱“HTTP for Humans”,直譯過來的意思是專門為人類而設計的HTTP模塊,該模塊支持發(fā)送請求,也支持獲取響應。查看全文>>
利用json模塊的dumps()函數(shù)和loads()函數(shù)可以實現(xiàn)Python對象和JSON數(shù)據(jù)之間的轉換,下面來分別演示兩種函數(shù)的用法查看全文>>
程序中與數(shù)據(jù)相關的操作分為數(shù)據(jù)的存儲與讀寫。下面將對如何存儲與讀寫不同維度的數(shù)據(jù)進行講解。1.數(shù)據(jù)存儲數(shù)據(jù)通常存儲在文件之中,為了方便后續(xù)的讀寫操作,數(shù)據(jù)通常需要按照約定的組織方式進行存儲。一維數(shù)據(jù)呈線性排列,一般用特殊字符分隔,具體示例如下。查看全文>>
Python變量并不是在哪個位置都可以訪問的,具體的訪問權限取決于變量定義的位置,其所處的有效范圍視為變量的作用域。根據(jù)作用域的不同,變量可以劃分為局部變量和全局變量。本節(jié)將針對局部變量和全局變量進行詳細地講解。查看全文>>
構建集合的這些對象稱為該集合的元素。例如,成年人集合的每一個元素都是已滿18周歲的人。通常用大寫字母如A、B、S……表示集合,用小寫字母如a、b、c……表示集合的元素。集合中的元素具有3個特征,具體如下。查看全文>>
目前,很多開源框架的繪圖功能都是基于matplotibl實現(xiàn)的,pandas便是其中之一。對于pandas的數(shù)據(jù)結構來說,直接使用其自身的繪圖功能要比matplotibl更加方便簡單。表9-16中列舉了有關pandas內(nèi)置數(shù)據(jù)結構繪制圖形的常用方法。查看全文>>