前期采集到的數(shù)據(jù),或多或少都存在一些瑕疵和不足,比如數(shù)據(jù)缺失、極端值、數(shù)據(jù)格式不統(tǒng)一等問題。因此,在分析數(shù)據(jù)之前需要對數(shù)據(jù)進(jìn)行預(yù)處理,包括數(shù)據(jù)的清洗、合并、重塑與轉(zhuǎn)換。Pandas中專門提供了用于數(shù)據(jù)預(yù)處理的很多函數(shù)與方法,用于替換異常數(shù)據(jù)、合并數(shù)據(jù)、重塑數(shù)據(jù)。查看全文>>
斐波那契數(shù)列(Fibonacci sequence),又稱黃金分割數(shù)列、因數(shù)學(xué)家萊昂納多·斐波那契(Leonardoda Fibonacci)以兔子繁殖為例子而引入,故又稱為“兔子數(shù)列”。查看全文>>
MySQL屬于關(guān)系型數(shù)據(jù)庫,Mongodb屬于非關(guān)系型數(shù)據(jù)庫,兩者有不同的特點,為什么選擇Mongodb而非MySQL存儲爬蟲數(shù)據(jù)呢?本節(jié)課就對這一問題做詳細(xì)解答。查看全文>>
Python中的模塊可分為三類,分別是內(nèi)置模塊、第三方模塊和自定義模塊,相關(guān)介紹如下。查看全文>>
Python程序中最常見的錯誤為語法錯誤。語法錯誤又稱為解析錯誤,它是指開發(fā)人員編寫了不符合Python語法格式的代碼所引起的錯誤。含有語法錯誤的程序會拋出異常,無法運行。如下所示為一段包含語法問題的代碼:查看全文>>
程序被執(zhí)行后成為了一個活動的實體,這個實體就是進(jìn)程。換言之,操作系統(tǒng)調(diào)度并執(zhí)行程序,這個“執(zhí)行中的程序”稱為進(jìn)程。進(jìn)程是操作系統(tǒng)進(jìn)行資源分配和調(diào)度的基本單位。一般情況下,進(jìn)程占據(jù)的內(nèi)存空間由控制塊、程序段和數(shù)據(jù)段三個部分組成,各部分的介紹如下。查看全文>>