Python模塊的開(kāi)頭通常會(huì)定義一個(gè)__all__屬性,該屬性實(shí)際上是一個(gè)元組,該元組中包含的元素決定了在使用from…import 語(yǔ)句導(dǎo)入模塊內(nèi)容時(shí)通配符所包含的內(nèi)容。 如果__all__中只包含模塊的部分內(nèi)容,那么from…import *語(yǔ)句只會(huì)將__all__中包含的部分內(nèi)容導(dǎo)入程序。查看全文>>
break語(yǔ)句用于跳出離它最近一級(jí)的循環(huán),能夠用于for循環(huán)和while循環(huán)中,通常與if語(yǔ)句結(jié)合使用,放在if語(yǔ)句代碼塊中,其格式如下所示。查看全文>>
在數(shù)據(jù)倉(cāng)庫(kù)建設(shè)中,一般會(huì)圍繞著星型模型和雪花模型來(lái)設(shè)計(jì)數(shù)據(jù)模型。下面就來(lái)介紹一下這兩種數(shù)據(jù)模型。查看全文>>
Scrapy的運(yùn)作流程由引擎控制,其過(guò)程如下:(1)引擎向Spiders請(qǐng)求第個(gè)要爬取的URL(s)。(2)引擎從Spiders中獲取到第一個(gè)要爬取的URL,封裝成Request并交給調(diào)度器。(3)引擎向調(diào)度器請(qǐng)求下一個(gè)要爬取的Request。查看全文>>
根據(jù)使用場(chǎng)景,網(wǎng)絡(luò)爬蟲(chóng)可分為通用爬蟲(chóng)和聚焦爬蟲(chóng)兩種。通用爬蟲(chóng)是捜索引擎抓取系統(tǒng)(Baidu、Google、Yahoo等)的重要組成部分,主要目的是將互聯(lián)網(wǎng)上的網(wǎng)頁(yè)下載到本地,形成一個(gè)互聯(lián)網(wǎng)內(nèi)容的鏡像備份。聚焦爬蟲(chóng),是“面向特定主題需求”的一種網(wǎng)絡(luò)爬蟲(chóng)程序。接下來(lái),就對(duì)這兩種爬蟲(chóng)分別進(jìn)行介紹。查看全文>>
NumPy支持比Python更多的數(shù)據(jù)類(lèi)型。下面介紹一些常用的數(shù)據(jù)類(lèi)型,以及這些數(shù)據(jù)類(lèi)型之間的轉(zhuǎn)換。通過(guò)“ndarray.dtype”可以創(chuàng)建一個(gè)表示數(shù)據(jù)類(lèi)型的對(duì)象。要想獲取數(shù)據(jù)類(lèi)型的名稱(chēng),則需要訪(fǎng)問(wèn)name屬性進(jìn)行獲取,示例代碼如下。查看全文>>