從基礎(chǔ)知識點到安裝部署、集群配置、各種服務(wù)安裝到增加新節(jié)點,通過知識點 + 實際操作的方式幫助小白快速掌握CDH的安裝和配置。查看全文>>
Python源碼不需要編譯成二進制代碼,它可以直接從源代碼運行程序。Python解釋器將源代碼轉(zhuǎn)換為字節(jié)碼,然后把編譯好的字節(jié)碼轉(zhuǎn)發(fā)到Python虛擬機(PVM)中進行執(zhí)行。接下來,通過一張圖來描述Python程序的執(zhí)行過程,如圖1所示。查看全文>>
完成了Hadoop集群安裝和測試之后,顯示構(gòu)建的Hadoop集群能夠正常運行。接下來,就通過Hadoop經(jīng)典案例——單詞統(tǒng)計,來演示Hadoop集群的簡單使用。查看全文>>
如果Hadoop集群中部署了Hive服務(wù),并且在Sqoop服務(wù)的sqoop-env.sh文件中配置了Hive的安裝路徑,那么也可以通過Sqoop工具將MySQL表數(shù)據(jù)導(dǎo)入Hive表中。將MySQL表數(shù)據(jù)導(dǎo)入到Hive文件系統(tǒng)中,具體指令示例如下。查看全文>>
Pandas執(zhí)行算術(shù)運算時,會先按照索引進行對齊,對齊以后再進行相應(yīng)的運算,沒有對齊的位置會用NaN進行補齊。其中,Series是按行索引對齊的,DataFrame是按行索引、列索引對齊的。查看全文>>