數(shù)據(jù)的一致性有3種類型,即強一致性、弱一致性以及最終一致性,具體介紹如下。查看全文>>
我們知道,Python語言當(dāng)前同時支持Python2和Python3兩個版本,這兩個版本的語法不完全兼容,因此在執(zhí)行其他版本的程序時很可能會報錯。查看全文>>
Pandas中的索引都是Index類對象,又稱為索引對象,該對象是不可以進(jìn)行修改的,以保障數(shù)據(jù)的安全。例如,創(chuàng)建一個Series類對象,為其指定索引,然后再對索引重新賦值后會提示“索引不支持可變操作”的錯誤信息,示例代碼如下。查看全文>>
在計算機使用中,目錄構(gòu)成了我們獲取文件的基礎(chǔ),一般來說所有的文件都會存儲在特定的目錄之下。接下來,筆者先來介紹一下使用Python獲取目錄相關(guān)信息的方法。查看全文>>
Serde是Serializer and Deserializer(序列化和反序列化)的簡稱,Hive 通過Serde處理Hive數(shù)據(jù)表中每一行數(shù)據(jù)的讀取和寫入,例如查詢Hive數(shù)據(jù)表數(shù)據(jù)時,HDFS中存放的數(shù)據(jù)表數(shù)據(jù)會通過Serializer序列化為字節(jié)流便于數(shù)據(jù)傳輸;向Hive數(shù)據(jù)表插入數(shù)據(jù)時,會通過Deserializer將數(shù)據(jù)反序列化成Hive數(shù)據(jù)表的每一行值,方便將數(shù)據(jù)加載到數(shù)據(jù)表中,不需要對數(shù)據(jù)進(jìn)行轉(zhuǎn)換。查看全文>>
當(dāng)我們?nèi)粘S肞ython做數(shù)據(jù)分析的時候,會利用Python的基礎(chǔ)語法來實現(xiàn)我們需要的功能。除此之外,技術(shù)人員也會通過第三方庫已經(jīng)封裝的功能,更快速、高效地處理和分析數(shù)據(jù)。查看全文>>