為什么選擇kafka采集數(shù)據(jù)?大數(shù)據(jù)采集層主要可以使用Flume, Kafka兩種技術(shù)。查看全文>>
本地和遠(yuǎn)程模式安裝配置方式大致相同,本質(zhì)上是將Hive默認(rèn)的元數(shù)據(jù)存儲(chǔ)介質(zhì)由自帶的Derby數(shù)據(jù)庫替換為MySQL數(shù)據(jù)庫,這樣無論在任何目錄下以任何方式啟動(dòng)Hive,只要連接的是同一臺(tái)Hive服務(wù),那么所有節(jié)點(diǎn)訪問的元數(shù)據(jù)信息是一致的,從而實(shí)現(xiàn)元數(shù)據(jù)的共享。下面就以本地模式為例,講解安裝過程。查看全文>>
任何一種編程語言都有特定的數(shù)據(jù)類型,Scala也不例外。與其他語言相比,Scala中的所有值都有一個(gè)類型,包括數(shù)值和函數(shù)。接下來,通過一張圖來描述Scala數(shù)據(jù)類型的層次結(jié)構(gòu),具體如圖1所示。查看全文>>
HBase數(shù)據(jù)庫最常見的操作就是讀寫數(shù)據(jù),接下來,針對HBase讀寫數(shù)據(jù)的流程進(jìn)行詳細(xì)介紹。查看全文>>
Hadoop集群的安裝和配置完成之后。并不能直接啟動(dòng)集群,因?yàn)樵诔醮螁?dòng)HDFS集群時(shí),必須對主節(jié)點(diǎn)進(jìn)行格式化處理,具體指令如下。查看全文>>
大數(shù)據(jù)不斷向世界的各行各業(yè)滲透,影響著我們的衣食住行。例如,網(wǎng)上購物時(shí),經(jīng)常會(huì)發(fā)現(xiàn)電子商務(wù)門戶網(wǎng)站向我們推薦商品,往往這類商品都是我們最近需要的。查看全文>>