<dl id="0qq4i"><xmp id="0qq4i"></xmp></dl>

<bdo id="0qq4i"></bdo>

<button id="0qq4i"><abbr id="0qq4i"></abbr></button>

<table id="0qq4i"><xmp id="0qq4i"></xmp></table>

<bdo id="0qq4i"><source id="0qq4i"></source></bdo>

了解HBase
HBase快速入門
1. 快速啟動HBase
Apache HBase配置
1. Apache HBase配置文件
2. HBase基礎條件
3. HBase運行模式
4. 開始運行HBase
5. HBase默認配置
6. HBase配置示例
7. HBase重要配置
8. HBase動態(tài)配置
升級HBase
1. HBase版本號和兼容性
2. HBase回滾：版本恢復
3. HBase升級路徑
HBase Shell
1. 使用Apache HBase Shell
2. HBase shell 技巧
HBase數(shù)據(jù)模型
1. HBase概念視圖
2. HBase物理視圖
3. HBase命名空間
4. HBase表、行與列族
5. HBase數(shù)據(jù)模型操作
6. HBase版本
7. HBase排序順序、列元數(shù)據(jù)以及聯(lián)合查詢
HBase和Schema設計
1. HBase模式(Schema) 創(chuàng)建
2. HBase表格模式經驗法則
Thumb的RegionServer大小規(guī)則
1. HBase列族數(shù)量
2. Rowkey（行鍵）設計
3. HBase版本數(shù)量
4. HBase支持的數(shù)據(jù)類型
5. HBase生存時間（TTL）
6. 保留已刪除的HBase單元格
7. HBase二級索引和備用查詢路徑
8. HBase限制因素
9. HBase模式（Schema）設計案例
10. HBase操作和性能配置選項
11. HBase特殊情況
HBase和MapReduce
1. HBase、MapReduce和CLASSPATH
2. MapReduce掃描緩存
3. 捆綁HBase MapReduce作業(yè)
4. HBase作為MapReduce作業(yè)數(shù)據(jù)源和數(shù)據(jù)接收器
5. 在批量導入時直接寫入HFiles
6. RowCounter示例
7. Map-Task分割
8. HBase MapReduce示例
Apache HBase安全
1. 為Web UI使用安全HTTP（HTTPS）
2. 將SPNEGO用于Web UI的Kerberos身份驗證
3. 客戶端安全訪問Apache HBase
4. 用戶訪問Apache HBase的簡單方法
5. 安全訪問HDFS和ZooKeeper
6. HBase數(shù)據(jù)安全
7. HBase安全配置示例
HBase架構
1. HBase架構概述
2. HBase目錄表
3. HBase客戶端
4. HBase客戶端請求過濾器
5. HBase架構：Master
HBase架構：RegionServer
1. RegionServer接口、進程與協(xié)處理器
2. HBase塊緩存
3. RegionServer Offheap讀/寫路徑
4. RegionServer拆分實現(xiàn)
HBase使用Write Ahead Log（WAL）
1. HBase使用WAL的目的
2. HBase：WAL供應方
3. HBase：MultiWAL支持
4. HBase：WAL拆分
5. HBase：WAL壓縮
6. WAL耐久性
7. HBase：禁用WAL
HBase區(qū)域
1. HBase區(qū)域數(shù)量
2. HBase區(qū)域服務器分配
3. HBase區(qū)域服務器位置
4. HBase區(qū)域拆分
5. HBase自定義拆分策略
6. HBase手動拆分區(qū)域
7. HBase在線區(qū)域合并
Store
1. MEMSTORE
2. Scans
3. HBase使用StoreFile（HFile）
4. 塊和KeyValue
HBase批量加載
1. HBase批量加載架構
2. HDFS
HBase：Timeline-consistent高可用讀取
1. HBase時間軸一致性（Timeline Consistency）
2. HBase時間軸一致性的權衡取舍
3. HBase時間軸一致性：將寫入傳播到區(qū)域副本
4. HBase時間軸一致性：存儲文件TTL
5. HBase時間軸一致性：META表區(qū)域的區(qū)域復制
6. HBase時間軸一致性：內存報告
7. HBase時間軸一致性：輔助副本故障切換
8. HBase時間軸一致性：配置屬性
9. HBase時間軸一致性：創(chuàng)建具有區(qū)域復制的表
10. HBase時間軸一致性：讀取API和用法
HBase：存儲中型對象（MOB）
1. HBase：為MOB配置列
2. HBase：配置MOB壓縮策略
3. HBase：配置MOB壓縮可合并閾值
4. HBase：測試MOB
5. HBase：配置MOB緩存
HBase：MOB優(yōu)化任務
HBase內存壓縮
啟用HBase內存壓縮
HBase備份與還原
1. HBase備份與還原策略
2. HBase備份與還原的首次配置
3. HBase備份和還原命令
4. HBase備份圖像管理
HBase同步復制
Apache HBase API
Apache HBase外部API
1. HBase：REST服務器
2. 將Java數(shù)據(jù)對象（JDO）與HBase一起使用
3. HBase與Scala一起使用
4. HBase與Jython一起使用
HBase：Thrift API和過濾器語言
1. HBase：常規(guī)過濾字符串語法
2. HBase：復合過濾器和運算符
3. HBase：過濾器計算順序
4. HBase：過濾器比較運算符
5. HBase比較器
6. HBase過濾器語言示例
7. HBase單個過濾器語法
HBase和Spark
1. HBase：基本Spark
2. Spark Streaming
3. 使用Spark將數(shù)據(jù)批量加載到HBase
4. SparkSQL / DataFrames
Apache HBase協(xié)處理器
1. Apache HBase協(xié)處理器概述
2. Apache HBase協(xié)處理器的類型
3. Apache HBase加載協(xié)處理器
4. HBase觀察者協(xié)處理器示例
5. HBase部署協(xié)處理器的準則
6. HBase限制協(xié)處理器的使用
Apache HBase性能調整
1. HBase性能調整：操作系統(tǒng)
2. HBase性能調整：網絡
3. HBase性能調整：Java GC
4. HBase性能調整：配置
5. HBase性能調整：架構設計
6. HBase性能調整：一般模式
7. HBase相關內容
8. 從HBase讀取
9. 從HBase刪除
10. HDFS的工作方式
11. Amazon EC2
12. 配置HBase和MapReduce
故障排除和調試Apache HBase
1. 故障排除和調試HBase：日志
2. 故障排除和調試HBase：資源
3. 故障排除和調試HBase：工具
  1. 內置工具
  2. 外部工具
4. 故障排除和調試HBase：客戶端
5. 故障排除和調試HBase：MapReduce
6. 故障排除和調試HBase：NameNode
7. 故障排除和調試HBase：網絡
8. 故障排除和調試HBase：RegionServer
9. 故障排除和調試HBase：Master
10. 故障排除和調試HBase：ZooKeeper
11. 故障排除和調試HBase：Amazon EC2
12. 故障排除和調試HBase：HBase和Hadoop版本問題
13. 故障排除和調試HBase：HBase和HDFS

閱讀(4.6k) 書簽贊(0) 我要糾錯

HBase作為MapReduce作業(yè)數(shù)據(jù)源和數(shù)據(jù)接收器

2018-04-04 11:05 更新

HBase作為MapReduce作業(yè)數(shù)據(jù)源和數(shù)據(jù)接收器

對于 MapReduce 作業(yè)，HBase 可以用作數(shù)據(jù)源、TableInputFormat 和數(shù)據(jù)接收器、TableOutputFormat 或 MultiTableOutputFormat。編寫讀取或寫入HBase 的 MapReduce作業(yè)，建議子類化 TableMapper 或 TableReducer。

如果您運行使用 HBase 作為源或接收器的 MapReduce 作業(yè)，則需要在配置中指定源和接收器表和列名稱。

當您從 HBase 讀取時，TableInputFormat 請求 HBase 的區(qū)域列表并制作一張映射，可以是一個 map-per-region 或 mapreduce.job.maps mapreduce.job.maps ，映射到大于區(qū)域數(shù)目的數(shù)字。如果您為每個節(jié)點運行 TaskTracer/NodeManager 和 RegionServer，則映射將在相鄰的 TaskTracker/NodeManager 上運行。在寫入 HBase 時，避免使用 Reduce 步驟并從映射中寫回 HBase 是有意義的。當您的作業(yè)不需要 MapReduce 對映射發(fā)出的數(shù)據(jù)進行排序和排序時，這種方法就可以工作。在插入時，HBase 'sorts'，因此除非需要，否則雙重排序（并在您的 MapReduce 集群周圍混洗數(shù)據(jù)）沒有意義。如果您不需要 Reduce，則映射可能會發(fā)出在作業(yè)結束時為報告處理的記錄計數(shù)，或者將 Reduces 的數(shù)量設置為零并使用 TableOutputFormat。如果運行 Reduce 步驟在你的情況下是有意義的，則通常應使用多個減速器，以便在 HBase 群集上傳播負載。

一個新的 HBase 分區(qū)程序 HRegionPartitioner 可以運行與現(xiàn)有區(qū)域數(shù)量一樣多的 reducers。當您的表格很大時，HRegionPartitioner 是合適的，并且您的上傳不會在完成時大大改變現(xiàn)有區(qū)域的數(shù)量。否則使用默認分區(qū)程序。

以上內容是否對您有幫助：

← 捆綁HBase MapReduce作業(yè)

在批量導入時直接寫入HFiles →

寫筆記

我要補充

<samp id="qm2sg"><strong id="qm2sg"></strong></samp>

<center id="qm2sg"></center>

<bdo id="qm2sg"><strong id="qm2sg"></strong></bdo><code id="qm2sg"><xmp id="qm2sg"></xmp></code>