| 目錄   正文 過濾器(Filter)  基礎(chǔ)API中的查詢操作在面對大量數(shù)據(jù)的時候是非常蒼白的,這里Hbase提供了高級的查詢方法:Filter。Filter可以根據(jù)簇、列、版本等更多的條件來對數(shù)據(jù)進行過濾,基于Hbase本身提供的三維有序(主鍵有序、列有序、版本有序),這些Filter可以高效的完成查詢過濾的任務(wù)。帶有Filter條件的RPC查詢請求會把Filter分發(fā)到各個RegionServer,是一個服務(wù)器端(Server-side)的過濾器,這樣也可以降低網(wǎng)絡(luò)傳輸?shù)膲毫Α?/p>
   要完成一個過濾的操作,至少需要兩個參數(shù)。一個是抽象的操作符,Hbase提供了枚舉類型的變量來表示這些抽象的操作符:LESS/LESS_OR_EQUAL/EQUAL/NOT_EUQAL等;另外一個就是具體的比較器(Comparator),代表具體的比較邏輯,如果可以提高字節(jié)級的比較、字符串級的比較等。有了這兩個參數(shù),我們就可以清晰的定義篩選的條件,過濾數(shù)據(jù)。 抽象操作符(比較運算符) 
LESS < LESS_OR_EQUAL <= EQUAL = NOT_EQUAL <> GREATER_OR_EQUAL >= GREATER > NO_OP 排除所有 比較器(指定比較機制) 
BinaryComparator 按字節(jié)索引順序比較指定字節(jié)數(shù)組,采用 Bytes.compareTo(byte[]) BinaryPrefixComparator 跟前面相同,只是比較左端的數(shù)據(jù)是否相同 NullComparator 判斷給定的是否為空 BitComparator 按位比較 RegexStringComparator 提供一個正則的比較器,僅支持 EQUAL 和非 EQUAL SubstringComparator 判斷提供的子串是否出現(xiàn)在 value 中 HBase過濾器的分類比較過濾器1、行鍵過濾器 RowFilter
Filter rowFilter = new RowFilter(CompareOp.GREATER, new BinaryComparator("95007".getBytes()));
scan.setFilter(rowFilter);  
View Code運行結(jié)果部分截圖 
 2、列簇過濾器 FamilyFilter
Filter familyFilter = new FamilyFilter(CompareOp.EQUAL, new BinaryComparator("info".getBytes()));
scan.setFilter(familyFilter);  
View Code
 3、列過濾器 QualifierFilter
Filter qualifierFilter = new QualifierFilter(CompareOp.EQUAL, new BinaryComparator("name".getBytes()));
scan.setFilter(qualifierFilter);  
View Code  4、值過濾器 ValueFilter
Filter valueFilter = new ValueFilter(CompareOp.EQUAL, new SubstringComparator("男"));
scan.setFilter(valueFilter);  
View Code  5、時間戳過濾器 TimestampsFilter
List<Long> list = new ArrayList<>();
list.add(1522469029503l);
TimestampsFilter timestampsFilter = new TimestampsFilter(list);
scan.setFilter(timestampsFilter);  
View Code
 專用過濾器1、單列值過濾器 SingleColumnValueFilter ----會返回滿足條件的整行
SingleColumnValueFilter singleColumnValueFilter = new SingleColumnValueFilter(
                "info".getBytes(), //列簇
                "name".getBytes(), //列
                CompareOp.EQUAL, 
                new SubstringComparator("劉晨"));
//如果不設(shè)置為 true,則那些不包含指定 column 的行也會返回
singleColumnValueFilter.setFilterIfMissing(true);
scan.setFilter(singleColumnValueFilter);  
View Code
 2、單列值排除器 SingleColumnValueExcludeFilter 
SingleColumnValueExcludeFilter singleColumnValueExcludeFilter = new SingleColumnValueExcludeFilter(
                "info".getBytes(), 
                "name".getBytes(), 
                CompareOp.EQUAL, 
                new SubstringComparator("劉晨"));
singleColumnValueExcludeFilter.setFilterIfMissing(true);
        
scan.setFilter(singleColumnValueExcludeFilter);  
View Code  3、前綴過濾器 PrefixFilter----針對行鍵
PrefixFilter prefixFilter = new PrefixFilter("9501".getBytes());
        
scan.setFilter(prefixFilter);  
View Code
 4、列前綴過濾器 ColumnPrefixFilter
ColumnPrefixFilter columnPrefixFilter = new ColumnPrefixFilter("name".getBytes());
        
scan.setFilter(columnPrefixFilter);  
View Code
 5、分頁過濾器 PageFilter  |