《Hive性能调优实战》摘录

性能调优的多样性

1 SQL&#x4F18;&#x5316;
union all&#x53EF;&#x4EE5;&#x6539;&#x6210;&#x4E24;&#x6B21;&#x8FDE;&#x7EED;&#x7684;insert&#x63D2;&#x5165;&#x53EF;&#x4EE5;&#x63D0;&#x9AD8;mapreduce&#x6027;&#x80FD;&#xFF0C;
&#x4F46;&#x662F;&#x5728;&#x4E4B;&#x540E;&#x7684;&#x7248;&#x672C;hive&#x81EA;&#x8EAB;&#x505A;&#x4E86;&#x4F18;&#x5316;&#xFF0C;&#x8BE5;&#x65B9;&#x6CD5;&#x5219;&#x5E76;&#x4E0D;&#x80FD;&#x518D;&#x63D0;&#x9AD8;&#x6027;&#x80FD;

2 &#x6570;&#x636E;&#x5757;&#x5927;&#x5C0F;
&#x51CF;&#x5C11;map&#x6570;&#x91CF;&#xFF0C;&#x63D0;&#x9AD8;&#x7F51;&#x7EDC;&#x4F20;&#x8F93;&#x538B;&#x529B;&#x6709;&#x65F6;&#x5019;&#x53EF;&#x4EE5;&#x63D0;&#x9AD8;&#x6027;&#x80FD;

3 &#x4E0D;&#x540C;&#x7684;&#x6570;&#x636E;&#x683C;&#x5F0F;
SequenceFile
Parquet
ORC

4 &#x8868;&#x8BBE;&#x8BA1;
&#x5982;&#x5206;&#x533A;&#xFF0C;&#x5206;&#x6876;&#xFF0C;&#x540C;&#x65F6;&#x5206;&#x533A;&#x5206;&#x6876;

优化案例

&#x5E72;&#x9884;SQl&#x8FD0;&#x884C;&#x65B9;&#x5F0F;
1 &#x5F15;&#x64CE;&#x6267;&#x884C;&#x8FC7;&#x7A0B;&#x7684;&#x5E72;&#x9884;
    --union&#x4F18;&#x5316;&#xFF1A;&#x7528;grouping sets&#x4EE3;&#x66FF;union&#x7684;SQL&#x4F18;&#x5316;
        SELECT a, b, SUM( c ) FROM table GROUP BY a, b GROUPING SETS ( (a,b), a) &#x7B49;&#x540C;&#x4E8E;
        SELECT a, b, SUM( c ) FROM table GROUP BY a, b
        UNION SELECT a, null, SUM( c ) FROM table GROUP BY a
    &#x4F18;&#x70B9;&#xFF1A;
    GROUPING SETS&#x5728;&#x9047;&#x5230;&#x591A;&#x4E2A;&#x6761;&#x4EF6;&#x65F6;&#xFF0C;&#x805A;&#x5408;&#x662F;&#x4E00;&#x6B21;&#x6027;&#x4ECE;&#x6570;&#x636E;&#x5E93;&#x4E2D;&#x53D6;&#x51FA;&#x6240;&#x6709;&#x9700;&#x8981;&#x64CD;&#x4F5C;&#x7684;&#x6570;&#x636E;,
    &#x5728;&#x5185;&#x5B58;&#x4E2D;&#x5BF9;&#x6570;&#x636E;&#x5E93;&#x8FDB;&#x884C;&#x805A;&#x5408;&#x64CD;&#x4F5C;&#x5E76;&#x751F;&#x6210;&#x7ED3;&#x679C;&#xFF0C;&#x800C;&#x4E0D;&#x4F1A;&#x50CF;GROUP BY&#x591A;&#x6B21;&#x626B;&#x63CF;&#x8868;&#x540E;&#x8FDB;&#x884C;UNION&#x64CD;&#x4F5C;&#x3002;
    &#x8FD9;&#x4E5F;&#x5C31;&#x662F;&#x4E3A;&#x4EC0;&#x4E48;GROUPING SETS&#x548C;UNION&#x64CD;&#x4F5C;&#x6240;&#x8FD4;&#x56DE;&#x7684;&#x6570;&#x636E;&#x987A;&#x5E8F;&#x662F;&#x4E0D;&#x540C;&#x7684;
    &#x7F3A;&#x70B9;&#xFF1A;
    &#x4F7F;&#x7528;union&#x64CD;&#x4F5C;&#x4F1A;&#x589E;&#x52A0;IO&#x5F00;&#x9500;,&#x4F1A;&#x51CF;&#x5C11;cpu&#x548C;&#x5185;&#x5B58;&#x7684;&#x5F00;&#x9500;,&#x4F7F;&#x7528;grouping sets&#x4F1A;&#x51CF;&#x5C11;IO&#x5F00;&#x9500;,&#x4F1A;&#x589E;&#x52A0;cpu&#x548C;&#x5185;&#x5B58;&#x7684;&#x6D88;&#x8017;

    --count distinct &#x6570;&#x636E;&#x503E;&#x659C;&#xFF1A;
    &#x539F;&#x56E0;&#xFF1A;&#x6240;&#x6709;key&#x4F1A;&#x5206;&#x53D1;&#x5230;&#x540C;&#x4E00;&#x4E2A;reduce&#x8FDB;&#x884C;&#x53BB;&#x91CD;&#x7EDF;&#x8BA1;&#x4E2A;&#x6570;&#xFF0C;&#x6570;&#x636E;&#x91CF;&#x8F83;&#x5927;&#x65F6;&#x5BFC;&#x81F4;&#x8FD0;&#x884C;&#x65F6;&#x95F4;&#x8FC7;&#x957F;&#x3002;
    &#x89E3;&#x51B3;&#x529E;&#x6CD5;&#xFF1A;&#x5C06; count distinct &#x6539;&#x5199;&#x4E3A; group by &#x7684;&#x5199;&#x6CD5;&#x3002;&#x76EE;&#x7684;&#x662F;&#x589E;&#x52A0;&#x4E00;&#x4E2A;MR&#x7684;&#x64CD;&#x4F5C;
    &#x6848;&#x4F8B;&#xFF1A;select s_age,count(distinct s_score) num
        from student_tb_orc
        group by s_age
    --&#x6539;&#x5199;&#x540E;&#x7684;&#x4EE3;&#x7801;&#x6BB5;
    select s_age,count(1) num
    from(
        select s_age,s_score,count(1) num
        group by s_age,s_score
    ) a
    &#x6CE8;&#x610F;&#xFF1A;distinct&#x5B57;&#x6BB5;&#x5982;&#x679C;&#x6570;&#x636E;&#x91CF;&#x4E0D;&#x5927;&#x4E0D;&#x63A8;&#x8350;&#x4F7F;&#x7528;&#x8BE5;&#x65B9;&#x6CD5;&#xFF0C;&#x56E0;&#x4E3A;&#x8BE5;&#x65B9;&#x5F0F;&#x662F;&#x901A;&#x8FC7;1&#x4E2A;MR&#x4EFB;&#x52A1;&#x53D8;&#x6210;2&#x4E2A;MR&#x4EFB;&#x52A1;&#x6765;&#x907F;&#x514D;&#x6570;&#x636E;&#x503E;&#x659C;
    &#x53E6;&#x5916; hive.optimize.countdistinct&#xFF1A;&#x9ED8;&#x8BA4;&#x503C;&#x4E3A;true&#xFF0C;Hive 3.0&#x65B0;&#x589E;&#x7684;&#x914D;&#x7F6E;&#x9879;&#xFF0C;hive&#x81EA;&#x52A8;&#x5206;2&#x4E2A;MR&#x4EFB;&#x52A1;&#x5904;&#x7406;

2 &#x901A;&#x8FC7;SQL-Hint&#x8BED;&#x6CD5;&#x5B9E;&#x73B0;&#x5BF9;&#x8BA1;&#x7B97;&#x5F15;&#x64CE;&#x6267;&#x884C;&#x8FC7;&#x7A0B;&#x7684;&#x5E72;&#x9884;
    --MAPJOIN()&#x62EC;&#x53F7;&#x4E2D;&#x6307;&#x5B9A;&#x7684;&#x662F;&#x6570;&#x636E;&#x91CF;&#x8F83;&#x5C0F;&#x7684;&#x8868;&#xFF0C;&#x8868;&#x793A;&#x5728;Map&#x9636;&#x6BB5;&#x5B8C;&#x6210;a,b&#x8868;&#x7684;&#x8FDE;&#x63A5;
    &#x5C06;&#x539F;&#x6765;&#x5728;Reduce&#x4E2D;&#x8FDB;&#x884C;&#x8FDE;&#x63A5;&#x7684;&#x64CD;&#x4F5C;&#xFF0C;&#x524D;&#x63A8;&#x5230;Map&#x9636;&#x6BB5;

    --STREAMTABLE()&#xFF0C;&#x62EC;&#x53F7;&#x4E2D;&#x6307;&#x5B9A;&#x7684;&#x6570;&#x636E;&#x91CF;&#x5927;&#x7684;&#x8868;
    &#x9ED8;&#x8BA4;&#x60C5;&#x51B5;&#x4E0B;&#x5728;reduce&#x9636;&#x6BB5;&#x8FDB;&#x884C;&#x8FDE;&#x63A5;&#xFF0C;hive&#x628A;&#x5DE6;&#x8868;&#x4E2D;&#x7684;&#x6570;&#x636E;&#x653E;&#x5728;&#x7F13;&#x5B58;&#x4E2D;&#xFF0C;&#x53F3;&#x8868;&#x4E2D;&#x7684;&#x6570;&#x636E;&#x4F5C;&#x4E3A;&#x6D41;&#x6570;&#x636E;&#x8868;
    &#x5982;&#x679C;&#x60F3;&#x6539;&#x53D8;&#x4E0A;&#x9762;&#x7684;&#x90A3;&#x79CD;&#x65B9;&#x5F0F;&#xFF0C;&#x5C31;&#x7528;/*+streamtable(&#x8868;&#x540D;)*/&#x6765;&#x6307;&#x5B9A;&#x4F60;&#x60F3;&#x8981;&#x4F5C;&#x4E3A;&#x6D41;&#x6570;&#x636E;&#x7684;&#x8868;

3 &#x901A;&#x8FC7;&#x6570;&#x636E;&#x5E93;&#x5F00;&#x653E;&#x7684;&#x4E00;&#x4E9B;&#x914D;&#x7F6E;&#x5F00;&#x5173;&#xFF0C;&#x6765;&#x5B9E;&#x73B0;&#x5BF9;&#x8BA1;&#x7B97;&#x5F15;&#x64CE;&#x7684;&#x5E72;&#x9884;
    &#x5982;&#x77ED;&#x6682;&#x63D0;&#x9AD8;&#x5199;&#x5165;&#x6548;&#x7387;&#x65F6;&#xFF0C;&#x53EF;&#x4EE5;&#x63D0;&#x9AD8;&#x5E76;&#x884C;&#x5EA6;&#xFF0C;&#x6682;&#x65F6;&#x5173;&#x95ED;wal&#x65E5;&#x5FD7;&#x7B49;

避免过度优化

代码优化原则

&#xB7;&#x7406;&#x900F;&#x9700;&#x6C42;&#x539F;&#x5219;&#xFF0C;&#x8FD9;&#x662F;&#x4F18;&#x5316;&#x7684;&#x6839;&#x672C;&#xFF1B;
    distinct&#x5B57;&#x6BB5;&#x5982;&#x679C;&#x6570;&#x636E;&#x91CF;&#x4E0D;&#x5927;&#x4E0D;&#x63A8;&#x8350;&#x4F7F;&#x7528;&#x989D;&#x5916;group by&#xFF0C;&#x56E0;&#x4E3A;&#x8BE5;&#x65B9;&#x5F0F;&#x662F;&#x901A;&#x8FC7;1&#x4E2A;MR&#x4EFB;&#x52A1;&#x53D8;&#x6210;2&#x4E2A;MR&#x4EFB;&#x52A1;&#x6765;&#x907F;&#x514D;&#x6570;&#x636E;&#x503E;&#x659C;
    &#x5982;&#x679C;&#x53BB;&#x91CD;&#x6570;&#x503C;&#x672C;&#x8EAB;&#x4E0D;&#x5927;&#xFF0C;&#x53EF;&#x81EA;&#x5B9A;&#x4E49;&#x5B9E;&#x73B0;MR
    map&#x9636;&#x6BB5;&#x5C40;&#x90E8;&#x53BB;&#x91CD;&#x540E;&#x5168;&#x90E8;&#x5199;&#x5165;null&#x4E3A;key&#x8FDB;&#x4E00;&#x4E2A;reduce&#xFF0C;&#x552F;&#x4E00;&#x4E00;&#x4E2A;reduce&#x505A;&#x5168;&#x5C40;&#x53BB;&#x91CD;&#xFF0C;&#x53EF;&#x5B9E;&#x73B0;O(1)&#x53BB;&#x91CD;&#x590D;&#x6742;&#x5EA6;
&#xB7;&#x628A;&#x63E1;&#x6570;&#x636E;&#x5168;&#x94FE;&#x8DEF;&#x539F;&#x5219;&#xFF0C;&#x8FD9;&#x662F;&#x4F18;&#x5316;&#x7684;&#x8109;&#x7EDC;&#xFF1B;
    1 desc formatted&#x3002;&#x901A;&#x8FC7;desc formatted tablename&#x6765;&#x67E5;&#x770B;hive&#x8868;&#x4FE1;&#x606F;
    &#x53EF;&#x4EE5;&#x83B7;&#x53D6;&#x5230;&#x6CE8;&#x91CA;&#x3001;&#x5B57;&#x6BB5;&#x7684;&#x542B;&#x4E49;&#xFF08;comment&#xFF09;&#x3001;&#x521B;&#x5EFA;&#x8005;&#x7528;&#x6237;&#x3001;&#x6570;&#x636E;&#x5B58;&#x50A8;&#x5730;&#x5740;&#x3001;&#x6570;&#x636E;&#x5360;&#x7528;&#x7A7A;&#x95F4;&#x548C;&#x6570;&#x636E;&#x91CF;&#x7B49;&#x4FE1;&#x606F;
    2 &#x67E5;&#x8BE2;&#x5143;&#x6570;&#x636E;
    Hive&#x7684;&#x5143;&#x6570;&#x636E;&#x4E3B;&#x8981;&#x5206;&#x4E3A;5&#x4E2A;&#x5927;&#x90E8;&#x5206;&#xFF1A;&#x6570;&#x636E;&#x5E93;&#x76F8;&#x5173;&#x7684;&#x5143;&#x6570;&#x636E;&#x3001;&#x8868;&#x76F8;&#x5173;&#x7684;&#x5143;&#x6570;&#x636E;&#x3001;&#x5206;&#x533A;&#x76F8;&#x5173;&#x7684;&#x5143;&#x6570;&#x636E;&#x3001;&#x6587;&#x4EF6;&#x5B58;&#x50A8;&#x76F8;&#x5173;&#x7684;&#x5143;&#x6570;&#x636E;&#x53CA;&#x5176;&#x4ED6;
    3 &#x901A;&#x8FC7;&#x7EC4;&#x4EF6;&#x53CD;&#x9988;&#x4FE1;&#x606F;&#x3002;&#x5E38;&#x89C1;&#x7684;&#x8D44;&#x6E90;&#x7BA1;&#x7406;&#x7EC4;&#x4EF6;&#x6709;YARN&#x548C;Mesos&#xFF0C;&#x5E38;&#x89C1;&#x7684;&#x4EFB;&#x52A1;&#x7BA1;&#x7406;&#x8C03;&#x5EA6;&#x5DE5;&#x5177;&#x6709;oozie&#x3001;azkaban&#x548C;airflow&#x7B49;
&#xB7;&#x575A;&#x6301;&#x4EE3;&#x7801;&#x7684;&#x7B80;&#x6D01;&#x539F;&#x5219;&#xFF0C;&#x8FD9;&#x8BA9;&#x4F18;&#x5316;&#x66F4;&#x52A0;&#x7B80;&#x5355;&#xFF1B;
&#xB7;&#x6CA1;&#x6709;&#x74F6;&#x9888;&#x65F6;&#x8C08;&#x8BBA;&#x4F18;&#x5316;&#xFF0C;&#x662F;&#x81EA;&#x5BFB;&#x70E6;&#x607C;&#x3002;

Hive程序相关规范

&#x89C1;&#x4E66;2.2.3

Mapreduce计算引擎

这里基本略过

Mapreduce原理和参数配置

mapper&#x53C2;&#x6570;&#x914D;&#x7F6E;&#x89C1;5.3.2
reducer&#x53C2;&#x6570;&#x914D;&#x7F6E;&#x89C1;5.4.2

Map端的聚合与Hive配置

Hive配置与作业输出
MapReduce作业与Hive配置

HiveSQL执行计划

执行计划还是需要在工作中对照着书仔细查看
可以结合书本和改文章一起结合理解执行计划
 MR join和group by代码实现

&#x67E5;&#x770B;&#x6267;&#x884C;&#x8BA1;&#x5212;&#x7684;&#x57FA;&#x672C;&#x4FE1;&#x606F;&#xFF0C;&#x5373;explain&#xFF1B;
&#x67E5;&#x770B;&#x6267;&#x884C;&#x8BA1;&#x5212;&#x7684;&#x6269;&#x5C55;&#x4FE1;&#x606F;&#xFF0C;&#x5373;explain extended&#xFF1B;
&#x67E5;&#x770B;SQL&#x6570;&#x636E;&#x8F93;&#x5165;&#x4F9D;&#x8D56;&#x7684;&#x4FE1;&#x606F;&#xFF0C;&#x5373;explain dependency&#xFF1B;
    explain dependency&#x8BC6;&#x522B;SQL&#x8BFB;&#x53D6;&#x6570;&#x636E;&#x8303;&#x56F4;&#x7684;&#x5DEE;&#x522B;
    &#x5982;&#x679C;&#x8981;&#x4F7F;&#x7528;&#x5916;&#x8FDE;&#x63A5;&#x5E76;&#x9700;&#x8981;&#x5BF9;&#x5DE6;&#x3001;&#x53F3;&#x4E24;&#x4E2A;&#x8868;&#x8FDB;&#x884C;&#x6761;&#x4EF6;&#x8FC7;&#x6EE4;&#xFF0C;&#x6700;&#x597D;&#x7684;&#x65B9;&#x5F0F;&#x5C31;&#x662F;&#x5C06;&#x8FC7;&#x6EE4;&#x6761;&#x4EF6;&#x653E;&#x5230;&#x8868;&#x7684;&#x5C31;&#x8FD1;&#x5904;
&#x67E5;&#x770B;SQL&#x64CD;&#x4F5C;&#x76F8;&#x5173;&#x6743;&#x9650;&#x7684;&#x4FE1;&#x606F;&#xFF0C;&#x5373;explain authorization&#xFF1B;
&#x67E5;&#x770B;SQL&#x7684;&#x5411;&#x91CF;&#x5316;&#x63CF;&#x8FF0;&#x4FE1;&#x606F;&#xFF0C;&#x5373;explain vectorization
    &#x5411;&#x91CF;&#x5316;&#x6A21;&#x5F0F;&#x662F;Hive&#x7684;&#x4E00;&#x4E2A;&#x7279;&#x6027;&#xFF0C;&#x5728;&#x6CA1;&#x6709;&#x5F15;&#x5165;&#x5411;&#x91CF;&#x5316;&#x7684;&#x6267;&#x884C;&#x6A21;&#x5F0F;&#x4E4B;&#x524D;&#xFF0C;&#x4E00;&#x822C;&#x7684;&#x67E5;&#x8BE2;&#x64CD;&#x4F5C;&#x4E00;&#x6B21;&#x53EA;&#x5904;&#x7406;&#x4E00;&#x884C;&#xFF0C;
    &#x5728;&#x5411;&#x91CF;&#x5316;&#x67E5;&#x8BE2;&#x6267;&#x884C;&#x65F6;&#x901A;&#x8FC7;&#x4E00;&#x6B21;&#x5904;&#x7406;1024&#x884C;&#x7684;&#x5757;&#x6765;&#x7B80;&#x5316;&#x7CFB;&#x7EDF;&#x5E95;&#x5C42;&#x64CD;&#x4F5C;&#xFF0C;&#x63D0;&#x9AD8;&#x4E86;&#x6570;&#x636E;&#x7684;&#x5904;&#x7406;&#x6027;&#x80FD;
    set hive.vectorized.execution.enabled = true; &#x524D;&#x63D0;&#x662F;&#x78C1;&#x76D8;&#x5217;&#x5F0F;&#x5B58;&#x50A8;&#x683C;&#x5F0F;&#x4E3A;&#xFF1A;ORC&#x3001;Parquet

SQL&#x6267;&#x884C;&#x8BA1;&#x5212;&#x89E3;&#x8BFB;
    &#x89C1;6.2/6.3
&#x666E;&#x901A;&#x51FD;&#x6570;&#x548C;&#x64CD;&#x4F5C;&#x7B26;
    &#x89C1;6.3.2
&#x5E26;&#x805A;&#x5408;&#x51FD;&#x6570;&#x7684;SQL&#x6267;&#x884C;&#x8BA1;&#x5212;&#x89E3;&#x8BFB; 6.4
    &#xB7;&#x5728;Reduce&#x9636;&#x6BB5;&#x805A;&#x5408;&#x7684;SQL&#x6267;&#x884C;&#x8BA1;&#x5212;&#xFF1B;
    &#xB7;&#x5728;Map&#x548C;Reduce&#x90FD;&#x6709;&#x805A;&#x5408;&#x7684;SQL&#x6267;&#x884C;&#x8BA1;&#x5212;&#xFF1B;
    &#xB7;&#x9AD8;&#x7EA7;&#x5206;&#x7EC4;&#x805A;&#x5408;&#x7684;&#x6267;&#x884C;&#x8BA1;&#x5212;
&#x9AD8;&#x7EA7;&#x5206;&#x7EC4;&#x805A;&#x5408;
    &#x4F7F;&#x7528;&#x9AD8;&#x7EA7;&#x5206;&#x7EC4;&#x805A;&#x5408;&#x9700;&#x8981;&#x786E;&#x4FDD;map&#x805A;&#x5408;&#x662F;&#x5426;&#x5F00;&#x542F; set hive.map.aggr=true

    GROUPING SETS,cube,rollup &#x7528;&#x6CD5;&#x5982;&#x4E0B;&#x56FE;
    &#x901A;&#x5E38;&#x4F7F;&#x7528;&#x7B80;&#x5355;&#x7684;GROUP BY&#x8BED;&#x53E5;&#xFF0C;&#x4E00;&#x4EFD;&#x6570;&#x636E;&#x53EA;&#x6709;&#x4E00;&#x79CD;&#x805A;&#x5408;&#x60C5;&#x51B5;&#xFF0C;&#x4E00;&#x4E2A;&#x5206;&#x7EC4;&#x805A;&#x5408;&#x901A;&#x5E38;&#x53EA;&#x6709;&#x4E00;&#x4E2A;&#x8BB0;&#x5F55;&#xFF1B;
    &#x4F7F;&#x7528;&#x9AD8;&#x7EA7;&#x5206;&#x7EC4;&#x805A;&#x5408;&#xFF0C;&#x4F8B;&#x5982;cube&#xFF0C;&#x5728;&#x4E00;&#x4E2A;&#x4F5C;&#x4E1A;&#x4E2D;&#x4E00;&#x4EFD;&#x6570;&#x636E;&#x4F1A;&#x6709;&#x591A;&#x79CD;&#x805A;&#x5408;&#x60C5;&#x51B5;&#xFF0C;&#x6700;&#x7EC8;&#x8F93;&#x51FA;&#x65F6;&#xFF0C;&#x6BCF;&#x79CD;&#x805A;&#x5408;&#x60C5;&#x51B5;&#x5404;&#x81EA;&#x5BF9;&#x5E94;&#x4E00;&#x6761;&#x6570;&#x636E;&#x3002;
    &#x5982;&#x679C;&#x4F7F;&#x7528;&#x8BE5;&#x9AD8;&#x7EA7;&#x5206;&#x7EC4;&#x805A;&#x5408;&#x7684;&#x8BED;&#x53E5;&#x5904;&#x7406;&#x7684;&#x57FA;&#x8868;&#xFF0C;&#x5728;&#x6570;&#x636E;&#x91CF;&#x5F88;&#x5927;&#x7684;&#x60C5;&#x51B5;&#x4E0B;&#x5BB9;&#x6613;&#x5BFC;&#x81F4;Map&#x6216;&#x8005;Reduce&#x4EFB;&#x52A1;&#x56E0;&#x786C;&#x4EF6;&#x8D44;&#x6E90;&#x4E0D;&#x8DB3;&#x800C;&#x5D29;&#x6E83;&#x3002;
    Hive&#x4E2D;&#x4F7F;&#x7528;hive.new.job.grouping.set.cardinality&#x914D;&#x7F6E;&#x9879;&#x6765;&#x5E94;&#x5BF9;&#x4E0A;&#x9762;&#x53EF;&#x80FD;&#x51FA;&#x73B0;&#x7684;&#x95EE;&#x9898;&#xFF0C;
    &#x5982;&#x679C;SQL&#x8BED;&#x53E5;&#x4E2D;&#x5904;&#x7406;&#x7684;&#x5206;&#x7EC4;&#x805A;&#x5408;&#x60C5;&#x51B5;&#x8D85;&#x8FC7;&#x8BE5;&#x914D;&#x7F6E;&#x9879;&#x6307;&#x5B9A;&#x7684;&#x503C;&#xFF0C;&#x9ED8;&#x8BA4;&#x503C;&#xFF08;30&#xFF09;&#xFF0C;&#x5219;&#x4F1A;&#x521B;&#x5EFA;&#x4E00;&#x4E2A;&#x65B0;&#x7684;&#x4F5C;&#x4E1A;&#x6765;&#x5904;&#x7406;&#x8BE5;&#x914D;&#x7F6E;&#x9879;&#x7684;&#x60C5;&#x51B5;&#x3002;

&#x5E26;&#x7A97;&#x53E3;/&#x5206;&#x6790;&#x51FD;&#x6570;&#x7684;SQL&#x6267;&#x884C;&#x8BA1;&#x5212; 6.5
&#x8868;&#x8FDE;&#x63A5;&#x7684;SQL&#x6267;&#x884C;&#x8BA1;&#x5212; 6.6
&#x5185;&#x63A5;&#x8FDE;&#x548C;&#x5916;&#x8FDE;&#x63A5; 6.6.2

Hive数据处理模式

过滤模式

&#xB7;where&#x5B50;&#x53E5;&#x8FC7;&#x6EE4;&#xFF1B;
&#xB7;having&#x5B50;&#x53E5;&#x8FC7;&#x6EE4;&#xFF1B;
&#xB7;distinct&#x547D;&#x4EE4;&#x8FC7;&#x6EE4;&#xFF08;&#x53BB;&#x91CD;&#x539F;&#x7406;&#xFF09;&#xFF1B;
    &#x5173;&#x95ED;Map&#x7AEF;&#x805A;&#x5408;&#x4E0B;&#xFF0C;&#x7684;distinct&#x53BB;&#x91CD;&#x4F1A;&#x5728;Reduce&#x9636;&#x6BB5;&#x4F7F;&#x7528;Group By Operator&#x64CD;&#x4F5C;&#x5C06;&#x5176;&#x8F6C;&#x5316;&#x6210;&#x5206;&#x7EC4;&#x805A;&#x5408;&#x7684;&#x65B9;&#x5F0F;
    explain select distinct s_age from student_tb_seq == explain select s_age from student_tb_seq group by s_age
    &#x6269;&#x5C55;&#xFF1A;&#x4F7F;&#x7528;&#x5206;&#x7EC4;&#x805A;&#x5408;&#x7684;&#x65B9;&#x5F0F;&#x4E0D;&#x662F;Hive&#x53BB;&#x91CD;&#x7684;&#x552F;&#x4E00;&#x65B9;&#x5F0F;&#xFF0C;&#x6709;&#x65F6;Hive&#x8FD8;&#x4F1A;&#x7528;Hash&#x8868;&#x8FDB;&#x884C;&#x53BB;&#x91CD;
&#xB7;&#x8868;&#x8FC7;&#x6EE4;&#xFF1B;
    &#x8868;&#x8FC7;&#x6EE4;&#x662F;&#x6307;&#x8FC7;&#x6EE4;&#x6389;&#x540C;&#x4E00;&#x4E2A;SQL&#x8BED;&#x53E5;&#x9700;&#x8981;&#x591A;&#x6B21;&#x8BBF;&#x95EE;&#x76F8;&#x540C;&#x8868;&#x7684;&#x6570;&#x636E;&#xFF0C;&#x5C06;&#x91CD;&#x590D;&#x7684;&#x8BBF;&#x95EE;&#x64CD;&#x4F5C;&#x8FC7;&#x6EE4;&#x6389;&#x5E76;&#x538B;&#x7F29;&#x6210;&#x53EA;&#x8BFB;&#x53D6;&#x4E00;&#x6B21;
    &#x5982;union&#x6539;multi-group-by-insert&#x65B9;&#x6CD5;
    &#x540C;&#x65F6;&#x4E24;&#x4E2A;group by&#x7684;insert&#xFF0C;hive&#x4F1A;&#x5408;&#x5E76;&#x4E00;&#x4E2A;mr&#x5904;&#x7406;
&#xB7;&#x5206;&#x533A;&#x8FC7;&#x6EE4;&#xFF1B;
    &#x666E;&#x901A;where&#x5B50;&#x53E5;&#x7684;&#x8FC7;&#x6EE4;&#x662F;&#x5728;Map&#x9636;&#x6BB5;&#xFF0C;&#x800C;&#x5206;&#x533A;&#x5217;&#x7B5B;&#x9009;&#x5176;&#x5B9E;&#x662F;&#x5728;Map&#x7684;&#x4E0A;&#x4E00;&#x4E2A;&#x9636;&#x6BB5;&#xFF0C;&#x5373;&#x5728;&#x8F93;&#x5165;&#x9636;&#x6BB5;&#x8FDB;&#x884C;&#x8DEF;&#x5F84;&#x7684;&#x8FC7;&#x6EE4;
&#xB7;&#x5206;&#x6876;&#x8FC7;&#x6EE4;&#xFF1B;
    &#x8BF4;&#x5206;&#x533A;&#x662F;&#x5BF9;&#x76EE;&#x5F55;&#x7684;&#x8FC7;&#x6EE4;&#xFF0C;&#x5206;&#x6876;&#x662F;&#x5BF9;&#x6587;&#x4EF6;&#x7684;&#x8FC7;&#x6EE4;&#x3002;&#x5982;&#x4E0B;&#x56FE;

&#xB7;&#x7D22;&#x5F15;&#x8FC7;&#x6EE4;&#xFF1B;
    Hive&#x7684;&#x7D22;&#x5F15;&#x5728;Hive 3.0&#x7248;&#x672C;&#x4E2D;&#x88AB;&#x5E9F;&#x5F03;&#xFF0C;&#x53EF;&#x4EE5;&#x4F7F;&#x7528;&#x4E24;&#x79CD;&#x65B9;&#x5F0F;&#x8FDB;&#x884C;&#x66FF;&#x6362;&#xFF1A;
    &#x65B9;&#x5F0F;&#x4E00;&#xFF0C;&#x7269;&#x5316;&#x89C6;&#x56FE;&#xFF08;Materialized views&#xFF09;&#x3002;&#x8FD9;&#x4E2A;&#x6982;&#x5FF5;&#x5BF9;&#x4E8E;&#x4F7F;&#x7528;Oracle&#x7684;&#x5F00;&#x53D1;&#x8005;&#x5E76;&#x4E0D;&#x964C;&#x751F;&#xFF0C;
    &#x901A;&#x8FC7;&#x4F7F;&#x7528;&#x7269;&#x5316;&#x89C6;&#x56FE;&#xFF0C;&#x53EF;&#x4EE5;&#x8FBE;&#x5230;&#x7C7B;&#x4F3C;hive&#x7D22;&#x5F15;&#x7684;&#x6548;&#x679C;&#xFF0C;&#x8BE5;&#x7279;&#x6027;&#x5728;Hive 2.3.0&#x7248;&#x672C;&#x4E2D;&#x5F15;&#x5165;&#x3002;

    &#x65B9;&#x5F0F;&#x4E8C;&#xFF0C;&#x4F7F;&#x7528;ORC/Parquet&#x7684;&#x6587;&#x4EF6;&#x5B58;&#x50A8;&#x683C;&#x5F0F;&#xFF0C;&#x4E5F;&#x80FD;&#x591F;&#x5B9E;&#x73B0;&#x7C7B;&#x4F3C;&#x7D22;&#x5F15;&#x9009;&#x62E9;&#x6027;&#x626B;&#x63CF;&#xFF0C;
    &#x5FEB;&#x901F;&#x8FC7;&#x6EE4;&#x4E0D;&#x9700;&#x8981;&#x904D;&#x5386;&#x7684;block&#xFF0C;&#x8FD9;&#x662F;&#x6BD4;&#x5206;&#x6876;&#x66F4;&#x4E3A;&#x7EC6;&#x7C92;&#x5EA6;&#x7684;&#x8FC7;&#x6EE4;
&#xB7;&#x5217;&#x8FC7;&#x6EE4;
    &#x5728;&#x8FDB;&#x884C;&#x5217;&#x7B5B;&#x9009;&#x65F6;&#xFF0C;&#x901A;&#x5E38;&#x9700;&#x8981;&#x5148;&#x53D6;&#x6574;&#x884C;&#x7684;&#x6570;&#x636E;&#xFF0C;&#x518D;&#x901A;&#x8FC7;&#x5217;&#x7684;&#x504F;&#x79FB;&#x91CF;&#x53D6;&#x5F97;&#x5BF9;&#x5E94;&#x7684;&#x5217;&#x503C;
    &#x4F46;&#x5982;&#x679C;&#x662F;&#x5217;&#x5F0F;&#x5B58;&#x50A8;&#xFF0C;&#x5219;&#x53EF;&#x4EE5;&#x76F4;&#x63A5;&#x8BFB;&#x53D6;

聚合模式

常见的聚合

&#xB7;distinct&#x6A21;&#x5F0F;&#xFF1B;
&#xB7;count&#x8BA1;&#x6570;&#x7684;&#x805A;&#x5408;&#x6A21;&#x5F0F;&#xFF1B;
    &#xB7;count&#xFF08;&#x5217;&#xFF09;&#xFF1A;&#x5982;&#x679C;&#x5217;&#x4E2D;&#x6709;null&#x503C;&#xFF0C;&#x90A3;&#x4E48;&#x8FD9;&#x4E00;&#x5217;&#x4E0D;&#x4F1A;&#x88AB;&#x8BB0;&#x5165;&#x7EDF;&#x8BA1;&#x7684;&#x884C;&#x6570;&#x3002;
    &#x53E6;&#x5916;&#xFF0C;Hive&#x8BFB;&#x53D6;&#x6570;&#x636E;&#x8FDB;&#x884C;&#x8BA1;&#x7B97;&#x65F6;&#xFF0C;&#x9700;&#x8981;&#x5C06;&#x5B57;&#x8282;&#x6D41;&#x8F6C;&#x5316;&#x4E3A;&#x5BF9;&#x8C61;&#x7684;&#x5E8F;&#x5217;&#x5316;&#x548C;&#x53CD;&#x5E8F;&#x5217;&#x5316;&#x7684;&#x64CD;&#x4F5C;&#x3002;

    &#xB7;count&#xFF08;*&#xFF09;&#xFF1A;&#x4E0D;&#x4F1A;&#x51FA;&#x73B0;count&#xFF08;&#x5217;&#xFF09;&#x5728;&#x884C;&#x662F;null&#x503C;&#x7684;&#x60C5;&#x51B5;&#x4E0B;&#xFF0C;&#x4E0D;&#x8BA1;&#x5165;&#x884C;&#x6570;&#x7684;&#x95EE;&#x9898;&#x3002;
    &#x53E6;&#x5916;&#xFF0C;count&#xFF08;*&#xFF09;&#x5728;&#x8FDB;&#x884C;&#x6570;&#x636E;&#x7EDF;&#x8BA1;&#x65F6;&#x4E0D;&#x4F1A;&#x8BFB;&#x53D6;&#x8868;&#x4E2D;&#x7684;&#x6570;&#x636E;&#xFF0C;&#x53EA;&#x4F1A;&#x4F7F;&#x7528;&#x5230;HDFS&#x6587;&#x4EF6;&#x4E2D;&#x6BCF;&#x4E00;&#x884C;&#x7684;&#x884C;&#x504F;&#x79FB;&#x91CF;&#x3002;
    &#x8BE5;&#x504F;&#x79FB;&#x91CF;&#x662F;&#x6570;&#x636E;&#x5199;&#x5165;HDFS&#x6587;&#x4EF6;&#x65F6;&#xFF0C;HDFS&#x6DFB;&#x52A0;&#x7684;&#x3002;

    &#xB7;count&#xFF08;1&#xFF09;&#xFF1A;
    count(*)&#x4E5F;&#x5305;&#x542B;NULL&#xFF0C;&#x5982;&#x679C;&#x8868;&#x6CA1;&#x6709;&#x4E3B;&#x952E;&#xFF0C;&#x90A3;&#x4E48;count(1)&#x6BD4;count(*)&#x5FEB;&#x3002;
    &#x8868;&#x6709;&#x4E3B;&#x952E;&#xFF0C;count(*)&#x4F1A;&#x81EA;&#x52A8;&#x4F18;&#x5316;&#x5230;&#x4E3B;&#x952E;&#x5217;&#x4E0A;&#x3002;&#x5982;&#x679C;&#x8868;&#x53EA;&#x6709;&#x4E00;&#x4E2A;&#x5B57;&#x6BB5;&#xFF0C;count(*)&#x6700;&#x5FEB;&#x3002;
    count(1)&#x8DDF;count(&#x4E3B;&#x952E;)&#x4E00;&#x6837;&#xFF0C;&#x53EA;&#x626B;&#x63CF;&#x4E3B;&#x952E;&#x3002;count(*)&#x8DDF;count(&#x975E;&#x4E3B;&#x952E;)&#x4E00;&#x6837;&#xFF0C;&#x626B;&#x63CF;&#x6574;&#x4E2A;&#x8868;&#x3002;&#x660E;&#x663E;&#x524D;&#x8005;&#x66F4;&#x5FEB;&#x4E00;&#x4E9B;&#x3002;
    count(1)&#x548C;count(*)&#x57FA;&#x672C;&#x6CA1;&#x6709;&#x5DEE;&#x522B;&#xFF0C;&#x4F46;&#x5728;&#x4F18;&#x5316;&#x7684;&#x65F6;&#x5019;&#x5C3D;&#x91CF;&#x4F7F;&#x7528;count(1)
&#xB7;&#x6570;&#x503C;&#x76F8;&#x5173;&#x7684;&#x805A;&#x5408;&#x6A21;&#x5F0F;&#xFF1B;
&#xB7;&#x884C;&#x8F6C;&#x5217;&#x7684;&#x805A;&#x5408;&#x6A21;&#x5F0F;&#x3002;

可计算中间结果的聚合模式
不可计算中间结果的聚合模式

Hive&#x4E2D;collect&#x76F8;&#x5173;&#x7684;&#x51FD;&#x6570;&#x6709; collect_list &#x548C; collect_set&#x3002;
&#x5B83;&#x4EEC;&#x90FD;&#x662F;&#x5C06;&#x5206;&#x7EC4;&#x4E2D;&#x7684;&#x67D0;&#x5217;&#x8F6C;&#x4E3A;&#x4E00;&#x4E2A;&#x6570;&#x7EC4;&#x8FD4;&#x56DE;&#xFF0C;&#x4E0D;&#x540C;&#x7684;&#x662F; collect_list &#x4E0D;&#x53BB;&#x91CD;&#x800C; collect_set &#x53BB;&#x91CD;

连接模式

&#x5206;&#x533A;&#x8FDE;&#x63A5;&#xFF0C;&#x5728;map&#x9636;&#x6BB5;&#x4E4B;&#x524D;

Replication&#x8FDE;&#x63A5;&#xFF0C;&#x53D1;&#x751F;&#x5728;Map&#x9636;&#x6BB5;&#xFF0C;&#x53C8;&#x88AB;&#x79F0;&#x4E4B;&#x4E3A;Map&#x8FDE;&#x63A5;
&#xB7;&#x666E;&#x901A;&#x7684;MapJoin&#xFF1A;&#x5BF9;&#x4F7F;&#x7528;&#x7684;&#x8868;&#x7C7B;&#x578B;&#x65E0;&#x7279;&#x6B8A;&#x9650;&#x5236;&#xFF0C;&#x53EA;&#x9700;&#x8981;&#x914D;&#x7F6E;&#x76F8;&#x5E94;&#x7684;Hive&#x914D;&#x7F6E;&#x3002;
    MapJoin&#x662F;&#x5148;&#x542F;&#x52A8;&#x4E00;&#x4E2A;&#x4F5C;&#x4E1A;&#xFF0C;&#x8BFB;&#x53D6;&#x5C0F;&#x8868;&#x7684;&#x6570;&#x636E;&#xFF0C;&#x5728;&#x5185;&#x5B58;&#x4E2D;&#x6784;&#x5EFA;&#x54C8;&#x5E0C;&#x8868;&#xFF0C;&#x5C06;&#x54C8;&#x5E0C;&#x8868;&#x5199;&#x5165;&#x672C;&#x5730;&#x78C1;&#x76D8;&#xFF0C;
    &#x7136;&#x540E;&#x5C06;&#x54C8;&#x5E0C;&#x8868;&#x4E0A;&#x4F20;&#x5230;HDFS&#x5E76;&#x6DFB;&#x52A0;&#x5230;&#x5206;&#x5E03;&#x5F0F;&#x7F13;&#x5B58;&#x4E2D;&#x3002;&#x518D;&#x542F;&#x52A8;&#x4E00;&#x4E2A;&#x4EFB;&#x52A1;&#x8BFB;&#x53D6;B&#x8868;&#x7684;&#x6570;&#x636E;&#xFF0C;
    &#x5728;&#x8FDB;&#x884C;&#x8FDE;&#x63A5;&#x65F6;Map&#x4F1A;&#x83B7;&#x53D6;&#x7F13;&#x5B58;&#x4E2D;&#x7684;&#x6570;&#x636E;&#x5E76;&#x5B58;&#x5165;&#x5230;&#x54C8;&#x5E0C;&#x8868;&#x4E2D;&#xFF0C;B&#x8868;&#x4F1A;&#x4E0E;&#x54C8;&#x5E0C;&#x8868;&#x7684;&#x6570;&#x636E;&#x8FDB;&#x884C;&#x5339;&#x914D;&#xFF0C;
    &#x65F6;&#x95F4;&#x590D;&#x6742;&#x5EA6;&#x662F;O&#xFF08;1&#xFF09;&#xFF0C;&#x5339;&#x914D;&#x5B8C;&#x540E;&#x4F1A;&#x5C06;&#x7ED3;&#x679C;&#x8FDB;&#x884C;&#x8F93;&#x51FA;
&#xB7;Bucket MapJoin&#xFF1A;&#x8981;&#x6C42;&#x4F7F;&#x7528;&#x7684;&#x8868;&#x4E3A;&#x6876;&#x8868;&#x3002;
&#xB7;Skewed MapJoin&#xFF1A;&#x8981;&#x6C42;&#x4F7F;&#x7528;&#x7684;&#x8868;&#x4E3A;&#x503E;&#x659C;&#x8868;&#x3002;
&#xB7;Sorted Merge Bucket MapJoin&#xFF1A;&#x8981;&#x6C42;&#x4F7F;&#x7528;&#x7684;&#x8868;&#x4E3A;&#x6876;&#x6392;&#x5E8F;&#x8868;&#x3002;
&#x4F7F;&#x7528;&#x65B9;&#x5F0F;
    &#x65B9;&#x5F0F;&#x4E00;&#x662F;&#x4F7F;&#x7528;MapJoin&#x7684;hint&#x8BED;&#x6CD5;&#xFF0C;&#x4F46;&#x4E0D;&#x63A8;&#x8350;&#xFF0C;&#x4E0D;&#x7075;&#x6D3B;
    &#x65B9;&#x5F0F;&#x4E8C;&#x662F;&#x4F7F;&#x7528;Hive&#x914D;&#x7F6E;&#x81EA;&#x52A8;&#x5224;&#x65AD;&#x542F;&#x7528;MapJoin

&#x6876;&#x8FDE;&#x63A5;
&#x5206;&#x6876;&#x7684;Hive&#x8868;&#x4F1A;&#x5C06;&#x6876;&#x5217;&#x7684;&#x503C;&#x8BA1;&#x7B97;Hash&#x503C;&#x53D6;&#x6876;&#x6570;&#x7684;&#x6A21;&#xFF0C;&#x4F59;&#x6570;&#x76F8;&#x540C;&#x7684;&#x4F1A;&#x53D1;&#x5F80;&#x76F8;&#x540C;&#x7684;&#x6876;&#xFF0C;&#x6BCF;&#x4E2A;&#x6876;&#x5BF9;&#x5E94;&#x4E00;&#x4E2A;&#x6587;&#x4EF6;

&#x503E;&#x659C;&#x8FDE;&#x63A5;

&#x8868;&#x8FDE;&#x63A5;&#x4E0E;&#x57FA;&#x4E8E;&#x6210;&#x672C;&#x7684;&#x4F18;&#x5316;&#x5668;
&#x81EA;&#x52A8;&#x5206;&#x6790;&#x4F18;&#x5316;&#x8868;&#x73B0;&#x4E3B;&#x8981;&#x5728;&#x5982;&#x4E0B;&#x4E09;&#x4E2A;&#x65B9;&#x9762;
1 &#x8868;&#x8FDE;&#x63A5;&#x7684;&#x987A;&#x5E8F;&#x4F18;&#x5316;&#xFF0C;&#x5728;&#x591A;&#x8868;&#x8FDE;&#x63A5;&#x67E5;&#x8BE2;&#x65F6;&#xFF0C;&#x4E0D;&#x9700;&#x8981;&#x7279;&#x522B;&#x6307;&#x5B9A;&#x5927;&#x5C0F;&#x8868;&#x7684;&#x987A;&#x5E8F;&#xFF0C;
CBO&#x4F1A;&#x6839;&#x636E;&#x6536;&#x96C6;&#x5230;&#x7684;&#x7EDF;&#x8BA1;&#x4FE1;&#x606F;&#xFF0C;&#x81EA;&#x52A8;&#x7B97;&#x51FA;&#x6700;&#x4F18;&#x7684;&#x8868;&#x8FDE;&#x63A5;&#x987A;&#x5E8F;&#x3002;
2 CBO&#x53EF;&#x4EE5;&#x57FA;&#x4E8E;&#x6536;&#x96C6;&#x5230;&#x7684;&#x7EDF;&#x8BA1;&#x4FE1;&#x606F;&#xFF0C;&#x4F30;&#x7B97;&#x51FA;&#x6BCF;&#x4E2A;&#x8868;&#x8FDE;&#x63A5;&#x7684;&#x7EC4;&#x5408;&#xFF0C;&#x751F;&#x6210;&#x4E00;&#x4E2A;&#x6210;&#x672C;&#x4EE3;&#x4EF7;&#x6700;&#x4F4E;&#x7684;&#x8868;&#x8FDE;&#x63A5;&#x65B9;&#x6848;&#xFF0C;
&#x9884;&#x5148;&#x4E24;&#x4E24;&#x7ED3;&#x5408;&#x751F;&#x6210;&#x4E2D;&#x95F4;&#x7ED3;&#x679C;&#x96C6;&#xFF0C;&#x518D;&#x9488;&#x5BF9;&#x8FD9;&#x4E9B;&#x4E2D;&#x95F4;&#x7ED3;&#x679C;&#x96C6;&#x8FDB;&#x884C;&#x64CD;&#x4F5C;&#x3002;
3 &#x7B80;&#x5316;&#x8868;&#x7684;&#x8FDE;&#x63A5;&#xFF0C;&#x5728;&#x591A;&#x8868;&#x8FDE;&#x63A5;&#x7684;&#x60C5;&#x51B5;&#x4E0B;&#xFF0C;CBO&#x5728;&#x89E3;&#x6790;SQL&#x5B50;&#x53E5;&#x65F6;&#xFF0C;&#x4F1A;&#x8BC6;&#x522B;&#x5E76;&#x62BD;&#x53D6;&#x76F8;&#x540C;&#x7684;&#x8FDE;&#x63A5;&#x8C13;&#x8BCD;&#xFF0C;
&#x5E76;&#x6839;&#x636E;&#x60C5;&#x51B5;&#x9002;&#x5F53;&#x6784;&#x9020;&#x4E00;&#x4E2A;&#x9690;&#x5F0F;&#x7684;&#x8FDE;&#x63A5;&#x8C13;&#x8BCD;&#x4F5C;&#x4E3A;&#x66FF;&#x6362;&#xFF0C;&#x4EE5;&#x907F;&#x514D;&#x9AD8;&#x6602;&#x7684;&#x8868;&#x8FDE;&#x63A5;&#x64CD;&#x4F5C;

YARN日志

ResourceManager Web UI 工作中经常会用到

数据存储

&#x6587;&#x672C;&#x683C;&#x5F0F;&#xFF08;TextFile&#xFF09;&#x3001;&#x4E8C;&#x8FDB;&#x5236;&#x5E8F;&#x5217;&#x5316;&#x6587;&#x4EF6;&#xFF08;SequenceFile&#xFF09;&#x3001;
&#x884C;&#x5217;&#x5F0F;&#x6587;&#x4EF6;&#xFF08;RCFile&#xFF09;&#x3001;Apache Parquet&#x548C;&#x4F18;&#x5316;&#x7684;&#x884C;&#x5217;&#x5F0F;&#x6587;&#x4EF6;&#xFF08;ORCFile&#xFF09;

&#x5217;&#x5F0F;&#x5B58;&#x50A8;
&#x4F18;&#x70B9;&#xFF1A;&#x5217;&#x67E5;&#x8BE2;&#x5757;&#xFF0C;&#x8282;&#x7701;&#x78C1;&#x76D8;&#x7A7A;&#x95F4;
&#x7F3A;&#x70B9;&#xFF1A;&#x9700;&#x8981;&#x5BF9;&#x6240;&#x6709;&#x7684;&#x5B57;&#x6BB5;&#x8FDB;&#x884C;&#x6821;&#x9A8C;&#x8FC7;&#x6EE4;&#xFF0C;&#x5728;&#x8FD9;&#x79CD;&#x573A;&#x666F;&#x4E0B;&#x5217;&#x5F0F;&#x5B58;&#x50A8;&#x9700;&#x8981;&#x82B1;&#x8D39;&#x6BD4;&#x884C;&#x5F0F;&#x5B58;&#x50A8;&#x66F4;&#x591A;&#x7684;&#x8D44;&#x6E90;&#xFF0C;
&#x56E0;&#x4E3A;&#x884C;&#x5F0F;&#x5B58;&#x50A8;&#x8BFB;&#x53D6;&#x4E00;&#x6761;&#x6570;&#x53EA;&#x9700;&#x8981;&#x4E00;&#x6B21;I/O&#x64CD;&#x4F5C;&#xFF0C;&#x800C;&#x5217;&#x5F0F;&#x5B58;&#x50A8;&#x5219;&#x9700;&#x8981;&#x82B1;&#x8D39;&#x591A;&#x6B21;&#xFF0C;&#x5217;&#x6570;&#x8D8A;&#x591A;&#x6D88;&#x8017;&#x7684;I/O&#x8D44;&#x6E90;&#x8D8A;&#x591A;

ORC

ORC&#x5217;&#x5F0F;&#x5B58;&#x50A8;&#x7684;&#x4F18;&#x52BF;
ORC&#x7684;&#x884C;&#x5217;&#x5F0F;&#x5B58;&#x50A8;&#x7ED3;&#x6784;&#x7ED3;&#x5408;&#x4E86;&#x884C;&#x5F0F;&#x548C;&#x5217;&#x5F0F;&#x5B58;&#x50A8;&#x7684;&#x4F18;&#x70B9;&#xFF0C;&#x5728;&#x6709;&#x5927;&#x6570;&#x636E;&#x91CF;&#x626B;&#x63CF;&#x8BFB;&#x53D6;&#x65F6;&#xFF0C;&#x53EF;&#x4EE5;&#x6309;&#x884C;&#x7EC4;&#x8FDB;&#x884C;&#x6570;&#x636E;&#x8BFB;&#x53D6;&#x3002;
&#x5982;&#x679C;&#x8981;&#x8BFB;&#x53D6;&#x67D0;&#x4E2A;&#x5217;&#x7684;&#x6570;&#x636E;&#xFF0C;&#x5219;&#x53EF;&#x4EE5;&#x5728;&#x8BFB;&#x53D6;&#x884C;&#x7EC4;&#x7684;&#x57FA;&#x7840;&#x4E0A;&#xFF0C;&#x8BFB;&#x53D6;&#x6307;&#x5B9A;&#x7684;&#x5217;&#xFF0C;
&#x800C;&#x4E0D;&#x9700;&#x8981;&#x8BFB;&#x53D6;&#x884C;&#x7EC4;&#x5185;&#x6240;&#x6709;&#x884C;&#x7684;&#x6570;&#x636E;&#x53CA;&#x4E00;&#x884C;&#x5185;&#x6240;&#x6709;&#x5B57;&#x6BB5;&#x7684;&#x6570;&#x636E;

&#x5728;Hive 0.14&#x7248;&#x672C;&#x540E;&#xFF0C;ORC&#x6587;&#x4EF6;&#x80FD;&#x591F;&#x786E;&#x4FDD;Hive&#x5728;&#x5DE5;&#x4F5C;&#x65F6;&#x7684;&#x539F;&#x5B50;&#x6027;&#x3001;&#x4E00;&#x81F4;&#x6027;&#x3001;
&#x9694;&#x79BB;&#x6027;&#x548C;&#x6301;&#x4E45;&#x6027;&#x7684;ACID&#x4E8B;&#x52A1;&#x80FD;&#x591F;&#x88AB;&#x6B63;&#x786E;&#x5730;&#x5F97;&#x5230;&#x4F7F;&#x7528; 9.1.3&#x7AE0;&#x8282;

&#x6269;&#x5C55;&#xFF1A;&#x5728;Hive&#x4E2D;&#x4F7F;&#x7528;bloom&#x8FC7;&#x6EE4;&#x5668;&#xFF0C;&#x53EF;&#x4EE5;&#x7528;&#x8F83;&#x5C11;&#x7684;&#x6587;&#x4EF6;&#x7A7A;&#x95F4;&#x5FEB;&#x901F;&#x5224;&#x5B9A;&#x6570;&#x636E;&#x662F;&#x5426;&#x5B58;&#x5728;&#x4E8E;&#x8868;&#x4E2D;&#xFF0C;
&#x4F46;&#x662F;&#x4E5F;&#x5B58;&#x5728;&#x5C06;&#x4E0D;&#x5C5E;&#x4E8E;&#x8FD9;&#x4E2A;&#x8868;&#x7684;&#x6570;&#x636E;&#x5224;&#x5B9A;&#x4E3A;&#x5C5E;&#x4E8E;&#x8FD9;&#x4E2A;&#x8FD9;&#x8868;&#x7684;&#x60C5;&#x51B5;&#xFF0C;&#x8FD9;&#x4E2A;&#x60C5;&#x51B5;&#x79F0;&#x4E4B;&#x4E3A;&#x5047;&#x6B63;&#x6982;&#x7387;
&#xB7;orc.bloom.filter.columns&#xFF1A;&#x9700;&#x8981;&#x521B;&#x5EFA;&#x5E03;&#x9686;&#x8FC7;&#x6EE4;&#x7684;&#x7EC4;&#x3002;
&#xB7;orc.bloom.filter.fpp&#xFF1A;&#x4F7F;&#x7528;&#x5E03;&#x9686;&#x8FC7;&#x6EE4;&#x5668;&#x7684;&#x5047;&#x6B63;&#xFF08;False Positive&#xFF09;&#x6982;&#x7387;&#xFF0C;&#x9ED8;&#x8BA4;&#x503C;&#x662F;0.05

Parquet

&#x7A0B;&#x5E8F;&#x53EF;&#x4EE5;&#x501F;&#x52A9;Parquet&#x7684;&#x8FD9;&#x4E9B;&#x5143;&#x6570;&#x636E;&#xFF0C;&#x5728;&#x8BFB;&#x53D6;&#x6570;&#x636E;&#x65F6;&#x8FC7;&#x6EE4;&#x6389;&#x4E0D;&#x9700;&#x8981;&#x8BFB;&#x53D6;&#x7684;&#x5927;&#x90E8;&#x5206;&#x6587;&#x4EF6;&#x6570;&#x636E;&#xFF0C;&#x52A0;&#x5FEB;&#x7A0B;&#x5E8F;&#x7684;&#x8FD0;&#x884C;&#x901F;&#x5EA6;&#x3002;
&#x540C;ORC&#x7684;&#x5143;&#x6570;&#x636E;&#x4E00;&#x6837;&#xFF0C;Parquet&#x7684;&#x8FD9;&#x4E9B;&#x5143;&#x6570;&#x636E;&#x4FE1;&#x606F;&#x80FD;&#x591F;&#x5E2E;&#x52A9;&#x63D0;&#x5347;&#x7A0B;&#x5E8F;&#x7684;&#x8FD0;&#x884C;&#x901F;&#x5EA6;&#xFF0C;
&#x4F46;&#x662F;ORC&#x5728;&#x8BFB;&#x53D6;&#x6570;&#x636E;&#x65F6;&#x53C8;&#x505A;&#x4E86;&#x4E00;&#x5B9A;&#x4F18;&#x5316;&#xFF0C;&#x589E;&#x5F3A;&#x4E86;&#x6570;&#x636E;&#x7684;&#x8BFB;&#x53D6;&#x6548;&#x7387;

数据归档

&#x5BF9;&#x4E8E;HDFS&#x4E2D;&#x6709;&#x5927;&#x91CF;&#x5C0F;&#x6587;&#x4EF6;&#x7684;&#x8868;&#xFF0C;&#x53EF;&#x4EE5;&#x901A;&#x8FC7;Hadoop&#x5F52;&#x6863;&#xFF08;Hadoop archive&#xFF09;&#x7684;&#x65B9;&#x5F0F;&#x5C06;&#x6587;&#x4EF6;&#x5F52;&#x5E76;&#x6210;&#x51E0;&#x4E2A;&#x8F83;&#x5927;&#x7684;&#x6587;&#x4EF6;&#x3002;
&#x5F52;&#x5E76;&#x540E;&#x7684;&#x5206;&#x533A;&#x4F1A;&#x5148;&#x521B;&#x5EFA;&#x4E00;&#x4E2A;data.har&#x76EE;&#x5F55;&#xFF0C;&#x91CC;&#x9762;&#x5305;&#x542B;&#x4E24;&#x90E8;&#x5206;&#x5185;&#x5BB9;&#xFF1A;&#x7D22;&#x5F15;&#xFF08;_index&#x548C;_masterindex&#xFF09;&#x548C;
&#x6570;&#x636E;&#xFF08;part-*)&#x5176;&#x4E2D;&#xFF0C;&#x7D22;&#x5F15;&#x8BB0;&#x5F55;&#x5F52;&#x5E76;&#x524D;&#x7684;&#x6587;&#x4EF6;&#x5728;&#x5F52;&#x5E76;&#x540E;&#x7684;&#x6240;&#x5728;&#x4F4D;&#x7F6E;

--&#x542F;&#x7528;&#x6570;&#x636E;&#x5F52;&#x6863;
set hive.archive.enabled=true;
set hive.archive.har.parentdir.settable=true;
--&#x5F52;&#x6863;&#x540E;&#x7684;&#x6700;&#x5927;&#x6587;&#x4EF6;&#x5927;&#x5C0F;
set har.partfile.size=1099511627776;
--&#x5BF9;&#x5206;&#x533A;&#x6267;&#x884C;&#x5F52;&#x6863;&#x7684;&#x547D;&#x4EE4;
alter table tablename archive partition&#xFF08;partition_col=partition_val&#xFF09;
--&#x5C06;&#x5F52;&#x6863;&#x7684;&#x5206;&#x533A;&#x8FD8;&#x539F;&#x6210;&#x539F;&#x6765;&#x7684;&#x666E;&#x901A;&#x5206;&#x533A;
alter table tablename unarchive partition&#xFF08;partition_col=partition_val&#xFF09;

发现并优化Hive中的性能问题

10.1 监控Hive数据库的状态

&#x6536;&#x96C6;&#x8868;&#x7684;&#x5143;&#x6570;&#x636E;&#xFF0C;&#x5B57;&#x6BB5;&#x7684;&#x5143;&#x6570;&#x636E;&#xFF0C;&#x6240;&#x6709;&#x5206;&#x533A;&#x7684;&#x5143;&#x6570;&#x636E;
&#x5982;&#x679C;&#x8868;&#x592A;&#x5927;&#xFF0C;&#x6536;&#x96C6;&#x6240;&#x6709;&#x5206;&#x533A;&#x7684;&#x5143;&#x6570;&#x636E;&#x53EF;&#x80FD;&#x4F1A;&#x5BFC;&#x81F4;&#x6536;&#x96C6;&#x8D85;&#x65F6;&#xFF0C;&#x53EF;&#x4EE5;&#x6307;&#x5B9A;&#x7279;&#x5B9A;&#x5206;&#x533A;&#x8FDB;&#x884C;&#x6536;&#x96C6;&#x5143;&#x6570;&#x636E;
&#x6536;&#x96C6;&#x6240;&#x6709;&#x5206;&#x533A;&#x7684;&#x5217;&#x7684;&#x5143;&#x6570;&#x636E;

&#xFF08;1&#xFF09;&#x76D1;&#x63A7;&#x666E;&#x901A;&#x8868;&#x5B58;&#x50A8;&#x7684;&#x6587;&#x4EF6;&#x7684;&#x5E73;&#x5747;&#x5927;&#x5C0F;&#x3002;&#x5BF9;&#x4E8E;&#x5927;&#x7684;&#x6587;&#x4EF6;&#x5757;&#x53EF;&#x80FD;&#x5BFC;&#x81F4;&#x6570;&#x636E;&#x5728;&#x8BFB;&#x53D6;&#x65F6;&#x4EA7;&#x751F;&#x6570;&#x636E;&#x503E;&#x659C;&#xFF0C;&#x5F71;&#x54CD;&#x96C6;&#x7FA4;&#x4EFB;&#x52A1;&#x7684;&#x8FD0;&#x884C;&#x6548;&#x7387;
&#xFF08;2&#xFF09;&#x76D1;&#x63A7;&#x5206;&#x533A;&#x5B58;&#x50A8;&#x7684;&#x6587;&#x4EF6;&#x5E73;&#x5747;&#x5927;&#x5C0F;&#xFF0C;&#x5927;&#x4E8E;&#x4E24;&#x500D;HDFS&#x6587;&#x4EF6;&#x5757;&#x5927;&#x5C0F;&#x7684;&#x5206;&#x533A;
&#xFF08;3&#xFF09;&#x76D1;&#x63A7;&#x5927;&#x8868;&#x4E0D;&#x5206;&#x533A;&#x7684;&#x8868;&#x3002;&#x5BF9;&#x4E8E;&#x5927;&#x6570;&#x636E;&#x91CF;&#x7684;&#x8868;&#xFF0C;&#x5982;&#x679C;&#x4E0D;&#x8FDB;&#x884C;&#x5206;&#x533A;&#xFF0C;&#x610F;&#x5473;&#x7740;&#x7A0B;&#x5E8F;&#x5728;&#x8BFB;&#x53D6;&#x76F8;&#x540C;&#x7684;&#x6570;&#x636E;&#x65F6;&#x9700;&#x8981;&#x904D;&#x5386;&#x66F4;&#x591A;&#x7684;&#x6587;&#x4EF6;&#x5757;
&#xFF08;4&#xFF09;&#x76D1;&#x63A7;&#x5206;&#x533A;&#x6570;&#x636E;&#x4E0D;&#x5747;&#x5300;&#x7684;&#x8868;&#x3002;&#x5206;&#x533A;&#x4E0D;&#x5747;&#x5300;&#x7684;&#x6570;&#x636E;&#xFF0C;&#x53EF;&#x80FD;&#x610F;&#x5473;&#x7740;&#x81EA;&#x5DF1;&#x7684;&#x5206;&#x533A;&#x5217;&#x8BBE;&#x8BA1;&#x5B58;&#x5728;&#x95EE;&#x9898;&#xFF0C;&#x6216;&#x8005;&#x67D0;&#x4E2A;&#x5206;&#x533A;&#x7684;&#x6570;&#x636E;&#x5199;&#x5165;&#x4E1A;&#x52A1;&#x6709;&#x8C03;&#x6574;&#xFF0C;
&#x5BFC;&#x81F4;&#x6570;&#x636E;&#x6025;&#x901F;&#x4E0A;&#x5347;&#x6216;&#x8005;&#x4E0B;&#x8DCC;&#xFF08;&#x5982;&#x5927;&#x4E8E;&#x5E73;&#x5747;5&#x500D;&#xFF09;
&#xFF08;5&#xFF09;&#x76D1;&#x63A7;&#x91C7;&#x7528;ORC&#x6216;&#x8005;Parquet&#x4EE5;&#x5916;&#x683C;&#x5F0F;&#x7684;&#x8868;&#x3002;ORC&#x548C;Parquet&#x90FD;&#x662F;&#x884C;&#x5217;&#x5F0F;&#x7684;&#x6570;&#x636E;&#x5B58;&#x50A8;&#x6587;&#x4EF6;&#xFF0C;&#x5728;&#x517C;&#x987E;&#x8BFB;&#x5199;&#x6548;&#x7387;&#x7684;&#x540C;&#x65F6;&#xFF0C;
&#x4E5F;&#x80FD;&#x4FDD;&#x8BC1;&#x6570;&#x636E;&#x7684;&#x5B58;&#x50A8;&#x5360;&#x7528;&#x7A7A;&#x95F4;&#x6BD4;&#x5176;&#x4ED6;&#x6587;&#x4EF6;&#x683C;&#x5F0F;&#x66F4;&#x5C11;
&#xFF08;6&#xFF09;&#x67E5;&#x8BE2;&#x6709;&#x4F7F;&#x7528;&#x7D22;&#x5F15;&#x7684;&#x8868;
&#xFF08;7&#xFF09;&#x67E5;&#x8BE2;&#x8868;&#x5B57;&#x6BB5;&#x7684;&#x7A7A;&#x503C;&#x7387;&#xFF0C;&#x4EE5;&#x53CA;&#x5B57;&#x6BB5;&#x91CD;&#x590D;&#x7684;&#x5360;&#x6BD4;&#x3002;&#x5982;&#x679C;&#x67D0;&#x4E2A;&#x5B57;&#x6BB5;&#x7684;&#x7A7A;&#x503C;&#x7387;&#x6216;&#x8005;&#x91CD;&#x590D;&#x5360;&#x6BD4;&#x5F88;&#x9AD8;&#xFF0C;&#x4F1A;&#x5F71;&#x54CD;Hive&#x7684;&#x67E5;&#x8BE2;&#x6548;&#x7387;&#xFF0C;
&#x7279;&#x522B;&#x662F;&#x542B;&#x6709;&#x8868;&#x8FDE;&#x63A5;&#x7684;&#x67E5;&#x8BE2;
&#xFF08;8&#xFF09;&#x76D1;&#x63A7;&#x5206;&#x533A;&#x7684;&#x5B57;&#x6BB5;&#x7A7A;&#x503C;&#x7387;&#xFF0C;&#x4EE5;&#x53CA;&#x5B57;&#x6BB5;&#x91CD;&#x590D;&#x503C;&#x7684;&#x5360;&#x6BD4;
&#xFF08;9&#xFF09;&#x76D1;&#x63A7;Hive&#x8868;&#x7684;&#x5206;&#x533A;&#x6570;

10.2 监控当前集群状态

10.3 定位性能瓶颈

&#x4F7F;&#x7528;HS2 WebUI&#x6392;&#x9664;&#x975E;&#x5927;&#x6570;&#x636E;&#x7EC4;&#x4EF6;&#x7684;&#x95EE;&#x9898;
&#x6392;&#x67E5;&#x957F;&#x65F6;&#x7B49;&#x5F85;&#x8C03;&#x5EA6;
Map&#x4EFB;&#x52A1;&#x8BFB;&#x53D6;&#x5C0F;&#x6587;&#x4EF6;&#x548C;&#x5927;&#x6587;&#x4EF6;
    &#x8BFB;&#x53D6;&#x53EF;&#x5206;&#x5272;&#x7684;&#x5927;&#x6587;&#x4EF6;&#xFF1A;&#x5982;&#x679C;&#x4E00;&#x4E2A;&#x6587;&#x4EF6;&#x5927;&#x5C0F;&#x8FDC;&#x5927;&#x4E8E;HDFS&#x7684;&#x6587;&#x4EF6;&#xFF0C;&#x53EF;&#x80FD;&#x4F1A;&#x88AB;&#x591A;&#x4E2A;Map&#x4EFB;&#x52A1;&#x540C;&#x65F6;&#x8BFB;&#x53D6;&#xFF0C;
    &#x8FD9;&#x65F6;&#x4F1A;&#x4E27;&#x5931;&#x4EFB;&#x52A1;&#x6267;&#x884C;&#x7684;&#x672C;&#x5730;&#x5316;&#xFF0C;&#x5373;&#x9700;&#x8981;&#x8DE8;&#x670D;&#x52A1;&#x8BFB;&#x53D6;&#x5B58;&#x50A8;&#x5728;&#x4E0D;&#x540C;&#x670D;&#x52A1;&#x5668;&#x7684;&#x6587;&#x4EF6;

Reduce的数据倾斜

缓慢的Shuffle

Shuffle&#x8FC7;&#x7A0B;&#x6D89;&#x53CA;&#x78C1;&#x76D8;&#x7684;&#x8BFB;&#x5199;&#x548C;&#x7F51;&#x7EDC;&#x4F20;&#x8F93;&#xFF0C;&#x5BB9;&#x6613;&#x4EA7;&#x751F;&#x6027;&#x80FD;&#x74F6;&#x9888;&#xFF0C;&#x53EF;&#x4EE5;&#x901A;&#x8FC7;&#x56FE;10.10&#x7684;&#x65B9;&#x5F0F;&#x6765;&#x67E5;&#x770B;&#x4F5C;&#x4E1A;Shuffle&#x9636;&#x6BB5;&#x7684;&#x901F;&#x5EA6;

10.3.6 集群资源的限制
10.4 数据倾斜

&#x4ECE;&#x672C;&#x8D28;&#x6765;&#x8BF4;&#xFF0C;&#x5BFC;&#x81F4;&#x6570;&#x636E;&#x503E;&#x659C;&#x6709;&#x4E24;&#x79CD;&#x539F;&#x56E0;&#xFF0C;&#x4E00;&#x662F;&#x4EFB;&#x52A1;&#x8BFB;&#x53D6;&#x5927;&#x6587;&#x4EF6;&#xFF0C;&#x4E8C;&#x662F;&#x4EFB;&#x52A1;&#x9700;&#x8981;&#x5904;&#x7406;&#x5927;&#x91CF;&#x76F8;&#x540C;&#x952E;&#x7684;&#x6570;&#x636E;&#x3002;

&#x4EFB;&#x52A1;&#x8BFB;&#x53D6;&#x5927;&#x6587;&#x4EF6;&#xFF0C;&#x6700;&#x5E38;&#x89C1;&#x7684;&#x5C31;&#x662F;&#x8BFB;&#x53D6;&#x538B;&#x7F29;&#x7684;&#x4E0D;&#x53EF;&#x5206;&#x5272;&#x7684;&#x5927;&#x6587;&#x4EF6;&#xFF0C;&#x4EFB;&#x52A1;&#x9700;&#x8981;&#x5904;&#x7406;&#x5927;&#x91CF;&#x76F8;&#x540C;&#x952E;&#x7684;&#x6570;&#x636E;&#xFF0C;&#x8FD9;&#x79CD;&#x60C5;&#x51B5;&#x6709;&#x4EE5;&#x4E0B;4&#x79CD;&#x8868;&#x73B0;&#x5F62;&#x5F0F;&#xFF1A;
    &#xB7;&#x6570;&#x636E;&#x542B;&#x6709;&#x5927;&#x91CF;&#x65E0;&#x610F;&#x4E49;&#x7684;&#x6570;&#x636E;&#xFF0C;&#x4F8B;&#x5982;&#x7A7A;&#x503C;&#xFF08;NULL&#xFF09;&#x3001;&#x7A7A;&#x5B57;&#x7B26;&#x4E32;&#x7B49;&#x3002;
    &#xB7;&#x542B;&#x6709;&#x503E;&#x659C;&#x6570;&#x636E;&#x5728;&#x8FDB;&#x884C;&#x805A;&#x5408;&#x8BA1;&#x7B97;&#x65F6;&#x65E0;&#x6CD5;&#x805A;&#x5408;&#x4E2D;&#x95F4;&#x7ED3;&#x679C;&#xFF0C;&#x5927;&#x91CF;&#x6570;&#x636E;&#x90FD;&#x9700;&#x8981;&#x7ECF;&#x8FC7;Shuffle&#x9636;&#x6BB5;&#x7684;&#x5904;&#x7406;&#xFF0C;&#x5F15;&#x8D77;&#x6570;&#x636E;&#x503E;&#x659C;&#x3002;
    &#xB7;&#x6570;&#x636E;&#x5728;&#x8BA1;&#x7B97;&#x65F6;&#x505A;&#x591A;&#x7EF4;&#x6570;&#x636E;&#x96C6;&#x5408;&#xFF0C;&#x5BFC;&#x81F4;&#x7EF4;&#x5EA6;&#x81A8;&#x80C0;&#x5F15;&#x8D77;&#x7684;&#x6570;&#x636E;&#x503E;&#x659C;&#x3002;
    &#xB7;&#x4E24;&#x8868;&#x8FDB;&#x884C;Join&#xFF0C;&#x90FD;&#x542B;&#x6709;&#x5927;&#x91CF;&#x76F8;&#x540C;&#x7684;&#x503E;&#x659C;&#x6570;&#x636E;&#x952E;

10.4.1 &#x4E0D;&#x53EF;&#x62C6;&#x5206;&#x5927;&#x6587;&#x4EF6;&#x5F15;&#x53D1;&#x7684;&#x6570;&#x636E;&#x503E;&#x659C;
&#x5F53;&#x5BF9;&#x6587;&#x4EF6;&#x4F7F;&#x7528;GZIP&#x538B;&#x7F29;&#x7B49;&#x4E0D;&#x652F;&#x6301;&#x6587;&#x4EF6;&#x5206;&#x5272;&#x64CD;&#x4F5C;&#x7684;&#x538B;&#x7F29;&#x65B9;&#x5F0F;&#xFF0C;&#x5728;&#x65E5;&#x540E;&#x6709;&#x4F5C;&#x4E1A;&#x6D89;&#x53CA;&#x8BFB;&#x53D6;&#x538B;&#x7F29;&#x540E;&#x7684;&#x6587;&#x4EF6;&#x65F6;&#xFF0C;
&#x8BE5;&#x538B;&#x7F29;&#x6587;&#x4EF6;&#x53EA;&#x4F1A;&#x88AB;&#x4E00;&#x4E2A;&#x4EFB;&#x52A1;&#x6240;&#x8BFB;&#x53D6;&#x3002;&#x5982;&#x679C;&#x8BE5;&#x538B;&#x7F29;&#x6587;&#x4EF6;&#x5F88;&#x5927;&#xFF0C;&#x5219;&#x5904;&#x7406;&#x8BE5;&#x6587;&#x4EF6;&#x7684;Map&#x9700;&#x8981;&#x82B1;&#x8D39;&#x7684;&#x65F6;&#x95F4;&#x4F1A;&#x8FDC;&#x591A;&#x4E8E;&#x8BFB;&#x53D6;&#x666E;&#x901A;&#x6587;&#x4EF6;&#x7684;Map&#x65F6;&#x95F4;
&#x5728;&#x6570;&#x636E;&#x538B;&#x7F29;&#x7684;&#x65F6;&#x5019;&#x53EF;&#x4EE5;&#x91C7;&#x7528;bzip2&#x548C;Zip&#x7B49;&#x652F;&#x6301;&#x6587;&#x4EF6;&#x5206;&#x5272;&#x7684;&#x538B;&#x7F29;&#x7B97;&#x6CD5;&#x3002;

10.4.2 &#x4E1A;&#x52A1;&#x65E0;&#x5173;&#x7684;&#x6570;&#x636E;&#x5F15;&#x53D1;&#x7684;&#x6570;&#x636E;&#x503E;&#x659C;
&#x8FD9;&#x4E9B;&#x4E0E;&#x4E1A;&#x52A1;&#x65E0;&#x5173;&#x7684;&#x6570;&#x636E;&#x5F15;&#x5165;&#x5BFC;&#x81F4;&#x5728;&#x8FDB;&#x884C;&#x5206;&#x7EC4;&#x805A;&#x5408;&#x6216;&#x8005;&#x5728;&#x6267;&#x884C;&#x8868;&#x8FDE;&#x63A5;&#x65F6;&#x53D1;&#x751F;&#x6570;&#x636E;&#x503E;&#x659C;&#x3002;&#x5BF9;&#x4E8E;&#x8FD9;&#x7C7B;&#x95EE;&#x9898;&#x5F15;&#x53D1;&#x7684;&#x6570;&#x636E;&#x503E;&#x659C;&#xFF0C;
&#x5728;&#x8BA1;&#x7B97;&#x8FC7;&#x7A0B;&#x4E2D;&#x6392;&#x9664;&#x542B;&#x6709;&#x8FD9;&#x7C7B;&#x201C;&#x5F02;&#x5E38;&#x201D;&#x6570;&#x636E;&#x5373;&#x53EF;

10.4.3 &#x591A;&#x7EF4;&#x805A;&#x5408;&#x8BA1;&#x7B97;&#x6570;&#x636E;&#x81A8;&#x80C0;&#x5F15;&#x8D77;&#x7684;&#x6570;&#x636E;&#x503E;&#x659C;
&#xFF08;hive.new.job.grouping.set.cardinality&#xFF09;&#x914D;&#x7F6E;&#x7684;&#x65B9;&#x5F0F;&#x81EA;&#x52A8;&#x63A7;&#x5236;&#x4F5C;&#x4E1A;&#x7684;&#x62C6;&#x89E3;&#xFF0C;&#x8BE5;&#x53C2;&#x6570;&#x9ED8;&#x8BA4;&#x503C;&#x662F;30&#x3002;
&#x8BE5;&#x53C2;&#x6570;&#x8868;&#x793A;&#x9488;&#x5BF9;grouping sets/rollups/cubes&#x8FD9;&#x7C7B;&#x591A;&#x7EF4;&#x805A;&#x5408;&#x7684;&#x64CD;&#x4F5C;&#xFF0C;&#x5982;&#x679C;&#x6700;&#x540E;&#x62C6;&#x89E3;&#x7684;&#x952E;&#x7EC4;&#x5408;&#xFF08;&#x4E0A;&#x9762;&#x4F8B;&#x5B50;&#x7684;&#x7EC4;&#x5408;&#x662F;4&#xFF09;&#x5927;&#x4E8E;&#x8BE5;&#x503C;&#xFF0C;
&#x4F1A;&#x542F;&#x7528;&#x65B0;&#x7684;&#x4EFB;&#x52A1;&#x53BB;&#x5904;&#x7406;&#x5927;&#x4E8E;&#x8BE5;&#x503C;&#x4E4B;&#x5916;&#x7684;&#x7EC4;&#x5408;&#x3002;&#x5982;&#x679C;&#x5728;&#x5904;&#x7406;&#x6570;&#x636E;&#x65F6;&#xFF0C;&#x67D0;&#x4E2A;&#x5206;&#x7EC4;&#x805A;&#x5408;&#x7684;&#x5217;&#x6709;&#x8F83;&#x5927;&#x7684;&#x503E;&#x659C;&#xFF0C;&#x53EF;&#x4EE5;&#x9002;&#x5F53;&#x8C03;&#x5C0F;&#x8BE5;&#x503C;

10.4.4 &#x65E0;&#x6CD5;&#x524A;&#x51CF;&#x4E2D;&#x95F4;&#x7ED3;&#x679C;&#x7684;&#x6570;&#x636E;&#x91CF;&#x5F15;&#x53D1;&#x7684;&#x6570;&#x636E;&#x503E;&#x659C;
&#x4F8B;&#x5982;&#x4F7F;&#x7528;collect_list&#x805A;&#x5408;&#x51FD;&#x6570;
&#x95EE;&#x9898;&#xFF1A;hive.groupby.skewindata&#x7684;&#x6838;&#x5FC3;&#x4F5C;&#x7528;&#x5728;&#x4E8E;&#x751F;&#x6210;&#x7684;&#x7B2C;&#x4E00;&#x4E2A;&#x4F5C;&#x4E1A;&#x80FD;&#x591F;&#x6709;&#x6548;&#x51CF;&#x5C11;&#x6570;&#x91CF;&#x3002;
&#x4F46;&#x662F;&#x5BF9;&#x4E8E;collect_list&#x8FD9;&#x7C7B;&#x8981;&#x6C42;&#x5168;&#x91CF;&#x64CD;&#x4F5C;&#x6240;&#x6709;&#x6570;&#x636E;&#x7684;&#x4E2D;&#x95F4;&#x7ED3;&#x679C;&#x7684;&#x51FD;&#x6570;&#x6765;&#x8BF4;&#xFF0C;&#x660E;&#x663E;&#x8D77;&#x4E0D;&#x5230;&#x4F5C;&#x7528;&#xFF0C;
&#x53CD;&#x800C;&#x56E0;&#x4E3A;&#x5F15;&#x5165;&#x65B0;&#x7684;&#x4F5C;&#x4E1A;&#x589E;&#x52A0;&#x4E86;&#x78C1;&#x76D8;&#x548C;&#x7F51;&#x7EDC;I/O&#x7684;&#x8D1F;&#x62C5;&#xFF0C;&#x800C;&#x5BFC;&#x81F4;&#x6027;&#x80FD;&#x53D8;&#x5F97;&#x66F4;&#x4E3A;&#x4F4E;&#x4E0B;
&#x89E3;&#x51B3;&#xFF1A;&#x8C03;&#x6574;Reduce&#x6240;&#x6267;&#x884C;&#x7684;&#x5185;&#x5B58;&#x5927;&#x5C0F;

10.4.5 &#x4E24;&#x4E2A;Hive&#x6570;&#x636E;&#x8868;&#x8FDE;&#x63A5;&#x65F6;&#x5F15;&#x53D1;&#x7684;&#x6570;&#x636E;&#x503E;&#x659C;
&#x4E24;&#x8868;&#x8FDB;&#x884C;&#x666E;&#x901A;&#x7684;repartition join&#x65F6;&#xFF0C;&#x5982;&#x679C;&#x8868;&#x8FDE;&#x63A5;&#x7684;&#x952E;&#x5B58;&#x5728;&#x503E;&#x659C;&#xFF0C;&#x90A3;&#x4E48;&#x5728;Shuffle&#x9636;&#x6BB5;&#x5FC5;&#x7136;&#x4F1A;&#x5F15;&#x8D77;&#x6570;&#x636E;&#x503E;&#x659C;&#x3002;
&#x9047;&#x5230;&#x8FD9;&#x79CD;&#x60C5;&#x51B5;&#xFF0C;Hive&#x7684;&#x901A;&#x5E38;&#x505A;&#x6CD5;&#x8FD8;&#x662F;&#x542F;&#x7528;&#x4E24;&#x4E2A;&#x4F5C;&#x4E1A;&#xFF0C;&#x7B2C;&#x4E00;&#x4E2A;&#x4F5C;&#x4E1A;&#x5904;&#x7406;&#x6CA1;&#x6709;&#x503E;&#x659C;&#x7684;&#x6570;&#x636E;&#xFF0C;
&#x7B2C;&#x4E8C;&#x4E2A;&#x4F5C;&#x4E1A;&#x5C06;&#x503E;&#x659C;&#x7684;&#x6570;&#x636E;&#x5B58;&#x5230;&#x5206;&#x5E03;&#x5F0F;&#x7F13;&#x5B58;&#x4E2D;&#xFF0C;&#x5206;&#x53D1;&#x5230;&#x5404;&#x4E2A;Map&#x4EFB;&#x52A1;&#x6240;&#x5728;&#x8282;&#x70B9;&#x3002;&#x5728;Map&#x9636;&#x6BB5;&#x5B8C;&#x6210;join&#x64CD;&#x4F5C;&#xFF0C;&#x5373;MapJoin&#xFF0C;
&#x8FD9;&#x907F;&#x514D;&#x4E86;Shuffle&#xFF0C;&#x4ECE;&#x800C;&#x907F;&#x514D;&#x4E86;&#x6570;&#x636E;&#x503E;&#x659C;

Hive知识体系总结

在Hive中，数据粒度可以分为表、分区、桶、列和字段

Original: https://blog.csdn.net/weixin_40503364/article/details/124546334
Author: 我爱肉肉
Title: 《Hive性能调优实战》摘录

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/818380/

转载文章受原作者版权保护。转载请注明原作者出处！

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31