AS深圳2017《美团点评数据平台融合实战》-谢语宸

2020-03-01 190浏览

  • 1.k b @ArchSummit 2017-07
  • 2.
  • 3.
  • 4.d • • Hadoop • • SQL
  • 5.Eat better, Live better
  • 6.l 15 10 / • , : APP ,1+1>2 • • - • - , / / / , , : • • • , , UGC,
  • 7.K i : App : - • , • — • — • — sql/udf • , , , , — • — • : :“ , …”
  • 8.H
  • 9.H
  • 10.
  • 11.r 0 • • 9 • 10 , , • • • 22 “ , : , , : ... ” —1 , —4
  • 12.: • , • , , 50% , 50% ( ) 500+ 11P 120T ( ) 3000+ 75P 800T
  • 13.k : • , • , , , • , ( ) 7000+ 28 100+ 400+ ( ) 14000+ 50+ 240+ 900+
  • 14.• , • • • , , , • • • • • ,
  • 15.• , • • • , , , • • • • • ,
  • 16.: ,
  • 17.B • Hadoop DistCP, • • • • • • • • • “ ” , :
  • 18.,2 ,2 • KDC • Client, Server • • Client, Server
  • 19.,2 ,2 , • • client • KDC, ticket , • client Service ticket KDC ticket KDC, Service Service ticket
  • 20.,2 ,2 • KDC principal, krbtgt/A@B, krbtgt/B@A , • • krb5.conf • realm KDC A realm principal • hadoop client (kinit), , kvno hadoop • * service principal RPC Server • B realm server principal dfs.namenode.kerberos.principal.pattern yarn.resourcemanager.principal.pattern • domain_realm hadoop.security.auth_to_local -Dsun.security.krb5.debug log, hadoop realm
  • 21.• , • • • , , , • • • • • ,
  • 22.H
  • 23.k o RD • , • , , , • • 7000+ • • 1-4 , 10 , , , 1-2 , • • , , 3-5
  • 24., • • , • , , , , , , , ,
  • 25.• — Hadoop • — • — • — Block / • • • , 2 / , :
  • 26.& JDK 1.7.0_76 1.6.0_43 Hadoop 2.7.1 2.4.1 HDFS Arch. HA using QJM, Federation Hive 0.13, 1.2 0.11 Kerberos keytab keytab, token, password Agent, Kafka, camus …… Patch …… , BlackHole ……. Review Patch
  • 27.
  • 28.a
  • 29.— Block — : Hadoop • Hadoop • • 2
  • 30.& • Hadoop , “ • • 120T, • , • • : 30 10G << 1ms, ,split 30ms NN 30 + ”
  • 31.& : DN • • NN , , , pipeline “zone” , NN , pipeline client • Application • YARN “zone” , , NM , • • • • : Balancer , DN Block
  • 32.
  • 33.& • • , , / , • • Rpc NN • • • • • EditLog FSImage + StandbyNN 4
  • 34.cv • NameNode Federation clusterID, • mount table • Hive • mysqldb , & • • • • KDC Master , KDC NN, DN, RM, NM , ,
  • 35.• , • • • , , , • • • • • ,
  • 36.- , , Hive - ,
  • 37.: insert into bi.table_a select x, y, z from bi.table_b join bi.table_c on *** where *** group by *** insert into mart_xxx.table_a select x, y, z from mart_yyy.table_b join mart_zzz.table_c on *** where *** group by ***
  • 38.• 8000 , …
  • 39.• 8000 , , , , ,
  • 40.
  • 41.
  • 42.Hive ,
  • 43.&- , e , • • Hive , • , • Hive , HDFS • HDFS&Hive , “ 7000 90% ” ” ”
  • 44.s
  • 45.p , • Hadoop • - , - • - • / • • yarn • • NameNode block , • , • • : Cache ,
  • 46.: • RPC • , • “ •“ ”: ( , ( ) ”, “ “ • • • • • • • / ” • • • ) ” , “ ” : “ , , ”
  • 47., • “ • ”, , (“ • • -> -> -> • • : • : / -> -> / -> -> ”)
  • 48.
  • 49.
  • 50.