深入剖析美團基于Flume的網站日志收集系統(tǒng)

2020-06-24

1311

美團的日志收集系統(tǒng)負責美團的所有業(yè)務日志的收集，并分別給Hadoop平臺提供離線數(shù)據(jù)和Storm平臺提供實時數(shù)據(jù)流。美團的日志收集系統(tǒng)基于Flume設計和搭建而成?！痘贔lume的美團日志收集系統(tǒng)》

美團的日志收集系統(tǒng)負責美團的所有業(yè)務日志的收集，并分別給Hadoop平臺提供離線數(shù)據(jù)和Storm平臺提供實時數(shù)據(jù)流。美團的日志收集系統(tǒng)基于Flume設計和搭建而成。

《基于Flume的美團日志收集系統(tǒng)》將分兩部分給讀者呈現(xiàn)美團日志收集系統(tǒng)的架構設計和實戰(zhàn)經驗。

第一部分架構和設計，將主要著眼于日志收集系統(tǒng)整體的架構設計，以及為什么要做這樣的設計。

第二部分改進和優(yōu)化，將主要著眼于實際部署和使用過程中遇到的問題，對Flume做的功能修改和優(yōu)化等。

1 日志收集系統(tǒng)簡介日志收集是大數(shù)據(jù)的基石。

許多公司的業(yè)務平臺每天都會產生大量的日志數(shù)據(jù)。收集業(yè)務日志數(shù)據(jù)，供離線和在線的分析系統(tǒng)使用，正是日志收集系統(tǒng)的要做的事情。高可用性，高可靠性和可擴展性是日志收集系統(tǒng)所具有的基本特征。

目前常用的開源日志收集系統(tǒng)有Flume, Scribe等。Flume是Cloudera提供的一個高可用的，高可靠的，分布式的海量日志采集、聚合和傳輸?shù)南到y(tǒng)，目前已經是Apache的一個子項目。Scribe是Facebook開源的日志收集系統(tǒng)，它為日志的分布式收集，統(tǒng)一處理提供一個可擴展的，高容錯的簡單方案。

2 常用的開源日志收集系統(tǒng)對比下面將對常見的開源日志收集系統(tǒng)Flume和Scribe的各方面進行對比。對比中Flume將主要采用Apache下的Flume-NG為參考對象。同時，美團將常用的日志收集系統(tǒng)分為三層（Agent層，Collector層和Store層）來進行對比。

3 美團日志收集系統(tǒng)架構美團的日志收集系統(tǒng)負責美團的所有業(yè)務日志的收集，并分別給Hadoop平臺提供離線數(shù)據(jù)和Storm平臺提供實時數(shù)據(jù)流。美團的日志收集系統(tǒng)基于Flume設計和搭建而成。目前每天收集和處理約T級別的日志數(shù)據(jù)。

下圖是美團的日志收集系統(tǒng)的整體框架圖。

a. 整個系統(tǒng)分為三層：Agent層，Collector層和Store層。其中Agent層每個機器部署一個進程，負責對單機的日志收集工作；Collector層部署在中心服務器上，負責接收Agent層發(fā)送的日志，并且將日志根據(jù)路由規(guī)則寫到相應的Store層中；Store層負責提供永久或者臨時的日志存儲服務，或者將日志流導向其它服務器。

b. Agent到Collector使用LoadBalance策略，將所有的日志均衡地發(fā)到所有的Collector上，達到負載均衡的目標，同時并處理單個Collector失效的問題。

c. Collector層的目標主要有三個：SinkHdfs, SinkKafka和SinkBypass。分別提供離線的數(shù)據(jù)到Hdfs，和提供實時的日志流到Kafka和Bypass。其中SinkHdfs又根據(jù)日志量的大小分為SinkHdfs_b，SinkHdfs_m和SinkHdfs_s三個Sink，以提高寫入到Hdfs的性能，具體見后面介紹。

d. 對于Store來說，Hdfs負責永久地存儲所有日志；Kafka存儲最新的7天日志，并給Storm系統(tǒng)提供實時日志流；Bypass負責給其它服務器和應用提供實時日志流。

下圖是美團的日志收集系統(tǒng)的模塊分解圖，詳解Agent, Collector和Bypass中的Source, Channel和Sink的關系。

a. 模塊命名規(guī)則：所有的Source以src開頭，所有的Channel以ch開頭，所有的Sink以sink開頭；

b. Channel統(tǒng)一使用美團開發(fā)的DualChannel，具體原因后面詳述；對于過濾掉的日志使用NullChannel，具體原因后面詳述；

c. 模塊之間內部通信統(tǒng)一使用Avro接口；

4 架構設計考慮下面將從可用性，可靠性，可擴展性和兼容性等方面，對上述的架構做細致的解析。

4.1 可用性(availablity)對日志收集系統(tǒng)來說，可用性(availablity)指固定周期內系統(tǒng)無故障運行總時間。要想提高系統(tǒng)的可用性，就需要消除系統(tǒng)的單點，提高系統(tǒng)的冗余度。下面來看看美團的日志收集系統(tǒng)在可用性方面的考慮。

4.1.1 Agent死掉Agent死掉分為兩種情況：機器死機或者Agent進程死掉。

對于機器死機的情況來說，由于產生日志的進程也同樣會死掉，所以不會再產生新的日志，不存在不提供服務的情況。

對于Agent進程死掉的情況來說，確實會降低系統(tǒng)的可用性。對此，美團有下面三種方式來提高系統(tǒng)的可用性。首先，所有的Agent在supervise的方式下啟動，如果進程死掉會被系統(tǒng)立即重啟，以提供服務。其次，對所有的Agent進行存活監(jiān)控，發(fā)現(xiàn)Agent死掉立即報警。最后，對于非常重要的日志，建議應用直接將日志寫磁盤，Agent使用spooldir的方式獲得最新的日志。

4.1.2 Collector死掉由于中心服務器提供的是對等的且無差別的服務，且Agent訪問Collector做了LoadBalance和重試機制。所以當某個Collector無法提供服務時，Agent的重試策略會將數(shù)據(jù)發(fā)送到其它可用的Collector上面。所以整個服務不受影響。

4.1.3 Hdfs正常停機美團在Collector的HdfsSink中提供了開關選項，可以控制Collector停止寫Hdfs，并且將所有的events緩存到FileChannel的功能。

4.1.4 Hdfs異常停機或不可訪問假如Hdfs異常停機或不可訪問，此時Collector無法寫Hdfs。由于美團使用DualChannel，Collector可以將所收到的events緩存到FileChannel，保存在磁盤上，繼續(xù)提供服務。當Hdfs恢復服務以后，再將FileChannel中緩存的events再發(fā)送到Hdfs上。這種機制類似于Scribe，可以提供較好的容錯性。

4.1.5 Collector變慢或者Agent/Collector網絡變慢如果Collector處理速度變慢（比如機器load過高）或者Agent/Collector之間的網絡變慢，可能導致Agent發(fā)送到Collector的速度變慢。同樣的，對于此種情況，美團在Agent端使用DualChannel，Agent可以將收到的events緩存到FileChannel，保存在磁盤上，繼續(xù)提供服務。當Collector恢復服務以后，再將FileChannel中緩存的events再發(fā)送給Collector。

4.1.6 Hdfs變慢當Hadoop上的任務較多且有大量的讀寫操作時，Hdfs的讀寫數(shù)據(jù)往往變的很慢。由于每天，每周都有高峰使用期，所以這種情況非常普遍。

對于Hdfs變慢的問題，美團同樣使用DualChannel來解決。當Hdfs寫入較快時，所有的events只經過MemChannel傳遞數(shù)據(jù)，減少磁盤IO，獲得較高性能。當Hdfs寫入較慢時，所有的events只經過FileChannel傳遞數(shù)據(jù)，有一個較大的數(shù)據(jù)緩存空間。

4.2 可靠性(reliability)對日志收集系統(tǒng)來說，可靠性(reliability)是指Flume在數(shù)據(jù)流的傳輸過程中，保證events的可靠傳遞。

對Flume來說，所有的events都被保存在Agent的Channel中，然后被發(fā)送到數(shù)據(jù)流中的下一個Agent或者最終的存儲服務中。那么一個Agent的Channel中的events什么時候被刪除呢？當且僅當它們被保存到下一個Agent的Channel中或者被保存到最終的存儲服務中。這就是Flume提供數(shù)據(jù)流中點到點的可靠性保證的最基本的單跳消息傳遞語義。

那么Flume是如何做到上述最基本的消息傳遞語義呢？

首先，Agent間的事務交換。Flume使用事務的辦法來保證event的可靠傳遞。Source和Sink分別被封裝在事務中，這些事務由保存event的存儲提供或者由Channel提供。這就保證了event在數(shù)據(jù)流的點對點傳輸中是可靠的。在多級數(shù)據(jù)流中，如下圖，上一級的Sink和下一級的Source都被包含在事務中，保證數(shù)據(jù)可靠地從一個Channel到另一個Channel轉移。

其次，數(shù)據(jù)流中 Channel的持久性。Flume中MemoryChannel是可能丟失數(shù)據(jù)的（當Agent死掉時），而FileChannel是持久性的，提供類似mysql的日志機制，保證數(shù)據(jù)不丟失。

4.3 可擴展性(scalability)對日志收集系統(tǒng)來說，可擴展性(scalability)是指系統(tǒng)能夠線性擴展。當日志量增大時，系統(tǒng)能夠以簡單的增加機器來達到線性擴容的目的。

對于基于Flume的日志收集系統(tǒng)來說，需要在設計的每一層，都可以做到線性擴展地提供服務。下面將對每一層的可擴展性做相應的說明。

4.3.1 Agent層對于Agent這一層來說，每個機器部署一個Agent，可以水平擴展，不受限制。一個方面，Agent收集日志的能力受限于機器的性能，正常情況下一個Agent可以為單機提供足夠服務。另一方面，如果機器比較多，可能受限于后端Collector提供的服務，但Agent到Collector是有Load Balance機制，使得Collector可以線性擴展提高能力。

4.3.2 Collector層對于Collector這一層，Agent到Collector是有Load Balance機制，并且Collector提供無差別服務，所以可以線性擴展。其性能主要受限于Store層提供的能力。

4.3.3 Store層對于Store這一層來說，Hdfs和Kafka都是分布式系統(tǒng)，可以做到線性擴展。Bypass屬于臨時的應用，只對應于某一類日志，性能不是瓶頸。

4.4 Channel的選擇Flume1.4.0中，其官方提供常用的MemoryChannel和FileChannel供大家選擇。其優(yōu)劣如下：

MemoryChannel: 所有的events被保存在內存中。優(yōu)點是高吞吐。缺點是容量有限并且Agent死掉時會丟失內存中的數(shù)據(jù)。FileChannel: 所有的events被保存在文件中。優(yōu)點是容量較大且死掉時數(shù)據(jù)可恢復。缺點是速度較慢。上述兩種Channel，優(yōu)缺點相反，分別有自己適合的場景。然而，對于大部分應用來說，美團希望Channel可以同提供高吞吐和大緩存。基于此，美團開發(fā)了DualChannel。

DualChannel：基于 MemoryChannel和 FileChannel開發(fā)。當堆積在Channel中的events數(shù)小于閾值時，所有的events被保存在MemoryChannel中，Sink從MemoryChannel中讀取數(shù)據(jù)；當堆積在Channel中的events數(shù)大于閾值時，所有的events被自動存放在FileChannel中，Sink從FileChannel中讀取數(shù)據(jù)。這樣當系統(tǒng)正常運行時，美團可以使用MemoryChannel的高吞吐特性；當系統(tǒng)有異常時，美團可以利用FileChannel的大緩存的特性。4.5 和scribe兼容在設計之初，美團就要求每類日志都有一個category相對應，并且Flume的Agent提供AvroSource和ScribeSource兩種服務。這將保持和之前的Scribe相對應，減少業(yè)務的更改成本。

4.6 權限控制在目前的日志收集系統(tǒng)中，美團只使用最簡單的權限控制。只有設定的category才可以進入到存儲系統(tǒng)。所以目前的權限控制就是category過濾。

如果權限控制放在Agent端，優(yōu)勢是可以較好地控制垃圾數(shù)據(jù)在系統(tǒng)中流轉。但劣勢是配置修改麻煩，每增加一個日志就需要重啟或者重載Agent的配置。

如果權限控制放在Collector端，優(yōu)勢是方便進行配置的修改和加載。劣勢是部分沒有注冊的數(shù)據(jù)可能在Agent/Collector之間傳輸。

考慮到Agent/Collector之間的日志傳輸并非系統(tǒng)瓶頸，且目前日志收集屬內部系統(tǒng)，安全問題屬于次要問題，所以選擇采用Collector端控制。

4.7 提供實時流美團的部分業(yè)務，如實時推薦，反爬蟲服務等服務，需要處理實時的數(shù)據(jù)流。因此美團希望Flume能夠導出一份實時流給Kafka/Storm系統(tǒng)。

一個非常重要的要求是實時數(shù)據(jù)流不應該受到其它Sink的速度影響，保證實時數(shù)據(jù)流的速度。這一點，美團是通過Collector中設置不同的Channel進行隔離，并且DualChannel的大容量保證了日志的處理不受Sink的影響。

5 系統(tǒng)監(jiān)控對于一個大型復雜系統(tǒng)來說，監(jiān)控是必不可少的部分。設計合理的監(jiān)控，可以對異常情況及時發(fā)現(xiàn)，只要有一部手機，就可以知道系統(tǒng)是否正常運作。對于美團的日志收集系統(tǒng)，美團建立了多維度的監(jiān)控，防止未知的異常發(fā)生。

5.1 發(fā)送速度，擁堵情況，寫Hdfs速度通過發(fā)送給zabbix的數(shù)據(jù)，美團可以繪制出發(fā)送數(shù)量、擁堵情況和寫Hdfs速度的圖表，對于超預期的擁堵，美團會報警出來查找原因。

下面是Flume Collector HdfsSink寫數(shù)據(jù)到Hdfs的速度截圖：

下面是Flume Collector的FileChannel中擁堵的events數(shù)據(jù)量截圖：

5.2 flume寫hfds狀態(tài)的監(jiān)控Flume寫入Hdfs會先生成tmp文件，對于特別重要的日志，美團會每15分鐘左右檢查一下各個Collector是否都產生了tmp文件，對于沒有正常產生tmp文件的Collector和日志美團需要檢查是否有異常。這樣可以及時發(fā)現(xiàn)Flume和日志的異常.

5.3 日志大小異常監(jiān)控對于重要的日志，美團會每個小時都監(jiān)控日志大小周同比是否有較大波動，并給予提醒，這個報警有效的發(fā)現(xiàn)了異常的日志，且多次發(fā)現(xiàn)了應用方日志發(fā)送的異常，及時給予了對方反饋，幫助他們及早修復自身系統(tǒng)的異常。

通過上述的講解，美團可以看到，基于Flume的美團日志收集系統(tǒng)已經是具備高可用性，高可靠性，可擴展等特性的分布式服務。

改進和優(yōu)化下面，美團將會講述在實際部署和使用過程中遇到的問題，對Flume的功能改進和對系統(tǒng)做的優(yōu)化。

1 Flume的問題總結在Flume的使用過程中，遇到的主要問題如下：

a. Channel水土不服”：使用固定大小的MemoryChannel在日志高峰時常報隊列大小不夠的異常；使用FileChannel又導致IO繁忙的問題；

b. HdfsSink的性能問題：使用HdfsSink向Hdfs寫日志，在高峰時間速度較慢；

c. 系統(tǒng)的管理問題：配置升級，模塊重啟等；

2 Flume的功能改進和優(yōu)化點從上面的問題中可以看到，有一些需求是原生Flume無法滿足的，因此，基于開源的Flume美團增加了許多功能，修改了一些Bug，并且進行一些調優(yōu)。下面將對一些主要的方面做一些說明。

2.1 增加Zabbix monitor服務一方面，F(xiàn)lume本身提供了http, ganglia的監(jiān)控服務，而美團目前主要使用zabbix做監(jiān)控。因此，美團為Flume添加了zabbix監(jiān)控模塊，和sa的監(jiān)控服務無縫融合。

另一方面，凈化Flume的metrics。只將美團需要的metrics發(fā)送給zabbix，避免 zabbix server造成壓力。目前美團最為關心的是Flume能否及時把應用端發(fā)送過來的日志寫到Hdfs上，對應關注的metrics為：

Source : 接收的event數(shù)和處理的event數(shù)Channel : Channel中擁堵的event數(shù)Sink : 已經處理的event數(shù)

2.2 為HdfsSink增加自動創(chuàng)建index功能首先，美團的HdfsSink寫到hadoop的文件采用lzo壓縮存儲。 HdfsSink可以讀取hadoop配置文件中提供的編碼類列表，然后通過配置的方式獲取使用何種壓縮編碼，美團目前使用lzo壓縮數(shù)據(jù)。采用lzo壓縮而非bz2壓縮，是基于以下測試數(shù)據(jù)：

其次，美團的HdfsSink增加了創(chuàng)建lzo文件后自動創(chuàng)建index功能。Hadoop提供了對lzo創(chuàng)建索引，使得壓縮文件是可切分的，這樣Hadoop Job可以并行處理數(shù)據(jù)文件。HdfsSink本身lzo壓縮，但寫完lzo文件并不會建索引，美團在close文件之后添加了建索引功能。

Java Code復制內容到剪貼板 /** *RenamebucketPathfilefrom.tmptopermanentlocation. */ privatevoidrenameBucket()throwsIOException,InterruptedException{ if(bucketPath.equals(targetPath)){ return; } finalPathsrcPath=newPath(bucketPath); finalPathdstPath=newPath(targetPath); callWithTimeout(newCallRunner<Object>(){ @Override publicObjectcall()throwsException{ if(fileSystem.exists(srcPath)){//couldblock LOG.info("Renaming"+srcPath+"to"+dstPath); fileSystem.rename(srcPath,dstPath);//couldblock //indexthedstPathlzofile if(codeC!=null&&".lzo".equals(codeC.getDefaultExtension())){ LzoIndexerlzoIndexer=newLzoIndexer(newConfiguration()); lzoIndexer.index(dstPath); } } returnnull; } }); }

2.3 增加HdfsSink的開關美團在HdfsSink和DualChannel中增加開關，當開關打開的情況下，HdfsSink不再往Hdfs上寫數(shù)據(jù)，并且數(shù)據(jù)只寫向DualChannel中的FileChannel。以此策略來防止Hdfs的正常停機維護。

2.4 增加DualChannelFlume本身提供了MemoryChannel和FileChannel。MemoryChannel處理速度快，但緩存大小有限，且沒有持久化；FileChannel則剛好相反。美團希望利用兩者的優(yōu)勢，在Sink處理速度夠快，Channel沒有緩存過多日志的時候，就使用MemoryChannel，當Sink處理速度跟不上，又需要Channel能夠緩存下應用端發(fā)送過來的日志時，就使用FileChannel，由此美團開發(fā)了DualChannel，能夠智能的在兩個Channel之間切換。

其具體的邏輯如下：

Java Code復制內容到剪貼板 /*** *putToMemChannelindicateputeventtomemChannelorfileChannel *takeFromMemChannelindicatetakeeventfrommemChannelorfileChannel **/ privateAtomicBooleanputToMemChannel=newAtomicBoolean(true); privateAtomicBooleantakeFromMemChannel=newAtomicBoolean(true); voiddoPut(Eventevent){ if(switchon&&putToMemChannel.get()){ //往memChannel中寫數(shù)據(jù) memTransaction.put(event); if(memChannel.isFull()||fileChannel.getQueueSize()>100){ putToMemChannel.set(false); } }else{ //往fileChannel中寫數(shù)據(jù) fileTransaction.put(event); } } EventdoTake(){ Eventevent=null; if(takeFromMemChannel.get()){ //從memChannel中取數(shù)據(jù) event=memTransaction.take(); if(event==null){ takeFromMemChannel.set(false); } }else{ //從fileChannel中取數(shù)據(jù) event=fileTransaction.take(); if(event==null){ takeFromMemChannel.set(true); putToMemChannel.set(true); } } returnevent; }

2.5 增加NullChannelFlume提供了NullSink，可以把不需要的日志通過NullSink直接丟棄，不進行存儲。然而，Source需要先將events存放到Channel中，NullSink再將events取出扔掉。為了提升性能，美團把這一步移到了Channel里面做，所以開發(fā)了NullChannel。

2.6 增加KafkaSink為支持向Storm提供實時數(shù)據(jù)流，美團增加了KafkaSink用來向Kafka寫實時數(shù)據(jù)流。其基本的邏輯如下：

Java Code復制內容到剪貼板 publicclassKafkaSinkextendsAbstractSinkimplementsConfigurable{ privateStringzkConnect; privateIntegerzkTimeout; privateIntegerbatchSize; privateIntegerqueueSize; privateStringserializerClass; privateStringproducerType; privateStringtopicPrefix; privateProducer<String,String>producer; publicvoidconfigure(Contextcontext){ //讀取配置，并檢查配置 } @Override publicsynchronizedvoidstart(){ //初始化producer } @Override publicsynchronizedvoidstop(){ //關閉producer } @Override publicStatusprocess()throwsEventDeliveryException{ Statusstatus=Status.READY; Channelchannel=getChannel(); Transactiontx=channel.getTransaction(); try{ tx.begin(); //將日志按category分隊列存放 Map<String,List<String>>topic2EventList=newHashMap<String,List<String>>(); //從channel中取batchSize大小的日志，從header中獲取category，生成topic，并存放于上述的Map中； //將Map中的數(shù)據(jù)通過producer發(fā)送給kafka tx.commit(); }catch(Exceptione){ tx.rollback(); thrownewEventDeliveryException(e); }finally{ tx.close(); } returnstatus; } }

2.7 修復和scribe的兼容問題Scribed在通過ScribeSource發(fā)送數(shù)據(jù)包給Flume時，大于4096字節(jié)的包，會先發(fā)送一個Dummy包檢查服務器的反應，而Flume的ScribeSource對于logentry.size()=0的包返回TRY_LATER，此時Scribed就認為出錯，斷開連接。這樣循環(huán)反復嘗試，無法真正發(fā)送數(shù)據(jù)?，F(xiàn)在在ScribeSource的Thrift接口中，對size為0的情況返回OK，保證后續(xù)正常發(fā)送數(shù)據(jù)。

3. Flume系統(tǒng)調優(yōu)經驗總結3.1 基礎參數(shù)調優(yōu)經驗HdfsSink中默認的serializer會每寫一行在行尾添加一個換行符，美團日志本身帶有換行符，這樣會導致每條日志后面多一個空行，修改配置不要自動添加換行符；lc.sinks.sink_hdfs.serializer.appendNewline = false調大MemoryChannel的capacity，盡量利用MemoryChannel快速的處理能力；調大HdfsSink的batchSize，增加吞吐量，減少hdfs的flush次數(shù)；適當調大HdfsSink的callTimeout，避免不必要的超時錯誤；

3.2 HdfsSink獲取Filename的優(yōu)化HdfsSink的path參數(shù)指明了日志被寫到Hdfs的位置，該參數(shù)中可以引用格式化的參數(shù)，將日志寫到一個動態(tài)的目錄中。這方便了日志的管理。例如美團可以將日志寫到category分類的目錄，并且按天和按小時存放：

lc.sinks.sink_hdfs.hdfs.path = /user/hive/work/orglog.db/%{category}/dt=%Y%m%d/hour=%HHdfsS ink中處理每條event時，都要根據(jù)配置獲取此event應該寫入的Hdfs path和filename，默認的獲取方法是通過正則表達式替換配置中的變量，獲取真實的path和filename。因為此過程是每條event都要做的操作，耗時很長。通過美團的測試，20萬條日志，這個操作要耗時6-8s左右。

由于美團目前的path和filename有固定的模式，可以通過字符串拼接獲得。而后者比正則匹配快幾十倍。拼接定符串的方式，20萬條日志的操作只需要幾百毫秒。

3.3 HdfsSink的b/m/s優(yōu)化在美團初始的設計中，所有的日志都通過一個Channel和一個HdfsSink寫到Hdfs上。美團來看一看這樣做有什么問題。

首先，美團來看一下HdfsSink在發(fā)送數(shù)據(jù)的邏輯：

Java Code復制內容到剪貼板 //從Channel中取batchSize大小的events for(txnEventCount=0;txnEventCount<batchSize;txnEventCount++){ //對每條日志根據(jù)categoryappend到相應的bucketWriter上； bucketWriter.append(event); ｝ for(BucketWriterbucketWriter:writers){ //然后對每一個bucketWriter調用相應的flush方法將數(shù)據(jù)flush到Hdfs上 bucketWriter.flush(); ｝

假設美團的系統(tǒng)中有100個category，batchSize大小設置為20萬。則每20萬條數(shù)據(jù)，就需要對100個文件進行append或者flush操作。

其次，對于美團的日志來說，基本符合80/20原則。即20%的category產生了系統(tǒng)80%的日志量。這樣對大部分日志來說，每20萬條可能只包含幾條日志，也需要往Hdfs上flush一次。

上述的情況會導致HdfsSink寫Hdfs的效率極差。下圖是單Channel的情況下每小時的發(fā)送量和寫hdfs的時間趨勢圖。

鑒于這種實際應用場景，美團把日志進行了大小歸類，分為big, middle和small三類，這樣可以有效的避免小日志跟著大日志一起頻繁的flush，提升效果明顯。下圖是分隊列后big隊列的每小時的發(fā)送量和寫hdfs的時間趨勢圖。

4 未來發(fā)展目前，F(xiàn)lume日志收集系統(tǒng)提供了一個高可用，高可靠，可擴展的分布式服務，已經有效地支持了美團的日志數(shù)據(jù)收集工作。

后續(xù)，美團將在如下方面繼續(xù)研究：

日志管理系統(tǒng)：圖形化的展示和控制日志收集系統(tǒng)；跟進社區(qū)發(fā)展：跟進Flume 1.5的進展，同時回饋社區(qū)；

成人AV在线无码|婷婷五月激情色,|伊人加勒比二三四区|国产一区激情都市|亚洲AV无码电影|日av韩av无码|天堂在线亚洲Av|无码一区二区影院|成人无码毛片AV|超碰在线看中文字幕

相關推薦