hadoop分布式文件系統(tǒng)的特性 下面哪個(gè)程序負(fù)責(zé)hdfs數(shù)據(jù)存儲(chǔ)?
下面哪個(gè)程序負(fù)責(zé)hdfs數(shù)據(jù)存儲(chǔ)?負(fù)責(zé)“HDFS”和“數(shù)據(jù)存儲(chǔ)”的程序是HDFS。Hadoop分布式文件系統(tǒng)(HDFS)是一種適合在普通硬件上運(yùn)行的分布式文件系統(tǒng)。它與現(xiàn)有的分布式文件系統(tǒng)有很多共同點(diǎn)
下面哪個(gè)程序負(fù)責(zé)hdfs數(shù)據(jù)存儲(chǔ)?
負(fù)責(zé)“HDFS”和“數(shù)據(jù)存儲(chǔ)”的程序是HDFS。Hadoop分布式文件系統(tǒng)(HDFS)是一種適合在普通硬件上運(yùn)行的分布式文件系統(tǒng)。它與現(xiàn)有的分布式文件系統(tǒng)有很多共同點(diǎn)。但同時(shí),它又不同于其他分布式文件系統(tǒng)。HDFS是一個(gè)高度容錯(cuò)的系統(tǒng),適合部署在廉價(jià)機(jī)器上。在HDFS上運(yùn)行的程序有很多數(shù)據(jù)集。典型的HDFS文件大小是GB到TB。因此,HDFS被調(diào)整為支持大文件。它還應(yīng)該以高帶寬支持集群中的數(shù)億個(gè)節(jié)點(diǎn)。大多數(shù)HDFS程序需要寫一次,讀很多次。一旦創(chuàng)建、寫入和關(guān)閉了文件,就不需要對(duì)其進(jìn)行修改。這種假設(shè)簡(jiǎn)化了數(shù)據(jù)一致性問(wèn)題,使高吞吐量數(shù)據(jù)訪問(wèn)成為可能。一個(gè)map-reduce程序或一個(gè)web爬蟲(chóng)程序可以很好地適應(yīng)這個(gè)模型。
HDFS能夠存儲(chǔ)哪幾種文件格式?
看你保存什么視頻,超過(guò)100兆的大文件可以考慮HDFS。對(duì)于大量100KB或幾MB的小文件,例如,如果您保存原始HLS格式,元數(shù)據(jù)壓力太大,HDFS不適合,TFs不支持指定文件名(保存時(shí)它會(huì)為您分配一個(gè)),您可能需要自己維護(hù)文件命名空間。另一個(gè)選項(xiàng)是一致散列、CEPH或swift。CEPH是用C語(yǔ)言開(kāi)發(fā)的,很難維護(hù)。Swift是用Python編寫的,openstack的Python代碼也非常風(fēng)騷。一般來(lái)說(shuō),小文件的開(kāi)源解決方案對(duì)于基于TFs的二次開(kāi)發(fā)是比較可靠的。此外,如果要構(gòu)建流媒體服務(wù),還需要考慮流媒體服務(wù)器和存儲(chǔ)之間的連接。當(dāng)然,HLS是最方便的。對(duì)于MP4,一些服務(wù)器軟件或nginx插件只支持訪問(wèn)本地文件。是否可以優(yōu)雅地裝載到本地文件系統(tǒng)也是一個(gè)考慮因素。