商業(yè)bi大數(shù)據(jù)架構(gòu) 學(xué)大數(shù)據(jù)需要有基礎(chǔ)嗎?
學(xué)大數(shù)據(jù)需要有基礎(chǔ)嗎?學(xué)習(xí)大數(shù)據(jù)也是要基礎(chǔ)的,但是相比較一般的程序員,大數(shù)據(jù)的門檻也要略高點。大數(shù)據(jù)我之所以被一般稱大數(shù)據(jù),恐怕是畢竟有龐大的數(shù)據(jù)量,奇怪的數(shù)據(jù)模型,因此,要學(xué)大數(shù)據(jù)不需要起碼兩方面的
學(xué)大數(shù)據(jù)需要有基礎(chǔ)嗎?
學(xué)習(xí)大數(shù)據(jù)也是要基礎(chǔ)的,但是相比較一般的程序員,大數(shù)據(jù)的門檻也要略高點。
大數(shù)據(jù)我之所以被一般稱大數(shù)據(jù),恐怕是畢竟有龐大的數(shù)據(jù)量,奇怪的數(shù)據(jù)模型,因此,要學(xué)大數(shù)據(jù)不需要起碼兩方面的基礎(chǔ),一是編程方面的基礎(chǔ),二是數(shù)學(xué)及算法方面的基礎(chǔ)。
先談?wù)劙删幊谭矫娴幕A(chǔ)現(xiàn)在擴大經(jīng)營數(shù)據(jù)的主流語言有兩種,一個是Java,Java充當最受歡迎的編程語言,無疑是也很全能的了,各種領(lǐng)域都差不多應(yīng)該有Java的影子。Hadoop充當設(shè)計和實現(xiàn)Java而電腦設(shè)計的大數(shù)據(jù)框架,也被運用得非常多的。
另一個那是Python,Python是一個后起之秀,在大數(shù)據(jù)和AI時代才發(fā)展起來起來的語言,近兩年更加的受歡迎。
那就能學(xué)好這些變得語言,比較熟悉相對應(yīng)的大數(shù)據(jù)框架,才能在這個行業(yè)有一個都差不多的位置,否則不,你連大數(shù)據(jù)實現(xiàn)的基本知識都是沒有,談何大數(shù)據(jù)呢?
接著,比編程能力更重要的是的是數(shù)學(xué)大數(shù)據(jù)的處理中,設(shè)計到了大量的和數(shù)學(xué)無關(guān)的知識,沒有數(shù)學(xué)的基礎(chǔ),基本就是注意到如大海好象的一個個數(shù)字,然后把無從入手。
要做到大數(shù)據(jù),我們最起碼必須這幾個方面的數(shù)學(xué)基礎(chǔ):
概率論與數(shù)理統(tǒng)計
在數(shù)據(jù)建模和數(shù)據(jù)挖掘中,我們會都用到很多和概率、數(shù)理統(tǒng)計相關(guān)的知識點,的或多為隨機變量非盈利組織會計分布的位置、方差分析及回歸分析、貝葉斯理論等等。
要是沒有這些理論的支持,我們在接受建模和挖掘的過程中,就肯定直接出現(xiàn)會增大的偏差或者效率的低下。
線性代數(shù)
在大數(shù)據(jù)的應(yīng)用場景中,我們會把分析對象抽象概念下一界矩陣,而矩陣就會有轉(zhuǎn)置、向量等等公式應(yīng)用方法到我們的不好算場景中。奇特值分解SVD、PCA、NMF、MF等,都在大數(shù)據(jù)分析中廣泛應(yīng)用的分析法,因此,才能學(xué)好線性代數(shù),是對大數(shù)據(jù)有著有用的意義。
當然,理工類的專業(yè),大學(xué)基本上都會學(xué)線性代數(shù),大學(xué)學(xué)習(xí)的這些知識你比較熟練了,也就夠用了。
這部分的數(shù)學(xué)知識與大數(shù)據(jù)技術(shù)開發(fā)的關(guān)系也很親近,矩陣、轉(zhuǎn)置、秩分塊矩陣、向量、正交矩陣、向量空間、特征值與特征向量等在大數(shù)據(jù)建模、分析中又是具體用法的技術(shù)手段。
離散數(shù)學(xué)
離散數(shù)學(xué)是計算機科學(xué)的重要的是基礎(chǔ),自然重要性再清楚不過,大數(shù)據(jù)也是終究逃不過計算機科學(xué)的范疇,也就又是前提是學(xué)好的一門學(xué)科。
在看以后,會不會覺著很“簡單”,就ok啦,這樣的話你可以選擇好好學(xué)習(xí),天天向上了。
大數(shù)據(jù)怎么入門學(xué)習(xí)好?
大數(shù)據(jù)入了門簡單的方法要怎么學(xué)習(xí)javase,掌握了javase之后,好是再你學(xué)學(xué)javaee,如果不學(xué)的話,影響也又不是而且大。接下來要學(xué)的東西就比較好多了,主要是兩塊,一種是不聯(lián)網(wǎng)計算出,以hadoop為主,一種是實時計算,以spark,當然大數(shù)據(jù)不是一兩個技術(shù)的組合,而是一整套發(fā)下的生態(tài)系統(tǒng),因此要學(xué)的東西肯定很多的,大數(shù)據(jù)主要解決的是海量數(shù)據(jù)的存儲和計算問題,建議我還是把java能學(xué)好,而且很多大數(shù)據(jù)的軟件都是基于javac語言程序的,因為剛?cè)腴T大數(shù)據(jù)的話,個人建議先從java入門自學(xué)也很好!