數據分析師用哪個數據庫比較好?
網友解答: 作為一個數據分析師來回答一下:我做這行兩年多了,剛開始的時候用的多是MySQL數據庫,當然,Oracle數據庫也會用到,尤其是在金融行業(yè)或者國企都用Oracle,一般的公司使
作為一個數據分析師來回答一下:
我做這行兩年多了,剛開始的時候用的多是MySQL數據庫,當然,Oracle數據庫也會用到,尤其是在金融行業(yè)或者國企都用Oracle,一般的公司使用MySQL數據庫,可能是因為MySQL數據庫免費吧。另外,在一家互聯(lián)網公司,我遇到了mongodb,目前一些新興的互聯(lián)網公司使用nosql的也比較多,這個當時是現學現賣的。作為一個數據分析師,可能對數據庫的使用一般是存取數據,至于更高級別的優(yōu)化、事務之類的,一般是使用不到的,有專門的數據庫人員,我們只要用好數據庫就好。
說道數據分析或者數據挖掘,除了數據庫來存取數據,我們還需要處理數據的工具,最趁手的當然是Python了。Python結合數據庫是日常的code,Python也提供了齊備的工具,針對MySQL的有pymysql庫,和oracle結合有cx_Oracle庫,和mongodb結合有pymongo庫,另外當然少不了我們的數據分析利器pandas庫了,提供了read_sql函數,支持各種數據庫,直接讀取成DataFrame的數據格式,十分的方便。
總結一下就是:其實遇到的大多數都是MySQL,oracle也有,這兩種都是sql語句,差別不大,只要掌握sql語句,這兩個數據庫問題都不大,mongodb是新興的非關系數據庫,語句也不是很復雜,之間上手工作也是無壓力的。結合Python中的pandas使用,讓你很溜的處理數據,數據分析也就得心應手了,小case了。
網友解答:這的看你需要分析的數據有多大了,M級隨便哪個庫,G級oracle或sql server, T級估計就的上hbase之類了,數據再大就麻煩了,如果你僅僅是分析有多少條,上面的請忽略。