pandas明明已經(jīng)安裝還是報(bào)錯(cuò) Python提示No module named pandas解決方法?
Python提示No module named pandas解決方法?Python運(yùn)行錯(cuò)誤沒(méi)有名為configparser的模塊是設(shè)置錯(cuò)誤導(dǎo)致的,解決方法是:1.根據(jù)提示,Python缺少rar模塊。
Python提示No module named pandas解決方法?
Python運(yùn)行錯(cuò)誤沒(méi)有名為configparser的模塊是設(shè)置錯(cuò)誤導(dǎo)致的,解決方法是:
1.根據(jù)提示,Python缺少rar模塊。在這種情況下,你應(yīng)該先在py官網(wǎng)下載rarfile壓縮包,比如rarfile-3.1.tar.gz,如下圖所示。
2.首先運(yùn)行-cmd,如下圖所示。
3.然后打開(kāi)rarfile的路徑,比如:CDC : users administrator desktop ython。
Arfile-3.1,如下圖所示。
4.然后輸入:Python install,回車(chē)安裝rar模塊,如下圖所示。
5.然后,安裝完成,如下圖所示。如果這一步出現(xiàn)錯(cuò)誤,可能是沒(méi)有安裝Python或者沒(méi)有配置Python環(huán)境,如下圖所示。
6.最后重新打開(kāi)cmd,先輸入Python,回車(chē),再輸入import rarfil
如何上手使用科學(xué)計(jì)算庫(kù)Numpy?
當(dāng)我們使用Python進(jìn)行數(shù)據(jù)分析時(shí),有時(shí)我們可能需要根據(jù)數(shù)據(jù)幀中其他列的值向Pandas數(shù)據(jù)幀中添加一列。
雖然這聽(tīng)起來(lái)很簡(jiǎn)單,但是如果我們嘗試使用if-else條件語(yǔ)句,可能會(huì)變得有點(diǎn)復(fù)雜。幸運(yùn)的是,有一個(gè)簡(jiǎn)單而好的方法可以用numpy做到這一點(diǎn)!
要學(xué)習(xí)如何使用它,讓 讓我們來(lái)看一個(gè)具體的數(shù)據(jù)分析問(wèn)題。我們有超過(guò)4000條AAA教育推文的數(shù)據(jù)集。帶有圖片的推文會(huì)獲得更多的贊和轉(zhuǎn)發(fā)嗎?讓 讓我們做一些分析來(lái)找出答案!
我們將從導(dǎo)入pandas和numpy并加載數(shù)據(jù)集開(kāi)始,看看它是什么樣子的。
我們可以看到,我們的數(shù)據(jù)集包含了每條推文的一些信息,包括:
1)日期——推文發(fā)布的日期。
2)時(shí)間——推文發(fā)出的時(shí)間。
3)tweet-tweet的實(shí)際文本
4)提及——推文中提到的任何其他Twitter用戶。
5)照片——推文中包含的任何圖片的URL。
6)replies _ count——推文上的回復(fù)數(shù)量
7 7)retweets _ count-轉(zhuǎn)發(fā)的推文數(shù)量
8)likes _ count——推文上的贊數(shù)。
我們還可以看到照片數(shù)據(jù)的格式有點(diǎn)奇怪。
使用np.where()添加具有正確/錯(cuò)誤條件的pandas列。
為了我們的分析,我們只想看錄像帶。帶圖片的推文是否能獲得更多的互動(dòng),所以我們不 實(shí)際上不需要圖像URL。讓 我們嘗試創(chuàng)建一個(gè)名為hasimage的新列,它將包含布爾值——如果tweet包含圖像,則為T(mén)rue如果不包含圖像,則為False。
為此,我們將使用numpy的內(nèi)置where()函數(shù)。這個(gè)函數(shù)依次接受三個(gè)參數(shù):我們要測(cè)試的條件,當(dāng)條件為真時(shí)分配給新列的值,當(dāng)條件為假時(shí)分配給新列的值。看起來(lái)是這樣的:
在我們的數(shù)據(jù)中,我們可以看到?jīng)]有圖片的推文在這個(gè)照片列中總是有值的。我們可以使用這些信息和np.where()創(chuàng)建一個(gè)新的列hasimage,如下所示:
在頂部,我們可以看到我們的新列已被添加到我們的數(shù)據(jù)集,并且推文已被正確標(biāo)記,包括圖像是真的,其他圖像是假的。
現(xiàn)在我們有了hasimage專(zhuān)欄,讓 讓我們快速創(chuàng)建幾個(gè)新的數(shù)據(jù)幀,一個(gè)用于所有圖片推文,一個(gè)用于所有非圖片推文。我們將使用布爾過(guò)濾器來(lái)做到這一點(diǎn):
現(xiàn)在我們已經(jīng)創(chuàng)建了這些,我們可以使用內(nèi)置的數(shù)學(xué)函數(shù)。mean()快速比較每個(gè)數(shù)據(jù)幀中的推文。
我們將使用print()語(yǔ)句使結(jié)果更容易閱讀。我們還需要記住使用str()來(lái)轉(zhuǎn)換的計(jì)算結(jié)果。mean()轉(zhuǎn)換成一個(gè)字符串,以便我們可以在打印的語(yǔ)句中使用它:
根據(jù)這些結(jié)果,似乎在AAA教育中包含圖像可能會(huì)促進(jìn)更多社交媒體的交互。有圖推文的平均贊數(shù)和轉(zhuǎn)發(fā)數(shù)是無(wú)圖推文的3倍。
添加具有更復(fù)雜條件的熊貓列
這種方法效果很好,但是如果我們要添加一個(gè)條件更復(fù)雜的新列(超出True和False的條件)怎么辦?
例如,為了更深入地研究這個(gè)問(wèn)題,我們可能希望創(chuàng)建一些交互式 "層與并評(píng)估推文到達(dá)每一層的百分比。為了簡(jiǎn)單起見(jiàn),讓 的用戶喜歡衡量互動(dòng)性,并將推文分為四個(gè)級(jí)別:
1)tier_4 -2或更少的喜歡
2) Tier _ 3-3-9喜歡
3) Tier _ 2-10-15喜歡
4) Tier _ 1-16喜歡
為此,我們可以使用一個(gè)名為()的函數(shù)。我們給它兩個(gè)參數(shù):一個(gè)條件列表和一個(gè)對(duì)應(yīng)的值列表,我們希望將這些值分配給新列中的每一行。
這意味著順序很重要:如果條件滿足列表中的第一個(gè)條件,列表中的第一個(gè)值將被分配給該行的新列。大數(shù)據(jù)分析在熊貓datafra中使用numpy如果滿足第二個(gè)條件,向me添加一個(gè)列將分配第二個(gè)值,依此類(lèi)推。
讓 讓我們看看它在Python代碼中的樣子:
干得好!我們創(chuàng)建了另一個(gè)新的專(zhuān)欄,根據(jù)我們的分級(jí)排名系統(tǒng)(盡管有些武斷)對(duì)每條推文進(jìn)行分類(lèi)。
現(xiàn)在,我們可以用它來(lái)回答更多關(guān)于數(shù)據(jù)集的問(wèn)題。例如,1級(jí)和4級(jí)推文中有圖像的比例是多少?
在這里,我們可以看到,雖然圖像似乎是有幫助的,他們不 這似乎不是成功的必要條件。
雖然這是一個(gè)非常膚淺的分析,但是我們已經(jīng)實(shí)現(xiàn)了我們真正的目標(biāo):根據(jù)關(guān)于現(xiàn)有列中的值的條件語(yǔ)句向pandas DataFrames添加列。
當(dāng)然,這是一項(xiàng)可以通過(guò)多種完成的任務(wù)。其中()和()只是兩個(gè)潛在的方法。