python關(guān)聯(lián)規(guī)則挖掘 apriori算法python包
數(shù)據(jù)關(guān)聯(lián)是數(shù)據(jù)庫中一種重要的可發(fā)現(xiàn)知識。如果兩個或多個變量的值之間存在某種規(guī)律性,則稱為關(guān)聯(lián)。關(guān)聯(lián)可以分為簡單關(guān)聯(lián)、時間關(guān)聯(lián)和因果關(guān)聯(lián)。關(guān)聯(lián)分析的目的是找出數(shù)據(jù)庫中隱藏的關(guān)聯(lián)網(wǎng)絡(luò)。有時數(shù)據(jù)庫中數(shù)據(jù)的關(guān)
數(shù)據(jù)關(guān)聯(lián)是數(shù)據(jù)庫中一種重要的可發(fā)現(xiàn)知識。
如果兩個或多個變量的值之間存在某種規(guī)律性,則稱為關(guān)聯(lián)。
關(guān)聯(lián)可以分為簡單關(guān)聯(lián)、時間關(guān)聯(lián)和因果關(guān)聯(lián)。
關(guān)聯(lián)分析的目的是找出數(shù)據(jù)庫中隱藏的關(guān)聯(lián)網(wǎng)絡(luò)。
有時數(shù)據(jù)庫中數(shù)據(jù)的關(guān)聯(lián)函數(shù)是未知的,即使是已知的,也是不確定的,因此關(guān)聯(lián)分析生成的規(guī)則具有可信性。
關(guān)聯(lián)規(guī)則挖掘在大量數(shù)據(jù)中查找項(xiàng)集之間有趣的關(guān)聯(lián)或相關(guān)性。
1993年,Agrawal首次提出在客戶事務(wù)數(shù)據(jù)庫中挖掘項(xiàng)目集之間關(guān)聯(lián)規(guī)則的問題。后來,許多研究者對關(guān)聯(lián)規(guī)則的挖掘問題做了大量的研究。
他們的工作包括對原有算法的優(yōu)化,如引入隨機(jī)抽樣、并行思想等,以提高算法挖掘規(guī)則的效率,促進(jìn)關(guān)聯(lián)規(guī)則的應(yīng)用。
關(guān)聯(lián)規(guī)則挖掘是數(shù)據(jù)挖掘中的一個重要課題,近年來得到了廣泛的研究。