python數(shù)據(jù)分析如何進行數(shù)據(jù)的歸一化處理？

2021-03-15

1891

如何進行數(shù)據(jù)的歸一化處理？第一個問題，測試集的歸一化的均值和標準偏差應(yīng)該來源于訓(xùn)練集。如果你熟悉Python的sklearn的話，你就應(yīng)該知道應(yīng)該先對訓(xùn)練集數(shù)據(jù)fit，得到包含均值和標準偏差的scal

如何進行數(shù)據(jù)的歸一化處理？

第一個問題，測試集的歸一化的均值和標準偏差應(yīng)該來源于訓(xùn)練集。如果你熟悉Python的sklearn的話，你就應(yīng)該知道應(yīng)該先對訓(xùn)練集數(shù)據(jù)fit，得到包含均值和標準偏差的scaler，然后再分別對訓(xùn)練集和驗證集transform。這個問題其實很好，很多人不注意，最容易犯的錯誤就是先歸一化，再劃分訓(xùn)練測試集。

第二個問題，是均值方差歸一化，最大最小歸一化等不同歸一化的選擇問題。歸一化的目的無非調(diào)整各個字段之間的數(shù)量級差異。均值方差歸一化可能更適合你不知道數(shù)據(jù)的邊界在哪里，最大最小歸一化相當于整合到01之間，這相當于你是知道這個字段的邊界在哪里。所以我個人更傾向于均值方差歸一化。這個問題我只是經(jīng)驗之談，不一定對。

我不是一個IT行業(yè)人，我想了解人工智能究竟是怎么實現(xiàn)的，或者說實現(xiàn)的方向，怎么做最接近？

人工智能就是模擬人類的。所以主要還是通過視頻，圖像和音頻輸入。像小度那樣的機器人，肯定是裝有攝像頭來識別人臉，有拾音器來辨別聲音。具體的，本質(zhì)上是人臉的半結(jié)構(gòu)化特征的提取，和聲紋的半結(jié)構(gòu)化特征提取，然后在后臺的特征數(shù)據(jù)集進行比對的結(jié)果。在這之前，分別需要對千萬級的人臉和聲紋數(shù)據(jù)進行模型訓(xùn)練，“教會”機器人怎么去檢測人臉和聲紋，怎么去提取特征，這個過程可以就是基于深度學習網(wǎng)絡(luò)的訓(xùn)練過程，而深度學習網(wǎng)絡(luò)是模擬人腦的一種神經(jīng)網(wǎng)絡(luò)?，F(xiàn)在比較流行的深度學習網(wǎng)絡(luò)的訓(xùn)練框架有caffe，TensorFlow等，流行的語言有python，c ，c等。想學的話，先百度一下我上面提到的所有不太理解的那些名詞吧，弄懂概念后才能繼續(xù)。

成人AV在线无码|婷婷五月激情色,|伊人加勒比二三四区|国产一区激情都市|亚洲AV无码电影|日av韩av无码|天堂在线亚洲Av|无码一区二区影院|成人无码毛片AV|超碰在线看中文字幕

如何進行數(shù)據(jù)的歸一化處理？

我不是一個IT行業(yè)人，我想了解人工智能究竟是怎么實現(xiàn)的，或者說實現(xiàn)的方向，怎么做最接近？

相關(guān)推薦

如何進行數(shù)據(jù)的歸一化處理？

我不是一個IT行業(yè)人，我想了解人工智能究竟是怎么實現(xiàn)的，或者說實現(xiàn)的方向，怎么做最接近？