lstm神經網絡原理 是否存在通用的神經網絡模型,可以處理圖像,語音以及NLP?
是否存在通用的神經網絡模型,可以處理圖像,語音以及NLP?對于目前的深度學習模型來說,盡管深度學習的一個目標是設計能夠處理各種任務的算法,然而截至目前深度學習的應用仍然需要一定程度的特化,還沒有通用的
是否存在通用的神經網絡模型,可以處理圖像,語音以及NLP?
對于目前的深度學習模型來說,盡管深度學習的一個目標是設計能夠處理各種任務的算法,然而截至目前深度學習的應用仍然需要一定程度的特化,還沒有通用的神經網絡處理模型。不過各個模型也在互相借鑒,彼此融合,共同提高,象有些創(chuàng)新能同時改進卷積神經網絡和循環(huán)神經網絡,比如批標準化與注意力等。通用的模型還有待未來研究提出。
圖像和視頻處理,計算機視覺,目前最流行的是cnn,即卷積神經網絡,及其變形和發(fā)展,cnn適合處理空間數據,在計算機視覺領域應用廣泛。象陸續(xù)出現的AlexNet,VGGNet,GoogLeNet,ResNet等都很有特色。以上幾種模型是圖像分類識別使用的。象圖像分割,目標檢測等還有更多針對性模型提出和得到廣泛應用。
語音處理,2012 年前,最先進的語音識別系統(tǒng)是隱馬爾可夫模型(HMM) 和高斯混合模型(GMM) 的結合。目前最流行的是深度學習的RNN循環(huán)神經網絡,及其發(fā)展長短時記憶網絡LSTM,以及GRU,雙向RNN,分層RNN等。
自然語言處理,除了傳統(tǒng)方法,目前深度學習用于自然語言處理的模型經歷了基于CNN的模型,基于RNN的模型,基于Attention機制的模型,基于Transformer的模型等幾個發(fā)展階段。NLP有很多模型和方法,不同的任務場景有不同的模型和策略來解決某些問題。