最干凈的搜索引擎 中國十大搜索引擎排名?
最干凈的搜索引擎 有哪些全文搜索引擎?中國十大搜索引擎排名? 全文搜索引擎有: 1. Lucene Lucene開發(fā)語言是Java,也是Java家族中最著名的開源搜索引擎之一,Java
最干凈的搜索引擎

有哪些全文搜索引擎?
中國十大搜索引擎排名?
全文搜索引擎有:
1. Lucene
Lucene開發(fā)語言是Java,也是Java家族中最著名的開源搜索引擎之一,Java世界上已經(jīng)是標(biāo)準(zhǔn)的全文檢索程序了,它提供了完整的查詢引擎和索引引擎,沒有中文分詞引擎,需要自己去實現(xiàn),所以用Lucene做搜索引擎需要自己去架構(gòu).此外,它不支持實時搜索,但linkedin和twitter有分別對Lucene實時搜實時搜素. 其中Lucene有一個C 移植版叫CLucene,CLucene因為使用C 寫,所以理論上比較lucene快.
官方主頁:http://lucene.apache.org/
CLucene官方主頁:http://sourceforge.net/projects/clucene/
2. Sphinx
Sphinx是一個用C 語言寫的開源搜索引擎也是主流搜索引擎之一。與索引事件相比,Lucene索引文件比例快50%,Lucene大一倍,所以Sphinx索引的建立是空間交換事件的策略,在檢索速度、和諧、和諧、lucene差別不大,但檢索精度方面,Lucene要優(yōu)于Sphinx,另外,在加入中文分詞引擎的難度方面,Lucene要優(yōu)于Sphinx.其中Sphinx支持實時搜索,使用方便.
官方主頁:http://sphinxsearch.com/about/sphinx/
3. Xapian
Xapian是一個用C 編寫的全文檢索程序,api并且檢索原理和lucene很多方面都很像,算是填補了lucene在C 中的一個空缺.
官方主頁:http://xapian.org/
4. Nutch
Nutch是一個用java開源web包括爬蟲在內(nèi)的搜索引擎crawler,索引引擎,查詢引擎. 其中Nutch是基于Lucene的,Lucene為Nutch提供文本索引和搜索API.
應(yīng)使用Lucene還是使用Nutch,如果不需要抓取數(shù)據(jù),應(yīng)該使用Lucene,最常見的應(yīng)用是:你有數(shù)據(jù)源,需要為這些數(shù)據(jù)提供一個搜索頁面。在這種情況下,最好的方法是直接從數(shù)據(jù)庫中取出數(shù)據(jù),并使用它們Lucene API建立索引.
5. DataparkSearch
DataparkSearch是一個用C語言實現(xiàn)開源搜索引擎. 其中網(wǎng)頁排序采用神經(jīng)網(wǎng)絡(luò)模型. 其中支持HTTP,HTTPS,F(xiàn)TP,NNTP等下載網(wǎng)頁.包括索引擎、檢索引擎和中文分詞引擎(這也是唯一開源的搜索引擎中有中文分詞引擎).可以個性化定制搜索結(jié)果,有完整的日志記錄.
官方主頁:http://www.dataparksearch.org/
6. Zettair
Zettair是根據(jù)Justin Zobel基于研究成果的全文檢索實驗系統(tǒng).它是用C語言實現(xiàn)的. 其中Justin Zobel它在全文搜索領(lǐng)域非常有名,是業(yè)內(nèi)第一個系統(tǒng)提出倒排序索引差分壓縮算法的人。倒排列表的壓縮大大提高了檢索和加載的性能,空間膨脹率也降低到了非常好的水平. 由于Zettair代碼來自學(xué)術(shù)界,RMIT University搜索引擎組織寫的,所以它的代碼簡潔精致,算法高效,是學(xué)習(xí)反向索引經(jīng)典算法的非常好的例子. 其中支持linux,windows,mac os等系統(tǒng).
官方主頁:http://www.seg.rmit.edu.au/zettair/about.html
7. Indri
Indri是一個用C語言和C 語言寫的全文檢索引擎系統(tǒng),由University of Massachusetts和Carnegie Mellon University開源項目合作推出. 特點是跨平臺,API接口支持Java,PHP,C .
官方主頁:http://www.lemurproject.org/indri/
8. Terrier
Terrier是由School of Computing Science,Universityof Glasgow用java全文檢索系統(tǒng)的開發(fā).
官方主頁:http://terrier.org/
9. Galago
Galago是一個用java關(guān)于文本搜索的語言寫作工具集. 包括索引擎和查詢引擎,還包括一個叫做TupleFlow分布式計算框架(和google的MapReduce很像).這個檢索系統(tǒng)支持很多Indri查詢語言.
官方主頁:http://www.galagosearch.org/
10. Zebra
Zebra是一個用C語言檢索程序的特點是支持大數(shù)據(jù),支持EMAIL,XML,MARC等格式數(shù)據(jù).
官方主頁:https://www.indexdata.com/zebra
11. Solr
Solr是一個用java開發(fā)的獨立企業(yè)級搜索應(yīng)用服務(wù)器,它提供了類似的企業(yè)級搜索應(yīng)用服務(wù)器Web-service的API接口,它是基于的Lucene全文檢索服務(wù)器,也算是Lucene很多一線互聯(lián)網(wǎng)公司都在使用一個變種Solr,也算是一種成熟的解決方案.
官方主頁:http://lucene.apache.org/solr/
12. Elasticsearch
Elasticsearch是一個采用java基于語言開發(fā)Lucene開源結(jié)構(gòu),分布式搜索引擎. 設(shè)計用于云計算,能實現(xiàn)實時搜索,穩(wěn)定可靠. Elasticsearch數(shù)據(jù)模型是JSON.
官方主頁:http://www.elasticsearch.org/
13. Whoosh
Whoosh是一個用純python開源搜索引擎.
官方主頁:https://bitbucket.org/mchaput/whoosh/wiki/Home
誰推薦一個好用干凈的網(wǎng)站導(dǎo)航?
蜘蛛網(wǎng)站導(dǎo)航 這個網(wǎng)站頁面清爽干凈,沒有討厭的廣告 值得推薦。 是我遇到的最好的網(wǎng)站導(dǎo)航站。他們網(wǎng)站的口號是蜘蛛網(wǎng)站導(dǎo)航,安全、實用、干凈。!網(wǎng)站上沒有廣告 頁面干凈清爽 你可以試試 網(wǎng)站頂部有各種搜索引擎的搜索框 搜索信息也很方便。我一直把這個網(wǎng)站設(shè)置為瀏覽器主頁