做過(guò)網(wǎng)站排名的朋友們都知道要優(yōu)化關(guān)鍵詞百度關(guān)鍵詞搜索排名,優(yōu)化網(wǎng)站百度關(guān)鍵詞搜索排名,但是不知道文章發(fā)布被抓取后百度關(guān)鍵詞搜索排名,爬蟲(chóng)經(jīng)歷了什么百度關(guān)鍵詞搜索排名?為什么別人網(wǎng)站的排名比你高,為什么你的這個(gè)關(guān)鍵詞比別人排名高,如何能讓自己網(wǎng)站的關(guān)鍵詞能獲得一個(gè)好的排名,如何能讓搜索引擎更加青睞自己的網(wǎng)站,今天我們一起來(lái)學(xué)習(xí)一下網(wǎng)站文章被爬蟲(chóng)抓取后,百度搜索引擎是怎么給關(guān)鍵詞排名的呢?
我們作為一名Seoer,必須知道搜索引擎的工作原理,你只有知道搜索引擎的工作原理你才能更好的對(duì)此加以在網(wǎng)站優(yōu)化的過(guò)程中加以運(yùn)用。今天簡(jiǎn)單地在這里給大家分享一下搜索引擎的工作原理。
搜索引擎的工作原理
搜索引擎的工作過(guò)程大致可以劃分為三個(gè)步驟: 搜索引擎蜘蛛爬行和抓取數(shù)據(jù) 、 搜索引擎后臺(tái)預(yù)處理(索引)所收集的數(shù)據(jù) 、搜索引擎按照一定方式進(jìn)行網(wǎng)站(網(wǎng)頁(yè))的排名。
一、搜索引擎蜘蛛爬行和抓取數(shù)據(jù)
搜索引擎蜘蛛會(huì)爬行和抓取你網(wǎng)站上的數(shù)據(jù),首先我們要給搜索引擎一個(gè)入口,越多的搜索引擎的抓取入口就意味著越多的抓取機(jī)會(huì)。新站可以在百度,360搜索引擎提交網(wǎng)站,讓它更快知道你的存在。
為什么原創(chuàng)文章更利于搜索引擎的抓取,因?yàn)樗阉饕媾佬泻妥ト?shù)據(jù)的時(shí)候,搜索引擎會(huì)檢查內(nèi)容,并匹配本身數(shù)據(jù)庫(kù)存在的內(nèi)容,如果權(quán)重低的站大量轉(zhuǎn)載內(nèi)容,蜘蛛爬取后在數(shù)據(jù)庫(kù)中對(duì)比,不是原創(chuàng)沒(méi)有任何價(jià)值后,將不再來(lái)爬取你的網(wǎng)站,而且嚴(yán)重情況可能會(huì)懷疑作弊,給你網(wǎng)站降權(quán)或者不在百度中展示你的網(wǎng)站,你之前有的關(guān)鍵詞排名也美喲了。所以對(duì)于新站的一個(gè)建議是原創(chuàng)最好。
二、搜索引擎后臺(tái)預(yù)處理(索引)所收集的數(shù)據(jù)
1、提取網(wǎng)站內(nèi)容如文字等:對(duì)于搜索引擎在網(wǎng)站抓取的內(nèi)容進(jìn)行提取相關(guān)意義內(nèi)容,去掉一些不必要的標(biāo)簽等。
2、進(jìn)行中文分詞及去掉無(wú)用詞:把網(wǎng)頁(yè)中的文字進(jìn)行拆分、分詞,并且過(guò)濾掉文章中的一些無(wú)意義的詞,如“的、地”等
3、對(duì)內(nèi)容消除非重要內(nèi)容:去掉與意義內(nèi)容正文無(wú)關(guān)的文字如一些本身存在的回帖,發(fā)帖之類(lèi)
4、去掉網(wǎng)站重復(fù)內(nèi)容:多個(gè)一樣內(nèi)容的頁(yè)面,要從數(shù)據(jù)庫(kù)中刪除掉重復(fù)頁(yè)面和鏈接。
5、索引內(nèi)容:正向及反向索引,以鏈接出發(fā),對(duì)應(yīng)若干關(guān)鍵詞叫正向索引百度關(guān)鍵詞搜索排名;或者以關(guān)鍵詞出發(fā),對(duì)應(yīng)多個(gè)鏈接的方式叫反向索引。
6、鏈接關(guān)系計(jì)算:計(jì)算每個(gè)頁(yè)面有哪些導(dǎo)入頁(yè)面,導(dǎo)入錨文本關(guān)鍵詞,形成了頁(yè)面(鏈接)的權(quán)重(如PR),并存儲(chǔ)該權(quán)重的數(shù)值。
三、搜索引擎按照一定方式進(jìn)行網(wǎng)站(網(wǎng)頁(yè))的排名
1、搜索關(guān)鍵詞處理:對(duì)于搜索的詞進(jìn)行分詞、去掉無(wú)用字、拼寫(xiě)矯正、指令處理等
2、查找關(guān)鍵詞對(duì)應(yīng)鏈接集合:用第一步得出的分詞后的關(guān)鍵詞到反向索引表進(jìn)行查詢(xún),找到該詞對(duì)應(yīng)的所有鏈接
3、初始子集選擇:基于各頁(yè)面(鏈接)權(quán)重?cái)?shù)值高低,篩選一個(gè)適當(dāng)?shù)年P(guān)鍵詞對(duì)應(yīng)鏈接的子集(幾千或幾萬(wàn))。
4、相關(guān)性計(jì)算:看分詞關(guān)鍵詞的常用度(常用度低的詞搜索引擎更關(guān)注)、看詞出現(xiàn)頻率密度、關(guān)鍵詞的位置及形式(關(guān)鍵詞位置重要,如開(kāi)頭,結(jié)尾,H1中,粗體中等相關(guān)性高)、關(guān)鍵詞距離(距離小的相關(guān)性高)、外鏈錨文字相關(guān)性、外鏈源本身相關(guān)性及鏈接周?chē)淖郑ㄟ@個(gè)應(yīng)該是考慮的最多的,可能這個(gè)就能體現(xiàn)我們對(duì)我們外部?jī)?yōu)化的一些工作的要求)
5、排名過(guò)濾及調(diào)整:經(jīng)過(guò)前幾步,大體排名就已經(jīng)確定了。搜索引擎還會(huì)對(duì)結(jié)果集進(jìn)行一些過(guò)濾,對(duì)作弊及涉嫌作弊頁(yè)面,會(huì)放到集合最后。
6、將搜索的排名結(jié)果顯示:這個(gè)就不多解釋?zhuān)褪撬阉髦蟪尸F(xiàn)給你的結(jié)果。
7、搜索結(jié)果的緩存:搜索引擎排名出結(jié)果后,會(huì)對(duì)結(jié)果集進(jìn)行緩存,不必每次重新計(jì)算。
8、用戶查詢(xún)及點(diǎn)擊日志:日志文件中的數(shù)據(jù)對(duì)搜索引擎判斷搜索結(jié)果質(zhì)量,調(diào)整搜索算法,預(yù)期搜索趨勢(shì)等都有比較重要意義,甚至?xí)鶕?jù)用戶體驗(yàn)來(lái)反作用與排名結(jié)果。
以上就是“網(wǎng)站文章被爬蟲(chóng)抓取后,百度搜索引擎是怎么給關(guān)鍵詞排名的呢?”的全部?jī)?nèi)容,如果有沒(méi)有表達(dá)清楚的地方,歡迎大家留言,一起進(jìn)步。
掃描二維碼推送至手機(jī)訪問(wèn)。
版權(quán)聲明:本文由信途科技轉(zhuǎn)載于網(wǎng)絡(luò),如有侵權(quán)聯(lián)系站長(zhǎng)刪除。
轉(zhuǎn)載請(qǐng)注明出處http://macbookprostickers.com/xintu/51323.html