搜索引擎如何判斷頁面的核心關(guān)鍵詞




搜索引擎判斷頁面的核心關(guān)鍵詞時(shí),會(huì)比較注重頁面的title、H標(biāo)簽、內(nèi)容中加粗變色的標(biāo)簽、主題內(nèi)容靠前部分中關(guān)鍵詞出現(xiàn)的頻率等,但這些并不是搜索引擎判斷頁面關(guān)鍵詞的主要渠道,而是參考而已。
從在采集內(nèi)容中硬性加入關(guān)鍵詞,單純以頁面的幾個(gè)重要地方著重關(guān)鍵詞和硬性提升內(nèi)容中關(guān)鍵詞密度的所謂“偽原創(chuàng)”已經(jīng)失效,就可以了解到搜索引擎并不是根據(jù)大眾seo所注重的幾個(gè)地方來判斷頁面的關(guān)鍵詞的?! №撁娴年P(guān)鍵詞布局方面,可參看鋼模板站點(diǎn)。
搜索引擎判斷一個(gè)頁面的核心關(guān)鍵詞的流程是:
1、抽取頁面內(nèi)容部分,對(duì)內(nèi)容進(jìn)行分詞處理;
2、根據(jù)各個(gè)關(guān)鍵詞在頁面中的頻率以及在全網(wǎng)的頻率來判斷哪些詞該是頁面的主要關(guān)鍵詞,這里一般使用的是TF-IDF及其改進(jìn)的搜索算法。
3、根據(jù)更為先進(jìn)的語義識(shí)別算法進(jìn)行判斷。
4、把頁面title、H標(biāo)簽、內(nèi)容開頭部分內(nèi)容,有時(shí)候就是內(nèi)容的第一句話,內(nèi)容中加粗變色文字中所提取的關(guān)鍵詞與其他算法綜合運(yùn)用來進(jìn)行判斷,從而計(jì)算出頁面的關(guān)鍵詞