在一些站長群里面,很多站長會和博主一樣常常會聽到一種聲音,我每天都在寫原創文章,可是關鍵詞什么排名都沒有。似乎大家聽慣了這種聲音,認為做SEO就是看百度的臉色,侃侃而過。當然,也有站長會支招,除了寫優質原創內容,也要提升網頁關鍵詞密度,網頁關鍵詞密度控制在2%-8%之間,然后分析關鍵詞布局,首段和結尾一般會出現關鍵詞。這些文章SEO寫作技巧已被眾多站長所接受,很多站長也套用此方法去優化自己的網頁。這些大多是前人的經驗之談,其中卻存在了很多SEO站長不知道的原理,作為一名SEO工作者,我們應該有探索精神,下面尹華峰SEO博客做個淺析。
百度如何判斷頁面與關鍵詞的相關度
一個網頁是否和關鍵詞相匹配,首先SEO站長要明白兩個概念,一個是詞頻,一個是密度。搜索引擎剛發展的時候,很多站長都知道堆積關鍵詞就可以輕松獲取排名,這就是詞頻。顯然這個算法是有弊端的,所以衍生出密度這個說法,密度的出現對關鍵詞堆積的行為有了一定的遏制。
上面說到詞頻這個概念,我們要了解一種統計方法TF-IDF。TF就是詞頻 (temfrequency),IDF是逆文檔頻率(inverse document frequency)。針對一個特定關鍵詞,包含這個關鍵詞的文件數量除以數據庫文件總數,得到這個詞的文件頻率。反過來,文件總數除以包含這個詞的文件數量(通常真正計算時還要取對數) ,就得到逆文檔頻率。所以,語言中越常見的詞,包含這個詞的文件數越多,文件頻率也就越高,逆文檔頻率越低。
逆文檔頻率代表了這個詞的語義重要性或者說區別文件的能力。舉例來說,“的”通常在所有文件中出現,文件頻率極高,逆文檔頻率極低,也就是“的”這個詞的語義重要性很低,幾乎無法用來代表和區別文件內容。“搜索引擎”這個詞只出現在一小部分文件中,逆文檔頻率要高得多,對文件內容來說重要性要高得多。
搜索引擎在判定頁面與什么關鍵詞更相關時,不是單純考慮詞頻,而是計算詞頻乘以逆文檔頻率,也就是TF-IDF。逆文檔頻率低,即使詞頻高,頁面與關鍵詞相關性還是不高。舉個例子,如果要優化“新加坡旅游”這個詞組,在百度搜索“新加坡”返回27600000個結果,搜索“旅游”返回100000000個結果,包含“新加坡”的文件數遠小于包含“旅游”的文件數,百度數據庫的文件總數是固定的,所以“新加坡”的逆文檔頻率大于“旅游”。或者換句話說,“新加坡”這個詞在區別、辨識文件能力上比“旅游”這個詞要高。在優化文案時,增加“旅游”出現次數就沒有增加“新加坡”次數更有效。
分析SEO站長如何寫作文章
說到文章寫作,原創是做受歡迎的,要突出內容的差異化,并且符合用戶的需求,這些可謂老生常談。這里博主只談下關鍵詞的在網頁的布局,提升百度搜索引擎判斷網頁與關鍵詞的相關度。
1、網頁標題優化
網頁最基礎的三要素是title、keywords和description,這三個標簽可以最直接告訴百度網頁所表達的是什么內容,而標題title被賦予的分值是最高的,在寫title時切記要包含優化的目標關鍵詞,可以做到用戶在搜索時直接匹配關鍵詞。當然,標題不宜太長,能夠概括文章主旨即可。
2、正文關鍵詞匹配
正文內容輸出要自然,在進行SEO寫作時要對關鍵詞做個簡要分析,自己是否完全理解了關鍵詞的含義,自己是否能夠組織語言寫篇文章出來,能寫出來最好,寫不出來可以先閱讀他人的文章然后用自己的語言來表達。即便是自然寫作,正文首段和尾段至少要出現一次關鍵詞,如果是生僻的關鍵詞,在文中也可以對其進行釋義,若出現其他網頁的關鍵詞時,還可以給關鍵詞設置錨文本指向該網頁,可以更好提升網站整體關鍵詞的相關性匹配。
3、相關文章的聚合
除了以上兩點,我們還可以添加相關性文章閱讀和tag標簽,幫助搜索引擎判斷當前網頁屬于什么范疇,相關度高的文章也可以起到一個輔助的作用,對網頁和關鍵詞相關度匹配還是極有幫助的。
結語:當然,以上是簡單的一個理論分析,寫這篇文章只是作為一個啟發。真實的百度搜索引擎在計算相關性時比簡單計算復雜得多 ,其實文章關鍵詞的密度保持多少是沒有定論的,SEO或編輯在進行文章寫作時,完全沒必要考慮這么多。還是那句話,只要自然寫作,關鍵詞必然會自然融入,就足夠了。