AlphaGo戰(zhàn)勝柯潔,證明了人工智能的長足發(fā)展即將從量變到質(zhì)變,阿爾法狗打敗柯潔其實是在預料之中的事,人工智能可以在海量數(shù)據(jù)中找出規(guī)律。近年來,人工智能在人臉識別、機器翻譯等領(lǐng)域被廣泛應用。我們都知道谷歌是一家搜索科技為主的公司,人工智能的發(fā)展勢必應用于搜索引擎。SEO技術(shù)隨時都會變革,在這里我們先領(lǐng)略下SEO前輩是怎么看待人工智能未來對搜索引擎的影響。
這位前輩就是昝輝,也許你更多的是關(guān)注他的《SEO每日一貼》,下面是ZAC大神的筆記,非常具有前瞻性。
關(guān)于未來兩三年的SEO趨勢,我談以下幾點:
1、未來兩三年,人工智能可能全面影響SEO領(lǐng)域:
只有互聯(lián)網(wǎng)公司才能實現(xiàn)的勝利
深度學習的意義在于實現(xiàn)“無人監(jiān)督的學習”
深度學習系統(tǒng)應用于搜索會怎么樣?
未來,系統(tǒng)將自己去思想,自已去琢磨哪些因素最終決定網(wǎng)站的質(zhì)量
2、關(guān)鍵詞相關(guān)性計算相對于傳統(tǒng)的改變:
語義分析是一種相關(guān)性判斷的新思路
它對未來的影響包括:寫作方式,文章長度、內(nèi)容深度
3、人工智能下的SEO,將促使網(wǎng)站不求大,而求內(nèi)容強
4、在深度學習的邏輯下,未來體現(xiàn)用戶體驗的每一個環(huán)節(jié),都可能被納入SEO的判斷因素。
“點石互動”成立到現(xiàn)在已經(jīng)第十個年頭了。十年前我們四個人成立點石的時候,他們幾個才20幾歲,也就我30多歲。在那之前我們互相連面都沒見過,只是在MSN聊天特別投緣,熱情一來就聯(lián)合開SEO博客。那年秋天,我們在北京組織了第一次SEO分享會,一轉(zhuǎn)眼就是十年。
關(guān)于SEO,通常我們在網(wǎng)上,或者看書的時候,內(nèi)容主要涉及的是基本SEO概念和技巧。但我希望做SEO的人,有時候停下來,看看世界,看看未來怎么走,大方向怎么走。
比如做網(wǎng)站的,假如在今天你有一批15年的老域名,那你現(xiàn)在可能做得很輕松,因為那時候有多少人想得到現(xiàn)在的情景,而且即使當時你擁有這些域名,還要一直維護著它。那么現(xiàn)在,我們是不是仍有機會看到未來10年需要怎么做?我想應該還有的。
關(guān)于未來兩三年的SEO趨勢,我今天談以下四點:
第一,人工智能可能全面影響SEO
1、只有互聯(lián)網(wǎng)公司才能實現(xiàn)的勝利。
上個月李世石和AlphaGo的圍棋大戰(zhàn),李世石以1:4不敵人工智能的機器人。賽前預測時,多數(shù)言論認為機器勝算不大,包括棋圣聶衛(wèi)平在賽前也認為電腦存在不可逾越的技術(shù)障礙,電腦完全無法戰(zhàn)勝人腦。但當時我就在博客上寫了有戰(zhàn)勝的可能勝,因為谷歌所用的人工智能下棋原理跟我們通常所想象的下棋方法完全不一樣。
當年IBM的電腦深藍打敗卡斯帕羅夫時,那時的算法和現(xiàn)在是不一樣的。國際象棋可以用窮舉的暴力算法來計算每一步的后續(xù)可能性。而圍棋的困難在于不可能進行窮舉,對美一種可能性進行計算的話,其可能性超過全宇宙的原子數(shù)量。
另外,象棋每個子有相對容易賦值的子力,車馬炮都各自有規(guī)定的走法和優(yōu)勢。但圍棋不一樣,棋手落的每一個字可能是廢子,可能被提掉,但也可能隨著棋局變化變成手筋,因此沒法對它的每一個子賦值。
那么,它是怎么完勝了人類的?為什么是Google,而不是傳統(tǒng)的科技公司?因為當今最高端、最復雜的計算系統(tǒng)是在百度、Google,基本上只有互聯(lián)網(wǎng)公司才有這個能力完成這種計算。
AlphaGo的算法分為兩部分:
一是Policy network,即落子部分,刪選出有利但有限的地方來落子;
另一種則是Value network,對局勢進行判斷的系統(tǒng)。判斷當前的棋局形勢如何,它不是按既定的圍棋規(guī)則,也不是按人類棋手的技術(shù)去的,而是將歷史上過往巨量棋局輸入服務器,系統(tǒng)知道每盤棋的所有過程和最終誰勝利,因而人工智能系統(tǒng)在實戰(zhàn)時計算的是大數(shù)據(jù)支撐下某種局勢下勝率是多少。局勢判斷系統(tǒng)才是AlphaGo決勝的關(guān)鍵。
這就是深度學習帶來的。
2、深度學習的很大意義在于實現(xiàn)“無人監(jiān)督的學習”。
有監(jiān)督的學習,是事先人為設定決定因素。比如我要建立一個廈門房價計算系統(tǒng),我可以會輸入面積、價格、朝向、區(qū)域等我們認為相關(guān)的因素,然后系統(tǒng)會根據(jù)這些計算出規(guī)律。未來,當我給出相應的條件,系統(tǒng)就能預測出房價。
無人監(jiān)督的深度學習下,你只需告訴系統(tǒng)大量數(shù)據(jù),不需要告訴系統(tǒng)結(jié)果由什么因素決定,讓系統(tǒng)自己去學習。系統(tǒng)學習的過程對人來講是個黑箱,它可能會加入一些平常我們想象不到的因素。還是房價系統(tǒng)的例子,如果我們只是輸入所有交易相關(guān)的數(shù)據(jù),讓系統(tǒng)自己去學習,它可能會加入我們想不到的因素,比如天氣對成交的影響,也許是年齡、性別對成交的影響。
而且人工智能系統(tǒng)能進行自我訓練,也就是自己跟自己對局。
3、深度學習系統(tǒng)應用于搜索會怎么樣?
當前搜索引擎辨別高質(zhì)量網(wǎng)站靠的是數(shù)據(jù)+人工。數(shù)據(jù)搜索引擎都會有網(wǎng)站的所有數(shù)據(jù),還包括關(guān)鍵詞布局,點擊方式、訪問方式這些判斷因素,這些數(shù)據(jù),他們都有,但哪些是真正高質(zhì)量網(wǎng)站,系統(tǒng)不一定知道。
Google就有一批人工監(jiān)測員來評估網(wǎng)站質(zhì)量。他們3月份剛剛發(fā)布一份質(zhì)量指南,告訴這些監(jiān)測員,你應該怎么去判斷這個網(wǎng)站,通過人工打分,把網(wǎng)站分成五級;蛄信e搜索的10個結(jié)果,讓人工去看,這樣的判斷跟用戶的判斷高度吻合,因為檢測員就是普通用戶。將這兩方面數(shù)據(jù)結(jié)合,Google就有辦法通過深度學習準確地評測網(wǎng)站的質(zhì)量。
4、未來,系統(tǒng)將自己去思想,自已去琢磨哪些因素最終決定網(wǎng)站的質(zhì)量。
a.規(guī)則為基礎的算法會被人工智能的黑箱取代;
b.系統(tǒng)工程師也不知道排名因素和權(quán)重——我們只知道輸入,結(jié)果,但過程中系統(tǒng)所采用的因素到底是什么可能誰也沒想到;
c.鉆空子會變得非常困難。因為你是在跟一位13段棋手在對戰(zhàn),只要有輸入,就會有輸出,這種算法可能運用在任何領(lǐng)域,它具有全世界第一的判斷力,比人的水平還高;
d.Panda,penguin算法很可能已經(jīng)用到了人工智能。雖然google沒有官方確認。目前應該還沒有大規(guī)模的使用在搜索引擎中,但未來必然會大規(guī)模應用。
(備注:google推出Google Panda,即熊貓算法,旨在反垃圾,保護原創(chuàng)。2012年4月24號周二,谷歌推出新的算法更新方案,代號“Penguin Update”。Penguin,直譯為企鵝,是谷歌繼2011年2月24號發(fā)布的“熊貓”之后再次推出的新算法調(diào)整。)
e.百度也有人工智能。百度和google比基本上是落后兩三年,研究google基本上等于研究未來兩到三年的百度。
第二,關(guān)鍵詞相關(guān)性計算相對于傳統(tǒng)的改變
傳統(tǒng)的關(guān)鍵詞排名算法基本邏輯是這樣的:
如果關(guān)鍵詞在所有文件中都出現(xiàn),意味著關(guān)鍵詞對文件的額區(qū)別能力非常小,基本為零,比如助詞“的地得”。
如果有些詞,只在比較少的一部分文件中出現(xiàn),被人為對相關(guān)性計算的意義較大。
1、語義分析是一種相關(guān)性判斷的新思路。
某些相關(guān)文件傾向于使用語義相關(guān)的詞,比如談減肥的文章中經(jīng)常出現(xiàn)卡路里,有氧運動,跳繩等,有時會出現(xiàn)羽毛球。林丹離羽毛球近點,離運動、有氧有一定距離,離減肥就更遠。
這樣的計算邏輯下,如果一篇談減肥的文章沒有提到有氧運到,系統(tǒng)可能會認為它跟減肥的相關(guān)性實際上低一些,雖然減肥這個詞大量出現(xiàn)。按這種判斷邏輯, 如果你減肥寫兩篇貼子,分別在一篇談飲食,另一篇談有氧,系統(tǒng)就會認為第一篇文章跟減肥相關(guān)性低一些,或者認為不是真正的減肥專家寫出的東西。
2、它對未來的影響包括:寫作方式,文章長度、內(nèi)容深度,關(guān)鍵詞分配方式,網(wǎng)站結(jié)構(gòu)等。
未來的內(nèi)容可能必須要寫得長,內(nèi)容必須要寫得更有深度,要不然你可能提不到語義相關(guān)關(guān)鍵詞。
百度百科、知乎的自然流量排名都非常高。知乎類文章都是專家寫的,都是有深度的文章。
關(guān)鍵詞的分配方式變了,做網(wǎng)站的思路也變了,以前網(wǎng)站可能想做大點,頁面要多,每個關(guān)鍵詞都配上文章。
以后,則需要更強、更緊湊。不要想每個關(guān)鍵詞都配文章,而是怎么把文章寫得更有深度,覆蓋更多詞。
第三,頁面數(shù)據(jù)與用戶體驗數(shù)據(jù)結(jié)合
我們通常認為用戶訪問數(shù)據(jù)的噪聲較大,因為這上面比較容易做弊,比如早些年就出現(xiàn)過針對百度的頁面點擊工具來騙取更高的搜索排名。雖然谷歌和百度都沒有明確承認 ,但當前在搜索引擎的算法中頁面點擊率應該是個因素。
在有了人工智能系統(tǒng)的情況下,這種情況將會改觀。用戶訪問數(shù)據(jù)會更有用,因為系統(tǒng)會綜合看很多條件,包括用戶是誰,在什么條件下點擊,輸入什么關(guān)鍵詞,于是噪聲問題就有可能被消除了。
第四,頁面數(shù)據(jù)與用戶體驗數(shù)據(jù)結(jié)合
在人工智能普及下,用戶體驗也是SEO。
在深度學習的邏輯下,未來體現(xiàn)用戶體驗的每一個環(huán)節(jié),都可能被納入SEO的判斷因素,包括:
網(wǎng)站打開速度。這已經(jīng)是排名算法的一部分;
搜索結(jié)果點擊率。
頁面停留時間、訪問頁面數(shù)(有深度學習系統(tǒng)的話,有可能這些數(shù)據(jù)都能呈現(xiàn)出來。)
頁面跳出率。
廣告、彈窗數(shù)據(jù)、位置。
增加頁面互動。讓用戶在你頁面上做些東西,而不只是看和讀
轉(zhuǎn)化率。
圖片、視頻 。內(nèi)容的制造成本越高、質(zhì)量就越高。
上面所說的觀點純屬個人預測,但很有可能是未來兩三年必須要做的東西。
謝謝大家!
來源:ZAC