搜the search

by byronyen


這本書原文名為「The Search: How Google and Its Rivals Rewrote the Rules of Business and Transformed Our Culture」,於2005年就出版了,我是在看到「阿里傳」時作者有建議馬雲看這本書,所以就從淘寶買來看了。書中除了記述Google發展的歷程外,也對搜尋這個行業的歷史做了交待。


1.搜尋所產生的社會問題:2001年911後美國國會很快就通過了「愛國者法案」(USA Patriot Act),根據法案,美國政府可以迫使Google這樣的公司根據政府機構的要求為他們提供信息,而且是祕密的。


2.Larry Page小時就讀了塞爾維亞發明家Nikola Tesla(1856-1943,特斯拉名稱的由來)的傳記,Page發現Tesla是偉大的發明家,但他取得的成就遠不及他應該取得的那樣大,主要原因就是Tesla很難把自己的發明商業化。Page也希望成為一個發明家,而且要能把發明製成成品,讓人們使用。


3.史丹佛大學向來以將學業成就與商業利益相結合而聞名,所以孕育了如惠普、雅虎、Google等公司。Page(1973-)和Sergey Brin(1973-)第一次是在舊金山街道見到的,當時Brin擔任未來學生遊覽舊金山。


4.Page從來沒有打算創造一個搜尋引擎,一開始是想了解當看到一個網站時,有沒有辦法知道有多少網頁上有指向那個網站的連結(即所謂的反向追蹤連結,back links),這樣就可以知道所看到網站的重要性,因此建立了一個軟體,稱為BackRub。因為要建立BackRub,所以要搜尋網路,而在他們看到自己新演算法(稱為PageRank)時,Page和Brin意識到他們可能發明了網路搜尋的技術。


5.一開始Page和Brin打算將Google出售,凱鵬華盈(KPCB)的Vinod Khosla極力想說服剛上市的Excite買下Google,但雙方價格談不攏,後來Google又找了雅虎、Infoseek,但都被拒絕。因為當時那些公司正在成為入口網站(portal site),沒把搜尋引擎當回事。後來是昇陽電腦的創辦人Andreas von Bechtolsheim(1955-,德國)於1998年開給了兩位史丹佛研究生10萬美金支票,成為Google的第一位投資者。


6.有了Andreas von Bechtolsheim的10萬美金投資,Page和Brin決定休學,於1998/9/7創立了Google,並且向當時Brin女友的友人、現任Youtube執行長Susan Wojcicki(1968-)租了一間房間與車庫當辦公場所。


7.一家搜尋引擎公司要能獲利,必須掌握三個重要元素,而Google三項都擁有:一是要有高質量的搜尋結果,也就是演算法,而MSN和雅虎當時是採取向Inktomi或Google外包的方式;二是公司需要一個搜索付費的網路體系,MSN和雅虎都是向Overture外購,而Google有自己的AdWords;三是要有屬於自己的訪問流量,也就是用戶的查詢語句,因為根據這些語句才能提供編輯和付費結果。


8.Google一度也考慮和當時最大的網路廣告商Doubleclick合作,但那種經營網頁橫幅廣告(banner)的方式讓Page和Brin反感。Google先嘗試文字廣告的方式,即如果搜尋的是「福特汽車」,則福特汽車的廣告就會出現在搜尋結果的頂端。這些廣告是以每千次曝光成本(CPM,Cost Per 1000 impression)來收費。結果2000年網路泡沫,Doubleclick的橫幅廣告崩潰,加上Google的文字廣告嘗試失敗,使Google朝向Bill Gross所開發、GoTo(後來的Overture)的每次點擊付費方式(CPC cost per click)模式,即2000年推出的AdWords。


9.比Page和Brin小了18歲的Eric Schmidt(1955-)在2001年成為Google的執行長:在加入Google前Schmidt是網威(Novell)的執行長,而從1999年6月至2001年初的18個月裡,Page和Brin已經考察了75位執行長候選人。當時是Schmidt的朋友、Google的一位董事希望他能夠去一趟Google,一開始Schmidt還認為他朋友在開玩笑,沒想到幾個位後他真的成為Google的執行長。


據Schmidt的回憶,他接受兩個27歲年輕人的面試,是在兩人共用的辦公室裡,而牆上投影著Google搜尋出Schmidt的簡歷。Page和Brin大肆批評Novell,批評Schmidt在技術與商業方面方面的每一個決定,但據本書作者說,Schmidt在回憶這些往事的時候,一副很享受的樣子。


雖然Page和Brin在面試時否認和貶低Schmidt所做的每件事,但他們還是選擇他做為公司的執行長。而另一方面,雖然面試時Schmidt認為自己是對的,Page和Brin是錯的,但6個月後當Schmidt回去Novell了解後續發展情況時,他卻發現那兩個年輕人的話都應驗了。


10.2003年初Google收購了Blogger,當時外界以為Google要走向入口網站的路線,但Google收購後沒對Blogger做出什麼改變。答案幾個月後揭曉,Google推出AdSense,使第三方網頁發布者得以進入Google龐大的廣告商網路。AdSense和AdWords顯著的差別是AdSense不再是用戶查詢的意圖,而是網站的內容。


11.點擊詐欺(click fraud):詐欺行為人利用了Google或雅虎等搜尋引擎廣告網路聯合經營的特點。例如他們註冊成為AdSense的發布成員,他們就可以將Google的廣告放置在自己網站內容的旁邊,但是這些黑帽(blackhat)網站並沒有實質內容,而只有Google的廣告。然後他們利用機器人(或是印度、東歐的廉價勞工)到網站上機械式的點擊廣告,廣告商因此受害。


12.Google於2004/8/19 IPO@85,總共發行價值2,718,281,828美金的股票(e:自然對數的底數)。Google另於2014年進行了股票分割,並將公司股票除了上市時的A股和B股(B股每股擁有10票投票權,且只有Page、Brin、Schmidt及少數管理階層持有B股,並使Page和Brin直到現在仍擁有超過5成(51.5%)的Alphabet控制權)外,新增了沒有投票權的C股。A股及C股在Nasdaq交易,B股則永遠不上市,分割後每A股和B股股東可以獲得1股C股股票。


13.搜尋引擎由三個主要部分構成:網頁捕獲(web capture)、索引、運行系統。這三個部分共同作用,決定引擎的性能和速度。事實上有數百個因素會影響搜尋的質量,但自20世紀70年代以來,搜尋的基本原理並沒有任何突破性的改進。


(1)搜尋的過程始於網頁捕獲裝置(或稱爬蟲,crawlers),這是一種在網際網路上從一個連結跳到另一個連結,把它找到的網頁打包,並送回伺服器以備索引處理的專用軟體。早期網頁捕獲器只能發現和索引網路的標題,但現在可以處理包括PDF、Office與影音文件。


(2)索引就是建立一張詞語的列表,而後在每個詞後面羅列所有與之相關的URL地址。了解索引的過程稱為分析,就像Google的PageRank演算法,它衡量來源網頁的受歡迎程度,判斷某個特定頁面與查詢請求的相關性。


(3)被捕獲網頁的數據經過分析、索引和標示後,就被儲存到所謂的運行索引,也就是直接位為用戶提供搜尋結果的數據庫中。

0 留言
0

You may also like