爬蟲技術成就瞭這些商業公司

從98年google以搜索技術起傢開始,互聯網至今,以提供內容為主的互聯網企業每一傢都離不開小爬蟲的幫助,大到互聯網巨頭,小到剛成立沒幾天的創業公司, 在早期沒有足夠內容來撐住自傢網站和app時,都會采取抓取手段來補充內容,讓自傢產品顯得內容滿滿。

爬蟲技術成就瞭這些商業公司

還有好些公司的商業模式就建立在爬蟲技術之上的,比如搜索引擎公司、大數據處理公司、網絡輿情監控公司,沒有數據,他們的公司就沒法運轉。

另外現如今互聯網公司的獲客成本上升,出現瞭增長黑客這個概念,裡面的大量運營技巧都是要依賴於爬蟲技術的手段來驅動,這裡不是指抓數據,而是模仿用戶請求,模仿用戶操作,自動發貼等手法來新增和激活用戶。

接下來老猿就來淺談幾傢在這方面做得成功的公司。

1.提到爬蟲,必然會說起搜索引擎,它是直接利用爬蟲抓取信息來構建底層服務的。簡單粗暴,但是直接有效,而如今世界上最大的兩傢搜索引擎服務公司(google和百度),已分別是7千億和600億美金市值。

2.現在已是國民資訊app的今日頭條,早期通過抓取數百傢機構的新聞源,然後以技術手段來分發給用戶,做到千人千面的閱讀體驗,現在已是中國互聯網公司第三極。

這也是一個在早期直接利用爬蟲手段而成功的例子,如果不抓取別人的新聞資訊,今日頭條根本不可能成功。

3.做職場社交,獲得2億美金投資的脈脈,早期直接抓取微博用戶信息,用來彌補自身用戶數量的不足,完成瞭脈脈早期幾百萬用戶積累,不過脈脈抓取微博用戶信息已被法院判決為非法,做社交媒體和輿情監控的估計沒幾傢沒抓過微博的數據吧。要小心噢。

當下隨著國傢知識產權法規越來越完善和嚴格,這種直接抓取別人信息然後直接商業化的行為夠你進去蹲幾年瞭。所以要慎重哦!!!

每個時代都有它所謂的企業原罪,8090年代是企業產權不明,要論互聯網時代的原罪估計就是企業早期冷啟動時抓取的內容是否應該直接商業化吧。

如果現在再做一個類似搜索引擎和今日頭條的產品,不解決版權問題,會隨時被請喝茶吧。那麼現在爬蟲抓取的內容就不能商業化瞭嗎?
也不盡然,比如政府公開的數據是可以直接商用的。

4.在企業工商信息查詢領域另辟蹊徑的天眼查/企查查。 這兩傢企業把各個省,市的官方幾千萬傢工商信息抓取出來,結構化整合後提供給用戶查詢,讓人眼前一亮。

這個APP已成為創業者,投資人,老板們的標配APP,查詢法人信息,企業股權結構等等一目瞭然。類似的數據還有商標,專利,法院判決文書等等

另外在電商領域抓取各傢電商平臺做比價網站一直是一個商業模式,比如即將在A股上市的什麼值得買,把各傢電商網站的商品和價格抓取過來,把他們的價格差異展示出來,方便用戶查看哪傢網站的便宜,但是後來各傢電商網站都把價格信息圖片化之後,解析準確價格的難度就加大瞭不少。

再比如在納斯達克上市,後又被私有化的去哪兒網,在早期能夠崛起成為一個機票和酒店預定的流量入口,就是他的搜索比價模式,實時抓取各傢機票和酒店信息,把價格差異展示出來,而這正擊中瞭用戶想要買便宜的需求。

用抓取的數據發展成為一個商業模式的例子還有很多,以上舉瞭幾個較為知名的,還有老猿瞭解的很多個人站長,自由職業者都是靠著抓取和整合數據做出瞭不錯的流量和用戶,每年有不菲的收入,在面朝大海,春暖花開的地方,吃著火鍋,喝著小酒,以後再為大傢一一道來。

Published in News by Awesome.

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *