第258章 上菜的路上還能邊走邊烹飪
「宿胖的技術路線,其實是這樣的:他宣傳PPT里提到的『人工智慧識別視頻內容,並根據用戶喜好推送』,實際上完全沒有做到。
傑克,不知道你注意到了沒有——為什麼快蹄上的視頻,都會在首頁上打上這麼多的字呢?比如這個『教你如何扎丸子頭』,或者那個『牙套妹,奈何美色』、『太木人道~』。從審美的角度來說,你不覺得短視頻打這麼多字很醜么?」
馮見雄侃侃而談地誘導著,力爭讓傑克馬自己去發現。
「對啊,為什麼,很醜。」傑克馬果然順著思路往下說。
馮見雄微微一笑:「因為其實宿胖跟張一鳴一樣,只會識別視頻的標題和文字說明。他的人工智慧是識別不出視頻圖像的故事內容的。他只是靠讀懂了文字,然後覺得這個視頻是講什麼的,就把它推薦給其他『曾經喜歡看同類文字標題或描述內容』的用戶。
所以,宿胖的真相,只是跟風了張一鳴的技術路線,然後偽裝成可以智能推送視頻而已。目前地球上,還沒有一種人工智慧可以看懂視頻的故事性。至少四年內不可能。」
「原來是這樣……確實,目前世界上圖像識別領域最強的就是谷歌,其次就是我們阿狸系,我說他們怎麼讓機器讀懂視頻內容的呢。」
這句話不是傑克馬說的,而是老曾為了補救,拍的馬屁。
他似乎已經忘了,就在不久前,他還信誓旦旦說「宿胖也能做到,所以你馮見雄不配要高價」呢。
不過,沒人會在意這些話就是了。
傑克馬也不傻,他知道下屬是為了幫他砍價。
沒有一個老闆會處罰一個為了幫自己砍價而說謊的下屬的。
馮見雄也是頂級人精,當下呵呵一笑,窮寇莫追。
他也跟著一起當頭棒喝后給甜棗:「老曾總算想明白了——老馬,你就這麼想好了,谷歌之所以圖像內容識別做得好,是因為他們要搞圖片智能搜索的引擎么。
你們阿狸之所以這麼投入,是因為你們要讓女人去線下服裝店拍了照、然後上淘寶找同款。
目前這些技術的商業變現渠道還不多。所以只有你們和谷歌這樣砸錢。連你都連根毛的成果還沒砸出來,宿胖這點小身板能做出個屁啊。科研是真金白銀燒錢的,又不是過家家。」
這個馬屁非常精妙,關鍵是言之有物,讓傑克馬聽得很爽。
畢竟馮見雄誇讚的是他的戰略眼光。
對於一個逼王來說,一般的馬屁是聽不進去的。
但如果有人能從高科技發展趨勢的角度,花式論證出他戰略決策的英明果決、高瞻遠矚,那傑克馬簡直會爽到毛孔通透。
可惜世人再無如此口才和犀利眼光。
「嗯……似乎不無道理」傑克馬沉吟數息,旋即想到另一個問題,「小馮,那你又準備如何解決『目前的人工智慧還看不懂視頻』這個問題呢?如果你沒有獨門秘訣,那也只不過是宿胖做不到、你也做不到而已。」
「我現在也做不到,但我可以在兩三年內做到,而且確保比他們快至少一到兩年。」馮見雄智珠在握地說。
「那描述一下你的技術藍圖。」傑克馬當仁不讓地問。
馮見雄也不客氣:「可以,不過能讓他們先迴避一下么?我的計劃,不是純粹靠技術手段來解決的。而是技術不夠、商業和運營來湊。所以,涉及到很多容易被『借鑒』的創意。我必須確保自己的商業機密。」
傑克馬一聽,給老曾和蔡重信都使了個顏色,讓他們先出去雞尾酒。
蔡重信和老曾對視一眼,一聲不吭帶著人走了。
馮見雄微微一笑:「其實,我的辦法,說穿了也簡單——據我所知,目前谷歌公司進行的『智能看懂視頻』項目,其項目預期期限,需要5年,才能攻克全部技術難點。
但是,這5年不是『行百里而半九十』的,而是按照一個個技術階段分別攻克的。他們要實現的最終目標,是『通過讓人工智慧演算法,識別出一個視頻中,哪幾幀畫面才是決定全篇調性、故事主題的『主要內容/中心思想』。
然後,再通過精讀識別這些幀的畫面上,有多少人物、什麼動作、發生了什麼故事』,最後總結出『這視頻大致是在說講怎麼樣一個故事』。」
馮見雄說到這裡的時候,稍微停頓了一下。也觀察了傑克馬的接受度,又通俗解釋了幾個點。
他的這番理論,如果都用術語表述,可能比較晦澀。
但是,舉個小學生都懂的例子,橫向對比一下,就通俗了——谷歌科學家們,在調教「深度學習」型人工智慧、理解人類語言文字/圖像信息的時候,其實有點兒像老師給小學生上語文課。
相信小學生都記得,當年語文課的時候,老師會不厭其煩問你:這篇課文的主要內容是什麼?中心思想是什麼?線索是什麼?
很多小學生當初肯定是內心有一萬頭羊駝奔騰而過:尼瑪!老子知道這個課文說了啥,看懂不就好了?你問個屁的「主要內容」、「中心思想」啊!考試答錯了還扣分!
但你別說,調教機器人學語文的時候,還真得嚴格按照「主要內容」、「中心思想」這麼一步步總結下來。很多人類覺得可以靠本能繞過去、或者省略掉的步驟,機器是繞不過去的。
傑克馬很快就懂了,示意他繼續:「那麼,然後呢?」
馮見雄繼續解說:「既然知道谷歌的技術路線了,那麼我們就可以推斷:在實現最終極的目標之前,谷歌需要先解決『讀懂一張圖裡發生的故事』的問題,然後再考慮『如何選出一個視頻中最能體現中心思想的那幾幀』。
那麼,距離『讀懂一張圖裡的故事』這一步,谷歌目前差多遠呢?我認為大致是三年——目前谷歌已經可以做到識別圖片里是不是有一張人臉,但還沒法識別這個人到底是誰、和另一張照片里的人是不是同一個。
谷歌還能識別出『圖裡有沒有一隻貓』,但識別不出『這隻貓和剛才那隻貓是否是同一隻』。而大約三年之後,這些都不是問題。谷歌能做到『從識別出圖裡有隻貓』,到『識別這一幀在講什麼故事』。
我們如果緊跟谷歌的步伐,結合阿狸系的圖像識別研發,就算留一年余量好了。那麼2016年也能搞出『讓機器讀懂一幀』的商用技術。當然,這裡面肯定需要與阿狸系圖像識別團隊的深度合作,也需要後續的投資。
而對我來說,只要做到了『識別出一幀』,我就能『大致讀懂整個故事』,從而把谷歌需要用純技術手段解決的問題,用運營手段給暫時繞過去。」
技術不夠,運營補。
這一招,馮見雄用得屢試不爽了。
「怎麼補?」傑克馬的語氣已經有些急切,他覺得自己完全被馮見雄天才的腦洞給折服了。
「傑克,你看過N站的視頻么?看過優酷或者youtube的么?」馮見雄不公布答案,而是先反問了一句。
「都看過吧,不多。」傑克馬不明所以,回答得比較謹慎。
馮見雄終於到了揭開謎底的一刻,他傲然笑道:「那不知道你有沒有發現一個細節——優酷和youtube上的視頻,其實都是沒有『封面』的,而我們N站的UP主,在上傳視頻時,已經養成了另外傳一張圖片作為封面的習慣了——當然,說實話,這個習慣不是UP主們自發養成的,是我讓天音硬逼著UP主們養成的。
或許將來有人看到這一招有效之後,會跟風我。但是一個網站的內容提供者水平,是不可能一朝一夕提高的,用戶習慣也不是一朝一夕可以改變的。優酷未來即使學了,他們的UP主在選封面方面的水平,也是遠遠弱於N站的……」
後世看過B站視頻的人,如果同時也是優酷用戶,恐怕不難發現一個現象:
在B站上,有一批惡劣的人,經常拿封面來實現「標題黨」的目的。
比如,凡是MMD配布模型的初音/巡音/弱音/愛醬舞蹈動畫,都會上一張暴露度特別羞恥的圖片作為封面,先騙用戶點進來。
然後實際上,這張圖的尺度,是明顯超過視頻過審尺度的,屬於「視頻里如果真出現這樣的鏡頭,肯定會被404」.因此用戶看完全視頻,都發現壓根兒就沒有出現封面圖的鏡頭。
這時候,用戶們就會怒吼「交封不殺!」、「可恥的播放量!」、「下作的播放量!」
唱到了甜頭的B站UP主們,為了騙點擊,就從此在「交封不殺」標題黨的路上越走越遠。
但是,這其實是B站的一個運營陰謀……嗯,或者說得好聽點,策略。
因為它成功地逼著自己的UP主們,精挑細選一張最能凸顯視頻主題思想的圖,來當封面。
相比之下,若干年後的優酷視頻,雖然也開始有「封面」這個選項,而不是直接拿「非黑屏的第一幀圖像直接作為默認封面」。但優酷上的封面,並沒有那麼精挑細選、標題黨。
B站的這種差異化策略,其實就是在賭,當人工智慧讀圖技術發展到「能看懂某一張圖的主題故事」這一道門檻之上、但還沒到「識別出一個視頻里哪幾幀最重要」程度時,這中間這段窗口期里,B站就能在「精確猜測用戶對視頻內容的喜好」這個領域,實現偷跑。
偷跑的原理是什麼呢?
就是:機器還不懂如何選取視頻中哪一幀最重要,最貼切主題。但人類知道,上傳視頻的作者知道。B站逼著作者把「選出代表的一幀」這個工作完成,然後人工智慧演算法只負責專心解讀並歸類這一幀。
完美實現「在技術不如谷歌的情況下,靠運營搶跑谷歌」。
馮見雄如今為N站謀划的,就是這個辦法。
哥知道人工智慧不能一蹴而就,但是哥知道如何把半成品的價值發揮到最大。
谷歌的技術確實比他牛逼,但谷歌太執著技術,不懂如何「板前料理」。
把菜從廚房端出來的路上,甚至擺上桌之後,還是可以繼續烹飪的嘛。
又沒人規定,所有菜必須100%完工才能出廚房的們,對吧?
哥燒菜是沒你快,可哥玩的是日料,你玩的是法餐,所以哥照樣可以上菜上得比你快。
推而廣之,其實從這個角度來說,UC系的「震驚部」雖然無恥,但從發展人工智慧的角度來說,震驚部的存在,跟「交封不殺」標題黨一樣,是「演算法對抗」的培養皿。
他們可以把人性的一個個衝動,提前發掘出來,讓技術宅們測試和堵漏。
傑克馬目瞪狗帶。
他匪夷所思地說:「這……這都行?那,那將來N站要是真被人黑成『交封不殺』的網站,編派你的黑材料,你怎麼搞定?」
「那有什麼,如果真到了演算法被調教好的時候,我卸磨殺驢就好了——直接說要整頓標題黨,對於UP主們上傳的內容與封面圖無關的,封號一定時間,或者不給榜單/廣告資源,以示警戒。到時候很容易就能治理的。
其實,我知道你今年還打算全資把UC科技給買了。如果你跟我合作愉快,我不吝教你如何把那些調教人工智慧演算法的運營擦邊球……」
比如,如何調教震驚部,什麼時候抓,什麼時候放。什麼時候對社會誠懇道歉,什麼時候偷偷不把UC諮詢讀者當人看、而是當成小白鼠……
運用之妙,存乎一心。
「呵,呵呵……罷了,我知道為什麼一輩子都沒說贏你過了。」傑克馬覺得自己被洗腦得如在雲端,渾渾噩噩而不知其所止,「你說N站目前部分融前就值60億美元,就60億吧。我再投20億,占你25%股份。不過,我還是希望你能夠跟我們阿狸系,在『輿論分發人工智慧』領域,常年合作下去,我不會虧待你的。」
「馬哥敞亮!20億美元都現砸了,我當然不會讓你失望。走,去喝兩杯吧。」馮見雄很隨和地拍拍傑克馬的肩膀,跟他扣肩搭背談笑風生地離開了休息室。
傑克馬其實是有可能選擇「抄襲馮見雄的創意,然後自己扶持其他同行去山寨」的。
但是,阿狸系在大文娛領域如今並無「親兒子」級別的布局。如果這個商業秘密泄露了,那就是兩家一起用了,絕對沒有現在這麼值錢。
傑克馬是干大事的人,他當然知道投資投的是有潛力的人,而不是公司和生意。
馮見雄這個人的潛力,值得他「聽了對方的創意,就直接痛快給錢」。
周天音傻傻跟在兩人後面,局促得手都不知道往哪兒放了。
她今天來的時候,可是做好了「讓對方占股四分之一、融15億美元」的心理準備了。
那樣的話,N站的現值也相當於45億,跟優酷差不多了。
在周天音看來,拆過之後的N站,能賣的跟優酷一樣貴,已經很知足。
但馮見雄偏偏就是腦洞一下前沿科技進展,跟傑克馬聊聊天,就多聊出來了5億美元。
「他剛才說的話,每個字大約值20萬美元。」周天音在內心默默估算了一下,徹底五體投地。