徐一龍:把今日頭條等同于算法推薦,是四五年前的認知了

  文/今日头条副总编辑 徐一龙

  一、頭條=算法+熱點+關注+搜索

  很少人知道,現在互聯網尋人非常高效的系統——頭條尋人,最初就是今日頭條一個日常彈窗運營動作。

  今日頭條的彈窗,有部分內容是針對本地用戶,給本地用戶彈窗本地資訊。2015年中旬,今日頭條嘗試將尋人啓事也做本地推送——只是這個本地更精准,取走失者周邊幾公裏。

  最初,我們預期用這個要领幫助尋找走失的兒童,沒想到兒童走失的案例非常少,并且即便推送出去的,也沒有一例乐成。到2016年春節,就在我們猶豫要不要放棄的時候,我們意外發現,偶爾我們推送的一條尋找走失老人的信息,居然乐成了。

  我記得,這是2016年大年初二的事情。後一鳴知道了這事兒,他說,這事有價值,當成一個長期項目做吧。

  後來的事情许多人都知道了。一個公益項目,從2016年大年初二整裝出發了。頭條尋人,基于LBS技術,從尋找走失老人開始,逐步擴充到精神病患者走失、尋找緊急住院無名患者家屬、尋找台海老兵遺屬、尋找烈士遺屬,三年過去,已經找到幫助超過1萬個離散家庭破鏡重圓。

  我講這件往事是想說,把頭條等同于算法,至少是四五年前的偏見了。寫這篇文章,就是想從傳統媒體人的角度,談談今日頭條在7年時間裏,是如何搭建一個包罗“算法+熱點+關注+搜索”在內的通用信息平台的。

  2015年1月,我履職今日頭條副總編輯,參與內容運營的事情。在此之前,我在傳統媒體事情了15年。來今日頭條前,我不但不了解“算法”,對“推薦”這個詞也很陌生——傳統媒體,是很少使用“推薦”這個話術來描述業務的。

  为什么?我的理解是,“算法”、“推荐”的业务场景都是处理惩罚海量资讯。我曾经在电视台、报社、杂志社事情,生产的内容其实都很有限,一份报纸最多也就千余条新聞,媒体界用“头条”、“头版”、“封面”,就可以解决现在资讯APP瞄准的“推荐”问题。而类似今日头条仅每日新增的内容,就有几十万篇文章,如果没有“推荐”,那可是彻底乱套了。

  所以,什麽是“推薦”呢?我的理解是:面對海量內容時,如何幫助用戶高效地選擇、消費內容。

  來今日頭條後,我這個文科生也對“算法”有了粗淺的了解,對更多內容行業觀察者來說,今日頭條甚至普及了“算法”這個看法:通過個性化推薦技術,用戶可以看到自己感興趣的內容,這後來也成爲了全球範圍內幾乎所有內容平台的標准配置。但是,今日頭條的推薦战略其實並不但是“算法”。

  2012年8月上線至今,今日頭條曆經了7次大的版本更新,並在這個過程中,演化成一款日活過億的國民級産品。今日頭條的推薦战略,早已不依賴于“算法”,而是一個囊括了“算法+熱點+關注+搜索”等多種成果的通用信息平台。

  熱點、關注、搜索……這些成果陸續推出的背後,其實是今日頭條在不斷完善自身的推薦战略。在我印象裏,有三個比較重要的節點。

  第一次,是2015年要闻区的设立。2015年1月,头条的推荐频道,已经有了要闻区,但是这个要闻走的是“加权推荐”的战略,不包管每个用户都能看到。其时我刚参加公司,基于传统媒体人对重大新聞的判断,我提出了入职后的第一个产物需求:“重大新聞应该让每个用户都看到”。靠算法起家的产物经理和工程师们,也认为这个需求很公道。因为他们也发明,每当产生重大新聞,头条的DAU就会提升,算法可以让用户看到自己喜爱的内容,而重大新聞则有“穿透性”,如热刀插黄油般,可以轻易穿透本性化——即便不存眷科技的用户,也会存眷孟晚舟女士在加拿大的遭遇。现在,“要闻”的演进更成熟了,仔细视察下现在的头条首页,会发明整个页面可以分为四个区域,第一块是搜索区,第二块是频道区,可以看到种种垂类信息,第三块是要闻区,权威媒体的重要新聞,第四块是本性化区,用户可能感兴趣的内容。我们希望能够通过这样的改造,同时满足用户对付本性化资讯和了解新聞热点的需求。

徐一龍:把今日頭條等同于算法推薦,是四五年前的認知了

  (圖說:今日頭條産品內容示意圖)

  第二次是2017年微頭條和問答産品的推出。我們通過這兩種全新的內容體裁,探索智能社交,包罗:上線問答頻道並推出獨立産品“悟空問答”,一個爲所有人服務的問答社區;上線“微頭條”,讓所有頭條用戶,特別是普通人通過發布短內容,與人互動、创建關系。這是頭條從算法分發走向社交分發的开端嘗試,我們希望用戶在頭條內能创建起有效的社交關系。與此同時,內容可以通過“關注”的形式來分發,而不是僅僅依賴于算法。所以我們在産品上也做了改變,今日頭條客戶端第一欄(最左邊)就是關注頻道,用戶可以在這裏實時查察自己關注用戶的動態。别的,用戶在刷推薦頻道時,也能夠隨機刷到自己關注的親戚朋友或名人明星的動態。因爲事情的關系,我在頭條上關注了许多名人、作者和朋友。我會發現,“關注頻道”對我吸引力越來越大了,甚至能媲美“推薦頻道”,這就是關注分發的魅力。

  第三次是2019年头条搜索的推出。最近,我们推出了全网搜索的成果。这是今日头条“信息创造代价”理念的延伸。用户可以通过今日头条最上面的搜索框进行搜索,查询站内外的信息。我本人也一直频繁使用头条内的搜索,坦诚说,最初效果并不太好,但最近,它越来越能满足我搜索的需求了。而热点运营事情,也延伸到搜索去。每当产生重大新聞,运营人员也会去优化搜索结果页,让人们能看到重大新聞最重要、最新的进展。

  二、算法不制造信息繭房,而是探索興趣

  在互聯網時代,人通過上網獲取信息,主要有四種途徑:一是門戶網站,二是搜索引擎,三是社交,四是算法。

  门户网站的特点是人工编辑筛选,把所有新聞列在首页,缺点是容量有限,一天顶多更新几百篇稿件,用户也不会每条都看。而像今日头条,内容池是上千万篇文章,能够提供的信息量要富厚得多。

  搜索是人主動獲取信息,但要在海量的搜索結果中,逐個仔細篩選出自己想要的,占用時間比較多。即便搜索結果也不斷被優化,搜索時,“找內容”的過程仍然要占據大量時間。

  社交便是關注和訂閱,由本人選擇,按自己需求出發。但一個人往往是相信什麽大概喜歡什麽之後,才會選擇關注什麽。比如我家人相信康健養生,就關注康健養生的作者,帶來的問題是難以突破認知。

徐一龍:把今日頭條等同于算法推薦,是四五年前的認知了

  (圖說:從互聯網獲取信息的方法许多,融合起來是最好的要领)

  有人說算法會造成“信息繭房”。這是對算法最大的誤解。

  “信息繭房”看法,來自于哈佛大學法學院教授凱斯·桑斯坦。他在《信息烏托邦——衆人如何生産知識》一書中指出,在信息傳播中,因公衆自身的信息需求並非全方位的,公衆只注意自己選擇的東西和使自己愉悅的通訊領域,久而久之,會將自身桎梏于像蠶繭一般的“繭房”中。

  爲什麽我說算法不會制造“信息繭房”?

  首先,算法在推薦時,除了用戶現有的個人興趣,還會基于使用環境、內容熱度、其他用戶的興趣,來給用戶推薦信息。這些因素能夠讓推薦內容越发豐富,制止了內容越來越窄。

  其次,算法自己還包罗興趣探索。

  一般人對算法的認識:喜歡什麽,就推什麽。可人生是漫長的,人的興趣不但是各種各樣的,也不斷變化的。比如,我是英超球隊阿森納的鐵杆球迷,可最近幾年阿森納每況愈下,實在心生疲憊;在體育內容上,最近一年我就更關心乒乓球,尤其是“日本選手張本智和和伊藤美誠多洪流平上可以挑戰中國乒乓球運動員”,就比“阿森納能不能排名英超前四”更讓我關注了。

  算法如何做這樣的興趣探索呢?尋找這個問題的答案,也是我來今日頭條後,想要探索的一個“新興趣”。

  在向公司的技術大拿同事求教後,我了解到,算法最有效的能力,是識別出你最感興趣的內容和最不感興趣的內容。在二者之間,還存在一大塊“你可能感興趣的內容”,這些內容絕對不會被工程師和産品經理們放棄。事實上,每個人的成長也是不斷地將“可能感興趣的事情”,固化爲“確定感興趣的事情”和“確定不感興趣的事情”的過程。

  对付算法如何识别人们“最不感兴趣的内容”,算法推荐里专门有个名词叫“协同过滤”,英文术语叫collaborative filtering。“过滤”是“推荐”的反义词,也是“同一个事情的两个方面”。算法有很强的能力,过滤掉那些你明显不感兴趣,跟你一点干系都没有的东西。比如我底子不存眷美妆、口红方面的内容,算法没须要推荐这些内容给我。

  那麽算法如何去探索那些人們“可能感興趣的內容”呢?

  用户兴趣泛化和窄化,其实是推荐系统中的经典问题,学界和业界一直很重视。这个问题叫EE(Exploitation Exploration):Exploitation是利用,通过已知的比力确定的用户兴趣,推荐相关的内容。Exploratio是探索,除了推荐给用户已知的感兴趣的内容,还需要不绝探索用户的其他兴趣,制止推荐结果一成稳定。

  算法追求的是,盡可能地滿足用戶獲取有價值信息的需求,並且讓用戶獲取信息的價值最大化。

徐一龍:把今日頭條等同于算法推薦,是四五年前的認知了

  (圖說:就像開寶箱一樣,算法需要通過探索來發現用戶的興趣)

  我們的工程師大拿說,興趣探索在短期內會減損用戶使用時長,因爲用戶會在信息流裏刷到不那麽感興趣的內容,覺得信息流很亂。但是如果不做興趣探索,短期內可以提升點擊率,但這個提升效果會迅速衰減,因此從長期看收益是負向的。

  所以,興趣探索並非算法的“錦上添花”,而是“必不可少”。

  這下你可以理解,“算法就是喜歡什麽就推什麽”是一個多麽“天真”的誤解了吧。

  三、人是萬物的标准,也是算法的标准

  當然,任何事物都不是完美的,算法也有一定的局限性。所以,需要一些其他手段,來幫助信息更好地流動。

  在今日頭條,我們在內容運營方面,主要做兩個事情:一是幫助頭條獲取更多優質來源;二是確保優質內容在頭條上獲得公道的閱讀比例。

  算法再精准,興趣探索再乐成,如果內容池的內容不夠優質、豐富,那推薦做得再好,也不會讓用戶感觉好。所以,從一開始,我們就非常重視優質內容。2015年,頭條率先推出“千人萬元計劃”,對1000個優質作者,給予每個月1萬元的保底補貼。今年又推出了“創作者收益計劃”,希望幫助1萬位創作者月薪過萬,讓優質創作者獲得更多收益。

  公平並非一視同仁,一篇公司調查和一篇娛樂八卦,前者支付的心血多,而流量往往低于娛樂內容,而平台這時候,就該勇于去“拉偏架”。“拉偏架”不但體現在資金扶持,也體現在流量扶持上。

  有些優質內容,它們不一定能引起所有用戶的興趣,也不能單純從用戶行爲習慣來判斷,無法被推薦系統直接有效地权衡。這個時候就需要人介入。

  一方面,我們調整機器推薦權重,比如給優質來源的優質內容更多推薦權重;另一方面,我們優化産品機制,提供雙標題、雙封面,幫助創作者提升推薦效果。别的,我們還投入專門的人力,想辦法幫助優質內容獲得更好的分發和閱讀體驗。我們專門有一個團隊就叫“作者體驗”。

  舉個例子。2017年10月,今日頭條和《三聯生活周刊》達成戰略相助後,我們爲《三聯》量身打造了封面專題的分發方法。封面專題是《三聯》的特色,一個專題往往由四到六篇文章組成。在手機信息流中,專題的閱讀效果其實不如單篇文章,但是,如果這些文章被拆開、打散,作爲一個專題的閱讀價值就會低落。後來,我們想辦法讓《三聯》專題在頭條信息流裏,同時擁有兩種分發方法,既可以被單條推薦,也可以以專題的方法被推薦。用戶把每個專題收藏起來,就可以看三聯周刊的所有封面報道。最新一期的封面報道《老友記》最近上線了,在今日頭條內搜索“三聯生活周刊”就能找到。

徐一龍:把今日頭條等同于算法推薦,是四五年前的認知了

  (圖說:三聯生活周刊的封面報道,在今日頭條內會打包成專題推薦,也在搜索中做了優化,幫助用戶快速獲取。)

  我入職今日頭條後,經常有媒體圈的老朋友問我:一龍,你在頭條幹什麽啊?頭條不是都靠算法嗎?

  看,這兩個問題,自己就是矛盾的。如果頭條都靠算法,那我在頭條真的沒事可做了。而事實是,我在頭條挺忙;頭條除了算法,還有许多人。

  我們始終相信人對于優質來源和優質內容的鑒別力。人的判斷差别于機器,但同樣值得被重視。技術更快,面對海量的信息,分發效率尤其重要;但人更准,特別是進入模棱兩可的地帶,人的同理心和想象力能夠發揮重要作用。

  無論是人還是技術,其實都只是一種手段,都是希望最優質的信息,能又好又快地觸達到需要的用戶手裏,讓人找到信息,讓信息找到人,消除用戶“早知道就好了”的遺憾。

  不久前,有同事发给我一个脑科学专家的言论。大意是说,要打败推荐算法,需要两个因素:1. 你需要有追求高品质内容的需求。2. 你需要随机取样人类各个领域的知识。

  其實,算法追求的,和這位專家追求的,一點也不沖突。因爲,說到底,算法的目標是由人設定的,算法的內核,和優質內容、多樣性並不對立。這也是今日頭條一直以來努力的偏向。

  而這位專家所需要的“因素”,在作爲通用信息平台上的今日頭條上都有。

  如果只有算法,絕不會有頭條尋人;如果只有算法,今日頭條也不會長期保持成長。

  “讓上帝的歸上帝,凱撒的歸凱撒。”人類其實沒须要打敗算法。一定要和算法分個勝負,大概是人的虛榮心和狂妄在作祟。比如在圍棋領域,我們沒有须要一定要追求打敗阿法爾狗。

  算法在效率方面確實勝過人,而人的同理心和想象力高于算法。我們應該做的是,和算法相互學習,做好分工。畢竟,參差多態,乃幸福之源。(李經)

原标题:徐一龍:把今日頭條等同于算法推薦,是四五年前的認知了

責任編輯:吳婵

看天下

讀懂中國放眼全球 進入欄目
欄目推薦
關于我們 | 廣告服務 | 执法聲明 | 網站地圖 | 跟帖評論自律管理承諾書
海南南海網传媒股份有限公司 版权所有 1999-2020 地址:海南省海口市金盘路30号新聞大厦9楼 电话:(86)0898-66810806  传真:0898-66810545  24小时举报电话966123
互联网新聞信息服务许可证:4612006002 信息网络流传视听节目许可证:2108281 互联网出书许可证:琼字001号
增值電信業務經營許可證:瓊B2-2008008 廣告經營許可證:460000100120 瓊公網監備號:46010602000273號
本网执法照料:海南東方国信律师事务所 李君律师
南海網存案号 琼ICP备09005000号