1. 掃描微信 關注瀋陽EMCBET
        期待與你分享更多精彩

        新浪微博 騰訊微博

        淺析B站視頻的內容推薦機制
        發佈時間:2020-05-21 10:27:56


        零售電商給你推薦喜愛的日用品、新聞閱讀給你推薦合口味的知識、短視頻軟件向你推薦你最愛的娛樂視頻……

        自個性化推薦算法在各種軟件廣泛應用開來,千人千面的說辭已經被互聯網用戶熟稔於心。

        可以說,這些被頻繁使用的軟件可能比消費者本身還要了解你的偏好。

        但,你真的知道,這些軟件是怎麼把這些信息更有效率的推送到你面前的麼?作爲創作者和用戶,如何利用推薦系統反哺自身?

        本文將以B站爲例,詳細回答這些問題。

        Tag處理:構建內容和用戶側寫 

        所謂千人千面,放在產品中,人指的是用戶,面指的是內容。

        一方面,用戶因爲年齡、性格、愛好、生活閱歷的不同,對內容有不同的需求;另一方面,內容的種類和質量也影響用戶的偏好。

        用戶和內容的高效連接和互相成全,是推薦系統,尤其是推薦算法的最高目標。

        1. 內容Tag

        我們先來走一遍用戶視角。

        進入B站,有明確的動畫、音樂、舞蹈、科技等按內容類型劃分的一級導航區。

        以科技區爲例,又可以展開爲科學科普、社科人文、演講公開課等二級導航;當你選擇科學科普欄目,又能看到環境、科學、生物、氣象這些小分類。

        我們以羅翔教授的這篇《爲什麼刑法要嚴格解釋》爲例,從科技>社科人文頻道,進入視頻詳情頁,可以在頁面中部看到和視頻相關的信息。

        這裏有三塊重要信息:


        鳥哥筆記,行業動態,47,規則,運營模式

        第一,視頻播放量、彈幕量、評論數和數據排行表現,分別爲161.1萬、2.6萬、7967和全站日排行最高第七。

        第二,點贊數、不喜歡數、投幣數、收藏數和分項數,其中不喜歡數並不顯示,其餘可量化的數據爲24.1萬、10萬、3.3萬和7616。

        第三,視頻標籤,這裏區分了比較熱門的羅翔、法考專輯標籤,也有刑法、校園星UP、厚大等普通熱度話題。

        這樣就可以得到一份有關視頻內容的Tag標籤:


        鳥哥筆記,行業動態,47,規則,運營模式

        那這些標籤是怎麼來的?

        我們從投稿流程看一下,哪些是可以由創作者控制的:

        從投稿頁面可以發現,用戶上傳視頻後,可以填寫的內容有五項,分別是分區、標題、類型、標籤和簡介,其中標籤的選擇可以是自定義、推薦來源和參與活動。

        鳥哥筆記,行業動態,47,規則,運營模式

        如果按照視頻投稿前後來給一份內容畫側寫,創作者相關信息和內容信息可以歸爲靜態數據,而具體的數據表現隨時間會隨時間變化歸爲動態數據。

        2. 用戶Tag化

        萬物皆有聯繫,“你的氣質裏,藏着你讀過的書和走過的路”告訴我們人格特質會受讀書習慣和生活經驗影響,而用戶的瀏覽、消費等操作行爲也隱藏着個人的偏好。

        先來看一下B站用戶會被記錄哪些信息和行爲數據。

        歷史瀏覽行爲:

        播放歷史的記錄使得用戶可以方便的追蹤到自己在什麼時間看了什麼視頻。但用戶往往並不會關注自己看到了哪裏,而只在乎下一次點進去是否可以跳過已播放的部分。

        但播放時長比是對視頻質量評判的一個重要標準:


        • 播放時間短,用戶可能只是被播放量或標題吸引點進來隨便看看, 但實際並不偏好此類內容;

        • 播放時間中等,用戶可能偏好此類內容,但視頻時長或質量會影響觀看完整度;

        • 播放時間長,反映出這類內容可能正對用戶興趣。


        此外,用戶在視頻詳情頁對內容的點贊、收藏或不喜歡等操作,也反映出了個人偏好;評論作爲文本數據,也可以從其長度、情感偏頗、可讀性反映出用戶對內容的喜好程度。

        上述可以被用戶明確感知到的行爲被歸爲顯式行爲,而另一類包含屏幕操作軌跡、停留時長等不易被用戶感知到的操作被稱爲隱式行爲。

        後者除了被用於構建用戶側寫外,也可以用於激發用戶的顯式行爲,如在B站視頻詳情頁停留時間滿足一定水平後,會觸發分享圖標轉爲顏色鮮明的微信圖標。

        關注和訂閱:

        關注和訂閱的up主、話題等,也會暴露用戶的興趣。

        例如,用戶的關注列表裏70%都是類似巫師財經、硬核的半佛仙人、財經藥丸這類up主,那系統在評估用戶愛好的時候大機率會給貼上金融愛好者的標籤。

        鳥哥筆記,行業動態,47,規則,運營模式

        消費行爲:

        B站用戶的消費除了會員外,還包含課程、演出展覽、線下遊戲等,而消費會留下交易金額、時間、地址、類型等痕跡。

        B站數億活躍用戶中,移動遊戲月均付費用戶接近150萬,直播季度付費用戶120萬,佔比僅爲1%左右;作爲“金主”,他們不僅在權益享受上優於普通用戶,也會因其出色的消費能力而被推薦系統“盯上”,貼上“消費能力佳”的標籤。

        身份信息:

        用戶的身份信息包含性別、年齡、教育水平、地理位置等,允許訪問通訊錄、上網記錄後,平臺還可以獲取到社交關係和其他產品使用情況,來推算用戶對產品的需求程度。

        綜上,本文得出一份有關用戶信息和行爲的Tag標籤:

        鳥哥筆記,行業動態,47,規則,運營模式

        從B站首頁,我們可以發現:目前基於興趣的推薦視頻一般可以分爲這幾種:已關注、高贊視頻、新星計劃、關注的人贊過、廣告和互動視頻,這些標籤正是基於內容或用戶的tag標籤推送到了用戶面前,但單一的tag處理,推薦精確度上還有可以優化的空間。

        鳥哥筆記,行業動態,47,規則,運營模式

        打造圈層:內容類聚和用戶羣分 

        完成對內容和用戶的tag處理後,這兩者仍是個體,但個體間會因爲標籤的類似產生聯繫,從而多個個體能夠進入同一圈子,權重和相似性通常被用作劃分圈子內個體關聯程度的標準。

        1. 內容類聚

        內容和內容之間的相似度常用創作者相關信息(認證、關注)或內容信息(頻道、話題活動、關鍵詞)來計算,而數據表現則一般用於排序展示在排行榜或熱門中。

        這一算法通常用於熱榜推薦場景。

        比如動物圈下的熱門標籤汪星人、喵星人、大熊貓等,就是因爲內容信息中關鍵詞的相似而被劃分爲同一類視頻,進而可以集中展示;或是搜索場景,依據關鍵詞進行搜索,關鍵詞用於和數據庫內的創作者或內容信息進行匹配。

        鳥哥筆記,行業動態,47,規則,運營模式

        2. 用戶羣分

        用戶和用戶之間的相似度常用用戶行爲來計算,這一過程被稱爲協同過濾,主要以基於物品的協同和基於用戶的協同爲底層框架。

        基於內容的協同:

        主體是內容,根據用戶喜歡的視頻,找到和這些視頻相似的內容再推薦給用戶。

        區別於上述的內容類聚,內容協同的過濾標準是用戶行爲指向內容的相似性,而後者的標準沒有納入用戶的偏好。

        基於用戶的協同:

        主體是用戶,根據某一用戶喜歡的視頻,找到和這位用戶有類似偏好的用戶,再把這個羣體所偏好的視頻推薦給用戶。

        我們以B站不同視頻的用戶瀏覽情況舉例,來區分這兩類推薦方式。

        假設用戶A喜歡看科技和數碼區的內容,B站會給這類用戶推薦什麼視頻:

        根據給出的內容分區和瀏覽用戶來判斷用戶的喜好,在基於內容的協同下,系統會給用戶A推薦  區的內容——因爲這三個分區的瀏覽用戶相似度更高。

        而在基於用戶的協同下,系統會給用戶A推薦動畫和  區——因爲A和用戶B、C的瀏覽歷史相似度更高,而這個羣體似乎更偏好這兩個分區。

        這一算法更常出現在推薦場景。

        觀察下面這個例子,可以發現用戶近期觀看的偏好和關注up主皆是舞蹈音樂類,所以首頁推薦同類視頻的佔比可以達到60%以上。

        巧用推薦:Bup主與平臺運營 

        1. up主運營建議

        1)內容冷啓動

        對於一個B站內新生產的視頻來說,其數據表現在短期內並不具備很高的參考價值,所以可供推薦系統參考的是內容方的靜態信息。

        從創作者相關信息來看,一個過去創作記錄更優質的up主的新內容會在冷啓動階段獲得更高推薦量;從內容信息看,標題、更新時間、關鍵詞和封面則是主要因素。

        2)持續創作能力的培養

        對於一名up主來說,標題、關鍵詞的選取不過是短時間的譁衆取寵,真正能獲得穩定關注者和預期收益的關鍵在於提高內容質量、培養自身的持續創作能力。

        基於平臺對內容原創度、垂直度和傳播度的衡量,up主可以更有針對性的尋找自身擅長、熱點度高的版塊,並構建自身創作的週期體系,在更新時間、內容質量上保持穩定性。

        3)普通用戶也可以訓練自己的待看清單

        利用推薦算法的機制,普通用戶也可以參照其原理,訓練自己的推薦清單,從而合理利用B站。

        比如,喜歡科普知識類分享的用戶,在關注同類up主、延長科普類視頻播放時長、增加點贊、評論、分享行爲後,會發現首頁推送會更合自己的興趣。

        2. 平臺運營建議

        1)用戶冷啓動

        相對內容,用戶從註冊到活躍,也會面臨一個從0到1的過程,平臺在此期間最重要的目的是通過優質內容提高用戶活躍和留存。

        相比行爲數據,身份信息是平臺可以獲取到第一手信息,比如依據手機品牌對用戶偏好做出第一輪興趣猜想。

        但要留住用戶,平臺更重要的任務是尋找到小白用戶的興趣點,給他貼上標籤、劃分興趣圈。

        一方面,平臺可以通過某頻道的強曝光逐步探索用戶的興趣,鎖定具體分區並逐漸縮小範圍,或是根據年齡這一維度更多元的屬性來做用戶協同推薦;另一方面,平臺可以積極利用用戶在初始階段主動選擇的分區、關鍵詞搜索行爲來逐步構建側寫。

        2)內容多樣性和質量優化

        平臺給出的頻道是有限的,而B站月均PUG視頻提交量就可以達到310萬,顯然,把規模如此大的視頻數僅用幾個標籤劃分是遠遠不夠的。

        因此,B站不僅允許創作者給視頻添加已有標籤和自定義標籤,還允許觀衆給視頻添加標籤,豐富視頻維度。

        從質量上看,B站目前延長了對視頻的審覈流程,意味着對視頻真實性、原創、價值引導上的審覈會更加嚴格,這一優化不僅是對用戶的尊重,更有利於平臺的長期維護。

        3)推薦算法也要跳出封地

        推薦算法的怪圈在於“信息繭房”,一種體現是:用戶越是消費某一類內容,系統越會推薦同類內容,而其他內容被隔離在外;另一種體現是:數據表現越好的內容越能獲得推薦,而長尾視頻無出頭之日。

        針對前者,B站的推薦系統並不會止步於用戶已有興趣的推薦,而是會在探索中鼓勵用戶發現自身更多元化的興趣,這就是基於用戶的協同推薦要優於基於內容的協同的地方。

        針對後者,B站在長尾視頻曝光上,引入了新星計劃,也會提高首頁推薦的權重。

        4)推薦系統>推薦算法

        推薦算法並不等同於推薦系統,人工編輯也有一席之地。

        推薦算法下的信息流容易遇到熱點話題刷屏等問題,而在價值、新鮮話題的反應上,人爲和機器推薦的組合有時更能起到畫龍點睛的作用。

        5)up主持續創作的引導

        Up主持續創作的動力不僅來自於金錢激勵,也來自於成就感、社交互動等心理激勵,而合理運用推薦算法可以在滿足創作者心理需求的同時,帶來金錢激勵。

        尤其需要注意的是:B站目前月均活躍up主的數量已達到百萬級,如何按照活躍度、關注度、創作質量等維度合理分配up主的推薦比重,是B站運營迫切需要解決的問題之一。


        作者:  來源:人人都是產品經理(woshipm)


        E星体育BOB软件HJC黄金城官网75贵宾厅