一文總覽近年來YouTube推薦系統算法梳理 | youtube推薦系統
作者:張皓來源:https://zhuanlan.zhihu.com/p/99953120整理:深度傳送門作者介紹:南京大學計算機系機器學習與數據挖掘所(LAMDA)碩士,騰訊優圖實驗室研究員,研究方向為視頻理解與推薦。個人主頁:https://haomood.github.io/homepage/YouTube創建於2005年,用於讓用户尋找和發佈視頻。近年來,YouTube上的視頻數量得到了迅猛增長,成為全球最大的視頻網站。截止2008年,整個YouTube視頻量已突破四千五百萬,每分鐘上傳視頻量7小時。截止2010年,每分鐘上傳視頻量超過24小時。截止2014年,每分鐘上傳視頻量超過100小時。2019年,...
作 者:張皓
來源: https://zhuanlan.zhihu.com/
p/99953120
整理:深度傳送門
作者介紹:南京大學計算機系機器學習與數據挖掘所(LAMDA)碩士,騰訊優圖實驗室研究員,研究方向為視頻理解與推薦。 個人主頁: https://haomood.github.io/homepage/
YouTube 創建於 2005 年,用於讓用户尋找和發佈視頻。近年來,YouTube 上的視頻數量得到了迅猛增長,成為全球最大的視頻網站。截止 2008 年,整個 YouTube 視頻量已突破四千五百萬,每分鐘上傳視頻量 7 小時。截止 2010 年,每分鐘上傳視頻量超過 24 小時。截止 2014 年,每分鐘上傳視頻量超過 100 小時。2019 年,月度活躍用户是 19 億。如此龐大的視頻量,使得用户難以搜索到其感興趣的視頻。YouTube 的成功得益於其精準的推薦系統。
YouTube 視頻推薦系統主要面臨以下幾大難題:
大規模:YouTube 的用户和視頻量級都是十億級別的,需要分佈式學習算法和高效的部署。
新鮮度:推薦系統需要及時對新上傳的視頻和用户的新行為作出響應。
噪聲:由於稀疏和外部因素影響,用户的歷史行為很難預測。大部分 YouTube 視頻只有隱式反饋(即用户對視頻的觀看行為),缺少顯式反饋(即用户對視頻的評分)。此外,視頻的元信息不夠有結構性。我們的算法需要對訓練數據的這些因素穩健(robust)。
多模態特徵,包括視頻內容、縮略圖、音頻、標題和描述、用户人口統計學信息、設備、時間、位置等。
本文介紹了 YouTube 從開始發展至今使用的五種推薦系統,對應於五篇論文。
[Baluja et al., 2008] Shumeet Baluja, Rohan Seth, D. Sivakumar, Y...