一文總覽近年來YouTube推薦系統演算法梳理 | youtube推薦系統
作者:張皓來源:https://zhuanlan.zhihu.com/p/99953120整理:深度傳送門作者介紹:南京大學計算機系機器學習與資料探勘所(LAMDA)碩士,騰訊優圖實驗室研究員,研究方向為影片理解與推薦。個人主頁:https://haomood.github.io/homepage/YouTube創建於2005年,用於讓使用者尋找和釋出影片。近年來,YouTube上的影片數量得到了迅猛增長,成為全球最大的影片網站。截止2008年,整個YouTube影片量已突破四千五百萬,每分鐘上傳影片量7小時。截止2010年,每分鐘上傳影片量超過24小時。截止2014年,每分鐘上傳影片量超過100小時。2019年...
作 者:張皓
來源: https://zhuanlan.zhihu.com/
p/99953120
整理:深度傳送門
作者介紹:南京大學計算機系機器學習與資料探勘所(LAMDA)碩士,騰訊優圖實驗室研究員,研究方向為影片理解與推薦。 個人主頁: https://haomood.github.io/homepage/
YouTube 創建於 2005 年,用於讓使用者尋找和釋出影片。近年來,YouTube 上的影片數量得到了迅猛增長,成為全球最大的影片網站。截止 2008 年,整個 YouTube 影片量已突破四千五百萬,每分鐘上傳影片量 7 小時。截止 2010 年,每分鐘上傳影片量超過 24 小時。截止 2014 年,每分鐘上傳影片量超過 100 小時。2019 年,月度活躍使用者是 19 億。如此龐大的影片量,使得使用者難以搜尋到其感興趣的影片。YouTube 的成功得益於其精準的推薦系統。
YouTube 影片推薦系統主要面臨以下幾大難題:
大規模:YouTube 的使用者和影片量級都是十億級別的,需要分散式學習演算法和高效的部署。
新鮮度:推薦系統需要及時對新上傳的影片和使用者的新行為作出響應。
噪聲:由於稀疏和外部因素影響,使用者的歷史行為很難預測。大部分 YouTube 影片只有隱式反饋(即使用者對影片的觀看行為),缺少顯式反饋(即使用者對影片的評分)。此外,影片的元資訊不夠有結構性。我們的演算法需要對訓練資料的這些因素穩健(robust)。
多模態特徵,包括影片內容、縮圖、音訊、標題和描述、使用者人口統計學資訊、裝置、時間、位置等。
本文介紹了 YouTube 從開始發展至今使用的五種推薦系統,對應於五篇論文。
[Baluja et al., 2008] Shumeet Baluja, Rohan Seth, D. Si...