引用格式:劉超慧,韓傳福,陳天成,等.融合懲罰因子和時間權重的協同過濾推薦算法[J].信息技術與網絡安全,2020,39(5):17-21.
隨著互聯網技術的發展和移動終端設備的普及,以用戶為核心的信息生產模型造成了信息的爆炸式增長,公眾很難在海量信息中迅速、準確地找到所需的信息,面臨著嚴峻的“信息過載”問題。以推薦系統為代表的信息過濾技術,是解決“信息過載”問題的常用方法。推薦系統依據用戶的歷史行為和數據,通過建立模型來挖掘用戶需求和潛在興趣,進而從海量信息中為用戶篩選所需的信息[1]。
協同過濾算法是眾多推薦算法中使用最廣泛、最有效的算法之一,已成功應用于許多商業推薦系統,但其仍存在著一些亟待解決的問題,例如冷啟動、數據稀疏和馬太效應。對此許多學者進行了卓有成效的研究工作。于洪等人提出基于時間窗口的時間數據權重,將用戶興趣分為長期和短期兩類,更好地反映出了用戶興趣變化規律,提高了推薦精度[2];趙文濤等人提出基于時間的Logistic權重函數與用戶特征屬性進行加權的新的相似度度量模型[3];蘭艷等人利用衰減因子建立非線性時間加權函數,賦予評分不同的時間權重,提高了推薦的準確性[4]。上述文獻雖然考慮了用戶興趣隨時間的變化,卻未注意到熱門物品對用戶評分的影響,對推薦精度有一定的影響。
謝修娟等人引入物品流行度與位置信息,提高了推薦結果的多樣性[5];孫紅等人通過添加物品熱門懲罰因子,優化了皮爾遜相似度計算,提高了推薦質量[6];AHM H J等人通過研究物品熱門程度的影響,使用啟發式算法對用戶相似性度量進行優化,緩解了傳統協同過濾算法的冷啟動問題[7];焦富森等人考慮物品質量和用戶評分傾向性對用戶打分的影響,提高推薦效果[8]。這些算法雖彌補了傳統算法過分考慮熱門物品對評分的影響,卻未考慮用戶興趣隨時間遷移的情況,無法動態追蹤用戶的興趣變化。
本文在基于皮爾遜相似度的基礎上進行改進實驗,提出了一種融合物品熱門懲罰因子和時間權重的相似度計算方法,彌補了傳統算法的缺陷。在Movies100k數據集上進行實驗,實驗結果顯示融合后的算法可以有效追蹤用戶興趣的變化和降低熱門物品對用戶評分的影響,提高推薦精度。
本文詳細內容請下載: http://m.viuna.cn/resource/share/2000003098
作者信息:劉超慧,韓傳福,陳天成,孔先進(鄭州航空工業管理學院 智能工程學院,河南 鄭州 450046)