【推薦系統(tǒng)】多視圖多示例多標簽的協(xié)同矩陣分解

題目: Multi-View Multi-Instance Multi-Label Learning based on Collaborative Matrix Factorization
會議: AAAI 2019
論文: https://arxiv.org/pdf/1905.05061.pdf
1 Motivation
1、現(xiàn)有的M3L方法僅僅探索了部分實體(包,實例和標簽)之間的關系,而這些實體之間的關系可以給M3L方法提供豐富的上下文信息,因此,現(xiàn)有的M3L方法性能次優(yōu);
2、大部分的MIML算法僅關注單視圖數(shù)據(jù),但是,在實際應用中,通??梢酝ㄟ^不同的視圖來表示多實例多標簽對象。
2 Related work
由于包之間以及實例之間存在多種類型的關系,與最近大量研究的MIML任務相比,從多視圖包中學習更加困難和挑戰(zhàn)。當前已有不少研究工作致力于解決這樣一種挑戰(zhàn)。如表1所示:

盡管這些方法在努力解決多視圖MIML學習問題,但是這些方法僅考慮了包之間和實例之間有限的關系類型。
3 Methodology
所提模型主要包括兩部分,一部分是異質網(wǎng)絡的構建,另一部分是協(xié)同關系矩陣分解。
3.1 Heterogeneous Network Construction

1、construct a subnetwork of instances for each feature view
利用高斯熱核為每個特征視圖中的實例構建子網(wǎng),其中為第v個視圖中m個實例的平均歐氏距離。
2、construct a bag subnetwork for each feature view
利用豪斯多夫距離為每個試圖中的包構建子網(wǎng)


3、construct a subnetwork of labels
利用cosine相似度來量化標簽相關性,其中和為兩個標簽,是標簽c在所有包中的分布。
以上三部分便構建完了實例-實例,包-包,標簽-標簽的子網(wǎng),另外,通過數(shù)據(jù)集的信息,作者繼續(xù)構建包-實例,包-標簽,實例-標簽之間的數(shù)據(jù)矩陣。
4、The bag-instance inter-relational data matrix .
5、The bag-label relational matrix .
6、The instance-label relational data matrix . 初始,實例-標簽的數(shù)據(jù)矩陣未知,設為0.
3.2 Collaborative Matrix Factorization
論文所提方法M3Lcmf的目標函數(shù)所下所示:

M3Lcmf有兩個預測項:實例-標簽的聯(lián)系和包-標簽的聯(lián)系。除了直接利用趨近,作者增加了一個整合項。這個整合項受多實例學習原理的驅動,即包的標簽取決于其實例的標簽。另外,此整合項可以反向指導和的學習。
由目標函數(shù)的前三項可以看出,M3Lcmf構建了包-實例,包-標簽,實例-標簽之間的關系。按照流行正則的思想,促使有著高相似性的數(shù)據(jù)點在低維空間內(nèi)相似,構成MR(G),利用圖拉普拉斯矩陣來構建包-包,實例-實例,標簽-標簽之間的關系。
最后,可以利用優(yōu)化好的和來獲取實例-標簽的相關性矩陣:,同樣,要將實例的標簽進一步映射到相應的包上,作者利用來趨近包-標簽相關性矩陣。因此,M3Lcmf既可以實現(xiàn)包級預測也可以實現(xiàn)實例級預測。
Experiments
Datasets

Metric
1、Ranking Loss (RankLoss),
2、macro AUC (Area Under receiver operating Curve)
3、Average Recall (AvgRecall),
4、Average F1-score (AvgF1).
Results
1、Prediction Results at the Bag-Level

M3Lcmf優(yōu)于MIMLmix和M2IL:M3Lcmf利用了更多對象之間的關系; M3Lcmf優(yōu)于MIML方法(MIMLNN, MIMLfast 和 MIMLSVM):MIML相比于M3Lcmf利用了更少的實體之間的關系; MIMLRBF性能逼近M3Lcmf:盡管MIMLRBF利用了更少的實體關系,但是MIMLRBF利用神經(jīng)網(wǎng)絡來獲取特征表示。


參數(shù)敏感實驗詳情請見原論文。
參考文獻
[Nguyen, Zhan, and Zhou 2013] Nguyen, C. T.; Zhan, D. C.; and Zhou, Z. H. 2013. Multi-modal image annotation with multi-instance multi-label lda. In IJCAI, 1558–1564.
[Nguyen et al. 2014] Nguyen, C. T.; Wang, X.; Liu, J.; and Zhou, Z. H. 2014. Labeling complicated objects: multi-view multi-instance multi-label learning. In AAAI, 2013–2019.
[Yang et al. 2018] Yang, Y.; Wu, Y.-F.; Zhan, D.-C.; Liu, Z.- B.; and Jiang, Y. 2018. Complex object classification: A multi-modal multi-instance multi-label deep network with optimal transport. In KDD, 2594–2603.
[Li et al. 2017] Li, B.; Yuan, C.; Xiong, W.; Hu, W.; Peng, H.; Ding, X.; and Maybank, S. 2017. Multi-view multi-instance learning based on joint sparse representation and multi-view dictionary learning. TPAMI 39(12):2554–2560.
[Zhou et al. 2008] Zhou, Z. H.; Zhang, M. L.; Huang, S. J.; and Li, Y. F. 2008. Miml: A framework for learning with ambiguous objects. Corr Abs 2012.
[Huang, Gao, and Zhou 2018] Huang, S.-J.; Gao, W.; and Zhou, Z.-H. 2018. Fast multi-instance multi-label learning. TPAMI 99(1):1–14.
[Zhang and Wang 2009] Zhang, M. L., and Wang, Z. J. 2009. Mimlrbf: Rbf neural networks for multi-instance multi-label learning. Neurocomputing 72(16-18):3951–3956.
往期精彩回顧
本站qq群851320808,加入微信群請掃碼:
