Last.fm音乐推荐数据集
音乐产业利用大数据推荐个性化音乐 #生活乐趣# #创新乐趣# #娱乐产业趋势#
背景描述
这个数据集包含社交网络、标签和音乐艺术家从一组2K个用户中收听的信息。fm在线音乐系统
该数据集是在第5届ACM推荐系统会议(RecSys 2011),第2届国际推荐系统信息异构与融合研讨会(HetRec 2011))框架下发布的。
数据说明
数据量
1892 users 17632 artists 12717双向用户朋友关系,即25434 (user_i, user_j)对 平均每个用户13.443个好友关系 92834用户收听艺术家关系,即元组[user, artist, listeningCount] 平均每位用户最常收听49.067位艺术家的作品 平均每位艺术家有5.265名收听用户 11946 tags 186479标签分配(tas),即元组[用户,标签,艺术家] 平均每个用户98.562个标签分配 平均每位艺术家14.891个标签分配 平均8.764个不同的标签用于每个用户 平均8.764个不同的标签用于每个艺术家文件信息
数据包含5个dat格式的文件:
数据格式
数据格式化为每行一个条目如下(tap分隔,“\t”):
id \t name \t url \t pictureURL
示例:
707Metallicahttp://www.last.fm/music/Metallicahttp://userserve-ak.last.fm/serve/252/7560709.jpg
tagID \t tagValue
示例:
1 metal
userID \t artistID \t weight
示例:
2 51 13883
userID \t artistID \t tagID \t day \t month \t year
示例:
25213 142009
userID \t artistID \t tagID \t timestamp
示例:
2 52 13 1238536800000
userID \t friendID
示例:
2 275
数据来源
数据来自grouplens
使用此数据集时,应引用:
Last.fm website, http://www.lastfm.com
亦可引用 HetRec'11 workshop 的内容如下:
@inproceedings{Cantador:RecSys2011,
author = {Cantador, Iv'{a}n and Brusilovsky, Peter and Kuflik, Tsvi},
title = {2nd Workshop on Information Heterogeneity and Fusion in Recommender Systems (HetRec 2011)},
booktitle = {Proceedings of the 5th ACM conference on Recommender systems},
series = {RecSys 2011},
year = {2011},
location = {Chicago, IL, USA},
publisher = {ACM},
address = {New York, NY, USA},
keywords = {information heterogeneity, information integration, recommender systems},
}
问题描述
该数据可用于推荐系统相关研究
网址:Last.fm音乐推荐数据集 https://c.klqsh.com/news/view/311681
相关内容
打造智能音乐推荐系统:基于深度学习的个性化音乐推荐实现Python实现个性化音乐推荐系统:从数据挖掘到算法优化
娱乐行业中的大数据分析与内容推荐
音频娱乐数据的挖掘和分析
10款好用的本地音乐播放器推荐
热门的音乐游戏合集 2024受欢迎的音乐游戏推荐
娱乐文化行业的数据革命:从数据采集到增强用户体验
音乐数据包
抖音娱乐运营数据分析怎么写
抖音音乐热度榜怎么看数据分析图
