周杰倫作為天王,具有劃時(shí)代的意義毋庸置疑,他的歌伴隨了多少個(gè)90后的日日夜夜,是多少人的回憶和情懷!
9 月 16 日晚間,一代天王周董發(fā)布了最新單曲《說好不哭》
發(fā)布后,真的讓一波人哭了
一群想搶鮮聽的小伙伴直接淚奔
因?yàn)?QQ 音樂直接被搞崩了
沒想到干翻 QQ 音樂的不是網(wǎng)易云音樂
也不是蝦米音樂
而是周董!
周董成成功地憑一己之力干翻了 QQ 音樂
那么聽過周董新歌后的小伙伴都是怎么評(píng)價(jià)的呢?
這里,我們獲取了 QQ 音樂的近 20W 條評(píng)論數(shù)據(jù)進(jìn)行分析
看看其中有哪些有趣的東西
1、請(qǐng)求分析
在 QQ 網(wǎng)頁版直接搜索『說好不哭』
很容易就能找到單曲頁面
說好不哭
拉到頁面最下方
可以看到評(píng)論的分頁查看按鈕
分頁查看
按下 F12 點(diǎn)擊第二頁
在請(qǐng)求流中就可以看到對(duì)應(yīng)的請(qǐng)求
評(píng)論請(qǐng)求
其中可以看到兩個(gè)重要參數(shù):pagenum 和 pagesize
將請(qǐng)求 copy 到 Postman 中進(jìn)行測(cè)試
Postman測(cè)試
發(fā)現(xiàn)可以直接獲取到數(shù)據(jù)
連 Header 都不需要添加
這里嘗試對(duì)請(qǐng)求參數(shù)進(jìn)行了精簡
最終只需要如下幾個(gè)參數(shù)即可
參數(shù)精簡
從 Postman 中可以直接獲取到對(duì)應(yīng)的代碼
import requests
url = "https://c.y.qq.com/base/fcgi-bin/fcg_global_comment_h5.fcg"
querystring = {"biztype":"1","topid":"237773700","cmd":"8","pagenum":"1","pagesize":"25"}
response = requests.request("GET", url, params=querystring)
print(response.text)
這里是單頁評(píng)論的獲取
所有評(píng)論的獲取只需遞增 pagenum 即可
2、數(shù)據(jù)解析
返回?cái)?shù)據(jù)中有很多暫時(shí)不需要的字段
這里我們只取其中的用戶名、評(píng)論時(shí)間、評(píng)論內(nèi)容、點(diǎn)贊數(shù)
對(duì)應(yīng)如下字段
{ "nick": "丨那壹刻永遠(yuǎn)消失\"\"", "praisenum": 1, "rootcommentcontent": "越聽越好聽怎么回事!", "time": 1568729836,}
由于數(shù)據(jù)量較大 這里我們暫時(shí)將數(shù)據(jù)存放在 Excel 中
一來無須依賴外部數(shù)據(jù)庫
二來可以使用 Excel 對(duì)數(shù)據(jù)進(jìn)行二次處理
數(shù)據(jù)存儲(chǔ)代碼如下:
def file_do(list_info, file_name): # 獲取文件大小 if not os.path.exists(file_name): wb = openpyxl.Workbook() page = wb.active page.title = 'jay' page.append(['昵稱','時(shí)間','點(diǎn)贊數(shù)','評(píng)論']) else: wb = openpyxl.load_workbook(file_name) page = wb.active for info in list_info: try: page.append(info) except Exception: print(info) wb.save(filename=file_name)
1、各時(shí)段的評(píng)論數(shù)
首先我們對(duì)評(píng)論按小時(shí)區(qū)間進(jìn)行匯總
由于時(shí)間粒度比較小,這里對(duì)時(shí)間粒度進(jìn)行了一些處理
評(píng)價(jià)人數(shù)走勢(shì)圖
周董的新曲是在 9.16 號(hào) 23 點(diǎn)準(zhǔn)時(shí)發(fā)布的
可以看出在發(fā)布后的一個(gè)小時(shí)內(nèi)(23:00-24:00)
評(píng)論數(shù)量達(dá)到了高峰
占了總評(píng)論數(shù)的一半以上
另外看了一眼 9.16 23 點(diǎn)之前的評(píng)論也很有意思
一種搬好小板凳嗑著瓜子坐等的既視感
2、大家都在說什么
詞云生成的方法有很多
可以用代碼生成
也可以用一些在線工具
這里我就使用了在線詞云工具:wordart
后續(xù)可以給大家單獨(dú)再普及一下
生成效果如下
詞云
周杰倫、杰倫字眼很明顯
還有大量跑來『打卡』的
『好聽』、『來了』、『哭了』、『愛了』
其中少不了的還有『青春』
另外『阿信』的出現(xiàn)估計(jì)給了很多人驚喜
3、大家都點(diǎn)贊了哪些評(píng)論
我們以點(diǎn)贊數(shù)對(duì)評(píng)論進(jìn)行了排序
排名靠前的評(píng)論是如下一些
評(píng)論排名
另外,QQ 音樂官方也會(huì)放出精彩評(píng)論
熱心網(wǎng)友昀愷丶
涼城
蝸牛..
對(duì)比下可以看出和我們獲取到的數(shù)據(jù)是比較一致的
只不過官方并不是按點(diǎn)贊個(gè)數(shù)進(jìn)行排名的
看得出來這些排名靠前的大都是在回憶青春
這些評(píng)論之所以能夠得到大家的共鳴
也許他們的青春里都有一個(gè)周杰倫吧
聯(lián)系客服