午夜无码人妻aⅴ大片色欲张津瑜,国产69久久久欧美黑人A片,色妺妺视频网,久久久久国产综合AV天堂

如何用Python爬取B站上1.4w條馬老師視頻數(shù)據(jù)來分析

這篇文章給大家介紹如何用Python爬取B站上1.4w條馬老師視頻數(shù)據(jù)來分析,內(nèi)容非常詳細(xì),感興趣的小伙伴們可以參考借鑒,希望對大家能有所幫助。

創(chuàng)新互聯(lián)公司是專業(yè)的武岡網(wǎng)站建設(shè)公司,武岡接單;提供網(wǎng)站制作、成都做網(wǎng)站,網(wǎng)頁設(shè)計,網(wǎng)站設(shè)計,建網(wǎng)站,PHP網(wǎng)站建設(shè)等專業(yè)做網(wǎng)站服務(wù);采用PHP框架,可快速的進(jìn)行武岡網(wǎng)站開發(fā)網(wǎng)頁制作和功能擴展;專業(yè)做搜索引擎喜愛的網(wǎng)站,專業(yè)的做網(wǎng)站團(tuán)隊,希望更多企業(yè)前來合作!

看到標(biāo)題       
 

啪的一下你就進(jìn)來了吧!

如果有經(jīng)常刷B站的小伙伴,肯定都知道B站鬼畜現(xiàn)在的頂流是誰?

印度:沒錯正是在下

那必須是當(dāng)代大師渾元形意太極拳掌門人「馬保國」先生??!

如何用Python爬取B站上1.4w條馬老師視頻數(shù)據(jù)來分析  

實話講,馬保國走進(jìn)大家視野還是他5月份PK被人連續(xù)KO三次。

不過現(xiàn)在他在鬼畜區(qū)的主要素材卻是馬保國更早時候的一些視頻。

如何用Python爬取B站上1.4w條馬老師視頻數(shù)據(jù)來分析  

比如2020年一月份,右眼被蹭了一下的馬老師面帶微笑,為我們生動形象地講述了健身房里的年輕人是如何不講武德,偷襲他的故事。

如何用Python爬取B站上1.4w條馬老師視頻數(shù)據(jù)來分析  

在視頻里,他控訴踢館的年輕人 “ 不講武德” ,勸他 “ 耗子尾汁” ??梢宰鳛锽站入站題目,建議全文背誦。

B站這個小機靈鬼,甚至還給馬老師專門開了專欄,這為我們后續(xù)爬取數(shù)據(jù)也帶來了便利。

如何用Python爬取B站上1.4w條馬老師視頻數(shù)據(jù)來分析  

跟平時爬取B站不太一樣,在B站的馬保國專欄下,F(xiàn)12可以輕松找到接口。

https://api.bilibili.com/x/web-interface/web/channel/multiple/list?channel_id=3503796&sort_type=hot&page_size=30
 

解析JSON后我們需要的數(shù)據(jù)都可以獲得。

如何用Python爬取B站上1.4w條馬老師視頻數(shù)據(jù)來分析  

其中要提到一點,url中的offest從解析上一個url的json中獲取,如如下圖所示。

如何用Python爬取B站上1.4w條馬老師視頻數(shù)據(jù)來分析  

通過簡短的爬蟲代碼,

很快啊,很快就爬取了1.4萬條馬保國先生的視頻數(shù)據(jù)。

def get_data(url,headers):
    data_m = pd.DataFrame(columns=['id','name','view_count','like_count','duration','author_name','author_id','bvid'])
    html = requests.get(url,headers=headers).content
    data = json.loads(html.decode('utf-8'))
    offset = data['data']['offset']
    print(offset)
    for j in range(30):
        data_m = data_m.append({'id':data['data']['list'][j]['id'],'name':data['data']['list'][j]['name'],
                            'view_count':data['data']['list'][j]['view_count'],'like_count':data['data']['list'][j]['like_count'],
                            'duration':data['data']['list'][j]['duration'],'author_name':data['data']['list'][j]['author_name'],
                            'author_id':data['data']['list'][j]['author_id'],'bvid':data['data']['list'][j]['bvid']},ignore_index=True)
    return(offset,data_m)
 
如何用Python爬取B站上1.4w條馬老師視頻數(shù)據(jù)來分析  
1.4萬條數(shù)據(jù)預(yù)覽

我們先進(jìn)行簡單的數(shù)據(jù)整理(播放量有的是萬為單位)后,將1.4萬個視頻按照播放量和點贊量制作了一個散點圖。

如何用Python爬取B站上1.4w條馬老師視頻數(shù)據(jù)來分析  

可以看到什么才是“頂流”的話題,播放量幾百萬,點贊量幾十萬的相關(guān)視頻特別多。

按照播放量排序一下。

如何用Python爬取B站上1.4w條馬老師視頻數(shù)據(jù)來分析  

第一名就是今年一月份相聲泰斗馬老師經(jīng)典單口相聲?。?!

如何用Python爬取B站上1.4w條馬老師視頻數(shù)據(jù)來分析  

那按照點贊量呢?如何用Python爬取B站上1.4w條馬老師視頻數(shù)據(jù)來分析

第一名是來自鬼畜up主的伊麗莎白鼠“武 林 高 手”!

而懂王與馬老師的聯(lián)動表現(xiàn)也很優(yōu)秀!

其中幾個特效向的表現(xiàn)更是突出!

如何用Python爬取B站上1.4w條馬老師視頻數(shù)據(jù)來分析  

由于馬老師的語錄太過經(jīng)典,我決定再補充爬一下它的彈幕。

# 繪制詞云圖
stylecloud.gen_stylecloud(text=' '.join(text1), 
                          collocations=False,
                          font_path=r'?C:\Windows\Fonts\msyh.ttc',
                          icon_name='fas fa-play-circle',
                          size=653,
                          output_name='馬保國詞云圖.png')

Image(filename='馬保國詞云圖.png') 
 
如何用Python爬取B站上1.4w條馬老師視頻數(shù)據(jù)來分析  

耗子尾汁真是門面擔(dān)當(dāng)!

婷婷、英國大理石、塔門說也夾雜其中。

如何用Python爬取B站上1.4w條馬老師視頻數(shù)據(jù)來分析  

關(guān)于如何用Python爬取B站上1.4w條馬老師視頻數(shù)據(jù)來分析就分享到這里了,希望以上內(nèi)容可以對大家有一定的幫助,可以學(xué)到更多知識。如果覺得文章不錯,可以把它分享出去讓更多的人看到。

當(dāng)前標(biāo)題:如何用Python爬取B站上1.4w條馬老師視頻數(shù)據(jù)來分析
當(dāng)前鏈接:http://www.ekvhdxd.cn/article12/jsjdgc.html

成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供網(wǎng)站策劃、網(wǎng)站制作、關(guān)鍵詞優(yōu)化、虛擬主機營銷型網(wǎng)站建設(shè)、全網(wǎng)營銷推廣

廣告

聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時需注明來源: 創(chuàng)新互聯(lián)

成都定制網(wǎng)站網(wǎng)頁設(shè)計