本文共 711 字,大约阅读时间需要 2 分钟。
前段时间在有讲上分享了一个微博粉丝爬虫的代码,爬取的是吴亦凡的部分粉丝(不要问我为什么选择吴亦凡),今天把数据来出来简单分享下,看看吴亦凡小盆友的粉丝妹子多,还是汉子多,嘿嘿。
import pandas as pdimport pymysqlconn = pymysql.connect(host='localhost', user='root', passwd='123456', db='test', port=3306, charset='utf8')weibo = pd.read_sql('select * from weibo',conn)weibo
weibo = weibo.drop_duplicates()weibo
weibo = weibo.reset_index(drop=True)weibo
city = weibo.address.str.split().str[0]year = weibo.time.str.split('-').str[0]weibo['city'] = cityweibo['year'] = yearweibo
这样我们就完成了简单的数据处理啦。
看看男女比例情况
妹子还是多一点,但汉子也是蛮多的,看来许多汉子也是有一颗少女心得(我只是路人,黑粉请不要喷我)。
城市分布情况
广东的粉丝是最多的,由于只是数据量不多,也不能说明太多问题,大家看看就好。
转载地址:http://glzda.baihongyu.com/