博客
关于我
新浪微博爬虫便携版
阅读量:161 次
发布时间:2019-02-27

本文共 1026 字,大约阅读时间需要 3 分钟。

需要调整的参数是新冠肺炎和page,返回一页的数据

import requestsimport pandas as pdimport jsonimport redef get_one_page():    one_page_data = []    params = {           'containerid': '100103type=60&q=新冠肺炎&t=0',        'page_type': 'searchall',        'page': 1    }    url = 'https://m.weibo.cn/api/container/getIndex'# 请求api    response = requests.get(url,params=params).text    cards = json.loads(response)['data']['cards']    for card in cards:        blog_data = card['mblog']        text = re.sub('<.*?>','',blog_data['text'])  # 文章内容        mid = blog_data['mid']  # 文章id        reposts_count = blog_data['reposts_count']  # 转发数        comments_count = blog_data['comments_count']  # 评论数        attitudes_count = blog_data['attitudes_count']  # 点赞数        data = [text,mid,reposts_count,comments_count,attitudes_count]        column = ['text','mid','reposts_count','comments_count','attitudes_count']        one_page_data.append(dict(zip(column,data)))    return one_page_dataif __name__ == '__main__':    data = get_one_page()    print(data)

转载地址:http://cwrf.baihongyu.com/

你可能感兴趣的文章
Navicat可视化界面导入SQL文件生成数据库表
查看>>
Navicat向sqlserver中插入数据时提示:当 IDENTITY_INSERT 设置为 OFF 时,不能向表中的标识列插入显式值
查看>>
Navicat因导入的sql文件中时间数据类型有参数而报错的原因(例:datetime(3))
查看>>
Navicat如何连接MySQL
查看>>
navicat导入.sql文件出错2006- MySQLserver has gone away
查看>>
Navicat导入海量Excel数据到数据库(简易介绍)
查看>>
Navicat工具Oracle数据库复制 or 备用、恢复功能(评论都在谈论需要教)
查看>>
navicat工具查看MySQL数据库_表占用容量_占用空间是多少MB---Linux工作笔记048
查看>>
navicat怎么导出和导入数据表
查看>>
Navicat报错connection is being used
查看>>
Navicat报错:1045-Access denied for user root@localhost(using passwordYES)
查看>>
Navicat控制mysql用户权限
查看>>
navicat操作mysql中某一张表后, 读表时一直显示正在载入,卡死不动,无法操作
查看>>
Navicat连接mysql 2003 - Can't connect to MySQL server on ' '(10038)
查看>>
Navicat连接mysql数据库中出现的所有问题解决方案(全)
查看>>
Navicat连接Oracle出现Oracle library is not loaded的解决方法
查看>>
Navicat连接Oracle数据库以及Oracle library is not loaded的解决方法
查看>>
Navicat连接sqlserver提示:未发现数据源名并且未指定默认驱动程序
查看>>
navicat连接远程mysql数据库
查看>>
Navicat通过存储过程批量插入mysql数据
查看>>