【Python】【爬虫】【问题解决方案记录】调试输出存在数据,print在控制台确丢失数据

调试输出存在数据,print在控制台确丢失数据

如下图,调试可以看到数据是完整的

【Python】【爬虫】【问题解决方案记录】调试输出存在数据,print在控制台确丢失数据

但是print输出的,恰好丢失了中间的一大堆数据。对,下图打问号的地方应该是小说才对。

【Python】【爬虫】【问题解决方案记录】调试输出存在数据,print在控制台确丢失数据

看代码可能看不出缺失内容,可视化看看

【Python】【爬虫】【问题解决方案记录】调试输出存在数据,print在控制台确丢失数据

对吧,刚好缺失了小说。

后来我尝试用写文件的方式保存获取的源码,经过观察发现

消失的数据都有一个特征,前面有 <br>&#xA0;
凡是有个特征的行,都没有在控制台输出

解决方法如下

【Python】【爬虫】【问题解决方案记录】调试输出存在数据,print在控制台确丢失数据

获取到源码后立即以替换的方式更换 <br>换行符为 \n, 改为空格。

【Python】【爬虫】【问题解决方案记录】调试输出存在数据,print在控制台确丢失数据

正常输出!over!

Original: https://www.cnblogs.com/mllt/p/python-q-print.html
Author: 萌狼蓝天
Title: 【Python】【爬虫】【问题解决方案记录】调试输出存在数据,print在控制台确丢失数据

原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/162561/

转载文章受原作者版权保护。转载请注明原作者出处!

(0)

大家都在看

  • C语言练习:hackerrank十五关

    第一关:Hello World C 输入一行字符串(可能含空格),输出hello world\n,字符串 Sample Input 0 Welcome to C programmi…

    Linux 2022年10月31日
    0241
  • CentOS6配置清华大学yum源

    CentOS官方已经停止服务了,yum源不能使用了,我们可以配置其它源。 清华大学的镜像网站:https://mirrors4.tuna.tsinghua.edu.cn/cento…

    Linux 2022年8月30日
    0187
  • Redis从入门到精通:初级篇

    原文链接:http://www.cnblogs.com/xrq730/p/8890896.html,转载请注明出处,谢谢 Redis从入门到精通:初级篇 平时陆陆续续看了不少Red…

    Linux 2022年9月14日
    0116
  • 博客停更通知

    大楼以科研为主,我会用相关博客维护这些工具;如果有任何不准确的地方,欢迎大家批评改正! [En] The building is mainly busy with scientif…

    Linux 2022年11月7日
    0100
  • 第2次作业:支付宝案例分析

    1.介绍产品相关信息 *你选择的产品是? 支付宝 *为什么选择该产品作为分析? 在使用支付宝之前,学费等金额相对较大的资金要去银行办理。在银行排队通常会花很多时间,特别是人多的时候…

    Linux 2022年10月21日
    0148
  • 白话linux操作系统原理

    虽然计算机相关专业,操作系统和计算机组成原理是必修课。但是大学时和真正从事相关专业工作之后,对于知识的认知自然会发生变化。还很有可能,一辈子呆在学校的老师们只是照本宣科,自己的理解…

    Linux 2022年9月10日
    0139
  • [转]ucLinux下sqlite数据库移植全攻略

    ucLinux 下sqlite数据库移植全攻略 本文讨论的是比较流行的嵌入式开发组合ARM+uclinux,即目标开发板为三星S3C4510,完成sqlite在其uclinux上的…

    Linux 2022年8月26日
    0157
  • springboot redis key乱码

    原写法: 写入redis后,查看key值 解决方式: 调整后查看redis key值: Original: https://www.cnblogs.com/janes/p/8796…

    Linux 2022年9月14日
    0126
  • 分支合并: git rebase 与 git merge 使用与区别

    分支合并的场景 假设你现在基于远程分支”origin”,创建一个叫”mywork”的分支。 $ git checkout -b my…

    Linux 2022年8月30日
    0178
  • 【转】如何查看yum 安装的软件路径

    今天使用yum 安装了一个软件,后来没有找到路径 1、首先安装一个redis 2、查找redis的安装包 3、查找安装包的安装路径 4、ok,现在就找到了! ———————————…

    Linux 2022年8月30日
    0183
  • Java|–Linux 安装Maven

    前提 : 安装位置选择 / JDK已经安装 /usr/local/ 备注 : Linux直接将安装压缩包解压后,有点像Windows系统的绿色安装一样. 0.下载 >>…

    2022年8月20日
    0119
  • CentOS——Redis消息订阅发布

    作用: 发布订阅类似于信息管道,用来进行系统之间消息解耦。类似于mq,rebbitmq,rocketmq,kafka,activemq 主要有消息发布者和消息订阅者。 比如:订单支…

    Linux 2022年9月14日
    0107
  • 相关powerLink教程、配置方法等

    openPowerLink的开发小组早已经解散,所以有些资料都可以在官网上下载到; 这也是最后一次更新了。其中相关powerlink的教程均放在百度网盘里,链接:https://p…

    Linux 2022年11月7日
    090
  • [Linux]CentOS运行DotNet Web程序

    文章说明 在Linux(CentOS)是运行C#的Web应用程序,这里使用及讲解的是Jexus服务器安装及配置。非ASP.net Core 安装步骤 一、下载及安装Mono yum…

    Linux 2022年8月26日
    0135
  • JuiceFS 在多云存储架构中的应用| 深势科技分享

    2020 年末,谷歌旗下 DeepMind 研发的 AI 程序 AlphaFold2 在国际蛋白质结构预测竞赛上取得惊人的准确度,使得” AI 预测蛋白质结构&#822…

    Linux 2022年11月8日
    0112
  • 修改shell命令提示符和命令的输入颜色

    修改命令提示符颜色 修改命令提示符的话,只需修改PS1环境变量即可。 PS1=’\[\033[01;31m\][\u@\h \W]$ \[\033[00m\]’ 效果如图: 修改命…

    Linux 2022年9月14日
    0136
最近整理资源【免费获取】:   👉 程序员最新必读书单  | 👏 互联网各方向面试题下载 | ✌️计算机核心资源汇总