宅男福利!我50行Python代码让小姐姐给你读Pdf

最近,小编忙着记录这个项目,需要阅读大量的文献。我困了,累了,因为我不喜欢看很长时间的书,所以我想有我的小妹妹在我身边读给我听会很好。

[En]

Recently, the editor was busy documenting the project and needed to read a lot of literature. I was sleepy and tired because I didn’t like reading for a long time, so I thought it would be nice to have my little sister beside me to read it to me.

就这么干吧,小编理清思路,熬夜,花了几个小时完成了整个小程序,让我们向小编学习。

[En]

Just do it, the editor sorted out his ideas, stayed up late at night and spent a few hours to complete the whole Mini Program, let’s learn from the editor.

01

代码的构思

要完成这项任务的设计,首先要有清晰的思路,总体设计方案如下图所示:

[En]

To complete the design of this task, first of all, we need a clear train of thought, and the overall design scheme is shown in the following figure:

宅男福利!我50行Python代码让小姐姐给你读Pdf

上图中,我们首先需要实现的是将PDF文章中,我们想要提取的文字提取出来,然后再将提取的文本内容,通过小姐姐文本朗读转化为MP3文件,保存到本地当中。明确思路之后,接下来我们就来看一下程序是如何实现的吧。

02

文字提取

对于PDF文档中文字的提取,这里我们采用的是pdfplumber库进行提取,pdfplumber可以处理PDF中,包括文本、表格、格式在内的各种信息,小巧但是功能十分的强大。

但是需要注意版本的使用,这里我们使用的python3.5环境下的版本号为0.5.25的pdfplumber。对于文本的提取,其程序如下所示:

宅男福利!我50行Python代码让小姐姐给你读Pdf

上述的程序中,我们首先打开pdf文件,并返回一个pdf的类对象,然后根据指定的pages数据,来提取指定页码的文本信息。我们来运行一下程序,看一下提取的结果如何吧。

宅男福利!我50行Python代码让小姐姐给你读Pdf

上述的红框中,左侧的是程序提取的结果,而右侧是PDF的文本,通过提取的结果来看,pdfplumber能够准确的提取出PDF中的文本信息。

03

文本转语音

提取到文本信息之后,接下来就是将文本信息,转化为语音信息,并保存到本地,这里,小编采用了两种方式进行实现,第一种方式采用的是pyttsx3库进行转换,而另一种方式采用的则是百度AI进行实现。程序如下所示:

宅男福利!我50行Python代码让小姐姐给你读Pdf

程序首先采用判断的方式,如果形参 baidu == True,则采用百度AI,否则就采用pyttsx3库。

对于百度AI的调用,想必大家都非常的熟悉,大家需要到百度的AI开发者平台,进行接口的申请,然后通过申请的信息来进行百度AI接口的调用。

宅男福利!我50行Python代码让小姐姐给你读Pdf

对于pyttsx3库,首先需要初始化语音引擎,然后设置语音的声音类型、语速和音量的信息。就可以进行引擎的调用。

结果展示

以上是对节目部分的讲解,下面的编辑通过视频的方式来展示一下节目的运行效果。

[En]

The above is the explanation of the part of the program, the following editor through the video show the way to see the running effect of the program.

最后来听一下小姐姐阅读pdf,是什么感觉!有点酥麻!

以上内容是小编今天带给大家的分享。通过这种处理,小编可以解放双眼,直达《听文》。每个人都可以快速下载程序并一起学习。

[En]

The above content is the sharing that the editor brings to you today. Through this treatment, the editor can liberate his eyes and “listen to the document” directly. Everyone can download the program quickly and learn it together.


需要本篇的源码,后台输入:pdf
也可以添加小助手微信小助手获得技术支持,暗号:pdf

菜鸟小助手推荐阅读:这个GitHub 1400星的Git魔法书火了,斯坦福校友出品丨有中文版贼 TM 好用的 Java 工具类库
超全Python IDE武器库大总结,优缺点一目了然!
秋招来袭!GitHub28.5颗星!这个汇聚阿里,腾讯,百度,美团,头条的面试题库必须安利!
收获10400颗星!这个Python库有点黑科技,竟然可以伪造很多'假'的数据!
牛掰了!这个Python库有点逆天了,竟然能把图片,视频无损清晰放大!
点这里,获取一大波福利

Original: https://blog.csdn.net/cainiao_python/article/details/111398956
Author: 菜鸟学Python
Title: 宅男福利!我50行Python代码让小姐姐给你读Pdf

原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/525789/

转载文章受原作者版权保护。转载请注明原作者出处!

(0)

大家都在看

亲爱的 Coder【最近整理,可免费获取】👉 最新必读书单  | 👏 面试题下载  | 🌎 免费的AI知识星球