书接上文,今天一起来学习把网页版文章下载到本地电脑上。
前面讲过,请求网页的流程是浏览器先向服务器请求 html,服务器返回 html,浏览器分析这个 html,发现 html 中还需要一堆的 js,css,图片,然后浏览器再去下载这些文件,最终组装成一个完整的 html 页面。
所以,第一步,要把这个 html ……继续阅读 »
kakalong
0评论
0个赞
一步步教你打造文章爬虫(1)-综述
本系列我将与大家一起学习批量下载任意公众号所有历史文章。
争取讲明白,源代码也会随着教程逐步放出来,但是不喜欢伸手党和不过如此党(凡事都说虽然我不会但我觉得不难的人)。
用户需要有一定的基础:
知道百度这个神奇的网站,而且知道是免费的。
遇到问题先自行尝试解决,不要张口就问。
有 html ……继续阅读 »
kakalong
0评论
0个赞
许多朋友可能遇到过这样的情况:正在微信中查看一篇文章,突然朋友来了一条消息,退出去看完消息需要重新再打开文章,有时候还会忘了这篇文章是从朋友圈还是群聊中打开的,需要再花点时间去找到这篇文章。
这个问题前段时间微信已经解决了,可以以浮窗的形式单独在微信中悬浮一篇文章,这样回完消息之后可以快速返回到刚才在看的文章,相信许多朋友已经体验过并喜欢上了这个功能。
可……继续阅读 »
kakalong
0评论
0个赞
公众号数据分析-水库论坛
kakalong 不止技术流 今天
此为公众号数据分析第 4 篇,前 3 篇见
挖一挖 caoz 大佬的公众号数据
分析一下占豪这个号
用数据解读咪蒙
此次分析“水库论坛”,号主 欧成效,欧神,房地产投资界牛人。
分析文章时间范围:
第一篇(2015-02-18)至 2019-07-11
共 703 篇文章,因违规/被举报/自己……继续阅读 »
kakalong
0评论
0个赞