2020年2月3日星期一

Wallabag教程:从入门到入土

Wallabag是什么?参考如下文章
我们本来最希望的是用这个软件解决下列等等问题:


然而我花费几天搭建和研究了这个软件,却发现这个软件就是一个坑!
存在如下几个最大的问题:
  1. 无法保存原始网页,也因此兼容性极差。这个软件开发者比较偏执,非要把原页面提取图文变成“阅读模式”然后保存。但是它又不能100%确保提取图文成功,更无语的是提取图文失败后什么都没有保存下来,让人恼火和无语。相比之下pocket就有网页视图,可以查看网页。这个问题是最大的最致命的!别的都可以忍。
  2. 使用PHP编写,且设计不合理,性能低下。最明显就比如新增文章的时候,是同步的方法,发送链接给它后,请求会卡在那里直到整个页面都被下载保存完毕,这带来了每次新增页面时几秒的卡顿,用户体验极差。这个操作其实应该是异步的,用户提交链接,加入待爬列表,然后多线程爬取内容,对用户则可以显示这个页面在“排队中”/“爬取中”这样的状态。打开一个页面,渲染都要好久,查看文章等每个操作都卡卡的(我可是8核CPU、4G内存服务器)。
  3. 无法配置代理,为了通过代理爬取网页需要手动vi修改php代码加一行代理设置。
  4. 运行不稳定,需要时不时(1-3天)进行手动一次重启docker。这还是我用的docker,如果不是docker怕是更麻烦。
  5. issue还开了396个呢😓
    保存网页失败
  6. 连续的失败
为此,我浪费了两三天的时间。安息吧,Wallabag!
记录下来,希望看到的朋友不要对wallabag浪费时间了,有这个功夫还不如自己写一个,可能都写完了。

没有评论:

发表评论