建议信息聚合(Really Simple Syndication, RSS)在08年我第一次摸到自己家电脑时就给我留下了印象,当时还想这打开都啥玩意呀怎么一堆编码,好多网站还都有,只怪当时无知,年少不知RSS好。RSS跳过了平台,更方便快速地获取各渠道来源的订阅信息。在平台日益封闭、推荐算法日益精准、各大APP日益臃肿(没错就是张小聋的大而丑)的今天,若能使用RSS获取信息,也算是稍稍打开信息茧房一丝缝,获得稍好阅读体验的一种方法。
RSS阅读器尽管关了许多,但仍然有新的产品运营,我目前使用的时Fluent Reader。然而最难解决的时RSS源的获取,有的网站还提供官方RSS源,不过如今是越来越少了。说到微信,平台封闭性很强,过去的微广场等都被封杀,如今的搜狗微信也无法再多显示哪怕第二条文章推送。本文所采用的feed43方法实际是通过搜狗微信来解决的,尽管操作简单方便,但局限性很明显,对有频繁推送的公众号是能力不足。并且feed43免费套餐更新频率低(6小时),适用于低频少量更新的公众号。
此外此处也介绍一下其他微信公众号转RSS或者获取RSS源的方法
Feed43由来已久,根据HTML标志爬取静态网页中的内容。进入官网https://feed43.com/后就可以直接创建RSS源了,不过也可以注册一个用户,用于管理自己的源,还可以对RSS链接个性化重命名。
创建的过程非常简单,根据其步骤操作即可。以公众号锌刻度为例进行示例,首先找到其微信号为znkedu。在搜狗微信对应的搜索网址为https://weixin.sogou.com/weixin?query=znkedu,其他公众号只需修改等号后的红色部分。确认无误后填入Feed43的URL框即可。值得注意的是有的微信号能搜出多个公众号,这块没关系,后面会进行筛选选择。
点击Reload,HTML代码就被加载显示出来了。第二步对特征HTML提取,对不熟悉HTML的小伙伴可以先在原网页用F12开启网页代码检查窗口,对元素进行定位。能够发现最新文章的链接对应的HTML字段。不同公众号其区别仅在于文章标题和网址的不同,因此可以给Feed43标志语段如下。其中{%}表示所要提取的内容,此外还有{*}类似通配符表示任意字符。提取内容按顺序{%1}、{%2}排列。点击Extract,可以看看所提取内容是否正确。此处也对搜出多个公众号的情况进行了处理,"account_article_0"字段表示第一个公众号,"account_article_1"表示第二个,以此类推,因此若按微信号搜索,第一应当都是所要的公众号,只需保持该代码即可。
<a target="_blank" uigs="account_article_0" href="{%}">{%}</a><span>
确保所提取内容正确后进入第三步,编辑RSS相关信息,如源名称、来源链接、描述等,以及最重要的RSS输出选项。以笔者所设为例,标题为{%2},即为文章题目,内容也为该题目,而全文链接即网页所提链接。点击Preview可以查看RSS生成信息
最后生成的URL即可提供给RSS阅读器作为源使用。也可以通过Change file name来自定义URL。
自此整个生成RSS源的过程就完成了
最大的局限性在开头就说过,搜狗微信的来源仅能使用最新文章,很明显,这样的方法可能只适用于一天或者更长时间才发一次推送,且一次推送仅有一篇文章的情况。
此外,若仔细看HTML中提取的{%1}字段,可以发现这个网址和普通的网址并不一样,也并非mp.weixin.qq.com域名。网友也指出这个所提取的网址是有时效性,需要转换,以及直接使用其前半部分需要验证码等问题。目前我所使用的阅读器可以使用加载网页在浏览器中使用完整的网址用于跳转,这样应当是模拟了用户点击链接后的操作,大概吧(我没学过HTML,基直觉理解如有错误还请指出)。
总而言之,本文的方法只能聊胜于无,真正要看内容需要多一级浏览器的跳转,而搜狗微信什么时候会不会又有什么其他操作也不好说。且用且看吧。不管怎么说,对于深恶痛绝微信的我来说,也算一个聊胜于无的方法,至少扫一眼标题也能看个大概了。
这篇文章也是输出了一些情绪,实在是对大而丑多年来的不满。