网站首页 文章专栏 碎碎念-网站维护
碎碎念-网站维护
创建于:2018-11-19 01:00:00 更新于:2024-04-26 10:55:09 羽瀚尘 766
网站日常 享书湾,公众号推文

叒叒叒又是周末,想请人看电影可是人家不去。做什么好呢?不如就把网站升级一下吧。

享书湾是在2018年10月1日-5日搭建完成的,简单让同学【测试】一遍功能就匆忙上线了。这一个半月发现了不少问题。

搜索结果出现电商链接

上线不久,我将网站在论坛做了推广,当即就有同学跟帖反映问题。

2018-11-18-website_update_201811-论坛图片

这个真不是我的锅,因为采用了多站聚合搜索,本站搜索不到的东西,会向其他网站请求结果。如果其他网站的链接中含有电商的推广链接,用户自然也会看到。整理了一下所有出现过的非可下载链接,多是豆瓣阅读、天猫、淘宝、亚马逊、喜马拉雅听书。

目前的做法是对已知的这些链接做了屏蔽,后续定期检查搜索链接,更新需要屏蔽的域名。

搜索结果页面丑陋

由于工期紧张,最初我希望数据库中的数据都是完备的,即同时存在书名、作者、简介、预览图片、豆瓣评分、豆瓣链接。后来发现仅仅本地数据库中的内容无法满足搜索需求,而聚合搜索得到的结果是不完备的,造成结果页面丑陋。

改进的方法也很简单,重写前端页面,如果没有上述的某项元素,直接不显示该项就好了。

搜索慢、结果少

最初的搜索功能很原始,仅仅是数据库的搜索方法,没有实现全文搜索。造成的后果就是,如果搜索词和潜在结果有一个字不匹配,该结果就不会显示。

痛定思痛,当年留下的坑最终都要填上去,实现全文搜索是必须的。对技术细节有兴趣的童鞋,可以参考我的博文.

而对于搜索结果少的问题,可以这样解释: 当前的聚合搜索是本地搜索结果为0,开始聚合搜索;如果本地有数据,就只返回本地的结果。

我很重视本地数据,是因为这些数据大多处理过,很完备。但似乎大家更关心搜索的数量问题,so, 把门限改成10就好了。


2018-11-18-website_update_201811-关键词高亮隐藏图片

综合以上的修改意见,最终的网页如上图所示。可以实现搜索结果的关键词高亮,没有图片的就不显示图片。整个页面干净了许多。

总体规划

  • [x] 滤除购物网站网址
  • [x] 增加搜索结果
  • [x] 界面美化
  • [x] 全文搜索引擎
  • [x] 记录搜索历史
  • [ ] 放爬虫,抓网盘资源
  • [ ] 放爬虫,抓种子资源
  • [ ] 实现kindle绑定与订阅
  • [ ] 定期自动清理无效下载链接

加油吧!