搜索背后的奥秘—浅谈语义主题计算

摘要: 两篇文档是否相关往往不只决定于字面上的词语重复,还取决于文字背后的语义关联。对语义关联的挖掘,可以让我们的搜索更加智能化。   本文着重介绍了一个语义挖掘的利器:主题模型。   主题模型是对文字隐含主题进行建模的 … 继续阅读 搜索背后的奥秘—浅谈语义主题计算

浅谈网页搜索排序中的投票模型

前些天读了一本《选举的困境》,其中有一章,从美国的选举制度说起,介绍美国选举制度的不足,然后针对其不足,提出种种改善,然而每种改善都有其各自的问题,其中的变化很有趣。   先说美国选举制度,美国的总统选举是一种“赢者通吃”的方式, … 继续阅读 浅谈网页搜索排序中的投票模型

Linux服务器快速安装宝塔面板新手教程!

这是一篇关于Linux服务器安装宝塔面板的教程,可能很少人看哈,自己纯当记录。   在很早之前就有写到关于使用代码安装宝塔的教程,不过那个可能不适用于新手,这里写个更简单版本的!   首先是购买Linux服务器,之后我们 … 继续阅读 Linux服务器快速安装宝塔面板新手教程!

如何用清风算法解决关键词堆砌问题?

自从清风算法出来之后,越来越多的人注意到题文对应、不堆砌这两个问题。   但是,你有没有从另外一个角度去解读百度算法?或者说,理解为什么百度算法要这么做?   一、题文对应 清风算法中明确的指出:禁止标题作弊,标题中包含 … 继续阅读 如何用清风算法解决关键词堆砌问题?