
重新索引互联网 Facebook 雇佣公关抹黑 Google 的过程已经水落石出。问题是: Google 那么多产品, Facebook 为何对 Social Circle 这么敏感?
Google :索引互联网
Google 号称自己的使命是“索引互联网”。
这件事的难点并非派出多少爬虫,而是对收集来的海量内容做排序:怎样让真正重要的网页,的排到 Google 搜索结果的前面来?
Google 的搜索结果排序有其他算法的辅助和人工调整,但是,他最基本的核心规则还是 Pagerank ,其理念并不复杂: “被许多优质网页引用的网页,仍然是优质网页。”
领域

Pagerank 是革命性的。而另一场革命似乎被我们忽视了: Tags 。
语义网络长期不靠谱的忽悠之后,简单的 Tags 可以终于可以给我们一些东西,让我们分辨这个网页是关于哪些方面的。从此“领域”也被引入网络。
具体些的“领域”的例子,就是 Quora 或者 Stack Overflow 的 Tags 。问题本身是属于“技术”领域,还是“设计”领域?是关于“ J2EE ”领域,还是“ Object-C ”领域?
某些没有 Tag 化的网页到底属于什么领域,还没有清晰的答案。但是已经有人在尝试解决这些问题。比如豆瓣九点,他是依靠算法来给 Blog 自动分类的。
出处:ifanr
责任编辑:bluehearts
上一页 下一页 重新索引互联网 [2]
◎进入论坛网站综合、网页制作版块参加讨论
|