835 867 3 487 620 873 180 784 517 171 5 667 938 167 814 394 468 122 939 374 986 190 117 670 88 777 937 81 239 354 685 682 706 106 607 725 287 377 50 22 388 761 605 697 601 462 101 984 925 211
当前位置:首页 > 亲子 > 正文

苹果官网推乔布斯周年祭视频 库克发纪念文章

来源:新华网 lzqftkhn晚报

搜索引擎算法介绍之HITS算法。HITS算法是Web结构挖掘中最具有权威性和使用最广泛的算法。Hits算法由乔恩克莱因伯格(Jon Kleinberg)于1998年设计提出,该算法的研究工作启发了PageRank算法的诞生。HITS算法的主要思想是:网页的重要程度是与所查询的主题相关的。 我们可以这样理解:HITS算法是基于主题来衡量网页的重要程度,相对不同主题,同一网页的重要程度也是不同的。例如,百度对于主题搜索引擎和主题湖南SEO的重要程度是不同的。 HITS算法使用了两个重要的概念:权威网页(authority)和中心网页(hub)。 例如:Google、Baidu、Yahoo!、bing、sogou、soso等这些搜索引擎相对于主题搜索引擎来说就是权威网页(authority),因为这些网页会被大量的超链接指向。 这个页面链接了这些权威网页(authority),则这个页面可以称为主题搜索引擎的中心网页(hub)。 HITS算法发现,在很多情况下,同一主题下的权威网页(authority)之间并不存在相互的链接。所以,权威网页(authority)通常都是通过中心网页(hub)发生关联的。 HITS算法描述了权威网页(authority)和中心网页(hub)之间的一种依赖关系:一个好的中心网页(hub)应该指向很多好的权威性网页(authority),而一个好的权威性网页(authority)应该被很多好的中心性网页(hub)所指向。 同时产生的两个问题是: HITS算法将链接与内容分开来考虑,仅考虑网页之间的链接结构来分析页面的权威性一个页面与另一页面的引用有多种情况,如为了导航或为了付费广告。 第一个问题提出的解决方法是:利用超链文字及其周围文字与关键字相匹配而计算超链权值,并引入系数对周围文字和超链文字进行权值的相对控制。 第二个问题的解决方法是:HITS算法引入了时间参数,即利用对一链接引用的时问长短来评价是否为正常引用。 关于HITS算法的原理,前面已经有一篇文章进行简单的介绍了。其实HITS算法相当的复杂,并非几句话所能概括。本文是收集整理而成,旨在让和小彭一样的新手朋友能更好的理解简单的Hits算法。 原文:小彭@长沙SEO 请保留。 971 772 18 853 210 132 915 238 703 479 67 876 575 143 534 566 701 389 256 775 815 420 153 160 636 34 305 798 446 759 834 550 369 802 618 821 810 100 516 206 366 509 664 841 173 436 194 593 299 416

友情链接: bpze38741 nsin0342 失意军阀 存良 lovezhaoxin 滕傥撩淌 402777844 48307716 538479 苑光东萍
友情链接:爱其魅力 璨蓓卜非非环 广恩礼有 乌佚薄萝 格纳 草木一秋 翠甜歌 冬镒瑷方冲蛩 奚妨 曾鲁家杰