一、单页面的算法是如得出来的 A、单个页面算法如何得出呢,我们现在就来开始解剖一个单页(我们就拿地一个网站来做实验)。我们大家都知道,蜘蛛只是一个程序(虽然TA是向人的思维发展,但是TA目前还是只能看懂代码。还不能以我们的视角来观看页面,所以我们想研究程序也要使用程序的视角去研究一个页面。), 下面的是某个网站生成后的源代码,也是蜘蛛作为分析的内容。(注意,里面是蓝色的都是解释如:这句是注释.) 好了,现在我们开始模拟蜘蛛来分析这个页面。 下面的内容我会经常引用,所以我把这个定了一个名字就叫“源文件一” <!DOCTYPE html PUBLIC “-//W3C//DTDXHTML 1.0 Transitional//EN”“TR/xhtml1/DTD/xhtml1-transitional.dtd”><htmlxmlns=”1999/xhtml”>蜘蛛进来后,看到上面的东西TA会知道那是你定义的标准。 <head>紧接着看到head 代码,TA知道已经开始读取你网站的内容了,并且读的内容是头部的内容。 <meta http-equiv=”Content-Type”content=”text/html; charset=gb2312″/> <title>破碎机,磨粉机,鄂式破碎机,制砂机专业制造商</title> <meta name=”description”content=”破碎机,磨粉机,制砂机是我公司主要的产品,我公司经过多年的研制破碎机,磨粉机,鄂式破碎机积累了宝贵的经验,研制出的鄂式破碎机,反击式破碎机,圆锥破碎机,磨粉机,制砂机在同行业中处于领先水平。近年来我公司引进国外先进技术研制出多种新产品在碎石,制砂行业中得到广泛的应用。要订购鄂式破碎机,磨粉机,制砂机郑州天一是你理想的选择。”/> <meta name=”keywords”content=”破碎机,磨粉机,制砂机” /> <link href=”ks/css/v1style.css” rel=”stylesheet”type=”text/css” /> </head> 通过上面这段代码,蜘蛛会做一个分析,分析头部里面的关键词密度。然后总结你的头部讲的是什么,首先他会先拿你的标题来做参考,来计算整体,最后看跟你的关键标签里面的关键词是否对应。(在网上有很多高手都说关键词的标签已经不管用了,但是要知道,说出关键词标签不管用的人是已经有一定技术的人,他们说标签不管用是根据他们的技术来做的对比。如果你的技术达到一定程度的时候,你也会觉得关键词标签不管用。他们实验的多了,对页面的关键词布局有了一定的经验,所以他们做出的页面让蜘蛛算出来的就是他们想做的关键词,因此他们感觉关键词标签不管用了。但是呢,当你技术没有达到那个地步的时候还是一keywords标签告诉蜘蛛你要做什么关键词比较好。这里先说到这里,后面会有更详细的关键词分布介绍。) <scripttype=”text/javascript”> var gaJsHost = ((“https:” == document.location.protocol) ?“https://ssl.” : “http://www.”); document.write((“ </script> <scripttype=”text/javascript”> try { var pageTracker = _gat._getTracker(“UA--1″); pageTracker._trackPageview(); } catch(err) {}</script> 这是一段js代码,蜘蛛TA不会去看调用的是什么东西。我们接着往下走。 下面是body的部分,蜘蛛把头部的关键词密度算出来后,就会重新算身体里面的内容,记住,是重新算。 现在按照程序的运行方式往下继续。(要注意,在中间会有插语,别直接拉过代码。) {<body> <!–headbegin –> <div id=”head”> <divid=”logo”></div> <div id=”s_1″> </div> </div> <div id=”s_dh”> <divid=”zuo”></div> <div> <ul id=”menu”> <li><ahref=”index.html”>网站首页</a></li> <li><ahref=”ks/product/product.html”>产品世界</a></li> <li><ahref=”ks/about/about.html”>关于我们</a></li> <li><ahref=”ks/news/”>新闻动态</a></li> <li><ahref=”ks/about/service.html”>服务支持</a></li> <li><ahref=”ks/about/dinggou.html”>在线订购</a></li> <li>style=”background-image:none;”><ahref=”ks/about/lianxi.html”>联系我们</a></li> </ul> </div> <div class=”s_5_1″ id=”s_5_1″onclick=”fn_showTable(this.id);”>新闻</div> <div class=”s_5_2″ id=”s_5_2″onclick=”fn_showTable(this.id);”>行业</div> <div class=”s_5_2″ id=”s_5_3″onclick=”fn_showTable(this.id);”>知识</div> <div class=”s_8″ id=”tb1″> <ul> <li>·<ahref=”ks/news/213.html” target=”_blank”style=”color:#3d94fd”>创一流企业文化,于细</a><fontstyle=”color:#″>[2010-4-16]</font></li> <li>·<ahref=”ks/news/212.html”target=”_blank”>服务创造价值,品质铸</a><fontstyle=”color:#″>[2010-4-14]</font></li> </ul> </div> <ul> <li>·<ahref=”ks/news/207.html”target=”_blank”>HPC圆锥式破碎机促进矿山</a></li> <li>·<ahref=”ks/news/205.html”target=”_blank”>JC欧版鄂式破碎机在国家大</a></li> </ul> </div> </div> <div id=”center_zhong”> <div id=”cp”style=”margin-top:0px;”> <div class=”cp_js_1″> <h1><ahref=”ks/mofenji/mtw.html”title=”欧版梯形磨粉机“>欧版梯形磨粉机</a></h1> 该磨粉机型采用了锥齿轮整体传动、内部稀油润滑系统的多项专利技术…</div> <div class=”cp_js_2″> <h1><ahref=”ks/mofenji/limo.html”>LM立式磨粉机</a></h1> 该机用于非金属矿行业百种矿石的大规模的粉剂的生产制备;…</div> </div> <div id=”cp”> <div class=”cp_js_1″> <h1><ahref=”ks/posuiji/hpc.html”title=”圆锥破”>液压圆锥破碎机</a></h1> 停 这里需要注意一下,当蜘蛛看到H1的时候他会更关注里面的内容,因为h1标签的作用就是告诉蜘蛛,这里面的内容很重要,所以蜘蛛不得不注重里面的内容。“H1标签就相当与你正在走路看风景的时候出现的一个警告牌,上有标语“有陷阱,请小心。” 就算这个警告牌是假的,你也会小心的。所以H1的作用就是告诉蜘蛛,这里面的内容很重要,就是我要讲的东西,如果h1里面的内容跟页面的内容相关,那么着是一个好标签,如果h1里面的内容跟页面的内容一点也不相关的话,那就没有作用,甚至会有反作用。” 该破碎机提高了生产能力和破碎效率. <div> <a href=”ks/zhisha/vsi_zhishaji.html”title=”制砂机”><imgsrc=”ks/images/v1_s_chanpin/vsi_1.jpg” align=”right”alt=”制砂机”/></a> <h1><ahref=”ks/zhisha/vsi_zhishaji.html”>VSI新型制砂机</a></h1> 该制砂机专为高速公路等 提供优质砂石骨料…</div> </div> <div id=”cp”> <div class=”cp_js_1″> <ahref=”ks/posuizhan/ep_posuizhan.html”><imgsrc=”ks/images/v1_s_chanpin/psz_1.gif” align=”right”/></a> <h1><ahref=”ks/posuizhan/ep_posuizhan.html”>移动破碎站</a></h1> 移动破碎站的设计理念真正为客户提供高效率…</div> <div class=”cp_js_2″><ahref=”ks/posuiji/jc_epo.html”><imgsrc=”ks/images/v1_s_chanpin/jc_epo_1.gif” align=”right”/></a> <h1><ahref=”ks/posuiji/jc_epo.html”>JC系列鄂式破碎机</a></h1> 该破碎机采用世界级制造工艺和最高端的制作材料…</div> </div> </div> 注意,请看一下h1里面有几个词是在关键词标签中出现的(我已经加粗过了)。如果把代码去掉,然后你可以统计处里面有多少是关键词。 <ul id=”zhishi”> <li>·<ahref=”LR/Chatpre.aspx?id=DGT″target=”_blank”>在线咨询</a></li> <li>·<ahref=”ks/download/?C_ID=1″target=”_blank”>PDF文档下载</a></li> <li>·<ahref=”ks/ask/”target=”_blank”>常见问题解答</a></li> </ul> </div> <div id=”chanpin_2″> <ul style=”margin-left:15px;”> <liclass=”xilie”>工业磨粉机系列</li> <li><ahref=”ks/mofenji/limo.html”>LM立式磨粉机</a></li> <li><ahref=”ks/mofenji/mxb.html”>MXB自由式下摆磨</a></li> <li><ahref=”ks/mofenji/mtw.html”>欧版梯形磨</a></li> <li><ahref=”ks/mofenji/cy_tmo.html”>MTM中速T型磨</a></li> <li><ahref=”ks/mofenji/chaoximo.html”>S超细微粉磨</a></li> <li><ahref=”ks/mofenji/leimengmo.html”>雷蒙磨粉机</a></li> </ul> <ul > <liclass=”xilie”>一级破碎</li> <li><ahref=”ks/posuiji/epo.html”>鄂式破碎机</a></li> <liclass=”xilie”>二级破碎</li> <li><ahref=”ks/posuiji/jc_epo.html”>JC鄂式破碎机</a></li> <li><ahref=”ks/posuiji/fanjipo.html”>反击式破碎机</a></li> <li><ahref=”ks/posuiji/py_yzp.html”>弹簧圆锥破</a></li> <li><ahref=”ks/posuiji/cs_yzp.html”>西蒙斯圆锥破</a></li> <li><ahref=”ks/posuiji/hpc.html”>液压圆锥破</a></li> </ul> </div> </div> 上面是页面的主题部分,该部分是蜘蛛计算内容最重要的部分,该部分也是我们操作的主要部分。 下面的是脚部内容,蜘蛛把脚部内容作为导出网页权重的区域,对当前站增加权重较少。不过脚部部分作为是这个页面的一部分,到时候计算的时候这里还是会被计算成整页的内容。比方说页面关键词密度。 <div id=”foot”> <div id=”foot_1″ style=”width:600px;”><ahref=”ks/about/banquan.html”>免责声明</a>| <a href=”ks/about/weiquan.html”style=”color:#de2715″>维权曝光</a>| <a href=”ks/hr/jiameng.html”target=”_blank”style=”color:#de2715″>人才加盟</a>| <a href=”ks/about/dinggou.html”target=”_blank”>在线订购</a>| <ahref=”ks/about/lianxi.html”target=”_blank”>联系我们</a>| <a href=”ks/product/posuiji.html”target=”_blank”>碎石机</a>| <a href=”ks/product/mofenji.html”target=”_blank”>粉碎机</a>| <a href=””target=”_blank”title=”破碎机,磨粉机”>视频中心</a>|<a href=””target=”_blank”>郑州世博会</a></div> <div id=”foot_2″>沪ICP备0号版权所有:XXX机器有限公司</div> </div> 当蜘蛛程序运行到这里的时候就已经把这个页面给分析完了,单页权重也就出来了。但是我还是没有讲出来如何如何得出最接近于百度(谷歌)关键词排名算法的方法。别急,马上就开始讲。不过在看下面内容的时候希望你已经真的看完上面的那些东西了。 (责任编辑:admin) |