移动互联网+与新技术研究汇总

程志鹏@6A商学院 专注SEM与“互联网+”研究与学习

『创想SEO』雅虎搜索工程师讲的一些SEO知识章

  经冰河的邀请,今天来与大家分享一些SEO知识,本着向大家学习的态度和推广SEO知识普级的目的。说实话,我很少做这样的培训,也没有相关的经验。
但在网上看到一些SEO知识和一些培训打着赚钱的口号骗人,就非常的生气,这不利于我们搜索的知识推广和正确引导。
  只有大家共同进步了,我们搜索工作者才能更好的为网民服务,我们之间的关系不是互相隐瞒,而应该互相坦诚,互通有无。为此,我今天还写了一下教案,为了更好的向大家介绍一些知识。希望大家不要怪我嘴太笨,必竟这辈子第一次当讲师。
  在此之前我介绍一下自己。我曾在中企动力做过,在百度做过,最后去了马云的雅虎中国,这段经历让我对中国的搜索有了更深一层次的认识。
  当时以为搜索引擎就是我们工程师的作品,是我们的理想,但在雅虎中国,有次马总来开认亲会的第二个月,准备让雅虎中国彻底的改变.
  说只要雅虎不是雅虎的时候就是成功的时候,当时我觉的此人有些傻,并且有些狂妄,但早对他有所了解,所以没有进一步的理会。有一次开例会,准备要把雅虎中国改为搜索为主体站的时候,我有点慌了,必竟这段时间的雅虎,大家如果有读新闻也应该知道我们处于半死活的状态,只有3721和一些无线广告做为主体盈利点,突然变为搜索为主体的雅虎,这意味着是一个新的时代的到来,这时大家也许觉的我说的话,与要讲的SEO没有必然的联系。但请听我讲下去,这关系到我们设计人员的心态和企业大的方面的把握。
  马总对我们设计工程部的同事做过一次演讲,他认为搜索就是为网民服务的。他不是你们工程师的玩具,如果你们没有按照网民的意志设计产品,那必然是失败的作品。这句话,我记忆深刻。那段时间我们为自己的技术太孤芳自赏了。有点飘,有点傲,自以为技术能左右这个世界,但不知是世界左右了我们。从那次后,我们会过深刻的反省,有些同事,不服马总,怪他不懂网络不懂技术,有些同事,在反省,是否真的强加了自己的意志。说实话,雅虎的工程师们都是有来头的,是业内非常棒的精英,他们是很傲,一时难以接受。最后我们经过决定,做属于网民的搜索,属于互联网站长的搜索,只有站长们得利了,那我们就发展了,所以现在的搜索引擎都是以人为本,并不是网络上有人说的完全程序化的收录与选择。

  在百度的时候我只是个做边缘化设计工作的普通职员,但我可以完全感觉到同事们的专业和认真态度,在搜索程序的设计方面做到很细致的分布算法。包括筛洗制度,和沙盒效应。那段时间让我受益颇多,也对我将来的设计工作有很大的帮助。

   OK,讲了这么多题外话,我想表达的是,不要把搜索引擎想的太复杂,因为制作他们的是我们人类,也不要想的太简单,因为他有自己的生存法则.我们不太经常的人为干预,但特定的情况与环境还是要做以评估,这是对网民的负责态度。也是对站长的负责态度。这里也请大家不要对搜索有偏见,必竟人无完人,我们也在不断改正错误的过程中。

  先讲一下搜索的引擎SE工作原理

1,搜索引擎释放蜘蛛(不明白的搜索一下)spider,spider先检查开放目录DMOZ上登陆录网站网址进行访问抓取,根据收录的网站的外部链接找到其它网站资源.这就是为什么很多人挤破头的要把网站登到DMOZ上,根据网站的更新频率及权重级别,安排spider的搜索频率与抓取规则.如果你的站是新站,那么会有个考验期,一般情况新站会在短时间内排名靠前,在考验期内,有的会进入沙盒(传说中的,呵呵)处理,有的直接收录数据,sandbox效应有的朋友看过很多SEO教程,会对这个很糊涂GOOGLE确实会在某一阶段把一些可疑网站放入sandbox,这是因为他们的网页布局有过“修饰的成份“这里大家应该明白我是说的什么。
但是有时候只是做为新站的考验期阶段。
其实很多搜索引擎并没有沙盒,只是近几年老有人这样说,就用这个名词代括了,说到底,他是个独立的过滤算法。


2,搜索引擎读取spider收集的数据资料时,会按照网址的收录优先规则进行调度爬虫crawler。这点与你们在网上看到的一些资料是有些相同。
GOOGLE我不太清楚,因为没有熟入了解,但大多数搜索都是这样设计的。对提交了sitemap的网站,抓取的深入层次会有所不同。


3,收录的网站还要根据分词技术进行你们所讲的关键字索引。
按照页面的权重进行排位。
你可以强奸一次搜索,但你也可能被强奸。。。。呵呵


4,搜索会进行反作弊spam kill(发同样消息的,关键字的,被灭可能性最大所以大家不要投机取巧。)
没基础的朋友,如果对上面讲的一些名词不明白,可以搜索一下。推荐去YAHOO哈哈,为自己家人AD一下。别骂我。
这里再多说一下spider(蜘蛛)他是根据html页面语法和格式,对读取的代码进行过滤,再收录内容。所以有些朋友做一些很无聊的设置是很无用的。下面会讲到。
DMOZ自己去搜索一下吧。GOOGLE很喜欢这东东。
然后讲正题。我不是一个SEO专业人士,因为自己做的是这个,再去哄自己那太白痴了。SEO是一个规则,一个规范。大家想做好SEO,只要安安份份做好人就行了。当然想短期获利,害国害民的朋友就另说了。呵呵。
SEO,有人叫作搜索引擎优化,当然从英文上是这样翻译,但我们更喜欢叫搜索引擎规范化,这只是我们内部的叫法,为什么这样讲?
SEO不是作弊,很多人都这样说。呵呵,其实有时候作弊的机率是很大的
对于网络上亿个页面,我们又能监控几个?必竟是程序就会有漏洞。
但请大家记住,搜索引擎不是白痴,你强奸一次,不能强奸一辈子,只要有相关证据,会让你这辈子都与搜索绝缘,我们可以做的到。只是几个函数的设置而已SEO知识是无止尽的,他是时刻变化的,千万不要把一朝的技术当作永远不变的真理。
我们也要不断的学习和完善。是程序就会有缺点。当然有一条是不变的,那就是合理化网页布局设计与真正的网站更新规率。你们所看过的SEO知识,我们也看过,有些教程很幼稚,不知道他们在讲什么,以为自己很了解搜索,但是却事与愿违。根本不是那么回事。
SEO并不复杂,不用很深入的知识,就能掌握。这点来讲,所有人都能学的会。
也许有朋友问,学习SEO要有那些知识储备?我可以告诉你,只要懂一点HTML知识,网页制作,和一些简单的程序技术就OK
最后,规范化很重要。
今天先讲一些基础的SEO知识和网上一些教程的误区,既然大家来到这里,都一定对SEO或多或少有点了解,我就不多做解释了,现在我主要讲一下SEO的一些SEO注意事项SEO规则设置。以便对大家有些启示。
在你新做一个网站时,最近很流行DIV+CSS,没错,搜索引擎喜欢这样的布局设计,他可以更方便的使蜘蛛攀爬相关组织结构。
可以这么说,搜索引擎促使了网页设计的标准化进程。这当然对网民是有利的。
但请记住,多年的网页设计习惯并不是一朝就可以改变,在网络上众以亿记的网站还是原始的表格设计嵌套。我们不会把这些网站抛弃也不会让这些优秀的网站消失。他们还是我们的主体资源。
所以大家不必很迷信DIV+CSS的网站一定比表格的好。这不一定。
只要大家遵守以下几种规则即会有所帮助,所有引擎都一样。先用你们常见的几个SEO小技巧来做一下说明。有几个是对的,有几个是有误区的.
1.如果你是新网站,请记的一定不要突然采集很多资源。
这是因为,短时间的资源扩充会激化沙盘效应,也许你会在短时间内流量大增,但肯定不会长久。我们不是傻子,当我们是白痴的人,我们也会把你当白痴的处置。呵呵。
就是在采集,请注意时间频率,一般一天的新增量控制在150篇左右,前三天是这样,后十天可以加倍,但一定不能太多上面说的一天,是网站刚建的第一天。
在第一个月保持这样的速度,第二个月,也要保持200篇左右,不要急功近利。
在第三个月中旬的时候可以大量的增加,但也不可太过,如果你一天增加一万篇,那肯定是采来的,会被当SPAM论处。所以我看到网上很多人卖数据,觉的很可笑,因为同样的数据早有记录了,再新出来的数据都会被当垃圾论处。根本没有帮助。
如果新手不知道什么是SPAM,我做以简单说明,一般所说的SPAM是垃圾邮件,但这里我们作为垃圾信息来定义。用不规范的技术来骗取搜索是不明智的选择
2.原创文章的鉴定!
有些朋友说原创文章的网站可以取得搜索的好感,这点是也可不是。
为什么这样讲,一原创文章他有自己的独创性,唯一性,在网络中唯一就是搜索的获取原则。
大家可以做原创文章,但请不要做其它的设置,比如现在有些软件可以在采集发布的时候,在文章中自己加一些文字,来改变原来采来文章的独创性。
以为改些字,添些字就会有所不同,这完全是错的,搜索引擎虽然还没有智能化那种地步,但也不是那么的傻。我们有自己的收取原则,有语句完整性的检测机制。一句话怎么也说不通,那我们只会把他当作SPAM。这就得不偿失了。
3.域名的选择
没错,.com的权重是要比.org的大,但org的网站却比.com的收录多。这点大家应该明白。商业化与非盈利的是有不同的一套原则规定。
至于大家常说的.cn的域名搜索不重视,那可未必,至少据我所知,不是你们想的那样,百度我不清楚,但YAHOO不这样歧视。
大家在网站改版时,一定不要变动URL,原因就不说了。如果非要转,旧的URL做转向转到新的。或者404页面指示一下也OK
[url=http://www.weet.com.cn/ss]www.weet.com.cn/ss[/url] 的比ss.weet.com.cn 的权重要差,这点有些SEOer说的不错。这里有个父子层的关系。知道就好。不做具体说明
文章内容方面,我们先从标题讲起
标题一定要准确简洁。不要加太多修饰语。那是浪费也不利与攀爬速度
标题一定要准确简洁。不要加太多修饰语。那是浪费也不利与攀爬速度
在段落方面,有些文章我记的说的是要多分段落,这点我都不知道他们为什么要这样讲。
段落多与否并不决定收录情况。但要注意关键字的垫加。这个我们在下面细讲
4.关键字加链接是很失败的做法切记!
我们来讲一下关键字,做SEO的都知道,关键字的选取是很重要的
但更重要的是关键字的垫加,我看过网上一些人的文章,他们把关键字垫加讲的太过神秘化,也太严格化,什么有个百分比,和全部内容的占有率,晕。真是胡扯。太不负责了,这样的话还有谁能做出一个非常标准的网页?那样的网页内容又怎么能看??真是驴唇不对马嘴。
搜索引擎不知道的所有网站的关键字,他有自己的一套识别方法,一般情况,关键字不能频繁出现,这里的频繁是指一句话里除了标点,还有“的”“了”“啊”“哦”等等语气助词外,全是关键字
还有就是关健字与网站主题内容不相符,也不允确认。你做的是食口,可是关键字是电脑。那显然是欺骗。
大家可以掌握以下原则来设计关键字,一段落中要保持语句通顺,不是刻意介绍关键字
二,关键字不要太长太特殊,不利于词语的组织分类,也许会被识别成两个不同的语句类型。
三,一切为了访客服务。这个最为关键。我们做搜索的,虽然互相在竞争,大量的吸入页面量,但请记着,优秀的网站和为网民服务的站点是不会放到最后介绍的。这也是个用户体验的问题,只有用户爽,我们才能爽

再说几个白痴型SEO优化误区,也是你们常见的,这里一定要做以澄清,以防大家再走弯路
1,就是隐藏文本关键字,唉,这条本不想说,但是很多人都这样干,有什么办法
他们以为搜索引擎是用眼睛来找网站的,隐藏了,或者文字颜色与背景色一样了,就找不到你了??真搞笑,有点掩耳盗铃。穿着马甲我就不认识你了??呵呵说笑。
2,把关键字隐藏在meta标签里面。笨就一个字,我只说一次(借用冰河最爱说的话)
3,隐藏标签,把关键字放到JS,alt,tags里等等。(落伍的技术就不要再用了)
4, 盗别人模版,改关键字。变为自己的。(有个惩罚制度,这里不详讲了)
5,一个网站,全是友链。(拿我们当白痴)
6,动画整站很难取得高权重
7,有软件可以查页面的关键字密度,但也不一定超过这个密度就必然被K,不是绝对的,但有个建议,1个网页设置1个主要的关键字,或者2-4个都是正常范围内的,有关键字的页面可以互相链接,这样有利于内容的链接与重复。
  讲了快一个小时了,最后想说一下,SEO不是万能的.他能带来一时的流量,却留不住真正的客户,只有网站自身是优秀的,那么流量才是有价值的,一时的得利不是永久的得利,SEO的设置往往他的用户体验是很差的,因为所有一切设置都是为搜索引擎服务的,他没有在意访问者的心情与操作度。所以大站的SEO是很难的。
  只是一味的迎合搜索。还有SEO不能代替其它的营销手段,千万不要抛弃过去固有的营销渠道。
  上面只是我的一些建议,当然在技术更新的道路上,随时做出变动!这点也请注意。
  今天先讲一些,只是让大家了解到搜索引擎是智能化的,也是人性化的。做站与做人是一样的。只要踏实做站,了解一些基本规则就可以得到很好的回报。今天就讲到这里,下次讲讲,如果站被封有什么办法可以应对!什么样的网站容易被K掉。
  还有反向链接在搜索中的重要性。

                                     本文来自『创想SEO-www.81seo.cn』整理  转载请保留连接

发表评论:

网站分类
搜索
最新留言
文章归档
友情链接
  • 订阅本站的 RSS 2.0 新闻聚合

Powered By Z-BlogPHP 1.7.2

Copyright ©2007-2023 程志鹏@6A商学院 All Rights Reserved
冀ICP备10208152号-4 |