外行看热闹,内行看门道,在SEO的路上,每个从业者对自己都是信心满满,这在很大程度上,都是依托于自己的实战经验,但有的时候,实战的结果基于行业的问题,关键词的属性,往往存在诸多“巧遇”。
简单来讲,当你通过大量实践得到结果,所给出的理论推断,可能就是一个偶然,而在某种程度上与搜索引擎理论的研究可能是大相径庭。
比如:近期一些SEO机构所讨论的内容原创问题,一段英文,一段中文,貌似收录很好。
那么,中英文结合的文章,有利于SEO吗?
根据以往搜索引擎的工作原理的研究,烨晟网络,将通过如下内容阐述:
1、主题提取
通常来讲,搜索引擎在面对一篇文章的时候,我们都非常清楚,它会通过百度蜘蛛去爬行页面中的相关性内容,而将每一个文章,通过中文分词,切分成一个个词组。
比如:烨晟网络是一个专业做SEO培训的自媒体博客。
当搜索引擎面对这样一句话的时候,通常它可能会拆分出如下关键词:蝙蝠侠,IT,专业,SEO,培训,自 媒 体,博客。
而在这个时候,这里面会有一个非常有意思的小疑问,有的小伙伴就会讲,为什么不是烨晟网络,而是蝙蝠侠和IT。
这是一个非常好的问题,通常而言对于一些新有名词,搜索引擎是很难判断它的相关性的,它需要借助大量的文章去学习与分析。
随着一定时间的推移,烨晟网络,这个关键词,就不在会被搜索引擎所拆分,而当成一个独立的关键词,这里面涉及一些列自然语言学习的策略,就不一一展开。
2、主题识别
而对于一段英文,一段中文的内容页面,实际上它是一个多语言的学习与分析,搜索引擎会怎么去识别呢?
通常而言,搜索引擎一样会去拆分这个页面,对于英文段落,由于百度早期更多的专注于中文关键词的研究,这个时候在去拆分英文段落的时候,实际上得到的相关性的特征向量,是没有办法匹配到词库列表中。
这个时候,搜索引擎就会去做一件事情,那就是针对这些英文段落去进行及时翻译,将它整合成中文,而进行进一步判断。
在这个过程中会产生诸多问题,比如:
①英文段落,拆分的关键词,翻译之后和主题不相关的问题。
②英文段落,拆分关键词,翻译错误的问题。
③英文段落,拆分关键词后,很难进行有效翻译的问题。
3、主题定位
当搜索引擎对于页面内容进行拆分之后,就会根据整理出的相关关键词进行主题关键词分析,通常在这个环节,并不是单单的依托于关键词密度,还会进一步分析词组之间的相关性。
去定义这个页面的核心主题到底是什么,而对于包含英文段落的内容,经常会由于“翻译”问题,产生大量不相关性的关键词。
搜索引擎在判断这个页面内容质量的时候,就会给予较高的评分,因为,一些冗余的关键词太多。
为什么有的内容文章这样的策略表现不错,我们认为是随着机器学习的不断完善,搜索引擎对于某一个特定行业关键词的翻译能力在逐渐提升,而使得英文句子在翻译过后,具有较高的相关性,但我们认为并不是所有行业都会出现这个情况。
总结:我们认为一段英文,一段中文的文章,并不有利于SEO,利用这个策略获得“原创内容”的方法,我们认为是不可取的,而上述内容,仅供参考!