您的位置:主页 > 北京seo > 密云县seo > 密云县seoseo转技术_seo转技术

密云县seoseo转技术_seo转技术

2020-07-27 15:28作者:川北SEO来源:成都SEO

[转]探讨SEO技术,如何用机器学习预测谷歌搜索排名

我们就认为这个网站将进入前十。为了衡量这个算法的性能,我们决定使用混合矩阵。下面这个图表概述了整个过程:理清数据我们使用了一个有20万条记录的数据,包括大约2000个不同的关键词搜索词。总体上,我们可以把这些关键词依据属性分为以下几类:数字属性类别变量文字属性数字属性指的是该关键词可以表示无限或有限区间内的任意数字。类别变量是指一个可以表示有限数量的值,每个值代表一个不同的群体或类别。文字属性显然指文本,包括搜索关键词,网站内容、标题、元数据描述(metadeion),锚文本、标题(H1H2,H3)等。特征工程我们设计了与排名有关的额外属性。大多数属性是布尔逻辑体系的(真或假),但是一些是数值的。

seo转技术_seo转技术

[转]探讨SEO技术,如何用机器学习预测谷歌搜索排名

例如,布尔逻辑属性是网站文本中的精确搜索词是什么,而数值属性是网站文本中有多少被标记的搜索词。运行TF-IDF算法为了预处理文本特征,我们使用了TF-IDF算法(检索词频率,反转文档频率)。此算法将每个实例视为文件,并将所有实例集合视为一个语料库。然后,它为每个词赋予分数,词汇在文件中出现的频率越高,在语料库中出现的频率越低,那么其分数就越高。我们试过两种TF-IDF方式,第一种方式由首先连接所有的文本特征构成,然后应用TF-IDF算法(也就是说,单个实例的所有文本列连接而成文件,一系列这样的实例构成语料库)。第二种方式是指对每个特征分开应用TF-IDF算法(也就是说,每个单独的文本列是一个语料库),

[转]探讨SEO技术,如何用机器学习预测谷歌搜索排名

混淆矩阵确保肯定的和否定的答案都是正确的。在我们最好的模型中,我们获得大约41%的正确肯定和41%的正确否定。特征曲线是「用图示法说明二进制分类器系统随着鉴别力阈(discriminationthreshold)而变化的效能。」在这整个系统中使用的非线性模型是XGBoost和一个神经网络,而线性模型是逻辑回归。整个系统的布局则是线性与非线性模型的结合。XGBoost是「极端渐进增长(ExtremeGradientBoosting)」的简称,渐进增长是「一种针对回归和分类问题的机器学习技术,它生成弱预测模型集成形式的预测模型,典型的是决策树。」下面的图表揭示了特征类别对此模型最终预测的准确率做出的相对贡献。

seo转技术_seo转技术

[转]探讨SEO技术,如何用机器学习预测谷歌搜索排名

seo转技术机器学习正在越来越快地成为很多大公司的一个不可获取的工具。相信每个人都听说过谷歌的人工智能算法打败了前世界围棋冠军,以及谷歌的搜索结果排名算法RankBrain。机器学习早就不是数学研究者们的神秘课题了。在有大量数据的行业里,技术总会有很多方法变得有用。机器学习也有能力改变传统的网站推广和SEO(搜索引擎优化)。去年晚些时候,我和我的同事开始了一项实验,我们将一个流行的机器学习算法应用到了预测谷歌对特定网页的排名中。最终我们得到了一个41%正确肯定和41%正确否定的数据集。在接下来的几段里,我将会带你过一遍我们的实验,我还会讨论一些对SEO很重要的技术问题。我们的实验在2015年年末的时候,

TAG标签: 搜索 技术 我们

文本地址:https://www.xcbseo.com/beijingseo/miyunxianseo/37644.html

说明:以上就是“密云县seoseo转技术_seo转技术 ”相关介绍,凡本站注明“本站”或“投稿”的所有文章,版权均属于成都川北SEO或投稿人,本站已授权使用的作品,应在授权范围内使用,并注明来源:川北SEO”并附上链接。

博主推荐

图文聚集

热门排行

最新文章

热门标签