初学
池州网站优化的人常常问关键词密度是多少最合适。其实关键词密度在现在的搜索引擎算法中已经是一个不太相关的概念,SEO人员完全不必关注。观察排名在前面的页面,我们会发现其中既有密度低到1%或2%的页面,也有高到20%的页面。只要自然写作,页面中必然出现几次关键词,这就已经完成优化了。
另一个与正文关键词出现有关的概念是TF一IDF。TF就是上面说的词频(temfrequency),IDF 是逆文件频率(inverse document frequency)。针对一个特定关键词,包含这个关键词的文件数量除以数据库文件总数,得到这个词的文件频率。反过来,文件总数除以包含这个词的文件数量(通常真正计算时还要取对数),就得到逆文件频率。所以,语言中越常见的词,包含这个词的文件数越多,文件频率也就越高,逆文件频率越低。
逆文件频率代表了这个词的语义重要性或者说区别文件的能力。举例说,“的”在几乎所有文件中出现,文件频率极高,逆文件频率极低,也就是“的”这个词的语义重要性很低,几乎无法用来代表和区别文件内容。“搜索引擎”这个词只出现在一小部分文件中,逆文件频率要高得多,对文件内容来说重要性要高得多。