wordpress开发 - 怎么用纯代码记录搜索引擎蜘蛛的爬行记录?

如果能方便的掌握蜘蛛在网站中的踪迹,便能更好的“对症下药”,更加方便的对网站进行SEO优化了,那么这一次的wordpress开发教程就教大家如何便捷的获取蜘蛛的爬行记录

对于一些对SEO有研究需求的站长来说,如果能方便的掌握蜘蛛在网站中的踪迹,便能更好的“对症下药”,更加方便的对网站进行SEO优化了,那么这一次的wordpress开发教程就教大家如何便捷的获取蜘蛛的爬行记录。

每次打开服务器端访问日志查看非常麻烦,特别是当日志文件比较大时更是不便。最好的办法就是在线直接打开看蜘蛛爬行记录。为此,我们可以免插件使用纯 PHP 代码在wordpress主题中来实现这个功能。

wordpress开发 - 怎么用纯代码记录搜索引擎蜘蛛的爬行记录?
wordpress开发教程

将以下代码插入 到主题根目录下的funtion.php 文件的<?php下面,并在网站根目录下创建一个名为 robotslogs.txt 的文件即可,文件名可自定义。

// 记录蜘蛛访问记录    
    function get_naps_bot(){  
    $useragent = strtolower($_SERVER['HTTP_USER_AGENT']);  
    if (strpos($useragent, 'googlebot') !== false){  
    return 'Googlebot';  
    }  
    if (strpos($useragent, 'bingbot') !== false){  
    return 'Bingbot';  
    }  
    if (strpos($useragent, 'slurp') !== false){  
    return 'Yahoobot';  
    }  
    if (strpos($useragent, 'baiduspider') !== false){  
    return 'Baiduspider';  
    }  
    if (strpos($useragent, 'sogou web spider') !== false){  
    return 'Sogouspider';  
    }  
    if (strpos($useragent, 'haosouspider') !== false){  
    return 'HaosouSpider';  
    }  
    if (strpos($useragent, 'yodaobot') !== false){  
    return 'YodaoBot';  
    }  
    return false;  
    }  
    function nowtime(){  
    date_default_timezone_set('Asia/Shanghai');  
    $date=date("Y-m-d G:i:s");  
    return $date;  
    }  
    $searchbot = get_naps_bot(); 
    if ($searchbot) {  
    $tlc_thispage = addslashes($_SERVER['HTTP_USER_AGENT']);  
    $url=$_SERVER['HTTP_REFERER']; 
    $addr=$_SERVER['REMOTE_ADDR']; 
    $file="robotslogs.txt";  //根目录下记录蜘蛛访问的文件
    $time=nowtime();  
    $data=fopen($file,"a");  
    $PR="$_SERVER[REQUEST_URI]";  
    fwrite($data,"[$time] - $addr - $PR - $searchbot $tlc_thispage \r\n");  
    fclose($data);  
    }

注意需为 robotslogs.txt 设置可写权限,最好是 777 (慎用)权限,755 权限某些主机配置下可能存在无法写入的情况。以上代码能记录搜索蜘蛛的基本抓取信息,完成以后,一般 24 小时候,就可以看到你“robotslogs.txt”当中已经满是数据的了。

说到SEO方面,那就不得不提一下robots.txt文件了,如果你还不知道这是什么的话,可以看看下面这篇wordpress开发教程文章:

wordpress开发 - 怎么用纯代码记录搜索引擎蜘蛛的爬行记录?-Npcink
wordpress开发 - 怎么用纯代码记录搜索引擎蜘蛛的爬行记录?-Npcink

怎么写robots.txt文件? - WordPress教程

网站

noindex与nofllow标签的作用和用法

2019-6-11 20:08:22

JavaScript输出内容:document.write - js笔记

2020-4-23 10:08:30

⚠️
Npcink上的部份代码及教程来源于互联网,仅供网友学习交流,若您喜欢本文可附上原文链接随意转载。
无意侵害您的权益,请发送邮件至 1355471563#qq.com 或点击右侧 私信:Muze 反馈,我们将尽快处理。
0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
搜索