wordpress开发 - 怎么用纯代码记录搜索引擎蜘蛛的爬行记录?

如果能方便的掌握蜘蛛在网站中的踪迹,便能更好的“对症下药”,更加方便的对网站进行SEO优化了,那么这一次的wordpress开发教程就教大家如何便捷的获取蜘蛛的爬行记录

对于一些对SEO有研究需求的站长来说,如果能方便的掌握蜘蛛在网站中的踪迹,便能更好的“对症下药”,更加方便的对网站进行SEO优化了,那么这一次的wordpress开发教程就教大家如何便捷的获取蜘蛛的爬行记录。

每次打开服务器端访问日志查看非常麻烦,特别是当日志文件比较大时更是不便。最好的办法就是在线直接打开看蜘蛛爬行记录。为此,我们可以免插件使用纯 PHP 代码在wordpress主题中来实现这个功能。

wordpress开发 - 怎么用纯代码记录搜索引擎蜘蛛的爬行记录?-Npcink
wordpress开发教程

将以下代码插入 到主题根目录下的funtion.php 文件的<?php下面,并在网站根目录下创建一个名为 robotslogs.txt 的文件即可,文件名可自定义。

// 记录蜘蛛访问记录    
    function get_naps_bot(){  
    $useragent = strtolower($_SERVER['HTTP_USER_AGENT']);  
    if (strpos($useragent, 'googlebot') !== false){  
    return 'Googlebot';  
    }  
    if (strpos($useragent, 'bingbot') !== false){  
    return 'Bingbot';  
    }  
    if (strpos($useragent, 'slurp') !== false){  
    return 'Yahoobot';  
    }  
    if (strpos($useragent, 'baiduspider') !== false){  
    return 'Baiduspider';  
    }  
    if (strpos($useragent, 'sogou web spider') !== false){  
    return 'Sogouspider';  
    }  
    if (strpos($useragent, 'haosouspider') !== false){  
    return 'HaosouSpider';  
    }  
    if (strpos($useragent, 'yodaobot') !== false){  
    return 'YodaoBot';  
    }  
    return false;  
    }  
    function nowtime(){  
    date_default_timezone_set('Asia/Shanghai');  
    $date=date("Y-m-d G:i:s");  
    return $date;  
    }  
    $searchbot = get_naps_bot(); 
    if ($searchbot) {  
    $tlc_thispage = addslashes($_SERVER['HTTP_USER_AGENT']);  
    $url=$_SERVER['HTTP_REFERER']; 
    $addr=$_SERVER['REMOTE_ADDR']; 
    $file="robotslogs.txt";  //根目录下记录蜘蛛访问的文件
    $time=nowtime();  
    $data=fopen($file,"a");  
    $PR="$_SERVER[REQUEST_URI]";  
    fwrite($data,"[$time] - $addr - $PR - $searchbot $tlc_thispage \r\n");  
    fclose($data);  
    }

注意需为 robotslogs.txt 设置可写权限,最好是 777 (慎用)权限,755 权限某些主机配置下可能存在无法写入的情况。以上代码能记录搜索蜘蛛的基本抓取信息,完成以后,一般 24 小时候,就可以看到你“robotslogs.txt”当中已经满是数据的了。

说到SEO方面,那就不得不提一下robots.txt文件了,如果你还不知道这是什么的话,可以看看下面这篇wordpress开发教程文章:

wordpress开发 - 怎么用纯代码记录搜索引擎蜘蛛的爬行记录?-Npcink
wordpress开发 - 怎么用纯代码记录搜索引擎蜘蛛的爬行记录?-Npcink

wordpress教程 - robots.txt文件该怎么写?

robots 是站点与 spider 沟通的重要渠道,站点通过 robots 文件声明该网站中不想被搜索引擎收录的部分或者指定搜索引擎只收录特定的部分
2020-03-23
WP开发

wordpress开发 - 如何调用最新,随机,热门,指定分类文章?

2020-3-23 23:19:01

WP开发

WordPress开发 - 怎么调用指定 tag标签下的所有文章?

2020-3-24 0:21:49

⚠️
Npcink上的部份代码及教程来源于互联网,仅供网友学习交流,未经Npcink作者或上传书面授权,请勿作他用。
若您的权利被侵害,请联系站长 QQ: 1355471563 或 点击右侧 私信:Muze 反馈,我们将尽快处理。
0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
有新消息 消息中心
搜索