如何利用Excel表格分析网站日志数据汇总?
网站维护工作人员,为避免网站服务器被攻击;SEO工作人员为确定搜索引擎爬虫访问网站情况,都避免不了要分析网站日志。但是我的得到的网站日志原始数据往往都是一大堆乱七八糟的数据。拿到这些原始数据后我们该怎么办呢?黑月分享一下如何利用Excel表格分析网站日志方法!
步骤/01.
登录“FTP”账号,链接到网站数据,找到网站日志文件夹。(注意:一般情况下,网站日志所在文件夹都是与网站文件同级文件夹,且带有log字样。只有少数情况下,网站日志文件夹在网站根目录下。)
步骤/02.
打开文件夹,下载日志压缩文件!(下载方法很简单,只要选中文件直接拖到电脑桌面,然后左下方的本地浏览下载目录的文件上“右键—传输队列”即可!)
步骤/03.
解压下载的日志文件,而后将解压后文件的后缀改为“txt”
步骤/04.
新建一个excel表格,并打开!找到顶端工具栏的“数据”工具
步骤/05.
点击“导入数据”,默认“直接打开数据文件”,再选择“选择数据源”。
步骤/06.
选中解压后的txt文档,并打开!
步骤/07.
默认“其他编码” 并“下一步”;
步骤/08.
选择“分隔符号”,并“下一步”;
步骤/09.
勾选所有选项,然后“下一步”;
步骤/10.
默认“常规”,并“完成”;
步骤/11.
如图,网站日志数据项之间全部分隔开;
步骤/12.
接下来只要保留自己需要的数据项即可。删除不需要的数据项!(如图,仅保留了数据分析需要的访客ip、访问文件、访问状态码以及访客名称四项数据。)
步骤/13.
选中访客名称一整列,然后点击“开始”栏目的“筛选”工具
步骤/14.
点击访客名称一列上方的三角下拉按钮;
步骤/15.
取消“全选”,找到百度蜘蛛的访客名称,选中并“确定”;
步骤/16.
如图所示,我们就可以得到百度蜘蛛访问网站的所有数据。
各大搜索引擎综合索引名称
百度蜘蛛:Baiduspider 谷歌爬虫:Googlebot
360爬虫:360Spider 必应爬虫:bingbot
搜狗爬虫:Sogou News Spider
网站日志也可以在服务器/主机管理面板中下载。得到的百度访问日志还需要分辨真假蜘蛛,并非所有蜘蛛都是真实百度蜘蛛,如站长工具的虚拟蜘蛛等。
评论