很简单就是分割字符串而已,可查看含有某些字符的项目,例如baidu.,也可以用模式匹配语法例如这样404.*?baiduPS:发现apache的日志也是可以用的。
?awstats中,uniquevisitor是根据IP来计算的,所以awstats中统计的UV值,即是IP值。webtrends中,也有对UV的统计,不过webtrends也是有JS统计代码的,所以,它的统计原理跟大部分统计代码都一样,通过JS获取客户端的cookie来计算UV值。
查看并询问了一些关于GoogleAnalytics计算UV数的算法,GoogleAnalytics对于独立访客(UV)的计算,是基于访客浏览器中cookie来确定的,当访客第一次(或cookie丢失后)访问添加GATC的代码时,便会创建一个唯一的cookie(即一个UV),cookie中utma变量记录了访客ID、访问次数、访问时间等信息,UV数以此累加。当访客丢失cookie或更换浏览器重新访问网站,都将会被认为新访客,而创建一个cookie,记录为一个新的UV。
apache日志分析:
以下内容也是一些关于apache日志分析的东东,记录下来。
1.什么是UV?UV是uniquevisitor的简写,是指独立访客,是以实际访问的电脑计数。2.什么是IP?IP是国际互联网协议(InternetProtocol)的简称,是通过网络间信息地址定位具体计算机的方式之一。3.UV和IP的概念有什么区别?对于IP来说,它在同一级别的网络(例如某个局域网、社区网、教学楼网或者INTERNET)范围内是唯一的,同一局域网内的所有电脑都只有一个共同ip。举例来说,我在一个局域网里,对外的IP是219.129.170.111,那么跟我同一局域网里的所有电脑都是这个IP,也就是说假如整个局域网的电脑都访问您的网站的话,在24小时内也只计算一个IP,所以相对UV来说不是很精确。而UV跟IP稍有不同,UV是访问你的网站的每一台电脑客户端。现在很多朋友用的网络都是局域网,引入了UV后,就能更精确的统计。总结:UV的统计数比IP更为准确,能够准确的计数每一台访问电脑,而IP把同一局域内的所有电脑视为一个。(PS:UV计数会涉及COOKIE。)
上次因工作的需求对一台apache的log做了一次整体的分析,所以顺便也对apache的日志分析做下简单的介绍,主要参考apache官网的LogFiles,手册参照https://httpd.apache.org/docs/2.2/logs.html
一.日志分析如果apache的安装时采用默认的配置,那么在/logs目录下就会生成两个文件,分别是access_log和error_log1.access_logaccess_log为访问日志,记录所有对apache服务器进行请求的访问,它的位置和内容由CustomLog指令控制,LogFormat指令可以用来简化该日志的内容和格式例如,我的其中一台服务器配置如下
CustomLog“|/usr/sbin/rotatelogs/var/log/apache2/%Y_%m_%d_other_vhosts_access.log86400480″vhost_combined
-rw-r–r–1rootroot2231075012-0523:592010_12_05_other_vhosts_access.log-rw-r–r–1rootroot2687318012-0623:592010_12_06_other_vhosts_access.log-rw-r–r–1rootroot2681000312-0723:592010_12_07_other_vhosts_access.log-rw-r–r–1rootroot2453021912-0823:592010_12_08_other_vhosts_access.log-rw-r–r–1rootroot2453668112-0923:592010_12_09_other_vhosts_access.log-rw-r–r–1rootroot1400340912-1014:572010_12_10_other_vhosts_access.log
通过CustomLog指令,每天一天生成一个独立的日志文件,同时也写了定时器将一周前的日志文件全部清除,这样可以显得更清晰,既可以分离每一天的日志又可以清除一定时间以前的日志通过制,LogFormat定义日志的记录格式
LogFormat“%h%l%u%t\”%r\”%s%b\”%{Referer}i\”\”%{User-Agent}i\”"combinedLogFormat“%{X-Forwarded-For}i%l%u%t\”%r\”%s%b\”%{Referer}i\”\”%{User-Agent}i\”"combinedproxyLogFormat“%h%l%u%t\”%r\”%s%b”commonLogFormat“%{Referer}i-%U”refererLogFormat“%{User-agent}i”agent
随意的tail一个access_log文件,下面是一条经典的访问记录
218.19.140.242–-[10/Dec/2010:09:31:17+0800]“GET/query/trendxml/district/todayreturn/month/2009-12-14/2010-12-09/haizhu_tianhe.xmlHTTP/1.1″2001933“-”“Mozilla/5.0(Windows;U;WindowsNT5.1;zh-CN;rv:1.9.2.8)Gecko/20100722Firefox/3.6.8(.NETCLR3.5.30729)”
一共是有9项,将他们一一拆开
218.19.140.242--[10/Dec/2010:09:31:17+0800]“GET/query/trendxml/district/todayreturn/month/2009-12-14/2010-12-09/haizhu_tianhe.xmlHTTP/1.1″2001933“-”“Mozilla/5.0(Windows;U;WindowsNT5.1;zh-CN;rv:1.9.2.8)Gecko/20100722Firefox/3.6.8(.NETCLR3.5.30729)”
1)218.19.140.242这是一个请求到apache服务器的客户端ip,默认的情况下,第一项信息只是远程主机的ip地址,但我们如果需要apache查出主机的名字,可以将HostnameLookups设置为on,但这种做法是不推荐使用,因为它大大的减缓了服务器.另外这里的ip地址不一定就是客户主机的ip地址,如果客户端使用了代理服务器,那么这里的ip就是代理服务器的地址,而不是原机.
2)-这一项是空白,使用”-”来代替,这个位置是用于标注访问者的标示,这个信息是由identd的客户端存在,除非IdentityCheck为on,非则apache是不会去获取该部分的信息(ps:不太理解,基本上这一项都是为空,奉上原文)The“hyphen”intheoutputindicatesthattherequestedpieceofinformationisnotavailable.Inthiscase,theinformationthatisnotavailableistheRFC1413identityoftheclientdeterminedbyidentdontheclientsmachine.Thisinformationishighlyunreliableandshouldalmostneverbeusedexceptontightlycontrolledinternalnetworks.ApachehttpdwillnotevenattempttodeterminethisinformationunlessIdentityCheckissettoOn.
3)-这一项又是为空白,不过这项是用户记录用户HTTP的身份验证,如果某些网站要求用户进行身份雁阵,那么这一项就是记录用户的身份信息
4)[10/Dec/2010:09:31:17+0800]第四项是记录请求的时间,格式为[day/month/year:hour:minute:secondzone],最后的+0800表示服务器所处的时区为东八区
5)“GET/..haizhu_tianhe.xmlHTTP/1.1″这一项整个记录中最有用的信息,首先,它告诉我们的服务器收到的是一个GET请求,其次,是客户端请求的资源路径,第三,客户端使用的协议时HTTP/1.1,整个格式为”%m%U%q%H”,即”请求方法/访问路径/协议”
6)200这是一个状态码,由服务器端发送回客户端,它告诉我们客户端的请求是否成功,或者是重定向,或者是碰到了什么样的错误,这项值为200,表示服务器已经成功的响应了客户端的请求,一般来说,这项值以2开头的表示请求成功,以3开头的表示重定向,以4开头的标示客户端存在某些的错误,以5开头的标示服务器端存在某些错误,详细的可以参见HTTPspecification(RFC2616section10).[https://www.w3.org/Protocols/rfc2616/rfc2616.txt]
7)1933这项表示服务器向客户端发送了多少的字节,在日志分析统计的时侯,把这些字节加起来就可以得知服务器在某点时间内总的发送数据量是多少
8)-暂不知
9)“Mozilla/5.0(Windows;U;WindowsNT5.1;zh-CN;rv:1.9.2.8)Gecko/20100722Firefox/3.6.8(.NETCLR3.5.30729)”这项主要记录客户端的浏览器信息
2.error_logerror_log为错误日志,记录下任何错误的处理请求,它的位置和内容由ErrorLog指令控制,通常服务器出现什么错误,首先对它进行查阅,是一个最重要的日志文件
tailerror_log,随意摘取一个记录
[FriDec1015:03:592010][error][client218.19.140.242]Filedoesnotexist:/home/htmlfile/tradedata/favicon.ico
同样也是分为几个项
[FriDec1015:03:592010][error][client218.19.140.242]Filedoesnotexist:/home/htmlfile/tradedata/favicon.ico
1)[FriDec1015:03:592010]记录错误发生的时间,注意,它跟我们上面access_log记录的时间格式是不同的
2)[error]这一项为错误的级别,根据LogLevel指令来控制错误的类别,上面的404是属于error级别
3)[client218.19.140.242]记录客户端的ip地址
4)Filedoesnotexist:/home/htmlfile/tradedata/favicon.ico这一项首先对错误进行了描述,例如客户端访问一个不存在或路径错误的文件,就会给出404的提示错误
二.实用的日志分析脚本了解日志的各种定义后,这里分享一下从网上淘来的一些对日志分析的脚本
1.查看apache的进程数ps-aux|grephttpd|wc-l
2.分析日志查看当天的ip连接数catdefault-access_log|grep“10/Dec/2010″|awk‘{print$2}’|sort|uniq-c|sort-nr
3.查看指定的ip在当天究竟访问了什么urlcatdefault-access_log|grep“10/Dec/2010″|grep“218.19.140.242″|awk‘{print$7}’|sort|uniq-c|sort-nr
4.查看当天访问排行前10的urlcatdefault-access_log|grep“10/Dec/2010″|awk‘{print$7}’|sort|uniq-c|sort-nr|head-n10
5.看到指定的ip究竟干了什么catdefault-access_log|grep218.19.140.242|awk‘{print$1″\t”$8}’|sort|uniq-c|sort-nr|less
6.查看访问次数最多的几个分钟(找到热点)awk‘{print$4}’default-access_log|cut-c14-18|sort|uniq-c|sort-nr|head
三.使用awstats自动分析日志当然啦,如果想最简单和最直观的分析日志还是用工具,现在网上较流行的工具是awstats,一个基于perl的web日志分析工具,功能很强大也支持IIS等服务器
Tags:Nginx日志分析,Apache,日志分析.
小编点评:纯净软件下载器PureSoftwareDown.
下载小编点评:快速下载工具,无插件!无恶意代码!下载速.
下载小编点评:软件简介:1,纯绿色版,安装无插件无广告,同.
下载小编点评:EventGhost遥控器控制电脑是一.
下载小编点评:协通xt800远程控制软件是一款专业.
下载小编点评:一个相当好用的“资源探测器”功能,它可以将FTP.
下载小编点评:antdownload二代无限速下.
下载小编点评:极致CMS建站系统是一个开源免费的PH.
下载小编点评:超级usb万能启动盘V2.2版本更新.
下载小编点评:软件介绍这是一款可从YouTube上.
下载小编点评:软件介绍以前企业建网站,需要请人制作。不但时.
下载小编点评:软件介绍你想了解你的员工在上班时是.
下载小编点评:软件介绍用电脑的时候经常收到烦人的信使服.
下载七彩色淘宝宝贝图片下载工具下载-淘宝图片批量下载工具 v6.6
Remote Utilities下载-Remote Utilities v6.9.4.0 免费版
校园e卡通app下载-校园e卡通 v2.4.2 安卓版
来付吧app下载-来付吧 v3.0.4 手机版
民生太原app下载-民生太原 v1.0.8 安卓版
诸葛天气极速版app下载-诸葛天气极速版 v1.1 手机版
铲车圈app下载-铲车圈 v2.3.5 手机版
兔博士app下载-兔博士 v12.6.1 安卓版
若途旅行app下载-若途旅行 v5.0 手机版
齐家极速版app下载-齐家极速版 v3.8.2 安卓版
佳优生活家app下载-佳优生活家 v3.4.0 安卓版
豫上装app下载-豫上装 v1.0.3 安卓版
悠管家app下载-悠管家 v2.0.7 安卓版