Webalizer Drucken

Inhalt

 

 

  

Um statistische Auswertungen aus Logfiles zu erstellen, hat man eine vielfältige Auswahl an Tools. Hier stelle ich das Tool Webalizer vor.
 


Vorteile von Webalizer


Die wesentlichen Vorteile von Webalizer sind:

  • Die Auswertung des HTTP-Referers, welcher Auskunft über die Auffindbarkeit und Verlinkung einer Webseite gibt
  • Detaillierte Informationen über das Surfverhalten der Nutzer mittels Ermittlung der Ein- und Ausgangsseite
  • Ausgiebige Formatierungsmöglichkeiten der Darstellung
  • Volle Automatisierbarkeit des Tools, z.B. mittels Batchjobs und einer Liste aller virtuellen Webserver

 

Konfiguration von Webalizer allgemein


Nach Installation des Webalizers enthält das Verzeichnis eine Standard-Konfigurationsdatei, in der viele Optionen voreingestellt sind. Andere sind auskommentiert, so daß man sie bei Bedarf nur aktivieren muß. Für den größten Teil der Optionen existiert eine Default-Einstellung, so daß prinzipiell kein Eintrag in der .conf-Datei nötig ist.

Es werden hier nur die wichtigsten Optionen der Konfigurationsdatei besprochen. Die Datei heißt standardmäßig webalizer.conf und sollte, damit sie beim Start des Webalizers ohne Pfadangabe gefunden wird, am besten im Webalizer-Pfad stehen. Um sie zu benutzen, wird der Durchlauf dann einfach mit webalizer gestartet. Benutzt man verschiedene Konfigurationsdateien für verschiedene Aufgaben, so muß außer bei Benutzung von /etc/webalizer.conf als Konfigurationsdatei dem Programm stets der Pfad mit der Option -c mitgegeben werden.

Beispiel:


 d:\webalizer\webalizer.exe -c d:\webalizer\webalizer.conf

 


Nun wird die Konfigurationsdatei mit dem Editor bearbeitet.

Zuerst muss der Pfad zum Logfile angegeben werden. In der Konfigurationsdatei muß angegeben werden, welche Logdatei benutzt werden soll, d.h. es gibt hier keine Voreinstellung.Es gibt mehrere Logfile-Formate, die benutzt werden können, das Standardformat heißt clf. Ebenso funktioniert der Durchlauf mit gezippten Logfiles im gz-Format, was man vielleicht nutzen möchte, weil man ab und zu große Logfiles packen will, um Plattenplatz zu sparen.


 LogFile d:\logs\_log

Dann sollten Sie das Verzeichnis angeben, in dem die Ergebnisse gespeichert werden sollen. Es empfiehlt sich natürlich, eigene Verzeichnisse für die Ausgabe zu erstellen. Falls man mit verschiedenen Konfigurationsdateien verschiedene Jobs erledigt, sollte man natürlich auch in der jeweiligen .conf-Datei das jeweilige Ausgabeverzeichnis angeben, da sonst Daten überschrieben werden oder, je nach Einstellung, neue Daten an solche angehängt werden, die überhaupt nicht dazu passen.


  OutputDir  d:\webalizer\statistik


Das "no" durch "yes" ersetzen. Damit wird Webalizer angewiesen, den Stand des Logfiles zu speichern und beim nächsten Aufruf an dieser Stelle fortzusetzen.


 Incremental no

Hier kann nun eine Überschrift für die Auswertung angegeben werden


  ReportTitle Usage Statistics

Nun noch den Hostnamen eintragen.

 
 HostName localhost


Danach folgen einige unwichtige oder defaultmäßig richtig oder sinnvoll eingestellte Parameter. Dann die Datei webalizer.conf abspeichern.




Konfiguration von Webalizer für die Auswertung von Squid-Logdateien


Die Auswertung mit Webalizer funktioniert nur, wenn die Logdatei des Squid das richtige Format besitzt. Statt des Standardformats der Squid-Logs muß der Squid seine Logdateien im "Apache-Stil" abliefern. Dazu muß folgende Einstellung in der squid.conf gesetzt werden:


 emulate\_httpd\_log on

Die Logdateien liegen in unserem Beispiel auf d:\squid\logs Und sie Statistikauswertung soll in d:\webalizer\squid erzeugt werden. 

Nun muß die Konfigurationsdatei des Webalizers angepaßt werden. Als Konfigurationsdatei benenne ich die Orginaldatei in die Datei squidstats.conf um. Nun sind in der Konfigurationsdatei von Webalizer nur drei Zeilen abzuändern.


 LogFile      d:\squid\logs\access.log

 LogType   
web

 OutputDir 
d:\webalizer\squid  

Mit dem folgenden Aufruf kann dann die Proxy-Statistik erzeugt werden:


 Pfad...\webalizer -c Pfad...\squidstats.conf
 

 


Quellen


Original Webalizer:  http://www.webalizer.org
StoneSteps Webalizer:                   
 http://www.stonesteps.ca/downloads/

 


Die Alternative: WebalizerGUI


Webalizer-GUI ist eine graphische Benutzeroberfläche für das Logfile-Analyse Programm Webalizer. Webalizer ist als Freeware für eine Reihe von Betriebssystemen erhältlich und dient der Auswertung der Logfiles von Proxy-Servern oder Webservern.
 

Das Programm erzeugt Tabellen und Diagramme, welche Aufschluß über die Anzahl der Zugriffe auf eine Webseite pro Tag, Woche oder Monat geben, über die am häufigsten abgerufenen Seiten, von welchen Seiten die Besucher kamen, welche Browser sie benutzten, etc.

Da Webalizer jedoch ein Konsolenprogramm ist, welches über eine Textdatei konfiguriert werden muß, wurde hierzu eine graphische Benutzeroberfläche entwickelt. Die Webalizer-GUI ermöglicht die einfache Einstellung der wichtigsten Optionen von Webalizer mittels der bekannten graphischen Bedienelemente. Danach ruft die GUI das Webalizer-Programm auf, welches für die Erstellung der Statistik verantwortlich ist.

webalizergui.jpg

In den mit "Plus" bezeichneten Downloadpaketen der GUI ist die Stone Steps-Variante von Webalizer bereits integriert, die GUI kann aber selbstverständlich auch mit anderen Webalizer-Versionen verwendet werden.

Die Webalizer-GUI ist wie Webalizer selbst unter der GPL veröffentlicht, wer das Programm also den eigenen Wünschen entsprechend anpassen oder erweitern möchte kann sich den Sourcecode herunterladen. Das Programm ist unter Delphi Version 2006 bzw. Kylix 3 geschrieben.

Seit der GUI-Version 2.1 enthalten die Plus-Downloadpakete nicht mehr den original-Webalizer, da dieser seit einigen Jahren nicht mehr weitergepflegt wird. Stattdessen ist dem Paket die Stone Steps-Variante beigefügt, welche neben einer Reihe von neuen Optionen auch Bugfixes und Sicherheitsupdates enthält. Bei einem Umstieg von einer der anderen Webalizer-Varianten sollte man jedoch beachten, daß die Stone Steps-Version auch solche Visits zählt, bei welchen keinerlei Textdateien, sondern z.B. nur Bilder heruntergeladen wurden. Dadurch ist die Anzahl der Visits bei Verwendung des Stone Steps Webalizers etwas höher als mit den anderen Webalizer-Varianten.

Homepage des Entwicklers:

http://www.tobias-schwarz.net/webalizer_gui.html    

 

 

 


Beispiel einer Webalizer Auswertung

In den Übersichten und Grafiken werden folgende Begriffe verwendet, die zuerst erläutern möchte. 

Begriff             
Bedeutung
 
 Hits
Ein Hit ist der Abruf (Anfrage) einer beliebigen Datei einer Seite. Die sind neben den eigentlichen Webseiten auch Grafiken, Scripte oder Formatierungsanweisungen.
 Files Dies sind alle Dateien einer Seite, die nach einer erfolgreichen Anfrage an den Browser übertragen wurden. (z.B. HTML-Seite und Grafiken)
 Pages Diese Zahl gibt an, wie viele HTML-Dokumente abgerufen wurden. Dies sind .htm und .php Dateien.
 Visits Die sind die gezählten Besucher (Rechner/Client) der Seite. Unabhängig davon, wie oft die Seite aufgerufen wurde. Jeder Aufruf wird nur einmal am Tag gezählt.
 Sites  
 Kbytes Die ist die Summe des übertragenen Transfer- oder Übertragungsvolumens. 
   

Jahresstatistk:
webalizer_zusammenfassung.jpg




 

 

 

 

 

 

 

 

 

 Monatsstatistik:

webalizer_nachmonaten.jpg

 

 

 

 

 

 

 

 

 

 

 

 

 

 Einzelmonat: webalizer_monatsstatistik.jpg