Webalizer Statistik interpretieren
06. Mai 2010 | Kommentare: 1
Hits Files Visits richtig lesen und verstehen
Kleine, kostenlose Besucherzähler waren Gestern: Wer heute den Erfolg seiner Webseite kontrollieren will, greift zu Analyse-Tools und Web-Statistiken. Diese jedoch richtig lesen zu können, erfordert etwas Hintergrundwissen. Ein verbreitetes WebStatistik-Programm ist Webalizer.
Dieses Tutorial erklärt, wie Webstatistiken entstehen und interpretiert werden können. Besonders die Grundlagen sind auch auf andere Statistik-Tools anwendbar.
Was ist Webalizer?
Webalizer ist ein Freeware-Software-Paket, das aus Webserver-Logfiles Statistiken erstellt. Webalizer analysiert rohe Daten und errechnet daraus anschauliche, grafisch aufbereitete Statistiken im HTML-Format. Das vielfach einstellbare Programm kann auf UNIX und Windows- Computern installiert werden. Damit kann man Statistiken Online bereitstellen oder lokal auf Windows/Unix-Rechnern zur Logfile-Analyse benutzen. Die Webalizer Web-Log-Analyse-Software wurde von Bradford L. Barrett geschrieben und ist heute Teil vieler Webhosting-Angebote.
Grundlagen: Wissen, was wie gezählt wird
Um die vom Webalizer erstellten Statistiken richtig zu verstehen, ist folgendes Vorwissen nötig:
Wie werden welche Daten gemessen und wie wird daraus die dargestellte Information errechnet?
Besucher nackt in Zahlen und Kommandos: die Log-Datei
Grundlage aller von Webalizer erstellten Statistik ist die Log-Datei des Web-Servers. Der weit verbreitete Webserver Apache z.B. protokolliert alle Zugriffe in der Datei apache\logs\access.log
access = englisch für Zugriff & log = englisch für Protokoll
Anfragen an den Webserver werden in diese Datei gespeichert - in einem standartisierten Format. Jede Zeile der Log-Datei dokumentiert einen Zugriff = Hit.
Genau betrachtet, erkennt man in einer Zeile der Datei access.log:
- die Adresse eines Webservers
- ein Datum mit Uhrzeit
- ein Kommando gefolgt von
- einer lokalen Adresse
- sowie ein paar weitere Zahlen
Aus diesen mehr oder weniger kryptischen Informationen werden Ihre Statistiken destilliert!
Wie viele Besucher habe ich?
Wer sich beim Anblick seiner Logdatei schon freut »So viele Besucher!«, der irrt: Je nachdem, wie viele Dateien bei einem Seitenaufruf übertragen werden müssen, so viele Zeilen schreibt Apache in sein Log. Ein Seitenaufruf (= eine Page Impression) resultiert also meist in mehreren übertragenen Dateien (=Hits).
Eine Page = mehrere Hits.
die wichtigsten Begriffe:
Es ist wichtig zu wissen, wie ein Webserver arbeitet und mit welchen Daten er es auf Ihrem Webspace zu tun hat. Das Verständnis folgender Begriffe ist für alle Webstatistiken unablässig:
Hits
=Zugriffe. Die absolute Zahl von Anfragen an den Server im angegebenen Zeitraum (Monat, Tag, Stunde ...)
Files
=Dateien. Die absolute Anzahl von Hits=Zugriffen, die Daten zum Nutzer zurücksenden ließen. Nicht alle Aufrufe resultieren auch tatsächlich in Daten. So passieren zum Beispiel Anfragen, die in 404 (Nicht gefunden) -Antworten enden. Oder: Der Nutzer hat jene Daten schon im Browser-Cache, so dass sie vom Server nicht nochmals gesendet werden mussten.
Vergleicht man den Unterschied zwischen Hits und Files, erhält man Hinweise auf wiederkehrende Besucher. Je größer der Unterschied, um so wahrscheinlicher ist es, dass Besucher Daten schon im Zwischenspeicher (=Cache) hatten - also schon einmal aufgerufen haben.
Sites
Zahl einzigartiger IP-Adressen, die Anfragen an den Server schickten. Eine Messgröße, mit der man sehr vorsichtig umgehen sollte. Viele Besucher scheinen von der gleichen IP-Adresse (Site) zu kommen, ein anderes Mal von verschiedenen IP-Adressen. Was an der dynamischen Zuweisung von IP-Adressen im Internet und Proxy-Servern/Load-Balancern liegt. Sites kann man also nur als groben Maßstab ansehen - am Besten im Vergleich zum ebenfalls ungenauen Punkt Besucher.
Visits
=Besuche. Ein Besuch wird gezählt, wenn eine nicht-lokale Site eine Anfrage nach einer Page (=Seite) zum ersten Mal macht. Solange dieselbe Site Anfragen im eingestellten Zeitraum stellt, wird sie zum selben Besuch gezählt. Dieser (vor)eingestellte Zeitraum beträgt 30 Minuten. Wenn dieselbe Site also nach 30 Minuten immer noch Anfragen sendet, wird sie als ein neuer Besuch gezählt. Nur Anfrage nach Pages, also *.html / *.asp / *.php - Dateien können einen Besuch auslösen. So wird die Anfrage einer Grafik von Ihrem Server keinen Besuch auslösen. So gemessen, reduziert sich die Anzahl »falscher« Besucher.
Pages
=Seiten. Jene URLs, hinter denen physische Webseiten stehen. Jede *.html / *.asp / *.php -Datei ist so eine Page.
*.jpg / *.css / *.js – Files sind (Hilfs-) Dateien, die nicht als Page gezählt werden. Einige nennen diese Messgröße auch »page views« oder »page impressions«
KByte
Zeigt die Datenmenge, die Ihr Webserver an entfernte Clients ausgeliefert hat, basierend auf den im Serverlog gespeicherten Daten. Ein Kilobyte sind 1024 bytes.
Referrer
Referrer sind jene URLs, die einen Nutzer zu Ihrem Webangebot führten. Auch »verweisende URLs« genannt.
Beispiel 1: auf der Seite http://example.com/partner.html befindet sich ein Link, welcher zu Ihrer Webseite http://meineseite.de/ führt. Klickt jemand diesen Link, passiert ein Seitenaufruf - mit dem Referrer http://example.com/partner.html.
Beispiel 2: Jemand verwendet eine Grafik von Ihrer Seite http://meineseite.de/bilder/sonne.jpg unter http://example.com/image-gallery.html. Ergebnis: in ihrer Statistik taucht http://example.com/image-gallery.html als Referrer auf.
Einige Firewalls sind in der Lage, Referrer zu unterdrücken.
User Agents
Ihre Webinhalte aufrufende Programme. Browser wie Safari, Internet Explorer, Mozilla Firefox, Netscape, Opera, Konqueror - aber auch Spider, Crawler und Robots. Beachten Sie, dass Browser sich Ihrem Server zwar mit Ihrem User Agent String zu erkennen geben - dies aber einfach unterdrückt oder gefälscht sein kann.
Häufig gestellte Fragen zu Webalizer-Statistiken
Webalizer sollte nun kein Mysterium mehr sein - trotzdem nochmal Antworten
Was ist der Unterschied zwischen Hits und Visits?
Kurz: Ein Visit=Besuch produziert mehrere Hits=Anfragen. Es endlich begreifen: Nachlesen unter Grundlagen.
Wie viele Besucher hat meine Seite nun?
Besuche zeigt Webalizer als Visits (gelbe Balken). Beachten Sie, dass Visits nach einem konfigurierbaren Algorithmus errechnet werden. Die Webalizer-Voreinstellung zählt Hits von derselben IP-Adresse nach einer halben Stunde als erneuten Besucher.
Auch können Sie nicht sicher sein, dass die dargestellten Besucherzahlen wirklich menschliche Wesen repräsentieren. Auch Suchmaschinen-Robots durchforsten das WWW, um Webinhalte zu indexieren und werden dadurch Hits auf Ihrem Server generieren.
AWstats oder Google Analytics besser als Webalizer?
Unterschiedliche Messmethoden bringen unterschiedliche Ergebnisse. Ob man Statistiken per Javascript, Zählpixel oder aus Server-Logfiles generiert - Name, Alter oder Schuhgröße Ihrer Besucher werden Sie so nicht erfassen können. Genausowenig, ob sie Vegetarier oder Linkshänder sind. Inwieweit Sie überhaupt messen können, hängt davon ab, wie genau Menschen von Maschinen unterschieden werden können.
web statistik unterschied webalizer analytics
lesen noch mal letzte Frage
an Hits oder page-impressions orientieren?
Vielfach zu beobachten ist, dass Leute mit Hits protzen. Sicher zeigen Hits die höchsten Zahlen. Eine aufgerufene Page produziert mehrere Hits. Und je nachdem, wie viele Dateien in einer Page verlinkt sind (mit aufgerufen werden) können das sehr viele Hits sein. Beispiel: eine Webseite mit vielen Grafiken (z.B. Galerie).
Pages – also tatsächliche Seiten-Dateien liefern vergleichsweise bessere Zahlen für eine Auswertung. Betrachten Sie aber auch *.pdf-Dateien, Videos und *.zip-Archive als Seite, können Sie sich nicht daran orientieren.
Ist es gut oder schlecht, dass meine robots.txt häufig aufgerufen wird?
Diese Datei dient ausschließlich Suchmaschinen-Robots und Spidern, um denen das Auslesen Ihrer Webinhalte zu erlauben oder zu verbieten. „Menschliche“ Browser rufen diese Datei nicht auf. Wenn sie gern mit Maschinen und Datensammlern kommunizieren, sind viele Hits auf ihre robots.txt natürlich gut.
Webalizer zählt jede IP nur einmal am Tag, oder nicht?
die Webalizer-Standard-Einstellung: 30 Minuten
Was sind für Webalizer hohe Zahlen?
Wie viele Besucher, Hits oder Kilobytes Traffic eine Seite hat, hängt maßgeblich von deren Inhalten und Popularität ab. Also selbst mal per Suchmaschine nach Webalizer-Statistiken suchen und vergleichen: So manche echte Webstatistik liegt ohne Zugangsschutz im Netz herum.
Woher kommen meine Besucher?
Wollen Sie es genau wissen: Fragen Sie sie doch mal! Webalizer-Statistiken zeigen Ihnen die Herkunft Ihrer Besucher auf Grundlage der IP-Adresse bzw. des ISPs des Besuchers.
Webalizer unbekannte Adressen
Unter Top-Countries zeigt Ihnen Webalizer nur unbekannte Adressen
? Dann werden (möglicherweise) auf Ihrem Webserver IP-Adressen nicht zu Hostnamen aufgelöst. Sonst ist es eine Frage der Webalizer-Konfiguration, welche ISP-Top-Level-Domain-(Kürzel) welchen Länder-Klarnamen zugeordnet werden. So steht die TLD .de
beispielsweise für Deutschland und .au
für Australien. Was Webalizer nicht kennt, nennt es unbekannt.
Kann ich Hits auf Bilder zählen?
Theoretisch ja. Konfigurieren Sie Webalizer entsprechend. webalizer.conf kennt zum Beispiel die Option HideURL *.jpg
...
Webalizer-Konfiguration
Wie Webalizer aus Logfiles eine Aufrufstatistik erstellt, kann man über die Datei webalizer.conf anpassen. Eine sample.conf dokumentiert anschaulich, wie man das tut.
Tipps und Tricks
Sie haben das Tutorial mit den Grundlagen von (Webalizer-) Statistiken gelesen? Nun fragen Sie sich: wie kann man dieses Wissen zur Optimierung von Websites einsetzen? Was zum Beispiel tun, wenn immer weniger Besucher kommen?
Stagnieren oder fallen Ihre Besucherzahlen, sollte das für Sie als Webseiten-Betreiber ein Alarm-Signal sein.
Viele Fehler beim Webseitenbau sind vermeidbar. Andere Probleme, die mit dem Server (wo Ihre Webseite liegt) zusammenhängen - und von Ihnen vielleicht nur eingeschränkt beeinflussbar sind - erfordern eine gewisse Problem-Vermeidungs-Strategie.
technische Probleme des Servers
Prüfen Sie, ob und wie gut die Webseite technisch erreichbar (abrufbar) ist. Abgestürzte Server oder lange Antwortzeiten lassen Besucher- wie auch Datenmengen auf drastische Weise sinken. Dauert die Übertragung großer Dateien stundenlang, müssen Sie sich nicht wundern, wenn Nutzer ihren Besuch genervt abbrechen und es nie wieder versuchen. Auffällig wird solches durch entsprechende HTTP-Statuscodes. Betrachten Sie die Besucherstatistik des Monats im Bereich "Hits by Response Code". Entscheidend sind Zahlen für
Code 200 - OKCode 206 - Partial ContentCode 404 - Not FoundCode 500 - Internal Server Error
Nicht gefundene, nur teilweise übertragene Daten oder Serverfehler sind der Tod - auch und gerade langfristig. Wie viel Geduld hätten Sie mit einer Webseite bei zu lange Antwortzeiten oder permanenten nicht gefunden-Meldungen?
Abfall in der Link-Popularität
Vielleicht wurden Links, die einmal auf Ihre Webseite führten, entfernt. Hier hilft Ihnen die Tabelle der Top Referrers. Dort sehen Sie, wie oft von wo aus Ihre Seite aufgerufen wurde. An welcher Stelle stehen bekannte Suchmaschinen? Wird Ihre Seite ausschließlich direkt aufgerufen? Bezahlen Sie für Link-Werbung? Wie wirkt diese?
Abfall in der Google-Gunst
Der Erfolg Ihrer Webseite hängt stark von Suchmaschinen ab. Sehen deren Bots, dass sich Ihre Webseite nicht mehr ändert, werden sie auch nicht mehr so oft zum indexieren vorbeikommen (Entsprechend der Logik: es tut sich ja sowieso nix mehr...). Seiten, die sich öfters mal ändern, haben nach der Suchmaschinen-Logik wohl auch Neues zu bieten und bewerten solche Seiten besser. Also ein Effekt, der doppelt negativ zuschlägt, wenn Sie nicht dranbleiben am Webseitenbau.
veraltete, uninteressante Inhalte
Möglicherweise interessiert sich wirklich niemand (kein Mensch) mehr für Ihre Seite. Etwas, dass nichts mit dem modischen Look Ihres Layouts zu tun haben muss.
Prüfen Sie vielmehr:
- ob Sie Inhalte haben
- wie begehrt diese sind,
- ob und wie gut diese erreichbar sind
Sehen Sie sich die Tabelle der Total Search Strings an. Hat sich die absolute Anzahl der Suchbegriffe (mit denen Ihre Seite aufgerufen wurde) drastisch reduziert? Werden Sie immer noch bei/mit nichts-sagenden Ein-Wort-Suchbegriffen angeklickt, die nicht wirklich etwas mit Ihren Inhalten zu tun haben?
(k)einer kam durch: Fehler in der Navigationsstruktur
Sehen Sie sich die Tabelle der Total URLs und die Top Entry Pages an. Finden Sie dort nur die URL ihrer Startseite? Oder nur einige wenige von Ihren vielen Pages? Das mag darauf hindeuten, dass sich niemand tiefer in Ihre Webseite hineinklicken wollte oder konnte. Weil Links nicht als solche erkennbar waren, falsch beschrieben waren oder ins Leere führten. Vielleicht haben Sie auf eine (wie auch immer) nonfunktionale nicht-interoperable Navigation gesetzt (z.B. Java-Applet als Navigation).
Möglicherweise ist Ihre Startseite überfrachtet mit Inhalten und muss darum ewig laden? Oder farbgestaltungsmäßig derart abstoßend, dass niemand länger darin surfen wollte.
Problem: Statistik-Spammer
Es ist generell keine gute Idee, seine Webalizer-Statistiken öffentlich Online zugänglich , also ohne Passwortschutz = ungeschützt zu zeigen. Selbst wenn Sie damit ihre unglaublich beeindruckenden Zugriffszahlen zu veröffentlichen meinen - Sie werden damit ein Publikum anziehen, welches Sie nicht wollen. Spammer. Diese setzen alles daran, mit ihren zweifelhaften Adressen in die Referrer (Verweise) - Liste zu kommen.
Folgende öffentlich zugängliche Statistiken zeigen dieses Phänomen
:
zum Vergleich: Webalizer-Statistiken ungeschützt online
Achtung! Nutzen Sie diese Adressen zum Vergleich + unter Berücksichtigung der angesprochenen Bedenken!
- http://www.safecrop.org/stats/ (vergleichsweise wenige Hits, einige Besucher und doch hoher Traffic durch große pdf Dateien)
- http://www.harmonie-kunterbunt.de/usage/ (eine der erfolgreicheren Seiten mit offensichtlich interessanten Inhalten - zu erkennen an den Suchausdrücken)
- http://www.monster-zoo.de/statistik/ (Null Inhalt - Statistik, die sich selbst als Grundlage hat - zu erkennen an: Top URls)
- http://www.hautarzt-castrop-rauxel.de/statistik/ (auch hier: Statistik erfolgreicher als Webseiten-Inhalt)
diese Statistiken vergleichen = Ihre Fragen beantworten:
- Wieviele Hits haben Websites durchschnittlich / normal / wie viele Hits zeigen andere Statistiken ... ?
- Wie viele Besucher sind (bei welchen Inhalten) zu erwarten?
- Welche zwielichtigen Verweise sammelt man mit ungeschützten Statistiken?
- Wie unterschiedlich sind Webalizer-Installationen konfiguriert?
Waren diese Informationen nützlich? Lassen Sie es mich wissen »

Rudolf Bamacher: on 15. April 2011
Endlich kann ich die Statistikdaten besser verstehen.