[Cologne-pm] Hallo Zusammen

Michael Lamertz mike at lamertz.net
Tue Jul 5 10:01:40 PDT 2005


Hoy,

On Tue, Jul 05, 2005 at 08:22:10PM +0200, j.huettemeister at gmx.net wrote:
> 
> Also:
> ich will ne große Anzahl server mit rrdtool überwachen. Bisher verfahr ich 
> folgendermaßen:
> über einen minütlichen cronjobs wird per ssh logtail auf einem remote Server 
> aufgeführt. Der output wird geparsed, nach Sekunden sortiert und in eine rrd 
> Datei geschrieben. Der step der rrd Datei ist 60 Sekunden, ich mache die 
> updates dennoch auf Sekundenbasis, da logtail die Daten nicht etwa bis zur 
> *vollen* Minute zurückgibt, sondern bis zum Dateiende.
> 
> Jetzt kann das ganze aber zu einem performance Problem werden, da jetzt noch 
> nochmal 40 Server dazu kommen und pro server können das mehrere Logfiles 
> werden.
> 
> Um hier performance rauszuholen könnte ich die Daten *zwischenpuffern* und nur 
> immer bis zur letzten Minute das rrd update fahren. Über Dateien auf Platte 
> würd das gehen, oder, damit ich mal was lerne, vielleicht auch mit Threads? 
> Ich dache an ne queue in die ein Thread schreibt und ein anderer immer bis 
> zur vollen Minute rausholt... Macht das Sinn?
> 
> 
> Hinzukommend: ich möchte nicht 100te Cronjobs haben, sondern nur ein skript, 
> das die einzelnen jobs minütlich anstößt. Da wäre Threads natürlich auch 
> toll, aber wie kann ich die minütlich anstoßen. Ich bräuchte ja sowas wie 
> einen scheduler.
> 
> Bestimmt gibts noch ganz andere und bessere Ideen ;-)

And here they come...

a. Nimm nicht ssh sondern SNMP

    Bei ssh musst Du neben dem Crypto-Overhead jedesmal ein vollwertiges
    Login durchlaufen.  Das kannst Du Dir sparen.

    Du wirst dann jedoch nicht 'drum kommen, für die Dienste, die nicht
    via SNMP auslesbar sind, eine Art Agent zu bauen, die den
    SNMP-Server füttern bzw. von diesem getriggert werden können.

b. Alternativ, nimm remote syslog...

    Dann sparst Du Dir die ssh vollständig.

c. Bei dieser Menge an RRD-Daten wird dir irgendwann alleine für das
füllen der DB auch die Last eng werden.  Die Kiste auf der das bei uns
läuft, derzeit IIRC mit 68 Servern, mit im Schnitt 8 Feeds pro Server,
läuft die Kiste (2 x 700Mhz PIII) mittlerweile auf 'ner Sustained Load
von 15-20.

Die Grafiken liegen in

    1 Stunde über 5min Intervalle
    1 Tag über 5min Intervalle
    1 Woche über 2h Intervalle
    1 Monat über 2h Intervalle
    1 Jahr über 1d Intervalle

Tages- und Stundengrafen werden alle 5min aktualisiert, der Rest 1x/tag.

Wenn Du weniger RRAs hast, zieht's natürlich auch weniger Last.

-- 
	    Well, then let's give that Java-Wussie a beating... (me)

Michael Lamertz                        |     +49 2234 204947 / +49 171 6900 310
Sandstr. 122                           |                       mike at lamertz.net
50226 Frechen                          |                 http://www.lamertz.net
Germany                                |               http://www.perl-ronin.de 


More information about the Cologne-pm mailing list