Zu große XMLs unter PHP4 – XMLspider

Was tun, wenn man zu große XML-Dateien parsen und die darin befindlichen Daten in eine Datenbank importieren muß.

Problembeschreibung:

Wir lassen bei einem großen Suchmaschinendienst Berichte über geschaltene Werbekampagnen erstellen, holen diese ab und wollen die enthaltenen Datensätze in eine Datenbank überführen, müssen aber zu jedem Datensatz noch eine Schlüsselwortkennnummer (im folgenden KeywordID) aus einer anderen Datenbank holen. Das klingt nicht weiter wild, wird es aber, wenn man bedenkt, dass wir von XML-Dateien reden, die locker 150 MB umfassen und sich darin ca. eine halbe Million Datensätze befinden.
Zu große XMLs unter PHP4 – XMLspider weiterlesen

Catwalk

Ein Schwank aus dem Leben eines Katzenbesitzers.

… wir saßen nun also da und installierten ein Ubuntu. Als nun die Zeit kam, da das Betriebssystem die Grundinstallation durchführte und gleichzeit die Kaffeezeit anbrach, die im Übrigen zu jeder anderen Zeit des Tages sein könnte, trafen wir uns zur gemeinsamen Einnahme unserer koffeinhaltigen Hauptdroge.

Nachdem wir diesem gemeinschaftlichen Ereignis ausgiebig gefrönt hatten, begaben uns wieder zu selbigem Rechner zu schauen was er tut. Es freute uns gar sehr, dass er ordnungsgemäß und völlig ohne jegliche weitere Aufforderung oder gar Fehlerdarstellung die Installation hinter sich gebracht hatte und uns nun ein feines login-promt präsentierte. Erst als wir versuchten mit den uns üblichen logins und den dazugehörigen Passwörtern Zugang zu erlangen, viel uns auf, dass keiner von uns einen Benutzer angelegt hatte. Bei Ubuntu ist der root-account übrigens standardmäßig abgeschalten, kann aber nach Bedarf mit dem erstellten Benutzer-Account wieder aktiviert werden.

Jener Account wurde aber definitiv von keinem erstellt, was die Vermutung nahe legte, dass der gute Kater, als er sich wärend unseres Kaffeekonsums über die Tische bewegte, es geschafft haben muss einen bzw. den Hauptbenutzer anzulegen. D.h. er muß einen validen Benuzternamen, ein login dafür (ok, das schlägt das System vor) und zweimal das gleiche Passwort eingegeben haben. Ein kluger Kater!
(Kurz: Wir haben’s dann neuinstalliert … ohne Kater!)

(P)Fund(s)stück der Woche

Eine Debugger-Object, daß scheinbar suizidgefährdet ist.


class Debugger{

[...]
	function runError($content,$typ){		
		
		 switch($typ){
		 	case E_USER_ERROR:
		 	 	unset($this);
		 		trigger_error($content, E_USER_ERROR);
		 		die();
		 		break;
		 	case E_USER_NOTICE:
		 		trigger_error($content, E_USER_NOTICE);
		 		break;
		 	case E_USER_WARNING:
		 		trigger_error($content, E_USER_WARNING);
		 		break;
		 	default:
		 		unset($this);
		 		trigger_error($content, E_USER_ERROR);
		 		die();
		 }
	}

}

Man nehme mal daß wir der Methode runError einen E_USER_ERROR (256) übergeben, schaun wir doch mal, was da passieren würde.

$deb = new $Debugger() ;
$deb->runError(‚die hard!‘,E_USER_ERROR);

Der switch findet ordnungsgemäß raus, das wir zum case-Block:E_USER_ERROR müssen und tötet sich erstmal selber … versucht es zumindest, denn im Falle eines Erfolges würde ja sonst das darauffolgende „trigger_error()“ nicht mehr ausgeführt werden.
Wird sie aber, da nur kurzzeitig das Object sich selber verliert dann sich aber seiner Existens wieder besinnt und wie befohlen einen Fehler wirft. In diesem Falle einen E_USER_ERROR was im Falle dieses Scriptes auch den Effekt des sofortigen Todes zur Folge hat.

Aber …
…sollte auch nur kleines Fünkchen Leben noch in dem Script selber stecken, wird mit dem anschließenden „die()“ auch garantiert, daß die komplette (jetzt schon tote) Ausführung auch wirklich beendet wird. Nachdem nun das Script zweimal gestorben ist, das erste zählen wir mal als mißglückten Suizidversuch, darf das Script dann wiederum ordnunggemäß aus dem switch springen und somit die Methode beenden.

Fein, alles tot (garantiert!!!) und fertig …

Ergo: Wenn du suizidgefährdete Klassen baust, sorge lieber „mehrfach“ dafür, daß sie nicht heile aus der Sache rauskommen!

so far – tucci

Why is programming fun?

Why is programming fun? What delights may its practioner expect as his reward?

First is the sheer joy of making things. As the child delights in his mud pie, so the adult enjoys building things, especially things of his own design. I think this delight must be an image of God’s delight in making things, a delight shown in the distinctness and newness of each leaf and each snowflake.

Second is the pleasure of making things that are useful to other people. Deep within, we want others to use our work and to find it helpful. In this respect the programming system is not essentially different from the child’s first clay pencil holder „for Daddy’s office.“

Third is the fascination of fashioning complex puzzle-like objects of interlocking moving parts and watching them work in subtle cycles, playing out the consequences of principles built in from the beginning. The programmed computer has all the fascination of the pinball machine or the jukebox mechanism, carried to the ultimate.

Fourth is the joy of always learning, which springs from the nonrepeating nature of the task. In one way or another the problem is ever new, and its solver learns something: sometimes practical, sometimes theoretical, and sometimes both.

Finally, there is the delight of working in such a tractable medium. The programmer, like the poet, works only slightly removed from pure thought-stuff. He builds his castles in the air, from air, creating by exertion of the imagination. Few media of creation are so flexible, so easy to polish and rework, so readily capable of realizing grand conceptual structures. (…)

Yet the program construct, unlike the poet’s words, is real in the sense that it moves and works, producing visible outputs separately from the construct itself. It prints results, draws pictures, produces sounds, moves arms. The magic of myth and legend has come true in our time. One types the correct incantation on a keyboard, and a display screen comes to life, showing things that never were nor could be.

Programming then is fun because it gratifies creative longings built deep within us and delights sensibilities we have in common with all men.

Fred Brooks, The Mythical Man-Month, Herrscher des Brook’schen Gesetzes

Sowas hat man auch selten…

#
# An unexpected error has been detected by HotSpot Virtual Machine:
#
# Internal Error (4A41564123414C4C530E4350500015), pid=5340, tid=1388
#
# Java VM: Java HotSpot(TM) Client VM (1.5.0_04-b05 mixed mode)
# An error report file with more information is saved as hs_err_pid5340.log
#
# If you would like to submit a bug report, please visit:
# http://java.sun.com/webapps/bugreport/crash.jsp
#

Einst war das echo …

So oder nur leicht anders fing bei jedem von uns ‚Scriptern‘ wohl an.

Wir wollen nun hier nicht nur unbedingt unseren Werdegang schildern und dazu vielleicht auch die eine oder andere Verfehlung unserer Selbst präsentieren, sondern auch Belustigendes, Anregendes und Bedenkliches was uns auf desem Wege wiederfahren ist und noch wird.

In diesem Sinne tucci

Los gehts

Nun kann es losgehen. Die Script Artists werden sich in den nächsten Tagen versammeln und hier aktiv werden.

Dieses Blog soll unser persönlicher Schreibblock werden, in den wir Gedanken, Ideen und Merkenswertes schreiben möchten. Von Ressourcen im Netz über Code-Snippets bis hin zu Software-News und -Reviews – eben alles, was uns beruflich und oft auch privat beschäftigt. Die Kategorien haben noch nicht wirklich Gestalt angenommen, aber das bringt sicher die Zeit mit sich.

Nach und nach werden alle von uns hier aktiv werden und so hoffentlich ein rundes Bild unseres Arbeitens zeichnen. Wer genau an diesem Projekt beteiligt sein wird, ist noch unklar, der „Grundstock“ steht fest.

Und weil dieser Satz auf keiner neuen Website fehlen darf: Viel Spaß.