Herzlichen Glückwunsch zu einer wirklich tollen Lösung!
Julian hat mit seiner Lösung bei der Code Competition "Machine Learning" überzeugt und den dritten Platz erreicht.
Im Interview stellt er sich und seine Lösung genauer vor.

IT-Talents: Hallo Julian herzlichen Glückwunsch zu Deinem dritten Platz bei der Code Competition „Machine Learning“! Erzähl den anderen IT-Talenten doch kurz etwas über Dich.
Julian: Hallo! Ich bin 21 Jahre alt und studiere Informatik im Bachelor an der Freien Universität Berlin. Dabei fokussiere ich mich quasi komplett auf Machine Learning und arbeite inzwischen als HiWi und Tutor für die ML-Gruppe.
IT-Talents: Was hat Dich motiviert, an der Competition teilzunehmen und wie bist Du auf den Wettbewerb aufmerksam geworden?
Julian: Ich wollte nun schon länger an einer Machine Learning Competition teilnehmen, war aber von Kaggle abgeschreckt, weil es da wirklich nur um die Accuracy geht, was dazu führt, dass die Gewinner immer überdimensionale, in der Realität kaum brauchbare Modelle benutzen. Die Competition von IT-Talents fand ich daher sehr motivierend.
IT-Talents: Wie bist Du an die Lösung der Aufgabenstellung herangegangen?
Julian: Nach einem groben Preprocessing habe ich die Class Imbalance entdeckt und habe mich ersteinmal darüber belesen, wie das Problem gelöst wird. Danach habe ich die vielversprechendsten Ansätze ausprobiert.
IT-Talents: Du hast Dich für eine Lösung der Aufgabenstellung mittels eines Python3- Konsolenscripts entschieden, wieso?
Julian: Ehrlich gesagt habe ich meinen Code eigentlich auf der Jupyter Notebook-Umgebung programmiert und erst am Schluss in ein Python3-Skript konvertiert. Im Nachhinein war das vielleicht auch ein Fehler, weil der Code im Notebook deutlich strukturierter aussah als im Skript.
Jupyter Notebooks würde ich übrigens jedem empfehlen, der schnell und iterativ Prototypen programmieren möchte!
IT-Talents: Welche Probleme sind bei der Entwicklung der Software aufgekommen? Wie lange hat die Entwicklung gedauert?
Julian: Zunächst natürlich die angesprochene Class Imbalance. Nachdem ich die mehr oder weniger gelöst hatte, war ich dennoch ziemlich unzufrieden mit der Accuracy und habe recht viel Zeit darauf verwendet, die Ordinalität der Labels (leichter Unfall < schwerer Unfall < tödlicher Unfall) zu nutzen und habe einige Paper gelesen. Leider hat keiner der Ansätze zu einer Verbesserung geführt.
Imsgesamt habe ich wohl ca. 10 Stunden gecoded, 5 Stunden recherchiert und 3 Stunden Hyperparameter optimiert.
IT-Talents: Und was hast Du durch die Entwicklung gelernt?
Julian: Ich habe jetzt eine Intuition dafür, wie man Class Imbalance löst und welche Ansätze bei welchen Daten vielversprechender sind. Außerdem weiß ich jetzt, das ich an meiner Code-Qualität arbeiten sollte.
IT-Talents: Was würdest Du Dir thematisch gerne einmal als Code Competition wünschen?
Julian: Da habe ich konkret wenig Wünsche, außer dass ich mich natürlich über möglichst viel Machine Learning freue.
IT-Talents: Zu guter Letzt: Wie findest Du die IT-Talents.de Plattform, welche Verbesserungsmöglichkeiten siehst Du?
Julian: Ich finde die Plattform gut, wobei ich sie noch nicht genug genutzt habe, um da ein richtiges Fazit zu ziehen. Eine coole Sache wäre, wenn der Code der Gewinner (mit Erlaubnis natürlich) öffentlich analysiert werden könnte, damit jeder daraus etwas lernt. Um den Anfang zu machen, folgendes war meine Abgabe: https://github.com/julianstastny/it-talents-ml-competition
Ihr werdet sehen, da gab es einiges an Luft nach oben ;)
IT-Talents: Vielen Dank für Deine Teilnahme, das Interview und viel Spaß mit Deinem Gewinn ;)