"Kleine" Testaufgabe, die ich mal ...

“Kleine” Testaufgabe, die ich mal für eine Bewerbung vorbereiten sollte, ich hatte dafür vier Tage Zeit:

Vielen Dank für Ihre Bewerbung. Nachfolgend übersende ich Ihnen eine Test-Aufgabe. Bitte bereiten Sie diese für unser Gespräch vor.

Rahmen:

Im Gesamtprojekt soll neben anderen Entwicklungen eine Suchmaschine für den Bereich Tourismus entwickelt werden. Diese Suchmaschine basiert insbesondere auch auf Semantic-Web-Technologien. Inhouse-Informationen werden entsprechend aufbereitet und mit zugelieferten Informationen verknüpft. Um einen möglichst aktuellen Zugriff, auf regionale/relevante (Hintergrund-)Informationen zu ermöglichen, sollen außerdem externe Quellen die bereits existierenden Informationen aufwerten. Der Nutzer soll so einen Zugriff auf mehr Datenquellen unter einem Dach haben. Die zusammengestellten Informationen sollen über eine innovative Suche dem Anwender verfügbar gemacht werden.

Bei den externen Quellen kann es sich um Webseiten handeln, welche einen Bezug zu touristischen Zielen haben. Dies könnten z.B. sein:

  • Webseiten der regionalen Nachrichtenmedien in den entsprechenden Städten/Regionen
  • Blogs mit dem Fokus auf bestimmte Ereignisse
  • Bewertungsseiten
  • persönlichen Reiseberichte (möglicherweise mit textuellen Wertungen/Einschätzungen) Ohne Beschränkung der Allgemeinheit sei hier ein Beispiel herausgegriffen: Ein Blog mit regionalen Festen, volkstümlichen Veranstaltungen und Wanderrouten (möglicherweise mit textuellen Bewertungen).

Aufgabe:

Die gecrawlte Dateien (i.A. HTML) werden zur Verfügung gestellt und sollen mit semantischen Daten verknüpft werden. Ziel ist eine möglichst präzise Klassifikation der Inhalte. Dabei sollen so viele Verknüpfungen wie möglich aufgebaut werden, um sicherzustellen, dass auf Basis einer Nutzeranfrage die Treffer mit der höchsten Relevanz ausgeliefert werden können.

Zu diesem Zweck stehen bereits verschiedene Datenbanken zur Verfügung. Es handelt sich um internes Expertenwissen über vielfältige Teilbereiche im Tourismuskontext (Domänenwissen) und semantische Datenbanken, die öffentlich zugänglich sind. Um einen Mehrwert beim Nutzer zu erreichen, sollen die gecrawlten Informationen so verknüpft werden, dass die touristische Websuche überwiegend relevante touristische Informationen ausliefert. Diese Anreicherung bzw. Präzisierung der genutzten Daten mittels Information Retrieval Techniken (u.a. NLP), Web/Text Mining, Reasoning, etc. soll eine höhere Qualität der Daten zusichern. So soll es unter anderem möglich sein, Kontexte und die Intention des Autors besser/genauer zu erkennen. Darüber hinaus ist zu ermitteln, welches (Basis-)Ranking die Webseiten bei der Suche haben sollen.

So soll es später möglich sein, die eingehenden Suchanfragen besser mit dem existierenden Index abzugleichen (nicht Teil dieser Test-Aufgabe). Dem Anwender der Suchfunktionen sollen Informationen zur Verfügung gestellt werden, deren Gesamtheit einen Mehrwert bedeuten und für ihn (positiv) “überraschend” sind. Dies betrifft insbesondere die Verknüpfung der Informationen. Übergreifendes Ziel muss es sein, die (wichtigsten/relevanten) Ereignisse zusammenzuführen/auszuwerten, so dass u.a. eine Gesamtontologie entsteht, deren Ausprägung die Anforderungen an Performance und Skalierbarkeit genügt.

Ihre Aufgabe ist die Entwicklung einer realisierbaren Vision für die Verarbeitung – insbesondere Klassifikation und Erfassung der Intention des Autors – der gecrawlten Daten. Diese soll aber tatsächlich in überschaubarer Zeit bis zur Marktreife geführt werden können. Ein Internet-Crawler kann vorausgesetzt werden (dessen Implementierung ist also nicht Teil des Konzepts). Dieser wird vorerst unspezifisch das Internet crawlen. Die Implementierung der Suchanwendung wird durch eine andere Gruppe vorgenommen, aber die benötigten Schnittstellen/Informationen müssen selbstverständlich beachtet werden. Konzentrieren Sie sich bei ihren Ausführungen auf die Aspekte bei denen Sie (technisches) Know how einbringen können.

Stellen Sie bitte einen Projektplan (konkrete Aufgabenpakete) entsprechend Ihren Vorstellungen auf. Es ist erlaubt bis zu 4 weitere Mitarbeiter (zumeist ohne spezielle Kenntnisse) einzuplanen.

Orientierungsfragen:

  • Welchen konkreten Beitrag kann Ihre Erfahrung zu dem Projekt leisten?
  • Welchen Technologien und Werkzeugen würden Sie einsetzen?
  • Wo sehen Sie die größten Herausforderungen?
  • Welchen Beitrag zur Wirtschaftlichkeit können Sie leisten?
  • Welche Zuarbeiten anderer Teams und externer Gruppen werden benötigt?
  • Wie sichert ihre Architektur die abgeleiteten Anforderungen?
  • Wurden die Besonderheiten bzw. das Umfeld eines eCommerce-Unternehmens (wie der ** GmbH) beachtet?

Richten Sie Ihre Präsentation auf maximal 20 min aus. Bitte übersenden Sie uns die aussagekräftigen Folien (idealerweise als PDF), so dass eine Vorbereitung im Vorfeld des Gesprächs möglich ist. Die Deadline hierfür ist auf Freitag, den *** Uhr festgelegt.

Es wird nicht erwartet, dass Sie für alle Herausforderungen Lösungen präsentieren können (schließlich handelt es sich um ein Forschungs- und Entwicklungsthema). Sie sollten aber deutlich und schwerpunktmäßig hervorheben, in welchem Bereich Sie ihre Erfahrung/Arbeitskraft einbringen können, wie Sie sich die Umsetzung vorstellen, wie ihre Einschätzung des Themas ist und welche weiteren Ideen/Konzepte Sie für lukrativ halten. In diesem Zusammenhang kann die Themenstellung durch Sie auch selbstständig ausgeweitet werden.

Hätte ich die Aufgabe gelöst, hätten sie mich nicht mehr einstellen brauchen….

Related