Mittwoch, 22. Dezember 2010

Bitte um MIthilfe bei einem wissenschaftlichen Projekt

Liebe Studenten, wir benötigen wieder einmal dringende Mithilfe für die Evaluation unserer Forschungsarbeit. Diesmal geht es wieder um die Evaluation von Heuristiken, die eine Ordnung in das Semantic Web (hier insbesondere die Linke Data Cloud in Gestalt der DBPedia) bringen soll.

Zu diesem Zweck haben wir eine kleine Anwendung geschrieben, in denen Ihnen bestimmte Wikipediaseiten gezeigt werden und Sie die Aufgabe haben, jeweils die 10 wichtigsten Links und Begriffe herauszusuchen, die inhaltlich mit dem gezeigten Wikipedia-Artikel zu tun haben. Dabei werden Sie durch eine Auto-Suggest-Funktion unterstützt. Einige von Ihnen haben bereits früher mitgeholfen, jetzt haben wir die zu bearbeitende Datenmenge noch einmal verändert und erhöht...

Um die Anwendung zu starten, gehen Sie einfach auf die u.a. URL und wählen sich einen Nutzernamen (damit wir wissen, welche Lösungen zusammengehören und Sie zwischendurch auch einmal Pause machen können und das Ganze später weiterspielen können).

Hier finden Sie die Anwendung: http://mediaglobe.yovisto.com:8080/RankMe2/

Wenn Sie sich den aktuellen Stand der Nutzerbeteiligung ansehen wollen, finden Sie die zugehörige Statistik hier: http://mediaglobe.yovisto.com:8080/RankMe2/Results.html

Wir würden uns sehr über eine rege Beteiligung freuen, da wir die Daten für eine Veröffentlichung benötigen, für die wir noch bis zum Jahresende Zeit haben. Ich wünsche Ihnen an dieser Stelle noch einmal ein Frohes Fest und einen Guten Rutsch ins Neue Jahr!

Mittwoch, 24. November 2010

'Who knows?' - A Semantic Web Game

Please support our research by playing our Semantic Web Game 'Who Knows'!

What is 'Who Knows?'
'Who Knows?' is a simple Q&A Game in the style of 'Who wants to be a Millionaire'. The questions are automatically generated from DBpedia content.

What is the purpose of 'Who Knows?'
The purpose is the evaluation of some heuristics that are used to determine a ranking of facts within a knowledge base such as e.g. DBpedia.

These are the simple assumptions 'Who Knows?' is based on:
  1. If a user knows the correct answer, the fact seems to be 'important'.
  2. If a user doesn't know the correct answer, the fact seems to be not so 'important'.
  3. If a user votes the question to be wrong, odd, or strange, the fact seems to be 'irrelevant'.
There a different variants to play the game:
  1. One-on-One questions -- only one choice is correct.
  2. N-to-One questions -- there are multiple correct answers.
  3. Hangman -- find the answer by playing the popular game of hangman.
  4. Maths -- find the answer and compute a simple arithmetic formula.
Meanwhile you will receive points for correct answers. The faster you provide the answer, the more points you will get. If you provide the wrong answer, you'll loose a life and some points will be taken from your score.

Try to score as many points as possible and don't forget to tell your friends!!!!

Freitag, 29. Oktober 2010

Squeezing out the HPI Internet backbone

I was asked by the HPI administrators to warn them when we want to do large-scale crawling runs, so that they are prepared for the eventual traffic spikes. Since the lab machine is used by all seminar participants, it might be anyway a good idea to coordinate high load peaks by any of the sub-projects. Therefore, please give the docents a hint if you want to perform larger test runs.

Dienstag, 26. Oktober 2010

FutureSOC Lab Setup


This is an initial overview of the lab setup being made available for the participants of this seminar. The resources are provided by the HPI FutureSOC Lab infrastructure.

Several aspects of the intended setup support the research on scalability issues. There are two different interconnection schemes to the stable storage, in order to analyze the implications of direct device access vs. networking file systems vs. iSCSI access.The internal connectivity is maximized, for both the networked file system access and the outer world connectivity. We also tried to determine some basic numbers for the available bandwidth. It turns out that the crawling efforts might be limited by the external connectivity of Campus Griebnitzsee to the Internet.

We will discuss about this picture in the seminar.

Mittwoch, 20. Oktober 2010

Doodle für Themenwahl

Hier der Link zum Doodle für die Themenwahl.

Bitte bis zum kommenden Mittwoch (27.10.2010) einfach auswählen, welches Thema für Sie interessant ist.

http://www.doodle.com/ms87awr9kpsut9zq

Donnerstag, 7. Oktober 2010

Deep Thought

A group of hyper-intelligent pan-dimensional beings demand to learn the Ultimate Answer to the Ultimate Question of Life, The Universe, and Everything from the supercomputer, Deep Thought, specially built for this purpose. It takes Deep Thought 7½ million years to compute and check the answer, which turns out to be 42. Unfortunately, The Ultimate Question itself is unknown.
—Wikipedia