Tagline Generator

14. Januar 2007

Schade, dass mein Bloghoster noch kein PHP5 im Einsatz hat. Denn das ist die Voraussetzung für die Installation vom Tagline Generator:

Tagline Generator by Chirag Mehta is a simple PHP codebase that lets you generate chronological tag clouds from simple text data sources without manually tagging the data entries.

Das Tool erstellt automatisch eine chronologische Tagwolke.

Verschiedene Variationen eines Wortes werden mit Hilfe des Porter Stemming Algorithmus zusammengefasst (z.B. “promised”, “promises”, “promising”, und “promise” werden gruppiert unter “promises”). Außerdem entfernt das Tool häufig gebrauchte Wörter wie “the”, “and” und “this”.

Schließlich wird die allseits bekannte Tagwolke generiert. Häufig verwendete Wörter erscheinen größer, weniger häufig verwendete Begriffe erscheinen kleiner. Wörter, die im Zeitverlauf nicht mehr so oft benutzt wurden, werden zudem farblich schwächer angezeigt.

Todd Bishop hat den Tagline Generator eingesetzt, um eine Fülle von Microsoft-Dokumenten und Reden der letzten 30 Jahre in Tags darzustellen (… unbedingt den Schieberegler beachten).

Die folgende Grafik zeigt die Auswertung der Bill Gates Keynote von der diesjährigen CES.

taglinemicrosoft

Ein wenig verwunderlich, dass das Wort “Zune” nicht häufiger verwendet wurde. IPTV scheint ein großes Thema.

Im nächsten Schritt gibt es sicher ein WordPress-Plugin für das automatisierte Betaggen von Blogs. Und dann erstellt Google eine Tagwolke vom Internet komplett.

7 Kommentare

Es gibt verschiedene Dienste die dir aus deinem Blogeintrag eine Liste von Tags generieren/vorschlagen.
Für deutschsprachige Texte kenne ich allerdings nur tagthe.net.

Ralf am 15. Januar 2007. #

Hmm, macht aber nicht so eine schöne chronologische Tagwolke …

georg am 15. Januar 2007. #

Hm, ja ok. Aber ist dann ja nur ein Schritt weit weg, die chronologische Tagwolke. Einfach mehrere Texte an den Dienst schicken, die Tags sammeln und dann als Tagwolke darstellen.

Wenn du Ultimate Tag Warrior benutzt, gibt es für tagthe.net eine Erweiterung. Du müsstest dann nur ab sofort immer deine Texte vertaggen lassen und die Tagwolke würde mit der Zeit langsam wachsen.
Ist dann zwar nicht das gleiche, aber vergleichbar.

(Ich habe mir grade mal den PHP-Code zu Tagline Generator runter geladen. Mal schauen was man daraus basteln kann. Zeit hab ich ja)

Ralf am 16. Januar 2007. #

Benutze auch UTW. Die tagthe.net Erweiterung kannte ich noch nicht. Wo gibt es die denn. Allerdings will die Integration der Yahoo term extraction API auch noch nicht. muss ich mir mal ansehen.

Generell gibt es aber das Problem dass die Verarbeitung natürlicher Sprache für Deutsch ungleich schwieriger ist als für Englisch.

Dies zusammen mit der Tatsache, dass auch erheblich weniger Ressourcen an der Entwicklung entsprechender Algorithmen arbeiten, wird IMHO einen erheblichen Standortnachteil mit sich bringen, da es den Endkunden schwer zu erklären sein wird warum es all die coolen Features englischsprachiger Sites nicht auch für deutschsprachige Sites gibt.

Gerd Kamp am 16. Januar 2007. #

@Gerd:
Im Blog von tagthe.net: http://www.tagthe.net/blog/stories/1442386/

Es gibt auch eine API, so das man weitere Plugins basteln kann.

Ralf am 16. Januar 2007. #

[...] (via Blogrolle) [...]

PHP-Script zum automatischen Taggen — Software Guide am 21. Januar 2007. #

Tag Clouds ausreizen…

[..]Tag Clouds sind eine hübsche Sache, die das Web 2.0 hervorgebracht hat und lassen mein Programmiererherz höher schlagen.Der Algorithmus, der auf Visualhype zum Einsatz kommt – um die Größe und die Farbe der Tags zu berechnen ist schon recht Ok …

Visualhype - Deutscher Webentwickler Blog am 1. Februar 2007. #

Schreibe einen Kommentar

Erforderlich.

Erforderlich. Wird nicht veröffentlicht.

Optional.