Segmentierung von Webseiten Heuristik zur Segmentierung von XHTML-Seiten für die rauschfreie Suche und Indexierung
-
- Deutsch ausgewählt
32,95 €
inkl. gesetzl. MwSt.,
Beschreibung
Produktdetails
Einband
Taschenbuch
Erscheinungsdatum
18.07.2012
Verlag
AV AkademikerverlagSeitenzahl
100
Maße (L/B/H)
22/15/0,7 cm
Gewicht
167 g
Sprache
Deutsch
ISBN
978-3-639-42940-4
In diesem Buch wird ein Verfahren zur Segmentierung von Webseiten in kohäsive, semantische Teile vorgestellt. Dabei werden rauschende Komponenten, wie Werbung, Menüs, Fußzeilen usw. von informativen Komponenten getrennt. So wird der eigentliche Inhalt eines XHTML-Dokuments, insbesondere einer Webseite, extrahiert. Die beschriebene Heurisitk vollzieht dies auf Basis einer Analyse des Textes der Seite und deren XHTML-Strukturen, in dem davon Verhältnisse abgeleitet werden. Anhand dieser Verhältnisse und der daraus bestimmten Kriterien sollen die einzelnen Komponenten gefunden und extrahiert werden.
Ein neues Kapitel für Ihre Bücher
Ein neues Kapitel für Ihre Bücher
Schenken Sie Ihren alten Schätzen ein zweites Leben: Einfach Barcode scannen, Versandetikett ausdrucken, Bücher verschicken und Thalia Geschenkkarte erhalten.
Jetzt verkaufenKundinnen und Kunden meinen
Verfassen Sie die erste Bewertung zu diesem Artikel
Helfen Sie anderen Kund*innen durch Ihre Meinung
Kurze Frage zu unserer Seite
Vielen Dank für Ihr Feedback
Wir nutzen Ihr Feedback, um unsere Produktseiten zu verbessern. Bitte haben Sie Verständnis, dass wir Ihnen keine Rückmeldung geben können. Falls Sie Kontakt mit uns aufnehmen möchten, können Sie sich aber gerne an unseren Kund*innenservice wenden.
zum Kundenservice