Jump to ContentJump to Main Navigation
Show Summary Details
More options …

it - Information Technology

Methods and Applications of Informatics and Information Technology

Editor-in-Chief: Molitor, Paul

6 Issues per year

Online
ISSN
2196-7032
See all formats and pricing
More options …
Volume 54, Issue 3 (May 2012)

Issues

Frontiers in Crowdsourced Data Integration

Probleme und Herausforderungen bei der Crowd-basierten Datenintegration

Katrin Braunschweig
  • 1 Technische Universität Dresden, Database Technology Group, Faculty of Computer S., Dresden
/ Julian Eberius
  • 2 Technische Universität Dresden, Database Technology Group, Faculty of Computer S., Dresden
/ Maik Thiele / Wolfgang Lehner
  • 3 TU Dresden, Database Technology Group, Faculty of Computer Sci, Dresden, Deutschland
Published Online: 2012-05-25 | DOI: https://doi.org/10.1524/itit.2012.0673

Abstract

There is an ever-increasing amount and variety of open web data available that is insufficiently examined or not considered at all in decision making processes. This is because of the lack of end-user friendly tools that help to reuse this public data and to create knowledge out of it. Therefore, we propose a schema-optional data repository that provides the flexibility necessary to store and gradually integrate heterogeneous web data. Based on this repository, we propose a semi-automatic schema enrichment approach that efficiently augments the data in a “pay-as-you-go” fashion. Due to the inherently appearing ambiguities we further propose a crowd-based verification component that is able to resolve such conflicts in a scalable manner.

Zusammenfassung

Die stetig wachsende Zahl offen verfügbarer Webdaten findet momentan viel zu wenig oder gar keine Berücksichtigung in Entscheidungsprozessen. Der Grund hierfür ist insbesondere in der mangelnden Unterstützung durch anwenderfreundliche Werkzeuge zu finden, die diese Daten nutzbar machen und Wissen daraus genieren können. Zu diesem Zweck schlagen wir ein schemaoptionales Datenrepositorium vor, welches ermöglicht, heterogene Webdaten zu speichern sowie kontinuierlich zu integrieren und mit Schemainformation anzureichern. Auf Grund der dabei inhärent auftretenden Mehrdeutigkeiten, soll dieser Prozess zusätzlich um eine Crowd-basierende Verifikationskomponente unterstützt werden.

Keywords: document and text processing; user/machine systems; database management; information storage and retrieval

About the article

* Correspondence address: Technische Universität Dresden, Database Technology Group, Faculty of Computer Science, 01062 Dresden,


Published Online: 2012-05-25

Published in Print: 2012-05-01


Citation Information: it - Information Technology, ISSN (Online) 2196-7032, ISSN (Print) 1611-2776, DOI: https://doi.org/10.1524/itit.2012.0673.

Export Citation

© by Oldenbourg Wissenschaftsverlag, Dresden, Germany. Copyright Clearance Center

Comments (0)

Please log in or register to comment.
Log in