Εμφάνιση απλής εγγραφής

dc.contributor.author Κεσίδης, Αναστάσιος Λ. el
dc.contributor.author Γαλιώτου, Ελένη el
dc.contributor.author Γάτος, Βασίλειος el
dc.contributor.author Λαμπρόπουλος, Αριστομένης Σ. el
dc.contributor.author Πρατικάκης, Ιωάννης Ε. el
dc.date.accessioned 2015-05-24T20:20:56Z
dc.date.available 2015-05-24T20:20:56Z
dc.date.issued 2015-05-24
dc.identifier.uri http://hdl.handle.net/11400/11087
dc.rights Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ηνωμένες Πολιτείες *
dc.rights.uri http://creativecommons.org/licenses/by-nc-nd/3.0/us/ *
dc.source http://dl.acm.org/citation.cfm?doid=1568296.1568307 el
dc.subject Natural language processing (Computer science)
dc.subject Computational morphology
dc.subject Υπολογιστική μορφολογία
dc.subject Historical document indexing
dc.subject Ιστορική ευρετηρίαση έγγραφου
dc.subject Επεξεργασία φυσικής γλώσσας
dc.subject Word spotting
dc.subject Εντοπισμός λέξεων
dc.title Accessing the content of greek historical documents el
heal.type conferenceItem
heal.classification Computer science
heal.classification Information systems
heal.classification Πληροφορική
heal.classification Πληροφοριακά συστήματα
heal.classificationURI http://skos.um.es/unescothes/C00750
heal.classificationURI http://skos.um.es/unescothes/C01993
heal.classificationURI **N/A**-Πληροφορική
heal.classificationURI **N/A**-Πληροφοριακά συστήματα
heal.keywordURI http://id.loc.gov/authorities/subjects/sh88002425
heal.contributorName Μανωλέσσου, Ιωάννα el
heal.contributorName Ράλλη, Αγγελική el
heal.identifier.secondary ISBN: 978-160558496-6
heal.identifier.secondary DOI: 10.1145/1568296.1568307
heal.language en
heal.access campus
heal.recordProvider Τεχνολογικό Εκπαιδευτικό Ίδρυμα Αθήνας. Σχολή Τεχνολογικών Εφαρμογών. Τμήμα Μηχανικών Πληροφορικής Τ.Ε. el
heal.publicationDate 2009-07
heal.bibliographicCitation Kesidis, A. L., Galiotou, E., Gatos, B., Lampropoulos, A. S., Pratikakis, I. E., et.al. (2009). Accessing the content of greek historical documents. 3rd Workshop on Analytics for Noisy Unstructured Text Data(AND). Barcelona, Spain. 23-24 July 2009. pp 55-62. Available from: http://dl.acm.org/citation.cfm?doid=1568296.1568307. en
heal.abstract In this paper, we propose an alternative method for accessing the content of Greek historical documents printed during the 17th and 18th centuries by searching words directly in digitized documents based on word spotting, without the use of an optical character recognition engine. We describe a methodology according to which synthetic word images are created from keywords. These images are compared to all the words in the digitized documents while user feedback is used in order to refine the search procedure. In order to improve the efficiency of accessing and searching, we have used natural language processing techniques that comprise (i) a morphological generator for early Modern Greek which provides the users with the ability to search documents using only a word stem and locate all the corresponding inflected word forms and (ii) a synonym dictionary which facilitates access to the semantic context of documents and enriches the results of the search process. en
heal.publisher ACM en
heal.fullTextAvailability true
heal.conferenceName Workshop on Analytics for Noisy Unstructured Text Data en
heal.conferenceItemType full paper


Αρχεία σε αυτό το τεκμήριο

Οι παρακάτω άδειες σχετίζονται με αυτό το τεκμήριο:

Εμφάνιση απλής εγγραφής

Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ηνωμένες Πολιτείες Εκτός από όπου ορίζεται κάτι διαφορετικό, αυτή η άδεια περιγράφεται ως Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ηνωμένες Πολιτείες