| dc.contributor.author | Βοργιά, Ευφροσύνη | el |
| dc.contributor.author | Vorgia, Efrosini | en |
| dc.date.accessioned | 2017-01-19T08:54:35Z | |
| dc.date.available | 2017-01-19T08:54:35Z | |
| dc.date.issued | 2017-01-19 | |
| dc.identifier.uri | http://hdl.handle.net/11400/20145 | |
| dc.rights | Default License | |
| dc.subject | Ψηφιακές Βιβλιοθήκες, Κατηγοριοποίηση, Συσταδοποίηση, WEKA, Μετρικές Βαρύτητας | |
| dc.title | Τεχνικές αυτόματης κατηγοριοποίησης στις ψηφιακές βιβλιοθήκες | el |
| heal.type | bachelorThesis | |
| heal.language | el | |
| heal.access | free | |
| heal.recordProvider | ΤΕΙ Αθήνας, Σχολή Διοίκησης και Οικονομίας, Tμήμα Βιβλιοθηκονομίας και Συστημάτων Πληροφόρησης | el |
| heal.publicationDate | 2016-11-18 | |
| heal.abstract | Η παρούσα πτυχιακή προτείνει την αυτόματη κατηγοριοποίηση τεκμηρίων βάσει των περιλήψεών τους με τη χρήση της κατηγοριοποίησης (classification) και της συσταδοποίησης (clustering) για την άμεση ταξινόμηση στις ψηφιακές βιβλιοθήκες. Στόχος είναι η εισαγωγή μιας νέας μετρικής βαρύτητας, της DEVMAX.DF, η οποία συγκρίνεται με την ήδη υπάρχουσα μετρική TF.IDF. Τα δεδομένα λήφθηκαν από 718 περιλήψεις επιστημονικών μελετών από 9 ακαδημαϊκές ψηφιακές βιβλιοθήκες. Μετά από την επεξεργασία τους, εισήχθησαν στο πρόγραμμα WEKA για την εξαγωγή αποτελεσμάτων. Η κατηγοριοποίηση απέφερε F-score ~97%, ενώ η συσταδοποίηση λανθασμένων παραδειγμάτων έφτασε ~4,50%. Εκ των δύο μετρικών, η DEVMAX.DF απέδωσε καλύτερα από την TF.IDF. | el |
| heal.abstract | This thesis proposes the automated categorization of documents based on abstracts using classification and clustering techniques for immediate classification on digital libraries. The research aims to introduce a new weighting metric, DEVMAX.DF, which is compared to the already existing metric TF.IDF. The data were gathered from 718 abstracts of scientific studies from 9 academic digital libraries. After processing, the data were imported to WEKA for the final results. Classification yielded an F-score ~ 97%, while clustering reached ~4.50% of incorrectly clustered instances. Of the two metrics, DEVMAX.DF performed better than TF.IDF. | en |
| heal.advisorName | Τριανταφύλλου, Ιωάννης | el |
| heal.advisorName | Triantafillou, Ioannis | en |
| heal.committeeMemberName | Τριανταφύλλου, Ιωάννης | el |
| heal.academicPublisher | Σχολή Διοίκησης και Οικονομίας, Τμήμα Βιβλιοθηκονομίας και Συστημάτων Πληροφόρησης | el |
| heal.academicPublisherID | teiath | |
| heal.numberOfPages | 60 | |
| heal.fullTextAvailability | campus | |
| heal.dateCreated | 2017-01-19 |