dc.contributor.author |
Βοργιά, Ευφροσύνη |
el |
dc.contributor.author |
Vorgia, Efrosini |
en |
dc.date.accessioned |
2017-01-19T08:54:35Z |
|
dc.date.available |
2017-01-19T08:54:35Z |
|
dc.date.issued |
2017-01-19 |
|
dc.identifier.uri |
http://hdl.handle.net/11400/20145 |
|
dc.rights |
Default License |
|
dc.subject |
Ψηφιακές Βιβλιοθήκες, Κατηγοριοποίηση, Συσταδοποίηση, WEKA, Μετρικές Βαρύτητας |
|
dc.title |
Τεχνικές αυτόματης κατηγοριοποίησης στις ψηφιακές βιβλιοθήκες |
el |
heal.type |
bachelorThesis |
|
heal.language |
el |
|
heal.access |
free |
|
heal.recordProvider |
ΤΕΙ Αθήνας, Σχολή Διοίκησης και Οικονομίας, Tμήμα Βιβλιοθηκονομίας και Συστημάτων Πληροφόρησης |
el |
heal.publicationDate |
2016-11-18 |
|
heal.abstract |
Η παρούσα πτυχιακή προτείνει την αυτόματη κατηγοριοποίηση τεκμηρίων βάσει των περιλήψεών τους με τη χρήση της κατηγοριοποίησης (classification) και της συσταδοποίησης (clustering) για την άμεση ταξινόμηση στις ψηφιακές βιβλιοθήκες. Στόχος είναι η εισαγωγή μιας νέας μετρικής βαρύτητας, της DEVMAX.DF, η οποία συγκρίνεται με την ήδη υπάρχουσα μετρική TF.IDF. Τα δεδομένα λήφθηκαν από 718 περιλήψεις επιστημονικών μελετών από 9 ακαδημαϊκές ψηφιακές βιβλιοθήκες. Μετά από την επεξεργασία τους, εισήχθησαν στο πρόγραμμα WEKA για την εξαγωγή αποτελεσμάτων. Η κατηγοριοποίηση απέφερε F-score ~97%, ενώ η συσταδοποίηση λανθασμένων παραδειγμάτων έφτασε ~4,50%. Εκ των δύο μετρικών, η DEVMAX.DF απέδωσε καλύτερα από την TF.IDF. |
el |
heal.abstract |
This thesis proposes the automated categorization of documents based on abstracts using classification and clustering techniques for immediate classification on digital libraries. The research aims to introduce a new weighting metric, DEVMAX.DF, which is compared to the already existing metric TF.IDF. The data were gathered from 718 abstracts of scientific studies from 9 academic digital libraries. After processing, the data were imported to WEKA for the final results. Classification yielded an F-score ~ 97%, while clustering reached ~4.50% of incorrectly clustered instances. Of the two metrics, DEVMAX.DF performed better than TF.IDF. |
en |
heal.advisorName |
Τριανταφύλλου, Ιωάννης |
el |
heal.advisorName |
Triantafillou, Ioannis |
en |
heal.committeeMemberName |
Τριανταφύλλου, Ιωάννης |
el |
heal.academicPublisher |
Σχολή Διοίκησης και Οικονομίας, Τμήμα Βιβλιοθηκονομίας και Συστημάτων Πληροφόρησης |
el |
heal.academicPublisherID |
teiath |
|
heal.numberOfPages |
60 |
|
heal.fullTextAvailability |
campus |
|
heal.dateCreated |
2017-01-19 |
|