Μοντέλα Παλινδρόμησης και Εφαρμογές στην Επεξεργασία Γνώσης

Περιγραφή

Η Γνωσιακη Επεξεργασια Δεδομενων, με στατιστικες μεθοδους σε συνδυασμο με διαδικασιες στατιστικής μαθησης περιλαμβανει:

  1. Οργανωση Συλλογων Δεδομενων για μικρα και μεγάλα δεδομενα (Data Sets).
  2. Περιγραφική Στατιστική και Ελέγχους Υποθέσεων
  3. Aνάλυση Αλληλεξαρτησης μεσω Συσχετισεων, Παλινδρομισης, Αναλυσης Κυριων Συνιστωσων (Principal Components Analysis), Αμοιβαιας Πληροροφοριας (Mutual Information).
  4. Διακριση μεσω μετρων εγγυτητος (Proximity, Similarity,Affinity) και εφαρμογες, Κατηγοριοποιηση (clustering) και Ταξινομιση (classification), με διαμερισεις (Partitional) ειτε ιεραρχική (Hierarchical), Αποφασεις μέσω Δενδρων, Νευρωνικων Δικτυων, αλγορίθμωv πλησιέστερων Γειτόνων (Nearest Neighbors), Δικτυων Bayes, Μηχανων Διανυσματων Υποστήριξης (Support Vector Machines).
  5. Ερμηνεια Αποτελεσματων, Δεικτες Αξιολόγησης μοντέλων κατηγοριοποίησης (Διασταυρωμένη επικύρωση, ακρίβεια (accuracy), ευκρίνεια (precision), ανάκληση(recall), καμπύλη Roc). Αναπαράσταση και Οπτικοποίηση Αποτελεσμάτων.
  6. Εφαρμογες σε πραγματικά δεδομένα και μεγάλα δεδομένα (Big Data).

Θα χρησιμοποιηθει το Λογισμικο Ανοικτου Κωδικα R: 
H παρακολούθηση των εργαστηρίων της R είναι υποχρεωτική.

Σημειώσεις: 

Ενδεικτική Βιβλιογραφία

  1. http://www-bcf.usc.edu/~gareth/ISL/ISLR%20First%20Printing.pdf
  2. http://statweb.stanford.edu/~tibs/ElemStatLearn/
Εξάμηνο: 
Διδακτικές Μονάδες: 
4
Πιστωτικές Μονάδες (ECTS): 
5.5
Ώρες: 
4ώρες
Κωδικός: 
0531
Τύπος Μαθήματος: 
X