Machine Learning 1

Ο canvas με τον οποίο θα εξασκηθούμε στο Machine Learning. Μια υποθετική περιοχή με βουνά, λίμνη και μια πόλη κάτω δεξιά. Τα βουνά βγήκαν ανάποδα αλλά δεν πειράζει. Δεν έχει καμία σημασία όμως.

Learner's Input

Domain Set: Το σύνολο όλων των pixels της εικόνας. Κάθε pixel αναπαρίσταται από τις τιμές του RGB (R,G,B). Για παράδειγμα, [34, 139, 34] για γρασίδι, [169, 169, 169] για πόλη κλπ.

Label Set: Δυαδικό σύνολο {0, 1} όπου:
0 = μη αστικό pixel (γρασίδι, λίμνη, βουνά)
1 = αστικό pixel (πόλη)

Pixel RGB	Label	Σημασία
[34, 139, 34]	0	Γρασίδι
[139, 69, 19]	0	Βουνά
[0, 191, 255]	0	Λίμνη
[169, 169, 169]	1	Πόλη

Labeling Function: Στην πραγματική δορυφορική εικόνα δεν γνωρίζουμε ποια pixels είναι αστικά. Δηλαδή, το labeling function που θα επιστρέφει 1 για πόλη και 0 για μη πόλη είναι άγνωστο. Στο παράδειγμά μας όμως, γνωρίζουμε τον καμβά που δημιουργήσαμε και χρησιμοποιήσουμε τις πληροφορίες από αυτόν.

Στον καμβά μας:

Συνολικά pixels: 600 x 400 = 240,000
Αστικά pixels (πόλη): 3 rows × 4 columns × (40 x 40) = 19,200
Μη αστικά pixels: 240,000 - 19,200 = 220,800

Probability distribution:
Η πιθανότητα να επιλέξουμε τυχαία ένα pixel αστικό (Y=1) ή μη αστικό (Y=0) από τον καμβά είναι:

P(Y=1) = 19,200 / 240,000 = 0.08
P(Y=0) = 220,800 / 240,000 = 0.92

Η Probability Distribution είναι άγνωστη στον Learner.

True Risk:

Στο machine learning, θέλουμε ένα μοντέλο που προβλέπει σωστά τα labels. Το true risk (ή expected risk) μας λέει πόσο πιθανό είναι το μοντέλο να κάνει λάθος, αν επιλέγαμε τυχαία ένα δείγμα από όλα τα δεδομένα (εδώ όλα τα pixels του καμβά).

Μαθηματικά, αν επιλέξουμε ένα pixel X τυχαία και το πραγματικό label του είναι Y, και έχουμε ένα μοντέλο f, το true risk είναι:

R(f) = P(pixel λάθος) = E[loss(f(X), Y)], όπου loss: loss of the learner

Στο παράδειγμά μας με τον καμβά:

Συνολικά pixels: 600 × 400 = 240,000
Αστικά pixels (πόλη): 19,200 → πιθανότητα P(Y=1) = 0.08
Μη αστικά pixels: 220,800 → πιθανότητα P(Y=0) = 0.92

Αν έχουμε ένα πολύ απλό μοντέλο που λέει πάντα "μη αστικό" (0), τότε:

Θα κάνει λάθος μόνο στα αστικά pixels.
True risk = P(Y=1) × πιθανότητα λάθους σε αστικό pixel + P(Y=0) × πιθανότητα λάθους σε μη αστικό pixel
Εδώ: R(f) = 0.08 × 1 + 0.92 × 0 = 0.08

Σημείωση: Το true risk δείχνει πόσο καλά θα τα πάει το μοντέλο σε όλο το σύνολο των δεδομένων. Στην πραγματικότητα δεν το ξέρουμε, αλλά στον καμβά μας μπορούμε να το υπολογίσουμε ακριβώς γιατί γνωρίζουμε όλα τα labels.

Βιβλιογραφία

Shalev-Shwartz, S., & Ben-David, S. (2014). Understanding machine learning: From theory to algorithms. Cambridge University Press