Αρχή

Machine Learning 6: Νόμος του Hooke και Απλή Γραμμική Παλινδρόμηση

1. Φυσικό Υπόβαθρο (Physical Background)

Στη μηχανική πετρωμάτων (rock mechanics) μελετάται η σχέση μεταξύ τάσης (stress) και παραμόρφωσης (strain). Η σχέση αυτή περιγράφει πώς ένα υλικό αντιδρά όταν του ασκείται δύναμη.

Τάση (Stress)

Η τάση ορίζεται ως η δύναμη που ασκείται ανά μονάδα επιφάνειας:

σ = F / A

όπου:

Η μονάδα μέτρησης στο Διεθνές Σύστημα είναι το Pascal (Pa):

1 Pa = 1 N / m²

Παραμόρφωση (Strain)

Η παραμόρφωση εκφράζει τη σχετική μεταβολή του μήκους ενός σώματος:

ε = ΔL / L0

όπου:

Η παραμόρφωση είναι αδιάστατο μέγεθος (dimensionless quantity).

Νόμος του Hooke (Hooke's Law)

Για μικρές παραμορφώσεις πολλά υλικά παρουσιάζουν γραμμική ελαστική συμπεριφορά (linear elastic behaviour). Στην περιοχή αυτή ισχύει ο Νόμος του Hooke:

σ = E · ε

όπου E είναι το Μέτρο Young (Young's Modulus). Το μέτρο Young εκφράζει την ακαμψία του υλικού και αντιστοιχεί στην κλίση της ευθείας στο διάγραμμα τάσης–παραμόρφωσης (stress–strain curve).


2. Στατιστική Μοντελοποίηση (Statistical Modeling)

Στην πράξη οι μετρήσεις περιέχουν πειραματικό σφάλμα. Για τον λόγο αυτό η σχέση μεταξύ τάσης και παραμόρφωσης μοντελοποιείται με τη μέθοδο της απλής γραμμικής παλινδρόμησης (Simple Linear Regression).

σi = β0 + β1 εi + ui

όπου:

Οι παράμετροι του μοντέλου εκτιμώνται με τη μέθοδο Ordinary Least Squares (OLS).


3. Μέθοδος Ελαχίστων Τετραγώνων (Ordinary Least Squares)

Υπόλοιπα (Residuals)

Το υπόλοιπο (residual) είναι η διαφορά μεταξύ της πραγματικής τιμής και της τιμής που προβλέπει το μοντέλο:

ei = σi − (β0 + β1 εi)

Η μέθοδος OLS επιλέγει τις τιμές των παραμέτρων ώστε να ελαχιστοποιείται το άθροισμα των τετραγώνων των υπολοίπων (sum of squared residuals).

S(β01) = Σ(σi − β0 − β1εi

4. Εκτιμητές OLS (OLS Estimators)

Για την απλή γραμμική παλινδρόμηση οι εκτιμητές μπορούν να γραφούν με χρήση των μεγεθών Sxx και Sxy.

Ορισμοί

Sxx = Σ(εi − ε̄)²
Sxy = Σ(εi − ε̄)(σi − σ̄)

όπου:

Estimator Κλίσης

β̂1 = Sxy / Sxx

Ο εκτιμητής αυτός αντιστοιχεί στην κλίση της ευθείας παλινδρόμησης.

Estimator Σταθερού Όρου

β̂0 = σ̄ − β̂1 ε̄

5. Πειραματικά Δεδομένα (Experimental Data)

Παραμόρφωση ε Τάση σ (Pa)
0.000511200000
0.001020500000
0.001530800000
0.002039900000
0.002551100000
0.003059400000
canvas
Γράφημα με τα πειραματικά δεδομένα σχεδιασμένο στο Spyder

Από τους υπολογισμούς της μεθόδου OLS προκύπτουν οι εκτιμήσεις:

β̂1 ≈ 1.98 × 10¹⁰ Pa
β̂0 ≈ 3.5 × 10⁵ Pa

Για να υπολογίσουμε τους εκτιμητές της παλινδρόμησης (OLS estimators) χρησιμοποιούμε τους ορισμούς των Sxx και Sxy. Για τον σκοπό αυτό δημιουργούμε έναν βοηθητικό πίνακα υπολογισμών.

εi σi (Pa) εi2 εiσi
0.0005112000000.000000255600
0.0010205000000.0000010020500
0.0015308000000.0000022546200
0.0020399000000.0000040079800
0.0025511000000.00000625127750
0.0030594000000.00000900178200

Υπολογισμός Αθροισμάτων (Sample Sums)

n = 6
Σ εi = 0.0105
Σ σi = 203200000
Σ εi2 = 0.00002275
Σ εiσi = 458050

Υπολογισμός Μέσων Τιμών (Sample Means)

ε̄ = (Σ εi) / n = 0.0105 / 6 = 0.00175
σ̄ = (Σ σi) / n = 203200000 / 6 ≈ 33866666.7

Υπολογισμός Sxx και Sxy

Sxx = Σ(εi − ε̄)²
Sxy = Σ(εi − ε̄)(σi − σ̄)

Estimator Κλίσης

β̂1 = Sxy / Sxx

Με αντικατάσταση των τιμών προκύπτει:

β̂1 ≈ 1.98 × 10¹⁰ Pa

Estimator Σταθερού Όρου

β̂0 = σ̄ − β̂1 ε̄
β̂0 ≈ 3.5 × 10⁵ Pa

6. Τελικό Μοντέλο (Estimated Regression Model)

σ̂ = 3.5 × 10⁵ + 1.98 × 10¹⁰ ε

Η κλίση της εκτιμημένης ευθείας αντιστοιχεί στο Μέτρο Young (Young's Modulus) του υλικού:

E ≈ 1.98 × 10¹⁰ Pa = 19.8 GPa
canvas
Γράφημα με τα πειραματικά δεδομένα και την γραμμή του μοντέλου σχεδιασμένο στο Spyder

Η σχεδόν γραμμική σχέση μεταξύ τάσης και παραμόρφωσης δείχνει ότι το υλικό βρίσκεται στην ελαστική περιοχή (elastic region) του διαγράμματος τάσης–παραμόρφωσης.


7. Ερμηνεία Υπολοίπων (Interpretation of Residuals)

Τα υπόλοιπα χρησιμοποιούνται για την αξιολόγηση της ποιότητας του μοντέλου παλινδρόμησης. Εάν τα υπόλοιπα κατανέμονται τυχαία γύρω από το μηδέν, τότε το γραμμικό μοντέλο θεωρείται κατάλληλο για την περιγραφή της σχέσης μεταξύ των μεταβλητών.

ei = σi − σ̂i

όπου:

Οι εκτιμημένες τιμές της τάσης υπολογίζονται από την εξίσωση παλινδρόμησης:

σ̂i = β̂0 + β̂1 εi

Ιδιότητες των Υπολοίπων στο OLS (Properties of OLS Residuals)

Στη μέθοδο των Ελαχίστων Τετραγώνων (Ordinary Least Squares – OLS) τα υπόλοιπα έχουν ορισμένες σημαντικές ιδιότητες:

Σ ei = 0
Σ εi ei = 0
(ε̄ , σ̄)

Άθροισμα Τετραγώνων Υπολοίπων (Residual Sum of Squares)

Η ποιότητα προσαρμογής του μοντέλου μπορεί να μετρηθεί μέσω του Residual Sum of Squares (RSS), το οποίο ορίζεται ως:

RSS = Σ ei2

Όσο μικρότερο είναι το RSS, τόσο καλύτερα το μοντέλο προσεγγίζει τα δεδομένα.

Εκτιμητής Διακύμανσης Σφάλματος (Error Variance Estimator)

Η διακύμανση του όρου σφάλματος (error variance) εκτιμάται από:

σ̂² = RSS / (n − 2)

όπου:

Ο estimator αυτός μετρά τη μέση απόκλιση των δεδομένων από την ευθεία παλινδρόμησης.

Ερμηνεία στο Πείραμα Τάσης–Παραμόρφωσης

Στο πείραμα τάσης–παραμόρφωσης (stress–strain experiment), τα υπόλοιπα εκφράζουν τη διαφορά μεταξύ της πραγματικής τάσης που μετρήθηκε στο εργαστήριο και της τάσης που προβλέπει το γραμμικό μοντέλο.

σ̂ = 3.5 × 10⁵ + 1.98 × 10¹⁰ ε

Για κάθε παρατήρηση υπολογίζεται πρώτα η εκτιμημένη τιμή (fitted value) και στη συνέχεια το υπόλοιπο (residual):

ei = σi − σ̂i

Παράδειγμα Υπολογισμού (First Observation)

Για την πρώτη παρατήρηση έχουμε:

ε = 0.0005

Η προβλεπόμενη τάση είναι:

σ̂ = 3.5×10⁵ + 1.98×10¹⁰ × 0.0005
σ̂ = 3.5×10⁵ + 9.9×10⁶
σ̂ = 1.025 × 10⁷ Pa

Το υπόλοιπο είναι:

e = 11200000 − 10250000
e = 950000 Pa

Υπολογισμός για Όλες τις Παρατηρήσεις

ε σ (Observed) σ̂ (Predicted) Residual e = σ − σ̂
0.0005 11200000 10250000 950000
0.0010 20500000 20150000 350000
0.0015 30800000 30050000 750000
0.0020 39900000 39950000 -50000
0.0025 51100000 49850000 1250000
0.0030 59400000 59750000 -350000

Residual Sum of Squares (RSS)

Η ποιότητα του μοντέλου μετριέται με το άθροισμα των τετραγώνων των υπολοίπων (Residual Sum of Squares).

RSS = Σ ei2

Για τα δεδομένα του πειράματος:

RSS = (950000² + 350000² + 750000² + 50000² + 1250000² + 350000²)
RSS ≈ 3.30 × 10¹²

Όσο μικρότερο είναι το RSS, τόσο καλύτερα το γραμμικό μοντέλο περιγράφει τη σχέση μεταξύ τάσης και παραμόρφωσης.

Η σχετικά μικρή απόκλιση των υπολοίπων δείχνει ότι τα πειραματικά δεδομένα ακολουθούν αρκετά καλά τον Νόμο του Hooke στην ελαστική περιοχή του υλικού. Οι περισσότερες παρατηρήσεις έχουν residuals μικρότερα του 3% των τιμών τους. Αυτό σημαίνει ότι το γραμμικό μοντέλο (Hooke’s Law) προσεγγίζει πολύ καλά τα δεδομένα.

Βιβλιογραφία

Montgomery, D. C., Peck, E. A., & Vining, G. G. (2021). Introduction to linear regression analysis (6th ed.). Wiley.