Regresi linier adalah cara untuk menjelaskan hubungan antara variabel dependen dan satu atau lebih variabel penjelas dengan menggunakan garis lurus. Ini adalah kasus khusus dari analisis regresi.
Regresi linier adalah jenis analisis regresi pertama yang dipelajari secara ketat. Hal ini karena model-model yang bergantung secara linear pada parameter-parameter yang tidak diketahui lebih mudah untuk di-fit daripada model-model yang berhubungan secara non-linear dengan parameter-parameternya. Terlebih lagi, sifat statistik dari estimator yang dihasilkan lebih mudah ditentukan.
Regresi linier memiliki banyak kegunaan praktis. Sebagian besar aplikasi masuk ke dalam salah satu dari dua kategori besar berikut ini:
- Regresi linier dapat digunakan untuk menyesuaikan model prediktif ke sekumpulan nilai yang diamati (data). Hal ini berguna, jika tujuannya adalah prediksi, atau peramalan, atau pengurangan. Setelah mengembangkan model seperti itu, jika nilai tambahan X kemudian diberikan tanpa nilai y yang menyertainya, model yang cocok dapat digunakan untuk membuat prediksi nilai y.
- Diberikan variabel y dan sejumlah variabel X1 , ..., Xp yang mungkin terkait dengan y, analisis regresi linier dapat diterapkan untuk mengukur kekuatan hubungan antara y dan Xj , untuk menilai Xj mana yang tidak memiliki hubungan dengan y sama sekali, dan untuk mengidentifikasi himpunan bagian mana dari Xj yang mengandung informasi berlebihan tentang y.
Model regresi linier mencoba membuat jarak vertikal antara garis dan titik-titik data (misalnya residual) sekecil mungkin. Hal ini disebut "menyesuaikan garis dengan data". Seringkali, model regresi linier mencoba meminimalkan jumlah kuadrat residual (kuadrat terkecil), tetapi ada cara lain untuk menyesuaikan. Termasuk meminimalkan "lack of fit" dalam beberapa norma lain (seperti pada regresi least absolute deviations), atau meminimalkan versi penalized dari fungsi least squares loss seperti pada regresi ridge. Pendekatan kuadrat terkecil juga dapat digunakan untuk menyesuaikan model yang tidak linier. Seperti yang telah diuraikan di atas, istilah "least squares" dan "model linear" sangat erat kaitannya, tetapi keduanya bukan sinonim.

