Artificial Intelligence For Learning The Basics
Plot by Kirill Eremenko & Hadelin de Ponteves on Udemy
Untuk membantu anda memprediksi gaji karyawan dari suatu perusahaan, Simple Linear Regression merupakan model Machine Learning yang tepat untuk mengatasi masalah ini. Simple Linear Regression digunakan untuk memprediksi variabel dependen dengan cara melakukan kalkulasi antara koefisien, konstanta (intercept) dan variabel independennya.
Koefisien dari perhitungan ini digunakan untuk mengetahui seberapa dekat garis prediksi dengan data aslinya dan untuk mengetahui kemiringan atau posisi yang optimal (terdekat) antara garis prediksi dengan data asli.
Simple Linear Regression juga menunjukkan apabila variabel independen mengalami kenaikan maka variabel dependen juga mengalami kenaikan. Karena alasan ini lah garis prediksi membentuk garis nya dari kiri bawah kemudian ditarik garis ke arah kanan atas dan membentuk diagonal.
Rumus Persamaan Simple Linear Regression
- Berikut ini adalah rumus untuk memprediksi data baru (variabel dependen) dari Simple Linear Regression :
Y = a + bX
Keterangan :
Y : variabel dependen (respon/prediksi)
a : konstanta (titik awal/intercept)
b : koefisien (kemiringan garis prediksi)
X : variabel independen (prediktor)
- Berikut ini adalah rumus untuk mendapatkan garis optimal dari Simple Linear Regression (Ordinary Least Squares) :
SUM(X1 – X2)^2
Keterangan :
y1 : data asli
y2 : data dari garis prediksi
- Berikut ini adalah rumus untuk mendapatkan nilai a dan b dari persamaan Simple Linear Regression :
Formula generated by ChatGPT
Setelah Anda mendapatkan nilai dari a dan b, maka Anda bisa memprediksi data variabel dependen (Y) berdasarkan data variabel independen (X) yang baru.
Kode Python Untuk Membuat Model Simple Linear Regression
Kita akan mengambil contoh kasus dalam Simple Linear Regression yaitu memprediksi gaji seorang karyawan berdasarkan pengalamannya dalam bekerja :
- Impor library yang diperlukan untuk memanipulasi data
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
- Impor data yang diperlukan untuk dilatih dan diprediksi
data = pd.read_csv(“Salary_Data.csv”)
X = data.iloc[:, :-1].values
Y = data.iloc[:, -1].values
- Memisahkan data antara training set dan test set
from sklearn.model_selection import train_test_split
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size = 1/3, random_state = 0)
- Training model dari Simple Linear Regression
from sklearn.linear_model import LinearRegression
regressor = LinearRegression()
regressor.fit(X_train, y_train)
- Memprediksi data test set
y_pred = regressor.predict(X_test)
- Menggambarkan plot untuk training set
plt.scatter(X_train, y_train, color = “red”)
plt.plot(X_train, regressor.predict(X_train), color = “blue”)
plt.title(“Salary vs Experience (Training Set)”)
plt.xlabel(“Years of Experience”)
plt.ylabel(“Salary”)
plt.show()
Plot by Kirill Eremenko & Hadelin de Ponteves on Udemy
- Menggambarkan plot untuk test set
plt.scatter(X_test, y_test, color = “red”)
plt.plot(X_train, regressor.predict(X_train), color = “blue”)
plt.title(“Salary vs Experience (Test Set)”)
plt.xlabel(“Years of Experience)
plt.ylabel(“Salary”)
plt.show()
Plot by Kirill Eremenko & Hadelin de Ponteves on Udemy
Setelah Anda memahami konsep, rumus persamaan dan kode untuk membuat model dari Simple Linear Regression, Anda akan mengetahui bahwa tujuan dari Simple Linear Regression ini adalah untuk memprediksi data variabel dependen kontinue berdasarkan variabel independen kontinue.
Dari prediksi ini, apabila ada data baru yang dimasukkan atau variabel independen baru (X) untuk diprediksi, maka data baru tersebut akan disesuaikan dengan garis prediksi dari model Simple Linear Regression yang sudah dibuat.
Maka dari itu kita harus membuat model Simple Linear Regression yang kuat, terpecaya, dapat diandalkan dan akurat supaya prediksi yang kita buat dapat mendekati nilai aslinya.
Bagi anda yang ingin memberikan komentar pada website ini, silahkan tulis komentar anda dengan mengisi nama dan alamat email anda. Anda dapat membaca blog kami sebelumnya mengenai 8 hal yang harus Anda perhatikan saat riset industri dan blog kami selanjutnya mengenai 9 hal yang harus Anda ketahui dalam melakukan riset makroekonomi.
[…] Bagi anda yang ingin memberikan komentar pada website ini, silahkan tulis komentar anda dengan mengisi nama dan alamat email anda. Anda juga dapat membaca blog kami sebelumnya tentang indikator Machine Learning : K-NN-based Strategy dalam aplikasi TradingView dan post kami selanjutnya mengenai model Machine Learning untuk memprediksi gaji karyawan. […]
[…] anda dengan mengisi nama dan alamat email anda. Anda dapat membaca blog kami sebelumnya mengenai model Machine Learning yang digunakan untuk memprediksi gaji suatu karyawan dan blog kami selanjutnya mengenai model Machine Learning yang membantu Anda memilih startup yang […]
[…] Simple Linear Regression […]