- Bài 1: Giới thiệu
- Bài 2: Thiết lập project
- Bài 3: Lấy dữ liệu
- Bài 4: Tái cấu trúc dữ liệu
- Bài 5: Chuẩn bị dữ liệu
- Bài 6: Split dữ liệu
- Bài 7: Xây dựng bài toán phân loại
- Bài 8: Hạn chế và Tổng kết
Bài 2: Thiết lập project - Hồi quy Logistic - Python
Đăng bởi: Admin | Lượt xem: 2019 | Chuyên mục: AI
Trong bài này, chúng ta sẽ hiểu chi tiết về quy trình liên quan đến việc thiết lập một project để thực hiện hồi quy logistic trong Python.
1. Cài đặt Jupyter
Tôi sẽ sử dụng Jupyter - một trong những nền tảng được sử dụng rộng rãi nhất. Nếu bạn chưa cài đặt Jupyter trên máy của mình, hãy tải xuống từ đây. Để cài đặt, bạn có thể làm theo hướng dẫn trên trang web của họ để cài đặt. Như trang web gợi ý, bạn có thể thích sử dụng Anaconda Distribution đi kèm với Python và nhiều gói Python thường được sử dụng cho tính toán khoa học và khoa học dữ liệu. Điều này sẽ làm giảm nhu cầu cài đặt các gói này riêng lẻ.
Sau khi cài đặt thành công Jupyter, hãy bắt đầu một project mới.
Bây giờ, hãy thay đổi tên của project từ Untitled1 thành “Logistic Regression” bằng cách nhấp vào tên tiêu đề và chỉnh sửa nó.
Đầu tiên, Ta sẽ import một vài packages Python cần thiết
In [1]: # import statements
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
from sklearn import preprocessing
from sklearn.linear_model import LogisticRegression
from sklearn.model_selection import train_test_split
Notebook của bạn sẽ trông như sau :
Chạy code bằng cách nhấp vào nút Run. Nếu không có lỗi nào được tạo ra, bạn đã cài đặt thành công Jupyter .
Ba câu lệnh nhập đầu tiên nhập các gói pandas, numpy và matplotlib.pyplot. Ba câu lệnh tiếp theo nhập các mô-đun được chỉ định từ sklearn.
Nhiệm vụ tiếp theo của ta là tải xuống dữ liệu cần thiết . Ta sẽ tìm hiểu phần này trong bài tiếp theo.
Theo dõi VnCoder trên Facebook, để cập nhật những bài viết, tin tức và khoá học mới nhất!