thắc mắc PostgreSQL có làm sạch dữ liệu được không

manzg21

Junior Member
Hôm trước mình có hỏi học gì để quản lý data 100gb.
Sau mấy ngày mình đã học xong khoá SQL trên udemy, học cơ bản nên khá dễ và cũng đủ nhu cầu mình dùng.
Nhưng vấn đề mới là data có nhiều ô không sạch kiểu ",*,',//, khoảng trống .... Mình muốn làm sạch để đưa vào database thì có dùng mấy lệnh SQL trong PostgreSQL được không, mình thấy trên datacamp có khoá Data cleaning with PostgreSQL nhưng không biết có đúng mục đích như trên không. Hay phải học thêm python để làm sạch dữ liệu.
Thank các bác.
 
nhu cầu của thớt là 1 phần trong cái người ta hay gọi là ETL, thực hiện ETL bằng bản thân PostgreSQL vẫn được (dùng stored procedure) nhưng không khuyến khích, nên dùng software ngoài kết nối tới PostgreSQL thực hiện thì hợp lý hơn
V3so9BC.png
 
nhu cầu của thớt là 1 phần trong cái người ta hay gọi là ETL, thực hiện ETL bằng bản thân PostgreSQL vẫn được (dùng stored procedure) nhưng không khuyến khích, nên dùng software ngoài kết nối tới PostgreSQL thực hiện thì hợp lý hơn
V3so9BC.png
Vậy PostgreSql thì vẫn ok hả bác.
 
nếu không phải dân tech thì bạn nên học python, dân tech còn xỉu lên xỉu xuống với stored procedure thì nói chi dân ngoài
V3so9BC.png
Khó hơn học mới python à bác. Bác biết khoá python nào về làm sạch dữ liệu không, giới thiệu cho e với.
 
Khó hơn học mới python à bác. Bác biết khoá python nào về làm sạch dữ liệu không, giới thiệu cho e với.

như mình nói rồi, làm sạch dữ liệu là một bước trong ETL thôi, bạn cứ tìm khoá học nào ETL bằng python ấy là đúng nhu cầu của bạn
V3so9BC.png
 
như mình nói rồi, làm sạch dữ liệu là một bước trong ETL thôi, bạn cứ tìm khoá học nào ETL bằng python ấy là đúng nhu cầu của bạn
V3so9BC.png
Thank bác. Đang cần liền nên ngại học cái mới. Vậy phải học thêm python cho đủ combo làm sạch và store.
 
đọc comment mới biết là "enrich" data, hoặc "ETL"
mới đầu tưởng là làm sạch là "delete/remove/truncate" data :(
 
Back
Top