[ EXCEL - Power query] Xin cách làm sạch dữ liệu.

Có thím nào làm phân tích dữ liệu đặc biệt là phần ETF còn nhớ cách trích xuất ra cụm text theo dạng model không. Ví dụ:

Data thô
Kết quả
Bao cao su durex 0,01cm DRX001 cảm giác như thậtDRX 001
bao cao su gai HCM 0,03cm HCM-003 dành cho vozer yslHCM 003
Nước bôi trơn WTR001 băng hỏaWTR 001

Như các thím thấy, cấu trúc của từng hàng data thô đều k có quy luật nhé thậm chí ở kết quả trong data thô còn có thể có 1 kí tự đặc biệt ( HCM-003) , xưa e nhớ là mở Power query và Power pivot data model rồi code DAX hay nhập kiểu " ABC+xxx"... gì đó thì phải.

Lâu quá không dùng rồi, giờ cần vl ạ.

Thank các thím nhé :love:

Chống trôi
2021314a6440-833d-4afc-b8e3-81058825943f.png
 
Cái này không biết Dax làm được không nhưng python dùng regex thì lọc 3 ký tự text + ký tự đặt biệt/blank + 3 ký tự chữ số thì chắc lấy dc cái mã
 
Back
Top