aaa
Senior Member
Chào các thím, mình nhận được 1 bài toán, nghĩ nó đơn giản mà hoàn toàn không đơn giản, mong nhận được cao kiến từ các thím
Bối cảnh: Giả sử hệ thống các thím có lượng user rất lớn, số lượng phần tử lên đến hàng trăm triệu records, mỗi user có rất nhiều thuộc tính như tên, tuổi, địa chỉ.... vì số lượng thuộc tính trên mỗi user rất nhiều nên không thể đánh index hết được, và số lượng user records sẽ tiếp tục tăng nhiều nữa.
Vấn đề đặt ra là các thím muốn biết được ngay số lượng có bao nhiêu user (n) thỏa mãn 1 điều kiện filter nhất định (ví dụ tuổi >20,địa chỉ là việt nam...) và điều kiện filter này sẽ linh động thay đổi theo nhu cầu các thím muốn tìm và xem xét theo những gì nên việc đánh index cho tất cả là không tối ưu.
Input: Mảng user arr = [1..N] với số phần tử N rất lớn, mỗi phần tử có rất nhiều thuộc tính(tên, tuổi, địa chỉ...)
Output:
- Hiện thực hàm và thuật toán tối ưu để sắp xếp và trả về số lượng có bao nhiêu user thỏa mãn filter trên mảng đó.
- Cách tối ưu nhất để lưu dữ liệu users
À mà ngôn ngữ hệ thống là Python nhé các thím, mình k biết python có hổ trợ nhiều về phần xữ lý này không.
Một phần nữa là nếu số lượng mảng phần tử user chỉ tương đối, hoàn toàn có thể cache trên RAM thì có cách nào giải quyết bài toán trên tối ưu nhất trên python không các thím, mình mới chuyển qua nghiên cứu thằng này. Khoai quá mấy thím, cũng muốn thử sức mong các thím khai sáng
Bối cảnh: Giả sử hệ thống các thím có lượng user rất lớn, số lượng phần tử lên đến hàng trăm triệu records, mỗi user có rất nhiều thuộc tính như tên, tuổi, địa chỉ.... vì số lượng thuộc tính trên mỗi user rất nhiều nên không thể đánh index hết được, và số lượng user records sẽ tiếp tục tăng nhiều nữa.
Vấn đề đặt ra là các thím muốn biết được ngay số lượng có bao nhiêu user (n) thỏa mãn 1 điều kiện filter nhất định (ví dụ tuổi >20,địa chỉ là việt nam...) và điều kiện filter này sẽ linh động thay đổi theo nhu cầu các thím muốn tìm và xem xét theo những gì nên việc đánh index cho tất cả là không tối ưu.
Input: Mảng user arr = [1..N] với số phần tử N rất lớn, mỗi phần tử có rất nhiều thuộc tính(tên, tuổi, địa chỉ...)
Output:
- Hiện thực hàm và thuật toán tối ưu để sắp xếp và trả về số lượng có bao nhiêu user thỏa mãn filter trên mảng đó.
- Cách tối ưu nhất để lưu dữ liệu users
À mà ngôn ngữ hệ thống là Python nhé các thím, mình k biết python có hổ trợ nhiều về phần xữ lý này không.
Một phần nữa là nếu số lượng mảng phần tử user chỉ tương đối, hoàn toàn có thể cache trên RAM thì có cách nào giải quyết bài toán trên tối ưu nhất trên python không các thím, mình mới chuyển qua nghiên cứu thằng này. Khoai quá mấy thím, cũng muốn thử sức mong các thím khai sáng
Last edited: