ducgiang99
Junior Member
Dạ e chào mọi người ạ
Em hiện tại đang muốn migrate hệ thống chạy Spark App từ quản lý bằng Yarn sang cụm Kurbenetes on premise dùng cho end user sử dụng Spark Operator, nhưng thấy mô hình deploy này đần độn quá =( . E có một số thắc mắc khi deploy spark app trên K8S, rất mong mọi người ai deploy mô hình này có thể tư vấn giúp e được không ạ:
Em hiện tại đang muốn migrate hệ thống chạy Spark App từ quản lý bằng Yarn sang cụm Kurbenetes on premise dùng cho end user sử dụng Spark Operator, nhưng thấy mô hình deploy này đần độn quá =( . E có một số thắc mắc khi deploy spark app trên K8S, rất mong mọi người ai deploy mô hình này có thể tư vấn giúp e được không ạ:
- E muốn deploy spark history server nhưng hiện tại helm chart của nó đã deprecated, ko biết giờ mình nên sử dụng image nào.
- Vấn đề về quản lý log, khi chương trình spark chạy xong thì chỉ còn lại mỗi log của driver, muốn tra log driver thì phải dùng kubecl logs driver-pods, nhưng về góc độ enduser thì ko đc truy cập vào trong cụm K8S, e có tra trên mạng thì thấy có giải pháp EFK và đã deploy thử, nhưng chỉ lưu log thô của chương trình để cho user dễ debug thì có cần thiết dùng EFK ko ạ (ko cần tính năng search, do ES nó lưu thêm nhiều trường quá mà e ko cần tính năng search trên Kibana). Chưa kể khi có nhiều chương trình, mỗi chương trình muốn lưu log vào riêng 1 folder thì ko biết phương án log lên S3 dùng fluentbit có khả thi ko ạ.
- Vấn đề khi muốn expose sparkUI của chương trình thì nó chỉ expose service ở trong cụm, e muốn expose ra ngoài cho enduser thì mỗi khi deploy 1 spark app mình lại phải tạo ra 1 ingress mới đúng ko ạ, điều này có gây ra vấn đề j ko ạ.
- Không biết trên K8S thì có tính năng queue như trên Hadoop YARN không, về tính năng quản lý, view các job đang RUNNING, FINISHED,...
- Ai đã làm phần này rồi có thể cho e thêm 1 số kinh nghiệm khi triển khai được không ạ