kiến thức Trực quan hóa dữ liệu trong BÓNG ĐÁ với một Data Scientist

Các bạn có muốn DOUS tiếp tục các chủ đề ntn nữa không? Thank

  • Votes: 25 96.2%
  • Không

    Votes: 1 3.8%

  • Total voters
    26

guyfawkes11

Junior Member
“Giá trị lớn nhất của một bức tranh là khi nó buộc chúng ta phải chú ý đến những gì chúng ta không bao giờ mong đợi để nhìn thấy.”

a525c0_1a04b626480a4218b3136eceb3369c72~mv2.png

Hôm nay chúng ta sẽ tìm hiểu về bản đồ nhiệt, chuyền bóng, dứt điểm. Chắc hẳn các bạn nhìn thấy những hình ảnh này xuất hiện rất nhiều lần trên TV, nhưng làm thế nào để tạo ra nó, nó sẽ giúp gì trong việc phân tích, ra quyết định của CLB/Đội tuyển quốc gia?
Hôm nay tôi sẽ giải đáp thắc mắc này cho bạn, xin lưu ý rằng đây là các bước tạo ra cụ thể bản đồ mô tả, còn công cụ dùng có thể khác nhau tùy từng người sử dụng, dẫn đến cách trực quan hóa cũng có thể khác nhau, nhưng cách làm thì cơ bản sẽ giống nhau.

LỜI MỞ ĐẦU

Tất các phương tiện truyền thông ca ngợi về thời đại của phân tích thể thao, họ có những quảng cáo thương mại hóa hình ảnh các công cụ "Big Data", các chuyên gia sử dụng máy ảnh đa chiều để thu thập chi tiết về từng giọt mồ hôi của các vận động viên thể thao.
Phân tích thể thao đã đi một chặng đường dài trong việc đưa ra các quyết định từ chuyển nhượng cầu thủ, thương mại hóa, phương pháp tập luyện, chế độ dinh dưỡng..., những thứ mà vốn theo truyển thống được thực hiện một cách rất cảm tính.
Bản đồ nhiệt di chuyển và bản đồ chuyền bóng, dứt điểm là một trong những thứ như vậy.
Và để tạo nên nó thì tôi cần các công cụ thực hiện bao gồm: Python, Matplotlib, Seaborn...- những thu viện phổ biến của một Data Scientist.

THU THẬP DỮ LIỆU

Đây luôn là phần khó nhất.
Mặc dù bạn có thể không gặp khó khăn khi thu thập số liệu thống kê tóm tắt về một sự kiện thể thao (bàn thắng trong một trận đấu bóng đá,số pha ném bóng trong một trận đấu bóng rổ, v.v.), nhưng việc tìm một tập dữ liệu chi tiết, từng trận của một giải đấu bóng đá hay quần vợt là khó hơn rất nhiều. Theo dõi các cầu thủ trên sân, đặc biệt là đối với các môn thể thao có nhịp độ cao, cường độ cao như bóng đá hoặc bóng rổ là một nhiệm vụ đáng gờm, mặc dù là một nhiệm vụ cực kỳ hữu ích. Các công ty như SportVu hoặc Opta Sports kiếm tiền bằng cách bán những thông tin được tìm kiếm nhiều này cho các đội, công ty tư vấn thể thao hoặc trung tâm nghiên cứu.

“For every match we have three guys using … a live video feed on a pitch graphic: one guy watches the home team, another does the away team and the third man is essentially a data checker”
Simon Banoub, Opta’s director of Marketing

Nhưng thật may mắn khi chúng ta có một người hùng thầm lặng, Statsbomb đã công bố rất nhiều tệp dữ liệu các trận đấu thuộc National Women Soccer League (US), FA Women’s Super League (England), World Cup 2018...
Trong ví dụ tạo bản đồ nhiệt và bản đồ chuyền bóng dưới đây, chúng ta sẽ làm việc với tệp dữ liệu World Cup 2018.

TẠO RA ĐỒ HỌA CHO SÂN BÓNG

Đầu tiên chúng ta sẽ dùng Matplotlib để vẽ một sân bóng đơn giản, bây giờ anh em thấy các môn như toán cao cấp, đại số tuyến tính và giải tích có một phần tác dụng như thế nào rồi chứ?

a525c0_e4fb55f9045f405b811daf5978c703dd~mv2.png


Và đây là thành quả sau khi gọi hàm draw_pitch() được viết ở trên

a525c0_86042faa830f4727b8c7abc17e122246~mv2.png


TẠO RA BẢN ĐỒ NHIỆT DI CHUYỂN VÀ BẢN ĐỒ CHUYỀN BÓNG, DỨT ĐIỂM

Bạn sẽ dễ dàng hình dung ra cách tạo ra các bản đồ này và một vài ý nghĩa của chúng trong hai ví dụ dưới đây.
Ví dụ 1: Khoảnh khắc gây sốc nhất của FIFA World Cup 2018 là gì?
a525c0_49d12876a97c4137ac96d2839001f58b~mv2.png


Có rất nhiều khoảnh khắc nhưng khi đương kim vô địch Đức bị loại khỏi World Cup sau thất bại trước Hàn Quốc. Có những nỗi đau, có những giọt nước mắt và chắc chắn có những lời chỉ trích. Hậu quả của thất bại nặng nề là số 10 huyền thoại của “Die Mannschaft”, Mesut Ozil đã từ giã đội tuyển quốc gia, một con "dê tế thần" đúng nghĩa. Người chịu gần như toàn bộ lỗi, cả về màn trình diễn trong trận đấu và cuộc gặp với tổng thống Thổ Nhĩ Kỳ Erdoğan ngay trước World Cup. Chỉ cần lắng nghe những gì chủ tịch của Bayern Munich, Uli Hoeness đã nói về Ozil là đã thấy sự thất vọng lớn đến như thế nào:
"Ozil đã chơi như rác rưởi nhiều năm qua. Lần gần nhất cậu ta tắc bóng thành công là trước World Cup 2014"

Nhưng sự thật là gì?


Hãy nhìn vào màn trình diễn của anh ấy trong trận đấu với Hàn Quốc. Tôi muốn vẽ bản đồ nhiệt và bản đồ đường chuyền để ghi lại màn trình diễn của anh ấy trong suốt 90 phút và đánh giá ảnh hưởng (dù tích cực hay tiêu cực) mà anh ấy đã gây ra đối với mặt tấn công của Đức.
Dữ liệu đường chuyền của Ozil sau khi đã được xử lý sẽ có dạng như bên dưới.

file.png


Và đây là kết quả sau khi trưc quan hóa nó với đồ họa sân bóng chúng ta đã tạo ra ở bước trước.

a525c0_c79b9f2cf6ff422bb99bb1d8820972ef~mv2.png


Bộ dữ liệu này cực kỳ có ý nghĩa, người ta có thể phát hiện ra rằng Ozil đã cố gắng thực hiện tới 95 đường chuyền, trong đó 7 đường chuyền tạo ra cơ hội ghi bàn, điều này khá ấn tượng đối với một tiền vệ tấn công, và anh ấy chuyền bóng nhiều nhất cho Toni Kroos ( 19 lần) và Marco Reus (18 lần) trong trận đấu. Đối với mục đích của bản đồ chuyền bóng, chúng tôi chỉ quan tâm đến vị trí bắt đầu và kết thúc của một đường chuyền.

Theo dõi vùng hoạt động bằng bản đồ nhiệt

Bản đồ nhiệt bóng đá được sử dụng bởi các nhà phân tích trong câu lạc bộ và phương tiện truyền thông để minh họa khu vực mà một cầu thủ đã hiện diện. Chúng là một bản đồ phân tán được làm mịn một cách hiệu quả về các vị trí của người chơi và có thể là một chỉ báo tốt về mức độ hiệu quả của một người chơi tại các phần khác nhau của sân. Mặc dù có thể có một số cuộc tranh luận về mức độ hữu ích của chúng (họ không cho bạn biết hoạt động này là điều tốt hay xấu!), Chúng thường có thể rất đẹp và hấp dẫn về mặt thẩm mỹ, do đó chúng trở nên phổ biến.
Bây giờ nếu chúng ta quay trở lại Mesut Ozil, một trong những lời chỉ trích chính mà anh ấy phải đối mặt là mức độ bao phủ sân thấp vì chúng ta hiếm khi thấy anh ấy có các pha tắc bóng hoặc tranh giành quyền kiểm soát trái bóng.

Và sự thật là?

Hãy vẽ một bản đồ nhiệt bằng cách sử dụng Seaborn để hình dung sự tham gia của Mesut Ozil trong suốt 90 phút của trận Đức-Hàn.
Chúng tôi sử dụng Kdeplot, và vẽ ước tính mật độ các điểm phân tán tại các vị trí của Özil.

a525c0_096fd8b127af4d9286b9d462272ad548~mv2.png


Biểu đồ này nói rằng Ozil đã hoạt động nhiều hơn trong những vùng có màu tối hơn.
Sau khi kết hợp tất cả chúng ta sẽ có bản đổ nhiệt di chuyển và chuyền bóng của Ozil trong hiệp 1 (mày xanh nước biển) và hiệp 2 (màu đỏ) như sau:

a525c0_52285e283ee246bfb0f1caf15911f8d6~mv2.png


Bây giờ chúng ta có thể thấy một bức tranh toàn cảnh hơn về màn trình diễn của Mesut Özil trong trận đấu. Một vài quan sát có thể nhận ra ngay lập tức ngay lập tức:
Anh ấy hầu như chỉ thường xuyên suất hiện ở nửa phần sân của đối thủ, vì vậy những lời chỉ trích về việc anh ấy thiếu tư duy phòng ngự không phải là hoàn toàn vô căn cứ. Nhưng câu hỏi đặt ra là, liệu anh ta có thể giành chiến thắng trong các tình huống 1–1 và thu hồi bóng như một tiền vệ giữa sân?
Anh ấy thực hiện nhiều đường chuyền về phía trước và vỗ mặt nhiều hơn trong hiệp hai, tương phản với một số lượng lớn hơn các đường chuyền có vẻ thận trọng và an toàn hơn được thực hiện trong hiệp một. Có thể có hai lý do: (1) sự khát bàn thắng đội Đức trong hiệp hai (2) việc đưa Mario Gómez vào vị trí Tiền đạo trung tâm thực sự tạo ra cơ hội cho những đường chuyền quan trọng của Özil, như chúng ta thấy có 6 đường chuyền trực tiếp vào vòng cấm, nhiều gấp ba lần anh ấy đã làm trong hiệp một.
Điều tôi thấy thú vị không kém là biểu đồ nhiệt và chuyền bóng của Timo Werner, người xuất phát ở vị trí tiền đạo duy nhất cho đội tuyển Đức, sau đó đá cặp với Mario Gomez trong phần lớn thời gian của hiệp hai.

a525c0_dddf02a1fa044f14afa3d60db663e3f3~mv2.png


Đáng ngạc nhiên, anh ấy đã dành rất nhiều thời gian của mình ở hai cánh, trong khi bạn sẽ mong đợi Tiền đạo trung tâm chiếm khoảng trống trong vòng 16m50 nhiều hơn nữa. Điều này phần nào giải thích cho sự kém hiệu quả của hàng công Đức trong trận đấu, khi các tiền đạo của họ (Werner, Reus, Goretzka và sau đó là Muller, Gómez) dồn lên hai cánh nhưng không chiếm được không gian trong vòng cấm, do đó tạo ra rất ít mục tiêu để các tiền vệ như Ozil và Kroos trực tiếp đưa bóng vào khu vực cấm địa.
Đến tận bây giờ tôi vẫn nhớ như in câu nói của Ozil: "Khi đội tuyển thắng tôi là người Đức, khi thua tôi chỉ là kẻ nhập cư".

Ví dụ 2: "Tuyển Pháp vô địch World Cup 2018 "


Một người bạn của tôi rất tin rằng chìa khóa dẫn đến thành công ở World Cup của Pháp là :"những nỗ lực không ngừng để phá vỡ hàng phòng ngự đối phương bằng những nỗ lực sút xa". Hãy nghĩ về bàn thắng tuyệt đẹp mà Benjamin Pavard ghi vào lưới Argentina trong trận Tứ kết.
Một lần nữa chúng ta có thể cố gắng hình dung tất cả các cú sút của đội tuyển Pháp để quyết định xem phần lớn các bàn thắng của họ đến từ bên ngoài hay bên trong vòng cấm?
Nếu tôi chỉ làm theo các quy trình như trên, thì đây là những gì tôi nhận được, có vẻ khá ổn.

a525c0_1c09dd444538465bacc0b3485de63336~mv2.png


Nhưng tôi có thể làm nhiều hơn nữa để làm cho hình ảnh hấp dẫn và sâu sắc hơn. Cụ thể, tôi đã thực hiện hai chỉnh sửa nhỏ:
(1) Vì chúng tôi chỉ tập trung vào các cú sút, tất cả đều được ghi ở một bên của sân, nên tôi sẽ chỉ vẽ một nửa bên phải của sân
(2) Vì chúng tôi chỉ quan tâm đến điểm bắt đầu của các bức ảnh, chúng tôi có thể ném các mũi tên đi và chỉ hình dung các bức ảnh dưới dạng các biểu đồ phân tán trong đó x, y là vị trí tại đó thực hiện pha dứt điểm.

a525c0_e4d0adffddff44bba79bbc4e337327ce~mv2.png


Bây giờ điều này trông tốt hơn rất nhiều. Chúng ta có thể thấy ngay rằng Pháp đã cố gắng thực hiện nhiều cú sút trong vòng cấm như họ đã thực hiện bên ngoài vòng cấm. Mặc dù ở một mức độ nhất định, nó ủng hộ lập luận rằng Pháp đã thực hiện nhiều nỗ lực sút xa hơn bình thường, vì tôi mong đợi mật độ các cú sút ngoài vòng cấm thấp hơn nhiều. Trong mọi trường hợp, thật thú vị khi các chỉ số có vẻ giống nhau về mặt phân tích với các nỗ lực dứt điểm ở phạm vi ngắn và dài.

a525c0_c63dc23c1c0040de9ad913660976a21b~mv2.png


Cảm ơn những tác giả đã đóng góp cho bài viết này đặc biệt TND!
Hãy đón chờ
DOUS ở những phần tiếp theo… From Dous with Love!
 
Mấy cái này chỉ là basic, xem cho vui như Hello World . Giờ tool analyst bọn nó bán đầy, mua data của Statsbomb lắp vào là ra.
Tool như thế này nó bán cả package real time, nhưng HLV tiếp nhận thông tin và xử lý đưa ra quyết định ntn cho hiệu quả lại là một câu chuyện khác.
 
Mấy cái này chỉ là basic, xem cho vui như Hello World . Giờ tool analyst bọn nó bán đầy, mua data của Statsbomb lắp vào là ra.
trong thức tế cái gì cũng có sẵn mua đc mà feed với mình thì mấy anh DE mất việc hết :)
Mình cũng có nói đây là các bước cơ bản mà có gì cao siêu đâu
 
Pro ngâm cứu thuật toán của Football Manager chưa?
Nếu có thì cho xin phần thuật toán với. :big_smile::big_smile:
Mình chưa ngâm cứu bro ơi :))
Nhưng data thì mình đã từng lấy qua của cả PES hay FIFA để phục vụ cho mục đích nghiên cứu
 
VTV lười, FPT, Viettel cũng ko tài trợ và lười, VFF, VPF lại càng lười.
bóng đá phát triển vậy thôi
cái này bỏ tiền ra là có mà bro, còn để mấy bác FPT với Viettel làm thì cũng đc đấy nhưng chắc ko đc lợi gì nên các bác í thôi :v
 
cái này bỏ tiền ra là có mà bro, còn để mấy bác FPT với Viettel làm thì cũng đc đấy nhưng chắc ko đc lợi gì nên các bác í thôi :v

là lười chi tiền đấy, kể cả ko mua nước ngoài thì mấy trò này mấy đội Viettel, FPT nó làm đơn giản. hình ảnh thì mờ mịt, thông số thì mù tịt, khán giả thì ko được tương tác như chơi FPL
 
là lười chi tiền đấy, kể cả ko mua nước ngoài thì mấy trò này mấy đội Viettel, FPT nó làm đơn giản. hình ảnh thì mờ mịt, thông số thì mù tịt, khán giả thì ko được tương tác như chơi FPL
Mình từng liên hệ với HN T&T ko dưới 3 lần để hỏi về phân tích dữ liệu trong thể thao của CLB mà không một lời phản hồi :v thế thì nâng tầm kiểu gì ko biết :v
 
là lười chi tiền đấy, kể cả ko mua nước ngoài thì mấy trò này mấy đội Viettel, FPT nó làm đơn giản. hình ảnh thì mờ mịt, thông số thì mù tịt, khán giả thì ko được tương tác như chơi FPL
Phân tích dữ liệu nó phải đi kèm với hiểu biết chiến thuật. Phân tích data thì đơn giản , Senior IT làm được hết ,nhưng hiểu chiến thuật để phân tích data thì nó lại là chuyện khác.
 
Mình từng liên hệ với HN T&T ko dưới 3 lần để hỏi về phân tích dữ liệu trong thể thao của CLB mà không một lời phản hồi :v thế thì nâng tầm kiểu gì ko biết :v
bữa đọc bài pv 1 ông scout kiêm agency cầu thủ người nước ngoài sống làm việc ở VN 10 năm, bảo rằng 80% hlv và coach ở vleague ko đủ trình làm việc ở cấp độ học sinh sinh viên ở châu âu :big_smile: trình độ thế này thì mong chờ gì ngó ngàng tới data
 
bữa đọc bài pv 1 ông scout kiêm agency cầu thủ người nước ngoài sống làm việc ở VN 10 năm, bảo rằng 80% hlv và coach ở vleague ko đủ trình làm việc ở cấp độ học sinh sinh viên ở châu âu :big_smile: trình độ thế này thì mong chờ gì ngó ngàng tới data
Trong cuốn tự chuyện của mình Sir Alex nói rằng, Data thật sự cần thiết nhưng nó chỉ duy trì chuẩn mực thôi. Còn nếu muốn vươn tới đỉnh cao thì phải có instinct, cái này mới là quan trọng, nhưng mình chưa làm đc đk cần thì ko nói tới cái sau.
 
Back
Top