Thì để hiểu lý do tại sao thì hãy cùng mình phân tích dữ liệu điểm thi tuyển sinh đại học của tất cả học sinh vào năm 2024 để nhé. Trong bài phân tích này mình sẽ sử dụng ngôn ngữ Python và công cụ Google Colab để phân tích và đưa ra những kết luận có ý nghĩa.
QUÁ TRÌNH PHÂN TÍCH DỮ LIỆU
Trước khi bắt đầu phân tích, có một điều cực kỳ quan trọng là chúng ta cần phải có một quy trình chung để phân tích dữ liệu. Bất cứ ai có công việc liên quan đến phân tích dữ liệu cũng có thể áp dụng quy trình dưới đây để giúp hướng đi phân tích dữ liệu hoạt động tốt và trở nên hiệu quả hơn
B1: Define Problem : xác định rõ vấn đề bạn đang giải quyết. Đây là bước quan trọng vì nó ảnh hưởng đến sự thành công của kết quả phân tích.
B2: Data Preparation: dữ liệu được lấy dữ liệu từ nguồn nào? có đầy đủ không? Dữ liệu phải được làm sạch trước khi bước vào giai đoạn phân tích.
B3: Analyze Evaluation: phân tích và đánh giá để biết kết quả phân tích của có ý nghĩa hay không.
B4: Communication: trình bày tất cả thông tin kết quả phân tích
Insight 1: Tỷ lệ số lượng thí sinh năm 2024 đã tăng 4% so với năm 2023.
Nhìn vào biểu đồ qua các năm 2022-2023-2024, tốc độ tăng trưởng đã bắt đầu ổn định, năm 2022 tăng khoảng 1%. Năm 2023 tăng thêm khoảng 3%. Năm 2024 tăng thêm khoảng 4%. Khi đầu vào quá nhiều có nghĩa là tỷ lệ cạnh tranh giữa các thí sinh ngày càng tăng.
Insight 2: Khu vực có thí sinh tăng nhiều trong năm 2024 là khu vực Đồng Bằng Sông Hồng khoảng 5%
Khu vực có thí sinh tăng nhiều trong năm 2024 là khu vực Đồng Bằng Sông Hồng khoảng 5%. Lý do nằm ở việc có sự gia tăng Hải Phòng lên 12% từ 22.000 lên 25.000 thí sinh. Các tỉnh như Quảng Ninh, tỉnh Vĩnh Phúc cũng tăng khá nhiều lần lượt là 11% và 10%.
Những khu vực khác cũng tăng nhẹ khoảng 5-6%. Dẫn đến khu vực đồng bằng sông Hồng có tỷ lệ gia tăng thí sinh cao nhất so với các vùng còn lại. Điều này có khả năng làm cho điểm chuẩn của các trường Đại học tại miền Bắc sẽ tăng cao, do có lượng lớn thí sinh tham gia xét tuyển.
Insight 3: Năm 2024 có sự cải thiện điểm số nằm 3 môn học Ngữ văn, Địa lý và Lịch sử.
Khi nhìn vào biểu đồ Line Chart phân tích điểm trung bình tất cả các môn. Hiếu nhận ra mức tăng điểm ở môn Lịch sử (đường màu hồng), Địa lý (đường màu nâu) và Ngữ văn (đường màu cam) tăng vọt trong giai đoạn 2020-2024
Năm 2024 có sự cải thiện điểm số nằm ở điểm ngữ văn, điểm địa lý, điểm lịch sử. Đây là ba môn học có điểm trung bình tăng. Chứng tỏ rằng đề Kỳ thi năm nay ở 3 môn này có vẻ dễ dàng hoặc là barem điểm có sự thay đổi.
Insight 4: Có nhiều sự cạnh tranh ở Top các thí sinh có điểm cao khối A
Theo như biểu đồ trên của khối A, mình nhận thấy có sự thay đổi về điểm số ở top đầu. Để dễ hình dung mình sẽ đưa ra một ví dụ.
Giả sử điểm chuẩn của ngành và trường mà bạn mong muốn vào năm ngoái là từ 25 điểm trở lên điều này đồng nghĩa với việc bạn phải nằm trong top 5% học sinh giỏi nhất khối A, mà nhà trường đang chọn ra top 5% học sinh xuất sắc nhất khối A để vào ngành đó.
Tuy nhiên với năm nay, con số 25 điểm chỉ nằm trong trong top 10%. Để đạt được Top 5%, bạn phải có từ 25,75 điểm trở lên để có thể đạt đầu vào của ngôi trường mà bạn chọn (nếu như chỉ tiêu trường không có sự thay đổi). Như vậy rõ ràng điểm số của năm 2024 cao hơn năm 2023 và có rất nhiều sự cạnh tranh rất nhiều ở nhóm top các thí sinh học giỏi khối A.
Vì vậy những bạn muốn nộp hồ sơ vào các trường top đầu như Đại học Ngoại thương, Trường Đại học Kinh tế Hồ Chí Minh hay Đại học Luật Kinh tế thì cần phải cân nhắc kỹ.
Sau khi đã tính toán sự khác biệt về điểm số cho mỗi tỷ lệ phần trăm, tiếp theo chúng ta cần phải biết về số lượng ứng cử viên năm nay thế nào để có thể đưa ra những quyết định đúng đắn.
Trong biểu đồ này, mình mô tả sự khác biệt về số thí sinh thực tế cho mỗi phạm vi điểm số để khi bạn có kết quả bạn biết mình nằm trong top mấy của khối A.
Ví dụ: Nếu bạn có số điểm là 26, bạn nằm trong top 5% những người giỏi nhất khối A.
Tuy nhiên, để chắc chắn hơn bạn cần phải biết năm nay có tổng cộng có bao nhiêu ứng cử viên so với năm ngoái và tăng tỷ lệ bao nhiêu phần trăm? Mọi người sẽ thấy rằng trong phạm vi 23,5 và 24 điểm có hơn khoảng 1.000 thí sinh và từ mốc 23,5 điểm trở đi thì có nhiều thí sinh hơn 2023.
Khi chúng ta áp dụng phương pháp ước lượng ở đây, điểm trung bình dao động từ 21-30 điểm, nó nằm trên độ lệch giữa năm 2024 và 2023 là khoảng 768 ứng cử viên với độ tin cậy là 95 %, chênh lệch dao động từ – 4800 đến 6300. Có nghĩa là giữa các điểm số, nó sẽ có sự khác biệt từ -4000 đến khoảng 6000 với độ tin cậy là 95 %.
Đây đó là cách mình áp dụng phương pháp ước tính thống kê để ước tính liệu năm nay số lượng thí sinh có số điểm đó nhiều hơn hoặc ít hơn năm ngoái.
Tương tự với khối A, mình sẽ đưa ra kết luận cho những khối A1, B, C, D như sau:
Insight 5: Sự chênh lệch không nằm ở Top đầu mà nằm Top giữa của khối A1
Điểm trung bình khối A1 cao hơn khoảng 0,25 so với năm ngoái. Đối với thí sinh thuộc khối A1, nếu năm ngoái chúng ta muốn nằm trong top 5% những người giỏi nhất ở khối A1 sẽ phải được 25,4 điểm, thì năm nay phải là 25,5 điểm. Các chênh lệch ở khối A1 không nhiều như khối A, phần top của khối A1 không chênh lệch nhiều. Tuy nhiên, phần chênh lệch lại nằm ở Top giữa đoạn nằm trong khoảng từ 20-24 điểm.
Vì vậy, những gì bạn đang có nguyện vọng vào các ngành có khoảng điểm từ 22-24 vào năm ngoái, thì năm nay các chuyên ngành này có thể sẽ tăng lên.
Insight 6: Không có sự thay đổi nhiều về điểm chuẩn khối B
Về khối B có thể thấy điểm thi năm nay thấp hơn năm ngoái. Xét về điểm trung bình trên tất cả các điểm, có vẻ như điểm chuẩn của khối B năm nay sẽ giữ nguyên hoặc đi xuống phụ thuộc vào chỉ tiêu của trường tăng lên hoặc giảm xuống. Có thể thấy điểm số khối B có thể tương đương với năm 2023.
Sự chênh lệch trung bình số học sinh không nhiều khoảng 200 thí sinh và dao động từ -5.000 đến 6.000 với độ tin cậy là 95%.
Insight 7: Có sự tăng vọt thí sinh có điểm cao ở khối C
Mức trung bình của khối C tăng gần 2,25 điểm so với năm ngoái và nếu năm ngoái bạn muốn nằm trong top 5% những người giỏi nhất ở khối C đạt 24,5 thì năm nay bạn phải đạt 26,25. Vì chênh lệch rất lớn trong phạm vi top xuất sắc của khối C từ phân khúc 23 điểm, nghĩa là khối C năm nay có 23 điểm, sẽ tương đương với khối C năm ngoái đạt 20,75. Điều này có nghĩa là khối C có rất nhiều cạnh tranh.
Insight 8: Số lượng thí sinh có Điểm số ở khối D khá ổn định
Mình thấy điểm thi năm nay của khối D chênh khoảng 0,5 so với năm ngoái. Và điểm số của top 5% chỉ cao hơn khoảng 0,3 điểm so với năm ngoái. Điểm trung bình vẫn tăng gần 0,5 điểm nhưng điểm top đầu chỉ cần trên 0,3. Điều này có nghĩa là top đầu số lượng thí sinh vẫn tăng nhưng tăng một ít.
Insight 9: Mối tương quan giữa các tổ hợp môn
Khi đánh giá mối tương quan của sự kết hợp của các khối với nhau, thì mình nhận ra rằng:
Khối A và B là có mức độ tương quan cao lên đến 0,83. Điều này giải thích cho viêc số người thi khối A đạt điểm cao thì khối B cũng đạt điểm cao. Tương tự với các khối như A1 thì tương quan nhiều với khối D, giá trị đạt 0,84 . Khối C đi với khối D mức độ tương quan là 0,72.
Nhìn chung, năm nay xác suất sẽ tăng điểm đồng nghĩa với việc các trường sẽ tăng điểm so với năm ngoái. Sự gia tăng sẽ phải phụ thuộc vào chỉ tiêu của các trường. Thông qua bài phân tích trên, thì mình cũng hiểu ra lý do tại sao điểm chuẩn các năm tăng cao do đề thi dễ hơn, số lượng thí sinh tăng cao hơn cùng với chỉ tiêu trường không tăng quá nhiều kết hợp cùng với nhiều hình thức xét tuyển.
Để xem thêm chi tiết về bài phân tích, mời mọi người xem video phía bên dưới của Hiếu nha!!