Hơn 1 tháng qua mình có chút bận rộn với những dự án cá nhân và công việc ở công ty nên chưa kịp viết bài thường xuyên. Viết blog không những là một sở thích cá nhân mà còn là một kĩ năng. Maz vẫn đang cố gắng từng ngày, mọi người thấy điểm nào chưa ổn thì cứ comment góp ý cho Maz với nhé.

Tâm sự với các bạn một tí, mình quay lại chủ đề tuần này: Maz chia sẻ các nguồn tham khảo các bài toán phân tích dữ liệu thực tế để mọi người cùng luyện tập.

Làm phân tích dữ liệu sẽ không khô khan, nhàm chán nếu như bạn chọn một lĩnh vực mà bản thân am hiểu và yêu thích. Bạn có thể làm phân tích sản phẩm công nghệ, phân tích tài chính, phân tích nhân sự (con người), phân tích rủi ro, … miễn là bạn có hứng thú với mảng đó, bạn sẽ không bao giờ thấy tẻ nhạt. Nếu như bạn là người đã đi làm, hẳn nhiên bạn sẽ có ít nhiều trải nghiệm với nghề để nhận ra mình có thiên hướng về cụ thể một lĩnh vực nào đó. Còn nếu là sinh viên, chưa có cơ hội để trải nghiệm thì việc quan sát và học hỏi những bài toán đa dạng sẽ giúp các bạn hình dung được một phần.

Sau đây là những nguồn giúp các bạn làm Data có thể tham khảo đa dạng các case studies thực tế trong rất rất nhiều lĩnh vực. Cùng Maz xem qua nhé!

1. Medium

Link: https://medium.com/

Medium là một nền tảng xuất bản nội dung được tạo ra 10 năm trước bởi Ev Williams, người đồng sáng lập Twitter. Nó cho phép người dùng đăng tải các bài viết cá nhân ở đa dạng các lĩnh vực trên toàn thế giới, được sắp xếp theo các danh mục và quản lý dựa vào AI. Bạn sẽ tìm được các bài viết liên quan khi đang dọc 1 chủ đề nào đó. Từ đó giúp bạn càng đọc càng tìm được những bài viết rất bổ ích.

Tuy nhiên, hiện nay Medium đang giới hạn truy cập cho các IP ở Việt Nam. Vì thế nếu bạn muốn tham gia cũng như tìm đọc các bài viết ở Medium, bạn bắt buộc phải dùng VPN hoặc một số thủ thuật khác. Xem thêm hướng dẫn Cách vào Medium bị chặn trên các thiết bị máy tính và điện thoại

2. Towards Data Science

Link: https://towardsdatascience.medium.com/

Cũng bắt nguồn từ nền tảng của Medium, Towards Data Science được tạo ra nhằm mục đích chủ chốt là nơi tổng hợp các bài viết về lĩnh vực Data Science và Machine Learning. Bạn có thể tìm thấy rất nhiều nội dung hay, từ những bài viết học thuật cho đến những bài hướng dẫn chi tiết: Stattistics, EDA, Visualization và Code.

3. GitHub

Link: https://github.com/

GitHub là một nền tảng quản lý các dự án làm việc và code của các lập trình viên. Ngoài ra GitHub còn hỗ trợ các tính năng như một mạng xã hội thu nhỏ cho người làm IT. Bạn có thể chủ động đăng tải các nội dung cá nhân cũng như theo dõi các tài khoản có nhiều bài viết hay, từ đó học hỏi được rất nhiều kiến thức. Đặc biệt ở GitHub, nó cho phép bạn public source code của các dự án, từ đó bạn có thể chủ động tham khảo và thực hành theo để nâng cao trình độ chuyên môn của bản thân.

4. Kaggle

Link: https://www.kaggle.com/

Kaggle cũng là một cộng đồng trực tuyến dành cho lĩnh vực Data Science. Cũng giống như GitHub, Kaggle cho phép người dùng đăng tải các nội dung (thường là những bài phân tích + source code). Nơi đây là một nguồn học tập vô cùng giá trị bởi nó quy tụ toàn bộ các cá nhân hoạt động trong cộng đồng cùng luyện tập, cùng thi thố.

Bản thân Maz cũng học tập từ trên Kaggle rất nhiều, mỗi khi tiếp cận một bài toán mới mình thường research rất nhiều nội dung trên đây để tham khảo. Ngoài các ideas mình còn tìm được nhiều cách trình bày dữ liệu mới lạ và bắt mắt.

Hãy thử cùng mình xem qua một bài phân tích dữ liệu của một công ty E-commerce sau nhé:

Link: E-Commerce Exploratory Analysis

Càng đọc nhiều mình càng tích lũy thêm nhiều kinh nghiệm xử lý số liệu và tư duy phân tích từng bài toán mình tiếp cận. Nếu có thời gian, tham gia các cuộc thi trên Kaggle là một môi trường để luyện tập và nâng cao kĩ năng của bản thân. Từ nay, hãy chọn Kaggle như là một nơi tham khảo mỗi khi bí ý tưởng phân tích bạn nha.

5. Tableau

Link: https://public.tableau.com/app/discover/business-dashboards

Tiếp theo đây sẽ là một nguồn tham khảo kĩ thuật visualization khi làm dashboard ở cộng đồng của Tableau. Xây dựng dashboard để monitor hiệu quả hoạt động của công ty, của sản phẩm là một trong những nhiệm vụ của các bạn làm DA/BI.

Thông thường để tạo ra 1 dashboard, chúng ta cần trải qua các bước sau: Xác định các metrics cần tính toán -> Chọn loại chart phù hợp để biểu thị dữ liệu -> Phát thảo outline của dashboard -> Thiết kế dashoard -> Tối ưu hóa tốc độ xử lý của dashboard.

Các tips để tạo ra 1 dashboard mang lại hiệu quả cao nhất mình đã có chia sẻ ở bài viết này, bạn có thể tham khảo thêm nhé.

Kết

Nội dung bài hôm nay đến đây là hết rồi nè. Hi vọng là chia sẻ của mình có thể hỗ trợ bạn trên hành trình làm việc với dữ liệu. Chúc tất cả chúng ta đều may mắn và thành công.

Happy weekend!

Maz.

error: Content is protected !!
0
Would love your thoughts, please comment.x
()
x