“Để trở thành một Data Analyst, một người mới cần bắt đầu từ đâu, nên học kiến thức và kĩ năng gì?”

Trước hết mình xin nói về bản thân một tí. Tính đến nay, mình đã bước chân vào công việc liên quan đến khoa học dữ liệu (Data Science) được gần 3 năm. Cụ thể mình đang đảm nhiệm vị trí Data Analyst trong một công ty Fintech ở Sài Gòn. Mặc dù chỉ trải qua hai công ty từ khi trở thành Data analyst. Tuy nhiên mình cũng được phân tích cho một vài mảng khác nhau: tài chính-ngân hàng (banking), phát triển sản phẩm (growth), quản trị rủi ro (risk management).

Với xuất phát điểm là một cậu sinh viên chuyên ngành kinh tế nhưng bén duyên với ngành công nghệ cần nhiều technical skills, mình bắt đầu con đường rẽ ngành hoàn toàn từ cột mốc số 0, từ những hoang mang và có cả đôi lần lạc lối. Gói ghém lại hành trình của bản thân bằng việc ghi lại trong chiếc blog nhỏ này. Một chặng đường khám phá – đi tìm cơ hội – hoàn thiện năng lực để sinh tồn trong cái nghề đã chọn. Bài viết hơi dài với hi vọng lưu giữ và mong muốn mang đến một chút kinh nghiệm cho mọi người, những bạn có định hướng bước chân vào con đường của “nhà phân tích dữ liệu”.

Quay lại câu hỏi ở đầu bài: Để trở thành một Data Analyst, một người mới cần bắt đầu từ đâu, nên học kiến thức và kĩ năng gì?”

Mình có theo dõi nhiều cuộc thảo luận về vấn đề này trong các cộng đồng nghề Data. Có nhiều lời khuyên rằng: bạn cần bắt tay vào học ngôn ngữ VBA, SQL, Python. Học thêm một số BI tools như Power BI, Tableau, Google data studio. Ngoài ra bạn cũng cần biết statistics (thống kê), machine learning (học máy).

Các phản hồi này hầu hết đều tập trung vào technical skills, đôi khi được giải thích một cách còn khá tổng quan. Nhưng mà các bạn có biết? Những kiến thức và kĩ năng đó sẽ được áp dụng thực tế ra sao trong công việc của một Data Analyst? Vai trò từng kĩ năng quan trọng và cần thiết cho các level Junior – Senior – Expert như thế nào? Với kinh nghiệm đã trải qua giai đoạn nhiều ngày mài mò nghiên cứu cho mình một hướng đi. Mình sẽ chia kinh nghiệm về câu hỏi này theo cấu trúc (bên dưới). Hi vọng có thể giúp các bạn mới bắt đầu theo đuổi nghề Data Analyst chuẩn bị hành trang hợp lí cho hành trình của mình.

Các nội dung:

  1. Hiểu một chút về các khái niệm: Data analysis – Data Analyst – Data Scientist – Business Intelligence Analyst
  2. Kiến thức và kĩ năng cần có cho Data Analyst
  3. Xác định khoảng cách năng lực và xây dựng tộ trình trở thành một Data Analyst
  4. Khi nào bạn sẽ sẵn sàng trở thành một Junior Data Analyst?
  5. Trải nghiệm cụ thể công việc Data Analyst của mình
  6. Career paths cho Data Analyst

(Nếu bạn là người thích xem video thì có thể check clip full HD không che ở đây nhen)

Data Analysis và Data Analyst

Data analysis là quá trình phân tích dữ liệu. Bắt đầu từ việc xác định, thu thập dữ liệu thô, làm sạch, chuyển hóa thành dữ liệu tinh gọn. Sau đó tìm mối liên hệ để kết nối nhiều nguồn lại với nhau. Tiếp tục dữ liệu được phân tích bằng các statistical techniques (kĩ thuật thống kê) và mô hình machine learning. Kết quả phân tích sẽ được trình bày thành những câu chuyện trong các báo cáo, nhằm đưa ra những thông tin giá trị, hỗ trợ thiết thực cho việc ra quyết định trong kinh doanh.

Data analyst chính là người sẽ kể câu chuyện thông qua dữ liệu từ quá trình trên. Hiểu theo cách tổng quát nhất, để có đưa ra được insights thì người Data analyst phải thực hiện. Bắt đầu từ Data preparation (cleaning, profiling, transform) –> Data exploratory (analyzing) –> Modeling & Evaluation –> Communication of insights.

Sự khác nhau giữa Data Analyst – Data Scientist

Nhìn vào quá trình trên, có thể thấy sự overlap công việc giữa Data analyst và Data Scientist. Với người Data analyst, họ cần phải hiểu bài toán có những yêu cầu nào cần giải đáp. Tiếp theo tập trung ở giai đoạn data preparation để chuẩn hóa dữ liệu. Sau đó đánh mạnh vào bước data exploratory bằng việc áp dụng các mô hình thống kê. Từ đó tìm ra nguyên nhân và những khuyến nghị cho các vấn đề của business.

Đối với Data scientist, ngoài những năng lực như programing skills (kĩ thuật lập trình), domain knowledge (kiến thức chuyên ngành) giống Data analyst để làm tốt bước data exploratory. Thì vị trí này còn yêu cầu một nền tảng về data modeling techniques (statistics, machine learning, AI). Data scientist sẽ phải tìm ra những yếu tố (features) quan trọng, phù hợp với thuật toán trong từng model. Đồng thời đánh giá và cải tiến được kết quả của mô hình. Bạn có thể đọc thêm tại https://bit.ly/DA_vs_DS

Thế còn Business Intelligence Analyst (BI analyst)?

Gần đây, mình thấy có nhiều công ty cần tuyển vị trí BI analyst. Mình đã từng nghĩ nó giống với DA nhưng thật ra lại có nhiều khác biệt khi tìm hiểu kĩ:

  • BI analyst sẽ tập trung phân tích tìm ra những insights phục vụ các vấn để của business thông qua việc query (truy xuất) data đã được làm sạch, xử lý gọn gàng.
  • BI analyst chủ yếu giải quyết bài toán descriptive analytics (phân tích mô tả), diagnostics analytics (phân tích chẩn đoán) trong khi “scope of work” của Data analyst thì rộng hơn, phải thực hiện nhiều giai đoạn (đã trình bày ở trên) và đôi khi giải quyết cả bài toán predictive.
  • Tóm lại, BI sẽ cố gắng đưa ra những insights giá trị cho business bằng việc query và visualization để kể nên những câu chuyện. Bạn có thể đọc thêm bài viết phân biệt DA và BI tại đây https://bit.ly/DA_vs_BI

Vậy, có thể hiểu BI analyst cũng cần có những năng lực tương đồng với Data analyst. Bằng kinh nghiệm của bản thân, mình xin phép chia sẻ sâu về vị DA hơn nha.

Kiến thức và kĩ năng cần có của Data Analyst

Có rất nhiều sách và bài viết nói về những năng lực cần có để trờ thành Data analyst. Mình sẽ trình bày thông qua những điều bản thân hiểu và trải nghiệm theo bố cục: Liệt kê những knowlegde (kiến thức) và skills (kĩ năng) phục vụ từng nhóm công việc trong mỗi giai đoạn của quá trình phân tích dữ liệu. Hi vọng sẽ giúp mọi người có cái nhìn dễ dàng hơn.

Data Analysis Stage Responsibility Skills Knowledge
Data Preparation– Querying
– Cleaning / Profiling / Transforming
– SQL, Python, R
– Problem solving
– Knowledge of database
– Data warehouse
– Data dictionary
Data Exploratory– Descriptive analytics
– Diagnostic analytics
– Analyzing and visualizing by: Excel, Python, R, BI tools
– Problem solving
– Statistics
– Domain knowledge of business / products
Modeling & Evaluation– Predictive analytics
– Prescriptive analytics
– Python, R
– Problem solving
– Statistics, Machine learning
– Domain knowledge of
business / products
Communication of Insights– Create reports: Story of Insights and Recommendations
– Presentation
– Visualization
– Communication
– Foreign languages
– Data story telling
Kiến thức và kĩ năng cần có của Data Analyst

Mình đã từng nghĩ technical skills là tất cả để trở thành Data analyst. Nhưng đó là một sự sai lầm vô cùng lớn. Phải sở hữu domain knowledge + soft skills thì mới trở thành một “chiến binh” xịn bạn nhé.

Lộ trình hoàn thiện năng lực cho người mới bắt đầu

Sau khi list ra tất cả các knowledge và skillset theo từng nhóm công việc, sắp xếp mức độ ưu tiên từ dễ đến khó, mức độ phổ biến trên thị trường là việc cần thiết. Nó sẽ cho mình biết nên bắt đầu từ đâu và bao giờ là sẵn sàng.

PhaseKnowledgeSkills
1. FundamentalAnalytics:
– Database, data warehouse, data dictionary
– Basic statistical techniques
– Business intelligence with descriptive and diagnostic analytics
– Problem solving
Technical skills:
– Programing language: SQL query
– Visualization tools: Excel, PowerPoint, Google Analytics

Soft skills:
– Communication
– Presentation
– Creative and analytical thinking
– Data story telling
2. IntermediateAnalytics:
– Advanced statistics for business intelligence

Domain knowledge:
– Data analysis by specific industries
Technical skills:
– Programing language: Python, R
– Visualization tools: Power BI / Tableau / Qlik Sense

– Data story telling
3. AdvancedAnalytics:
– Machine learning for predictive and prescriptive analytics

Domain knowledge:
– Predictive and prescriptive analytics by specific industries
– Data story telling
Khung năng lực Data Analyst theo từng mức độ

Fundamental

Là nhóm cơ bản nhưng bao hàm đầy đủ kiến thức và kĩ năng cần có. Nó sẽ giúp bạn có thể làm được việc của một Data analyst:

  • Hiểu được kiến thức tổng quan về database (cơ sở dữ liệu). Nắm rõ việc truy xuất vào môi trường data nào không làm ảnh hưởng đến performance của hệ thống.
  • Biết dùng programing language như SQL để query, clean, transform từ data thô (thiếu giá trị, hoặc thừa thông tin). Biết áp dụng các câu lệnh SQL để join, union các bảng dữ liệu lại mà lấy đầy đủ các thông tin cần thiết. Sau đó có thể xuất ra file csv để tiếp tục phân tích bằng Excel hoặc kết nối vào các BI tools.
  • Ở giai đoạn phân tích: Việc áp dụng các basic statistical techniques sẽ giúp bạn hiểu sâu sắc dữ liệu (không bị đánh lừa) và phân tích một cách khoa học. Các kĩ thuật cơ bản như:
    • Phân tích mẫu (sample) và tập hợp (population)
    • Các loại dữ liệu: categoricalnumerical sẽ có phương pháp xử lý tương ứng
    • Các chỉ số đo lường thống kê mô tả: mean, mode, median, standard deviation, correlation, …
    • Biết sự dụng một số charts: histogram, box plots, scatter plots để đánh giá dữ liệu có hợp lí và loại bỏ outlier (dữ liệu ngoại lai)
  • Excel, Google Data Studio, Powerpoint là những tools cơ bản giúp bạn trực quan hóa kết quả phân tích của mình dễ dàng nhất.
  • Data story telling + communication + analytical thinking là những kĩ năng mà mình liệt kê rất nhiều lần. Bởi nó có thể quyết định việc thành/bại của toàn bộ quá trình làm phân tích. Biết đặt vấn đề, đặt giả thiết, dùng data để chứng minh thật chặt chẽ và logic. Có phương pháp trình bày thông minh để người xem có thể hiểu trọn vẹn thông điệp của mình. Cuối cùng sếp sẽ hành động theo những để xuất mà bạn đưa ra. Bởi đấy là giải pháp tốt giúp cải thiện tình hình của business. Thế mới là sự thành công của một người làm phân tích.

Intermediate

Đây là giai đoạn up skills.

  • Advanced statistics mà bạn cần biết nhiều hơn đó là: áp dụng được các phương pháp kiểm định giả thuyết (hypothesis testing), biết làm một số phân tích hồi quy (regression analysis), …
  • Ngôn ngữ Python hay R sẽ giúp bạn làm tốt các kĩ thuật advanced statistics phía trên. Đây cũng là ngôn ngữ giúp bạn có thể làm các bài toán về machine learning.
  • Học 1 trong số các BI tools: Power BI, Tableau, Qlik sẽ giúp việc visualization của bạn dễ dàng hơn bao giờ hết. Nó hỗ trợ cực tốt trong việc tạo ra các report và dashboard trực quan. Theo kinh nghiệm của mình Power BI là công cụ miễn phí và thân thiện cho người mới bắt đầu.
  • Liên tục update domain knowledge (kiến thức về ngành hàng) mà công ty đang vận hành cũng như mở rộng tìm hiểu vai trò của dữ liệu trong những ngành khác. Đây là phần quan trọng vô cùng vì bạn đang dùng data để giải quyết bài toán của business. Việc hiểu sâu sắc nội tại sản phẩm của ty cũng như trên thị trường, sẽ giúp việc phân tích trở nên xuất sắc hơn.

Advanced

Advanced là giai đoạn mình nghĩ bạn đã phần nào master công việc Data analyst. Bản thân mình cũng đang tiếp tục hoàn thiện nên đây cũng là một góc nhìn qua việc tìm hiểu:

  • Machine learning (ML) sẽ là kiến thức giúp mình giải quyết bài toán dự báo cho tương lai thông qua các nhóm thuật toán chính như: supervised learning (học có giám sát), unsupervised learning (học không giám sát), …
  • Áp dụng machine learning vào từng business case sẽ là điều tuyệt vời tiếp theo để thấy được sức mạnh của dữ liệu trong kinh doanh. Một vài ví dụ:
    • Marketing: Bạn có thể tối ưu hóa chi phí và hiệu quả quảng cáo khi triển khai phù hợp cho từng customer segmentation mà ML có thể thực hiện được bằng phương pháp clustering. Bạn có thể biết trước được khả năng khách hàng rời bỏ (churn) bằng các thuật toán hồi quy (regression) để có những hành động kịp thời giữ khách hàng tiếp tục sử dụng sản phẩm.
    • Risk management: Xác định hạn mức tín dụng của khách hàng thông qua các mô hình credit scoring sẽ giúp hạn chế được tỉ lệ nợ xấu. Hiểu được hành vi của nhóm kẻ gian sẽ giúp các tổ chức tài chính phòng chống gian lận qua các bài toán Fraud detection.
  • Và cuối cùng, master kĩ năng data story telling vẫn là vũ khí lợi hại nhất của người làm dữ liệu ^_^

Khi nào bạn sẽ sẵn sàng trở thành một Junior Data Analyst?

Hoàn thành Fundamental phase, mình nghĩ ít nhất là như vậy.

Thế làm sao nhà tuyển dụng có thể kiểm chứng được mức độ năng lực của một fresher, nếu bạn chưa từng đi làm Data analyst ở bất kì công ty nào trước đây?

Câu trả lời: Hãy bắt tay vào làm những projects (dự án) thực tế, lấy chúng hoàn thiện portfolio (hồ sơ) của mình để chinh phục nhà tuyển dụng nhé! (Mình xin phép chia sẻ chủ đế này ở một bài viết khác để có thể nói chi tiết hơn)

Master Data analyst là cả một quá trình dài hơi. Bởi lẽ người DA không phải chỉ giỏi về technical mà còn phải đủ am hiểu business. Vì thế đừng vội thúc ép bản thân cùng một lúc lĩnh hội tất cả kiến thức và kĩ năng mà mình liệt kê phía trên.

Học phải đi đôi với hành, on the job training là một lộ trình vừa phát triển nhanh vừa học hiệu quả. Nếu bạn là một người mới, từ một lĩnh vực khác chuyển sang thì vô cùng khó để học hết tất cả mọi thứ. Bản thân mình từng chỉ sở hữu 70% khả năng trong Fundamental phase thôi nhưng cũng đã đậu vào vị trí DA. Sau đó trong quá trình làm thực tế, kinh nghiệm của mình tăng lên nhanh chóng. Thời gian sau, mình tiếp tục hoàn thiện Intermediate phase. Và giờ là thời điểm mình muốn bản thân Advanced hơn.

Hãy step-by-step bạn nhé!

Trải nghiệm công việc thực tế của mình

Phần đầu mình đã trình bày các nhiệm vụ của DA trong quá trình phân tích dữ liệu. Từ quá trình đấy sẽ áp dụng vào các nhóm công việc chính nào trong công ty. Theo mình thì có thể chia thành 4 nhóm:

  • Reporting: Làm báo cáo định kì tuần/ tháng/ quý/ năm để theo dõi kết quả kinh doanh, hiệu quả của sản phẩm.
  • Build dashboard: Mình làm DA cho một sản phẩm có mobile application. Việc tạo ra dashboard trên Power BI, Tableau theo dõi các performance metrics hằng giờ, hằng ngày là đầu công việc thứ 2.
  • Ad-hoc analysis: Trả lời hàng vạn câu hỏi vì sao của business, của sếp một cách đột xuất.
    • Vì sao hôm qua tỉ lệ người dùng mới thấp đến 80% so với xu hướng?
    • Tại sao tỉ lệ khách hàng thanh toán thành công trên iOS lại thấp hơn 1/2 so với Android?
  • Build strategy thông qua analysis cho một tính năng/ sản phẩm/ long-term project: Mình đã và đang follow theo tính năng eKYC (xác thực khách hàng) trong vòng 1 năm hơn. Liên tục monitor, đánh giá, phân tích để đưa ra strategies cải thiện sản phẩm.

Mình cũng xin phép viết chi tiết hơn phần này trong các bài viết tiếp theo để có thể giúp mọi người hiểu sâu sắc hơn –> Mình đã hoàn thành, bạn có thể xem tại https://madzynguyen.com/cong-viec-data-analyst/

Career Paths cho một Data Analyst

Chọn nghề cho bản thân là một trong những cột mốc quan trọng trong cuộc sống. Chọn đúng nghề, để mỗi ngày thức dậy đều sống trong đam mê, luôn tràn trề tâm huyết trong công việc bản thân đang làm. Làm Data analyst có chăng chỉ mãi mãi là Data analyst?

Bạn có thể tham khảo 4 hướng phát triển sau đây, khi bạn sở hữu năng lực phân tích dữ liệu của một DA:

  1. Data Scientist

Yêu cầu về background chuyên sâu trong lĩnh vực data science, computer science hoặc statistics. Người DS sẽ phải xuất sắc trong programming skills (python, pySpark, R), hiểu rõ về mathematcis (toán), đồng thời xây dựng và tối ưu được các machine learning models. Vì thế có rất nhiều DS khởi đầu hành trình của mình từ vị trí DA.

2. Analysis Specialist

Nếu phát triển lên DS đòi hỏi nhiều chuyên môn khó, hoặc không phù hợp với khả năng. Bạn có thể nghiên cứu chuyên sâu cho mình một lĩnh vực (tài chính, marketing, y tế, giáo dục, thương mại điện tử, …) để trở thành một analysis specialist. Hãy thử nghĩ đến các vị trí sau: Financial analyst, operations analyst, marketing analyst, growth analyst, … Bạn có thích cái nào hơn không?

3. Business Strategy / Consultant

Sở hữu cho mình thật nhiều kinh nghiệm phân tích trong nhiều lĩnh vực, nhiều công ty khác nhau. Bạn có thể nghĩ đến việc trở thành một business strategy. Đó là người làm chiến lược kinh doanh (từ lúc lên kế hoạch, xây dựng, triển khai và tối ưu), chiến lược sản phẩm (toàn bộ product life cycle). Consultant về data analytics là một vị trí đầy hấp dẫn nếu bạn muốn làm việc với nhiều clients, mang kiến thức và kinh nghiệm của mình giúp đỡ những công ty khác.

4. Management

Cuối cùng là con đường phổ biến khi phát triển lên những vị trí quản lý trong mảng analytics. Có thể bắt đầu từ junior –> senior –> leader –> manager –> director of analytics. Và đừng quên trau dồi năng lực leadership để có thể dẫn dắt team members của mình nhé.

Nhìn đi nhìn lại, quả thực trở thành Data analyst là một nghề đầy thú vị và hấp dẫn trong thời điểm hiện tại. Tương lai, “data-driven making decision” sẽ là kim chỉ nam trong việc kinh doanh và quản lý doanh nghiệp. Vì thế sẽ có rất nhiều cơ hội cho các bạn tại thị trường Việt Nam cũng như ở nước ngoài đấy.

Kết

Nhìn lại sau hơn 2 năm làm trở thành Data Analyst, mình cũng đã đạt được một vài thành quả rất có ý nghĩa với riêng cá nhân. Đó là sự kiện thay đổi title từ junior lên middle level sau 5 tháng làm việc. Đó là cột mốc kết thúc năm 2020 khi được ghi nhận là một trong những cá nhân có performance tốt nhất của team. Và đôi lời được khen và động viên từ sếp và đồng nghiệp khi có những bài phân tích sâu sắc và phần trình bày hấp dẫn. Thở phào một cái, thì ra mình cũng có sự phù hợp và niềm đam mê với cái nghề này nhỉ!

Bài viết dài hơi cũng chứa đựng nhiều tâm huyết của mình, cám ơn bạn đã ghé qua.

Nếu bạn thấy hữu ích, giúp mình chia sẻ thêm với mọi người nhé!

Follow Maz tại đây để cùng cập nhật thông báo mỗi khi có bài viết mới nhé:

** Mọi thông tin trên blog đều thuộc bản quyền của blog Maz Nguyen. Vui lòng đọc kĩ Copyright Notice trước khi copy hoặc đăng tải nội dung/hình ảnh của bài viết **

Maz có một dự án dạy học ở đây: Maz Học Data với SQL là course đầu tiên, bạn có thể tham khảo qua nếu thấy cần thiết nhé.


Subscribe

Để lại email nếu bạn muốn nhận thông báo cho các bài viết mới nha!

*
error: Content is protected !!
77
0
Would love your thoughts, please comment.x
()
x