Hi mọi người, chuyện là Maz đã hoàn thành xong 8 khóa học trong lộ trình của chứng chỉ Google Data Analytics hồi tháng 2 vừa qua. Nhưng vì mải mê vui chơi sau khi có chứng chỉ, nên đến tận bây giờ mình mới có thể viết review và chia sẻ cho mọi người được 🙂

Nội dung bài viết lần này gồm có:

  1. Google Data Analytics là gì?
  2. 3 lý do mình muốn chinh phục chứng chỉ này
  3. Mình đã học được gì trong lộ trình 8 courses của Google
  4. Đánh giá của mình về chứng chỉ Google Data Analytics
  5. Lời khuyên dành cho bạn

1. Google Data Analytics Certificate là gì?

Vào tháng 3 năm 2021 Google đã chính thức ra mắt một chương trình đào tạo trong lĩnh vực Data là Data Analytics Professional Certificates. Cụ thể nội dung và mục tiêu của chương trình này là trang bị kiến thức cũng như kĩ năng cho những ai muốn bắt đầu trở thành một Data Analyst.

Với định nghĩa về Data Analytics từ Google:

"Data analysis is the collection, transformation, and organization of data in order to draw conclusions, make predictions, and drive informed decision-making. Data analytics in the simplest terms is the science of data. It's a very broad concept that encompasses everything from the job of managing and using data to the tools and methods that data workers use each and every day"

Có hai khái niệm được Google đề cập trong nội dung trên. Đầu tiên là “Data analysis”, nó khá giống với quá trình phân tích dữ liệu mà mình từng chia sẻ trong các bài viết trước. Bắt đầu từ việc thu thập, tổ chức lưu trữ cho đến chuyển hóa, phân tích và đưa ra các đề xuất. ‘”Data analytics” là một thuật ngữ rộng hơn khi nó đề cập đến bất kể một công việc nào cần sử dụng dữ liệu đến các công cụ phân tích trong vận hành hằng ngày.

Từ đó, định hướng mà Google mang tới trong khóa học của mình là trang bị cho học viên kiến thức và cả kĩ năng trong lĩnh vực data analytics.

2. Lý do khiến mình muốn chinh phục chứng chỉ Google Data Analytics

  • Đầu tiên, mình bị ấn tượng bởi độ “Hot” bởi chứng chỉ này do Google cung cấp, một công ty siêu to khổng lồ và có danh tiếng không thể chối từ. Ngoài ra, nếu bạn lên internet và tìm kiếm các khóa học dành cho Data Analytics thì Google Data Analytics Certificate luôn xuất hiện ở top đầu và được rất nhiều người khuyến nghị.
  • Thứ hai, mình rất muốn biết và muốn xem ở ngoài kia, thế giới đang bàn luận, định nghĩa về Data Analyst như thế nào. Đặc biệt là ở Google, một công ty công nghệ lớn và danh tiếng thì họ đang sử dụng data ra sao, công việc của người làm phân tích dữ liệu như thế nào.
  • Cuối cùng, mình biết ở Việt Nam có rất nhiều bạn trẻ đang bắt đầu định hướng tham gia và lĩnh vực này. Vì thế việc học một chứng chỉ trong ngành là cần thiết với các bạn. Mọi người hay hỏi Maz nên chọn khóa học nào đây? Để tư vấn được cho các bạn thì mình cũng muốn học qua để có thể chia sẻ thực tế hơn thay vì là ngồi đọc thông tin giới thiệu đơn giản của từng khóa.

3. Mình học được gì trong lộ trình của Google Data Analytics Certificate

A. Các công cụ mình được học và thực hành

  • Spreadsheets: Phân tích dữ liệu với Excel và Google Sheets
  • SQL (Structured Query Language): Truy vấn và xử lý dữ liệu với SQL
  • Tableau: Trực quan hóa dữ liệu và tạo dashboard
  • R và các thư viện Tidyverse: Xử lý, phân tích và trực quan hóa dữ liệu

Với 4 tools mà Google giảng dạy, mình đã trau dồi được gần như là đầy đủ các technical skills để trở thành một người làm phân tích dữ liệu. Từ việc xử lý data đơn giản trên Excel, truy vấn data trong cơ sở dữ liệu bằng SQL, trực quan hóa với BI tool như Tableau và cả việc dùng 1 programing language như R để phân tích. Chỉ có một trở ngại rằng, so với Power BI và Python thì Tableau và R có vẻ ít phổ biến hơn. Vì thế, sẽ khó cho các bạn nào có định hướng học Power BI và Python.

B. Các kĩ năng mình được Google dạy khi làm phân tích

Trong lộ trình này, mình học tổng cộng 8 khóa học tương ứng với 6 giai đoạn trong quá trình làm phân tích dữ liệu kết hợp với khóa mở đầu giới thiệu các khái niệm và khóa cuối cùng là thực hiện một project.

Nội dung cụ thể từng course như sau:

Course 1: Foundations: Data, Data, Everywhere!

Google sẽ giải thích một số khái niệm cơ bản trong trong môi trường và công việc phân tích dữ liệu như data ecosystem, data analysis process, data roles and qualifications of a data analyst. Từ đó bạn sẽ có được những kiến thức tổng quan nhất, cũng như hiểu được vì sao Google lại chia nội dung học thành 8 courses vì nó tương ứng với các giai đoạn phân tích dữ liệu mà Google đề xuất.

Điểm sơ qua các nội dung tiêu biểu mà mình học được trong khóa này:

  • The 5 essential skills of a Data Analyst
  • The 5 key aspects of Analytical Thinking
  • Variations of the data life cycle
  • 6 steps of Data Analysis
  • Tools a Data Analyst uses in a Data Ecosystem

Course 2: Ask Questions to make Data-Driven Decisions

Mọi người thường nghĩ Data Analyst chỉ làm phân tích trong lúc xử lý data để tìm ra insights. Nhưng thực tế là mình đã thực hiện việc phân tích ngay từ khi tiếp nhận một yêu cầu hay một bài toán. Mình phải phân tích rõ các khía cạnh của yêu cầu bằng việc đặt những câu hỏi cần thiết cho đối tác, từ đó xây dựng được cho mình chiến lược phân tích và giải quyết vấn đề.

Các điểm chính trong khóa này:

  • Asking effective Questions using SMART Methodology
  • 6 common types of problems:
  • Small data and big data
  • Types of Stakeholders and their roles in the project
  • How to work with the stakeholders and tips for Communication

Phải nói rằng, khi học xong course này mình càng thấy rõ tầm quan trọng của việc xác định đúng vấn đề và hướng giải quyết khi bắt đầu phân tích một bài toán.

Course 3: Preparing Data for Exploration

Chuẩn bị dữ liệu là giai đoạn thứ hai trong “Data analysis process”. Bước này vô cùng quan trọng vì đơn giản không có đủ dữ liệu thì bạn chẳng thể nào làm phân tích được cả.

Các nội dung tiêu biểu:

  • Data sources
  • Differentiate between data format & structures
  • Data types and how to identify good data
  • Data modeling levels and techniques
  • Understanding bias, credibility, privacy, ethics, and access
  • SQL Basics with BigQuery
  • Getting started with Linkedin and Kaggle.

Mình ấn tượng rất nhiều nội dung khóa này như là: làm sao để phân biệt tính đúng đắn và toàn vẹn của dữ liệu, cách cấu trúc và tổ chức các loại data cũng như cung cấp một số nguồn để lấy data như Kaggle hay GitHub.

Course 4: Process Data from Dirty to Clean

Tiếp nối nội dung của khóa số 3 (chuẩn bị dữ liệu đầy đủ và đảm bảo tính toàn vẹn của dữ liệu). Ở course số 4, mình được tiếp cận các phương pháp chuẩn hóa và làm sạch dữ liệu một cách chỉn chu và có phương pháp.

Điểm qua một vài nội dung thú vị nhé:

  • Describe statistical measures associated with data integrity including statistical power, hypothesis testing, and margin of error

Một số kiến thức thống kê se được nhắc đến: sample, population, margin of error, A/B testing và confidence interval, …

  • Why data integrity is important?
  • What to do when you find an issue with your data?
  • Data Cleaning techniques
  • Cleaning Data in Spreadsheets and SQL
  • Documenting Data Cleaning process

Course 5: Analyze Data to Answer Questions

Chuyện gì tới cũng sẽ tới, giai đoạn phân tích ở đây rồi. Mục tiêu của course này là giúp mình hiểu rõ goals và những nhiệm vụ chính trong lúc khai phá insights từ dữ liệu. Ngoài ra, SQL sẽ được hướng dẫn nhiều ở khóa này.

Các nội dung chính bao gồm:

  • Aggregating data for analysis
  • Organizing Data for analyzing
  • Sorting Data in Spreadsheet and SQL
  • Converting and Formatting Data
  • Combining multiple Datasets
  • Data aggregation using VLOOKUP and JOINS
  • Pivot Tables and Data Validation process.

Thú vị nhất theo mình là các phần kiến thức xử lý dữ liệu với SQL. Xuất phát từ yêu cầu bài toán, bạn được hướng dẫn dùng các phần quan trọng nào của SQL để xử lý.

Course 6: Share Data through the Art of Visualization

Phân tích bằng Excel với SQL rồi, tiếp theo mình sẽ được học phương pháp trực quan hóa dữ liệu bằng Tableau để có thể mang kết quả trình bày với các đối tác một cách hiệu quả hơn.

  • Data visualization and Communicate Data insights
  • Frameworks for organizing Visualizations với The McCandless MethodKaiser Fung’s Junk Charts Trifecta Checkup
  • Principles of Design:
    • Choose the right visual
    • Optimize the data-ink ratio
    • Use orientation effectively
    • Color
    • Numbers of things
  • Phases of Design Thinking
  • Data Storytelling with Tableau
  • A recipe for a powerful visualization

Phải nói đây là một trong những course thú vị nhất. Bởi lẽ có quá nhiều kiến thức hay ho mình đã được học một cách bài bản hơn bao giờ hết.

Course 7: Data Analysis with R Programming

Ngoài dùng Excel, SQL và Tableau để thực hiện hết các quá trình phân tích phía trên, Google còn muốn mang đến cho học viên một loại ngôn ngữ lập trình phân tích dữ liệu là R. Trong khóa này, mình được trang bị các kiến thức như:

  • Basic programming concepts: Các khái niệm cơ bản khi bạn tiếp xúc với một ngôn ngữ mới
  • Exploring R packages: Tìm hiểu các thư viện của R
  • Cleaning Data in R: Làm sạch dữ liệu với R
  • Creating Data Visualizations in R: Trực quan hóa dữ liệu với các thư viện có sẵn

Ngoài ra, trong phần hands-on bạn sẽ được luyện tập trên RStudio từ các mức độ dễ đến khó.

Course 8: Google Data Analytics Capstone: Complete a Case Study

Chương cuối là nơi để mình có thể tổng hợp tất cả các kiến thức và kĩ năng đóng gói lại trong một vấn đề/bài toán thực tế. Có 2 projects được Google cung cấp là:

  • Case Study 1: Cyclistic Bike-Share
  • Case Study 2: Bellabeat smart devices

Sau khi bạn hoàn thành việc xử lý data, phân tích với SQL, Tableau và R thì sẽ phải tổng hợp lại một file báo cáo. Xây dựng thêm porfolio là chuyên mục cuối cùng mà Google hướng dẫn. Cụ thể bạn có thể tạo tài khoản trên GitHub, sau đó đăng tải các sản phẩm của mình lên đó.

Mock interview (phỏng vấn thử) là một phần cũng thú vị. Được xem người của Google tuyển dụng và quá trình phỏng vấn xuyên suốt 3 vòng cũng giúp mình phần nào có nhiều kinh nghiệm hơn.

4. Đánh giá của mình về chứng chỉ này

A. Những điều ấn tượng

  • Lộ trình các khóa học giúp các bạn chưa có kinh nghiệm tích lũy được khá đầy đủ kiến thức và kĩ năng phục vụ công việc của một Junior Data Analyst. Từ cách đặt vấn đề, phương pháp cho đến các kĩ năng như excel, SQL, Tableau, R, …
  • Giảng viên hướng dẫn ở level director/head của nhiều phòng ban có sử dụng dữ liệu trong công ty Google. 8 courses được dạy bởi 8 người, từ đó giúp mình mở rộng nhiều góc nhìn hơn về “thế giới data”
  • Có nhiều khách mời tham gia chia sẻ, tức ngoài giảng viên chính mình còn thấy nhiều videos phỏng vấn nhiều thành viên khác ở Google về vấn đề ở mỗi courses.

B. Những điểm còn thiếu

  • Các kĩ năng dạy chưa thật sự sâu sát: SQL , R, Tableau, Excel. Hầu hết bài giảng và cách tiếp cận được Google thiết kế dựa trên “vấn đề cần gì thì mình học cái đó”. Việc này mang tính áp dụng thực tiễn cao nhưng không đảm bảo bạn sẽ hiểu đầy đủ toàn vẹn kiến thức ở các kĩ năng. Ví dụ như nếu học về SQL, thật sự sẽ còn rất rất nhiều phần kiến thức mình nên học qua chứ không phải “cưỡi ngựa xem hoa” vài nội dung như: SELECT – FROM – WHERE – JOIN – PIVOT – GROUP BY. Tương tự như vậy cho phần của Tableu và R.
  • Khóa học có ở Coursera và có phí 39USD/ tháng. Nếu bạn hoàn thành càng nhanh bạn càng tiết kiệm được tiền. Nếu bạn muốn free thì có thể xin tài trợ từ Coursera.

5. Lời khuyên của Maz

A. Đối tượng phù hợp:

  • Người mới bắt đầu muốn tìm hiểu về Data Analytics và Data Analyst (entry level): Bởi lẽ Google xây dựng khóa học với những nội dung cơ bản nhằm giúp xây dựng nền tảng cho người chưa có kinh nghiệm.
  • Muốn làm đẹp hồ sơ của mình bằng chứng chỉ của Google.
  • Có thể dành ra 8-10 tiếng/ tuần để học và hoàn thành các bài tập.

B. Đối tượng không phù hợp

  • Người đã có kinh nghiệm và kiến thức về Data analytics từ trước. Thật ra mình học là để củng cố kiến thức nền tảng để có trình bày những điều cơ bản này một cách khoa học và dễ dàng. Nếu nói mình học được nhiều kiến thức mới không thì mình phải thừa nhận là không, ngoại trừ mình có học được R.
  • Người muốn sử dụng Power BI cũng như Python. Một cách dễ hiểu rằng nếu bạn học Tableau và R sẽ không phổ biến bằng 2 đối thủ kia.

Kết

Vậy là đã xong nội dung bài viết lần này rồi. Tuy là hơi dài nhưng mà Maz muốn cung cấp cho mọi người nhiều thông tin nhất một cách có thể. Việc chọn lựa một khóa học cho bản thân vô cùng quan trọng vì phía trước bạn sẽ phải đánh đổi thời gian, công sức và tiền cho việc học. Vì vậy hãy cân nhắc thật kĩ và chọn lựa cho mình một nơi phù hợp nha.

Mọi người có thể đọc lại các bài viết mà Maz có nói về SQL và Tableau ở đây nha.

Tham gia nhóm chia sẻ kiến thức Data ở đây: Link nhóm

Follow Maz tại đây để cùng cập nhật thông báo mỗi khi có bài viết mới nhé:

** Mọi thông tin trên blog đều thuộc bản quyền của blog Maz Nguyen. Vui lòng đọc kĩ Copyright Notice trước khi copy hoặc đăng tải lại nội dung/hình ảnh của bài viết **

—————————————————————————————————–

Maz có một dự án dạy học ở đây: Maz Học Data với SQL là course đầu tiên, bạn có thể tham khảo qua nếu thấy cần thiết nhé.

error: Content is protected !!
9
0
Would love your thoughts, please comment.x
()
x