[Explained] Cách thực hiện mô hình hóa dữ liệu trong Power BI

Spread the love

Bạn mới sử dụng Power BI hoặc muốn biết rõ hơn về nó? Bạn nên bắt đầu với việc lập mô hình dữ liệu trong Power BI, sau đó thực hiện theo cách của mình thông qua việc khai thác dữ liệu và cuối cùng, trích xuất thông tin chi tiết hữu ích từ các báo cáo Power BI.

Mô hình hóa dữ liệu là cốt lõi của bất kỳ dự án phân tích dữ liệu nào. Nó nằm bên dưới bảng điều khiển và trực quan hóa dữ liệu thực tế mà khán giả nói chung nhìn thấy.

Giống như bất kỳ công cụ phân tích dữ liệu nào khác, Power BI cũng cần lập mô hình dữ liệu trong phần phụ trợ để tích hợp dữ liệu, chuyển đổi dữ liệu, tạo mối quan hệ giữa các bảng khác nhau của tập dữ liệu đầu vào, thêm các phép tính, v.v.

Hãy đọc tiếp để tìm hiểu mọi thứ bạn cần biết về lập mô hình dữ liệu trong Power BI, bao gồm hướng dẫn từng bước dễ dàng về cách tạo mô hình dữ liệu Power BI.

Mô hình hóa dữ liệu là gì?

Trong mô hình hóa dữ liệu, bạn tạo một cách trình bày đơn giản về cấu trúc dữ liệu, mối quan hệ và thuộc tính bằng cách liên kết các khối cơ bản của bộ dữ liệu như bảng, hàng, cột, v.v.

Nó giúp tổ chức và hiểu dữ liệu để lưu trữ, truy xuất và phân tích hiệu quả. Mô hình dữ liệu phụ trợ hỗ trợ thiết kế cơ sở dữ liệu, phần mềm và hệ thống.

Mô hình hóa dữ liệu bao gồm việc xác định các thực thể, xác định thuộc tính của chúng và hiển thị cách chúng kết nối với nhau để tạo ra các mẫu và thông tin chi tiết có thể hành động. Điều quan trọng là phân tích dữ liệu, đảm bảo độ chính xác của dữ liệu và hỗ trợ quá trình ra quyết định.

Tầm quan trọng của việc phân tích dữ liệu trong Power BI

Mô hình hóa dữ liệu đóng vai trò then chốt trong các công cụ phân tích dữ liệu như Power BI. Công cụ kinh doanh thông minh này dựa trên các mô hình dữ liệu có cấu trúc tốt để tạo ra những hình ảnh trực quan và hiểu biết sâu sắc có ý nghĩa.

Bằng cách sử dụng các nguyên tắc lập mô hình dữ liệu, bạn có thể kết nối, chuyển đổi và trực quan hóa dữ liệu từ nhiều nguồn một cách hiệu quả trong một tập dữ liệu lớn. Lập mô hình dữ liệu trong Power BI cũng giúp bạn đảm bảo rằng dữ liệu được trình bày trong các công cụ phân tích này là chính xác và phù hợp

Cuối cùng, nó tạo điều kiện thuận lợi cho việc đưa ra quyết định sáng suốt và khai thác toàn bộ tiềm năng của những hiểu biết sâu sắc dựa trên dữ liệu. Về bản chất, nó cũng đóng vai trò là nền tảng để các công cụ phân tích dữ liệu mạnh mẽ như Power BI có thể cung cấp thông tin kinh doanh có giá trị.

Các loại mô hình dữ liệu

#1. Mô hình hóa dữ liệu khái niệm

Nó tập trung vào bức tranh lớn của dữ liệu. Vì vậy, mô hình hóa khái niệm thể hiện dữ liệu ở mức cao mà không xem xét các cấu trúc cơ sở dữ liệu cụ thể hoặc các chi tiết kỹ thuật. Khái niệm này hỗ trợ việc sắp xếp dữ liệu phù hợp với mục tiêu của tổ chức và giúp các bên liên quan hiểu được mục đích và tầm quan trọng của dữ liệu.

  6 giải pháp lưu trữ OpenCart tốt nhất cho cửa hàng từ nhỏ đến lớn

#2. Mô hình hóa dữ liệu vật lý

Khi bạn lập mô hình tập dữ liệu của mình dựa trên khía cạnh triển khai kỹ thuật để lưu trữ và truy xuất, đó là mô hình hóa dữ liệu vật lý. Nó chỉ định các cấu trúc lưu trữ dữ liệu, như bảng, chỉ mục và ràng buộc mà bạn có thể sử dụng trong hệ thống cơ sở dữ liệu.

#3. Mô hình hóa dữ liệu logic

Mô hình hóa dữ liệu logic thu hẹp khoảng cách giữa mô hình khái niệm và vật lý. Mô hình hóa như vậy đóng vai trò như một kế hoạch chi tiết cho thiết kế cơ sở dữ liệu và tạo điều kiện giao tiếp giữa các bên liên quan trong kinh doanh và nhóm kỹ thuật trong khi vẫn duy trì tính toàn vẹn và nhất quán của dữ liệu.

Kỹ thuật lập mô hình dữ liệu trong Power BI

#1. Lược đồ sao

Lược đồ hình sao là một kỹ thuật mô hình hóa dữ liệu được sử dụng nhiều trong Power BI. Theo cách tiếp cận này, có một Bảng dữ kiện trung tâm chứa các số liệu và thước đo chính, được bao quanh bởi các Bảng thứ nguyên cung cấp ngữ cảnh cho dữ liệu. Nó được gọi là “ngôi sao” vì Bảng dữ kiện nằm ở trung tâm, được kết nối với các Bảng thứ nguyên giống như các điểm của một ngôi sao.

#2. Hồng y

Cardinality xác định mối quan hệ giữa các bảng trong Power BI. Nó chỉ định có bao nhiêu giá trị duy nhất trong một bảng khớp với các giá trị trong bảng khác. Các tùy chọn số lượng bao gồm Một đến Một, Một đến Nhiều và Nhiều đến Một. Việc chọn đúng số lượng là rất quan trọng để mô hình hóa dữ liệu chính xác.

#3. Hướng lọc chéo

Cách bộ lọc được áp dụng trên dữ liệu trong một bảng được liên kết sẽ tác động đến dữ liệu của bảng kia được gọi là hướng bộ lọc chéo. Có hai loại hướng lọc chéo và chúng như sau:

Đơn

Hướng bộ lọc chéo đơn là một tùy chọn mối quan hệ trong đó các bộ lọc chỉ có thể chảy theo một hướng, thường là từ Bảng thứ nguyên đến Bảng sự kiện. Nó đảm bảo rằng việc lọc Bảng thứ nguyên ảnh hưởng đến Bảng sự kiện chứ không ảnh hưởng ngược lại.

Hai chiều

Bộ lọc chéo hai chiều cho phép các bộ lọc di chuyển theo cả hai hướng giữa Bảng sự kiện và Bảng thứ nguyên. Nó có thể hữu ích trong một số trường hợp nhưng nên sử dụng thận trọng vì nó có thể dẫn đến kết quả không mong muốn nếu không được quản lý đúng cách.

#4. Lược đồ bông tuyết

Tín dụng hình ảnh: Tìm hiểu.Microsoft.Com

Lược đồ bông tuyết là một phần mở rộng của Lược đồ hình sao, trong đó các Bảng thứ nguyên được chuẩn hóa sâu hơn thành các thứ nguyên phụ. Điều này tạo ra một lược đồ có cấu trúc hơn nhưng phức tạp hơn. Mặc dù có thể giảm sự dư thừa dữ liệu nhưng có thể cần nhiều nỗ lực hơn để điều hướng trong Power BI.

#5. Bảng tra cứu

Bảng tra cứu là Bảng thứ nguyên chứa thông tin tham khảo, như chi tiết sản phẩm hoặc dữ liệu địa lý. Chúng được sử dụng để làm phong phú thêm dữ liệu trong Bảng sự kiện, cung cấp bối cảnh bổ sung cho việc phân tích.

#6. Bảng dữ liệu

Bảng dữ liệu là một thuật ngữ đôi khi được sử dụng thay thế cho Bảng sự kiện. Chúng chứa dữ liệu chính, bao gồm các thước đo và khóa ngoại, đồng thời đóng vai trò là nền tảng để xây dựng các báo cáo và trực quan hóa Power BI.

Lợi ích của việc lập mô hình dữ liệu trong Power BI

  • Lập mô hình dữ liệu Power BI cho phép bạn liên kết nhiều bảng dữ liệu để bạn có thể lấy dữ liệu từ các bảng này khi phân tích toàn bộ tập dữ liệu, tạo báo cáo hoặc xây dựng bảng thông tin.
  • Các mô hình dữ liệu có cấu trúc tốt cho phép trực quan hóa hấp dẫn và có ý nghĩa trong Power BI.
  • Khán giả nói chung có thể dễ dàng tương tác với khía cạnh trực quan của dữ liệu khi có mô hình dữ liệu cơ bản.
  • Các mô hình dữ liệu Power BI được tối ưu hóa giúp bạn truy vấn dữ liệu nhanh hơn từ cơ sở dữ liệu lớn chứa hàng triệu hàng.
  • Bạn có thể thực hiện phân tích chuyên sâu về một tập dữ liệu lớn bằng cách phân tích tất cả các bảng của tập dữ liệu đó khi có mô hình dữ liệu có cấu trúc trong phần phụ trợ.
  • Ngoài ra, bạn có thể dễ dàng liên kết mô hình dữ liệu này với mô hình dữ liệu khác hoặc tham khảo mô hình dữ liệu trong báo cáo khác với các tập dữ liệu liên kết chéo để trích xuất thông tin chuyên sâu ở cấp độ cao.
  • Bạn có thể kiểm soát và bảo vệ các phần nhạy cảm của dữ liệu cũng như giữ cho phần công khai của dữ liệu luôn mở bằng cách tạo mô hình dữ liệu Power BI và bảo mật chúng bằng quyền truy cập dựa trên vai trò.
  • Nếu bạn làm việc trên một tập dữ liệu không ngừng phát triển theo thời gian thực bằng cách thu thập dữ liệu từ các POS, ứng dụng và thị trường bán lẻ, trước tiên bạn phải tạo mô hình dữ liệu trước khi phân tích toàn bộ tập dữ liệu khi nó phát triển mỗi ngày.
  •   Apple Watch bị kẹt logo Apple? 9 cách để khắc phục!

    Cách thực hiện mô hình hóa dữ liệu trong Power BI

    Tạo mô hình dữ liệu trong Power BI thực sự đơn giản. Dưới đây là các bước bạn phải tuân theo:

    Nhập tập dữ liệu của bạn vào Power BI

    Trước tiên, bạn phải nhập tập dữ liệu của mình vào Power BI. Bạn có thể nhập bao nhiêu tập dữ liệu tùy thích hoặc nhập tập dữ liệu có nhiều đối tượng dữ liệu như bảng, cột, hàng, v.v.

    Power BI sẽ tự động phân tích tập dữ liệu hoặc đối tượng dữ liệu đã nhập và tạo mô hình dữ liệu chính dựa trên tên của tiêu đề cột hoặc tiêu đề bảng.

    Để nhập tập dữ liệu, hãy làm theo các bước sau:

    • Mở ứng dụng máy tính để bàn Power BI.
    • Nó sẽ hiển thị không gian làm việc Power BI cùng với màn hình giật gân.
    • Nhấp vào Nhận dữ liệu.
    • Trên hộp thoại Lấy dữ liệu, bạn có thể chọn danh mục dữ liệu bạn muốn nhập trong ngăn điều hướng bên trái và các nguồn hoặc loại dữ liệu trong ngăn điều hướng bên phải.
    • Lựa chọn loại nguồn dữ liệu mặc định là Tất cả.
    • Vì tập dữ liệu của tôi nằm trong sổ làm việc Excel nên tôi sẽ chọn tùy chọn Sổ làm việc Excel ở bên phải và nhấp vào Kết nối.

    • Trên hộp thoại Mở, điều hướng đến tệp Excel bạn muốn nhập trên PC và bấm đúp vào tệp để nhập vào Power BI.

    • Bây giờ, bạn sẽ ở trong hộp thoại Điều hướng.
    • Ở đó, đánh dấu chọn các đối tượng dữ liệu bạn muốn nhập vào báo cáo Power BI.
    • Nhấp vào Tải để hoàn tất quá trình nhập dữ liệu trong Power BI.

    Tạo mô hình dữ liệu Power BI

    Khi bạn bấm vào nút Tải trên Bộ điều hướng, Power BI sẽ bắt đầu phân tích tập dữ liệu, tạo mô hình đối tượng dữ liệu, tạo mô hình dữ liệu và cuối cùng đưa bạn đến tab Chế độ xem báo cáo.

    Nếu nhấp vào menu Chế độ xem bảng trên bảng điều khiển bên trái, bạn sẽ có được chế độ xem dạng bảng của tất cả các đối tượng dữ liệu bạn vừa nhập vào Power BI.

    Power BI sẽ không tự động lưu công việc của bạn. Vì vậy, bạn cần nhấp vào Tệp trên menu ruy-băng rồi nhấp vào Lưu trên bảng điều khiển bên trái để lưu tệp vào một vị trí trên PC của bạn.

    Bây giờ, chúng ta tìm hiểu sâu hơn về quy trình lập mô hình dữ liệu trong Power BI. Thực hiện theo các bước sau:

    • Nhấp vào tab Chế độ xem mô hình trên bảng điều khiển bên trái của không gian làm việc Power BI.
    • Bây giờ bạn sẽ thấy mô hình dữ liệu mặc định được tạo bởi Power BI.
    • Trong ví dụ hiện tại, đó là lược đồ hình sao vì có một bảng sự kiện ở giữa và bảng sự kiện được bao quanh bởi các bảng thứ nguyên.

    • Hiện tại, Power BI không phải lúc nào cũng có thể tạo chính xác các kết nối mô hình dữ liệu mà bạn cần.
    • Trong ví dụ hiện tại, nó không thể kết nối bảng dữ kiện với thứ nguyên Table24 mặc dù có các tiêu đề cột tương tự Địa lý và Địa lý.
    • Nó không thể làm điều đó vì các tiêu đề cột không khớp.
    • Hai kết nối Table24 với bảng dữ kiện Dữ liệu chính, chỉ cần kéo đối tượng Geo của Table24 vào phần tử Địa lý của bảng dữ kiện ở giữa.
      Pretexting là gì và làm thế nào để bảo vệ bản thân khỏi nó?

    Đó là nó! Bạn đã tạo thành công mô hình dữ liệu trên Power BI. Tìm bên dưới ý nghĩa của các đối tượng khác nhau trên các đường quan hệ:

    • Một ngôi sao ở cạnh bảng dữ kiện và số 1 ở cạnh bảng chiều biểu thị kết nối một-nhiều.
    • Mũi tên trên đường kết nối giữa hai bảng trên Power BI cho biết hướng của bộ lọc. Khi cạnh nhọn của mũi tên đối diện với bảng dữ kiện, bất kỳ bộ lọc nào được áp dụng cho bảng chiều sẽ ảnh hưởng đến bảng dữ kiện.

    • Khi có hai mũi tên, bộ lọc sẽ tác động đến bảng của cả hai bên, đó là bảng thực tế và bảng thứ nguyên.

    Trực quan hóa dữ liệu của bạn

    Dưới đây là cách bạn có thể trực quan hóa tập dữ liệu của mình để rút ra những hiểu biết sâu sắc hữu ích:

    • Nhấp vào tab Chế độ xem báo cáo.
    • Chọn bất kỳ biểu đồ nào từ phần Trực quan hóa ở bên phải.

    • Tôi đã chọn biểu đồ cột xếp chồng.
    • Mở rộng bộ dữ liệu ở phía bên phải của không gian làm việc Power BI.

    • Kéo và thả các mục trên trường trục X và trục Y trên trình chỉnh sửa biểu đồ.
    • Power BI sẽ tự động tạo biểu đồ cho bạn.

    Các trường hợp sử dụng mô hình hóa dữ liệu trong Power BI

    Tạo báo cáo toàn diện

    Để tạo báo cáo hoặc bảng điều khiển đa chiều trên Power BI, bạn phải sử dụng chức năng mô hình dữ liệu Power BI. Dữ liệu trong một bảng có thể không đủ ý nghĩa. Tuy nhiên, khi bạn mang dữ liệu từ các bộ dữ liệu và đối tượng khác nhau, bạn có thể trực quan hóa dữ liệu theo cách tốt hơn.

    Tích hợp dữ liệu

    Giả sử có nhiều tập dữ liệu hoặc bảng dữ liệu trong sổ làm việc Excel hoặc cơ sở dữ liệu SQL nguồn. Thay vì tạo các báo cáo Power BI khác nhau, bạn có thể kết nối tất cả chúng trong lược đồ ngôi sao hoặc bông tuyết và trực quan hóa chúng một cách tổng thể. Bạn có thể kể chuyện dữ liệu tốt hơn bằng cách thống nhất tất cả các đối tượng dữ liệu.

    Làm sạch và chuyển đổi dữ liệu

    Việc bạn có cần dọn dẹp và chuyển đổi tập dữ liệu thô hay không chỉ trở nên rõ ràng khi cố gắng tạo mô hình dữ liệu Power BI.

    Ví dụ: nếu công cụ không thể liên kết các cột hoặc bảng dữ liệu liên quan trong mô hình dữ liệu thì có thể có sự không khớp trong tiêu đề cột. Vì vậy, bạn biết những gì để sửa chữa.

    Một ví dụ khác có thể có nhiều hơn một phần tử trong bảng. Giả sử chỉ có 4 khu vực địa lý trong tập dữ liệu là US, CA, UK và DE. Nhưng mô hình dữ liệu đang hiển thị phần bổ sung, đó là Trống. Đó là vì một số tên địa lý chứa khoảng trắng không cần thiết và do đó Power BI phân loại chúng trong một thành phần địa lý mới.

    Kiểm soát khả năng hiển thị dữ liệu

    Bạn có thể hạn chế người có thể xem nội dung trong báo cáo hoặc bảng thông tin Power BI của mình bằng cách sử dụng tab Chế độ xem mô hình. Bằng cách nhấp vào biểu tượng con mắt trên mỗi thẻ dữ liệu trên không gian làm việc của mô hình dữ liệu Power BI, bạn có thể ẩn hoặc hiện bảng.

    Nếu có nhiều cột trong thẻ dữ liệu, bạn cũng có thể tùy chỉnh mức độ hiển thị của các cột đó.

    Thao tác với các bảng dữ liệu đã chọn

    Mỗi bảng dữ liệu trên giao diện mô hình dữ liệu Power BI đều đi kèm với Tùy chọn khác hoặc biểu tượng ba chấm. Ở đó, bạn có thể khám phá các hoạt động sau mà bạn có thể thực hiện trên bảng dữ liệu đã chọn:

    • Thước đo hoặc cột mới
    • Làm mới dữ liệu
    • Quản lý các mối quan hệ
    • Làm mới gia tăng
    • Quản lý tập hợp
    • Và nhiều cái khác

    Phần kết luận

    Vì vậy, đó là tất cả về việc tạo ra một Power BI mô hình dữ liệu để trực quan hóa các tập dữ liệu lớn và phân tán trong một báo cáo hoặc bảng thông tin logic.

    Cho đến nay, bạn đã tìm hiểu về các kỹ thuật lập mô hình dữ liệu khác nhau trong Power BI. Ngoài ra, bạn đã tìm thấy các bước để tạo mô hình dữ liệu Power BI từ đầu. Thực hiện theo các bước và tạo mô hình dữ liệu của riêng bạn ngay lập tức.

    Tiếp theo, các khóa học phân tích dữ liệu tốt nhất để bắt đầu sự nghiệp phân tích dữ liệu hoặc khoa học dữ liệu của bạn.

    x