Cách thiết lập làm mới tăng dần trong Power BI [4 Easy Steps]

Hãy đọc hết bài viết này để khám phá những bí quyết thiết lập quá trình làm mới gia tăng trong Power BI nhằm giảm chi phí điện toán của phiên bản đám mây và nhanh chóng nhận được dữ liệu theo thời gian thực.
Khi làm việc với các tập dữ liệu lớn để phân tích thông tin kinh doanh, việc cập nhật dữ liệu từ máy chủ của nó trở nên khó khăn. Cơ sở dữ liệu bạn đang phân tích trên ứng dụng Power BI được cập nhật liên tục trong phần phụ trợ.
Nếu bạn làm mới tập dữ liệu, nó có thể tiếp tục cập nhật hàng giờ và thậm chí nhiều hơn khi nó có dung lượng lớn hoặc nhận nguồn cấp dữ liệu theo thời gian thực từ nhiều máy tự động, như POS bán lẻ, thanh toán trực tuyến, dữ liệu biểu mẫu trực tuyến, v.v.
Để xử lý các tình huống phức tạp như vậy trong quá trình nhập và phân tích dữ liệu trong Power BI, Microsoft đã tích hợp nhiều tính năng làm mới dữ liệu. Khi chức năng này được làm mới dần dần, chức năng này khá phổ biến để nhập và phân tích dữ liệu theo thời gian thực một cách dễ dàng.
Hãy đọc tiếp để tìm hiểu nó là gì, nó làm gì, điều kiện tiên quyết để sử dụng công cụ này trong Power BI là gì và cách thiết lập công cụ này theo các bước đơn giản. Bắt đầu nào!
Cũng đọc: Tableau so với Power BI: Sự lựa chọn tốt hơn vào năm 2023?
Mục lục
Làm mới gia tăng trong Power BI
Làm mới gia tăng là phần mở rộng của quá trình làm mới dữ liệu theo lịch trình trong Power BI. Nó tạo các phân vùng khác nhau của tập dữ liệu trong không gian lưu trữ bằng cách tách biệt các bảng tập dữ liệu được cập nhật thường xuyên.
Hầu hết các cơ sở dữ liệu mà bạn sử dụng đều chứa một số bảng cập nhật thường xuyên vì chúng chứa dữ liệu giao dịch, như số lượng bán hàng, số lượng hàng tồn kho, v.v. Những dữ liệu này có thể tăng theo cấp số nhân theo thời gian, khiến tệp Power BI gốc chiếm dung lượng lớn trên đám mây của bạn hoặc máy chủ tại chỗ.
Tại đây, Power BI có thể sử dụng chính sách làm mới tăng dần để phân vùng bảng dữ liệu theo tham số RangeStart và RangeEnd. Nó cũng có thể sử dụng phân vùng DirectQuery cho dữ liệu thời gian thực. Cuối cùng, dữ liệu bạn truy vấn từ cơ sở dữ liệu đám mây sẽ co lại, do đó, tập dữ liệu đã nhập trên ứng dụng Power BI của bạn trở nên nhỏ hơn và dễ xử lý hơn.
Làm mới tăng dần đảm bảo rằng bạn luôn xử lý dữ liệu mới nhất trong cơ sở dữ liệu lớn chứa hàng triệu hàng.
Ví dụ: bạn có một báo cáo bán hàng chứa dữ liệu của 10 năm. Tuy nhiên, không phải lúc nào bạn cũng cần cập nhật toàn bộ tập dữ liệu. Bạn có thể chỉ cần cập nhật cho tuần trước hoặc lâu hơn.
Trong trường hợp này, nếu bạn thực hiện cập nhật tập dữ liệu đầy đủ, Power BI có thể mất hàng giờ để hoàn thành nhiệm vụ. Thay vào đó, bạn chỉ có thể định cấu hình làm mới tăng dần và tiết kiệm thời gian cũng như tiền bạc cho chi phí điện toán.
Cũng đọc: Chứng chỉ phân tích dữ liệu Microsoft Power BI (PL-300): Cách lấy nó
Tại sao bạn nên sử dụng tính năng Làm mới tăng dần trong Power BI?
Sử dụng tính năng làm mới tăng dần trong Power BI là một bước đi thông minh vì ba lý do chính. Đầu tiên, nó tiết kiệm thời gian và nguồn lực. Thay vì làm mới tất cả dữ liệu mỗi lần, nó chỉ tập trung vào dữ liệu mới hoặc dữ liệu đã thay đổi, giúp báo cáo của bạn nhanh hơn và hiệu quả hơn.
Thứ hai, nó lý tưởng cho các tập dữ liệu lớn. Khi bạn có lượng dữ liệu khổng lồ, việc làm mới mọi thứ có thể chậm và tốn kém. Làm mới tăng dần cho phép bạn chỉ làm mới những gì cần thiết, đảm bảo báo cáo của bạn luôn linh hoạt.
Thứ ba, nó giúp các báo cáo của bạn luôn được cập nhật. Bằng cách nhắm mục tiêu dữ liệu mới nhất, bạn đảm bảo rằng báo cáo phản ánh những thay đổi gần đây nhất trong nguồn dữ liệu của bạn, cung cấp thông tin chi tiết chính xác để đưa ra quyết định tốt hơn.
Các trường hợp sử dụng Làm mới gia tăng
Doanh số bán lẻ
Làm mới tăng dần giúp bạn cập nhật dữ liệu bán hàng hàng ngày mà không cần phải làm lại toàn bộ báo cáo. Do đó, bạn đảm bảo thông tin chi tiết cập nhật để đưa ra quyết định tốt hơn. Nó cũng cho phép bạn theo dõi số liệu tương tác hàng ngày, tiết kiệm thời gian và tài nguyên bằng cách chỉ làm mới dữ liệu mới hoặc phạm vi bạn đã định cấu hình.
Quản lý hàng tồn kho
Nếu bạn cần theo dõi sự thay đổi hàng tồn kho theo thời gian thực và tối ưu hóa mức tồn kho một cách hiệu quả, bạn có thể thiết lập làm mới gia tăng trong các báo cáo Power BI đó. Nó cũng có thể hỗ trợ bạn cập nhật liên tục số liệu thống kê lưu lượng truy cập web để có thông tin chi tiết cập nhật từng phút về hành vi của người dùng.
Báo cáo tài chính
Làm mới tăng dần giúp bạn cập nhật báo cáo tài chính bằng cách chỉ làm mới dữ liệu mới nhất thường xuyên. Bạn cũng có thể cập nhật thông tin cập nhật về chuỗi cung ứng liên quan đến tài chính và cải thiện khả năng phản hồi trước những thay đổi chi phí linh hoạt trong quy trình của chuỗi cung ứng.
Giám sát IoT
Làm mới tăng dần đặc biệt quan trọng trong việc đào tạo và giám sát các thiết bị IoT. Các thiết bị IoT thu thập và gửi một lượng lớn dữ liệu mỗi ngày kể từ khi chúng thu thập dữ liệu theo từng giây. Nếu bạn bắt đầu cập nhật toàn bộ cơ sở dữ liệu được liên kết với một số hệ thống IoT, có thể mất vài ngày để hoàn tất quy trình. Thay vào đó, bạn thiết lập làm mới tăng dần và chỉ cập nhật phần cần thiết trong cả ngày.
Phân tích thị trường chứng khoán
Thị trường chứng khoán là một nguồn phổ biến khác tạo ra các bản cập nhật dữ liệu lớn theo giây. Tại đây, bạn có thể sử dụng tính năng làm mới tăng dần của Power BI để phân tích các chuyển động tăng hoặc giảm của một số giá cổ phiếu nhằm dự đoán chiến lược đầu tư của mình.
Lợi ích của việc làm mới gia tăng trong Power BI
Lợi ích của việc làm mới tăng dần là vô tận, vì bạn có thể sử dụng nó theo nhiều cách khác nhau tùy thuộc vào dự án phân tích dữ liệu và khoa học dữ liệu mà bạn đang thực hiện.
Làm mới hoàn toàn Vs. Làm mới gia tăng trong Power BI
Làm mới toàn bộ Power BI bao gồm việc tải lại tất cả dữ liệu từ nguồn. Đó là một quá trình tốn thời gian và tốn nhiều tài nguyên cho các tập dữ liệu lớn. Nó thay thế toàn bộ tập dữ liệu, ngay cả khi chỉ một phần nhỏ dữ liệu bị thay đổi.
Mặt khác, làm mới tăng dần chỉ cập nhật dữ liệu mới hoặc đã thay đổi, giảm đáng kể thời gian làm mới và mức sử dụng tài nguyên.
Tìm bên dưới sự khác biệt rõ ràng giữa hai chế độ làm mới này của Power BI:
Tính năng so sánh Làm mới hoàn toànLàm mới tăng dầnCập nhật dữ liệuLàm mới tất cả dữ liệu mỗi lầnChỉ làm mới phạm vi ngày/giờ mới hoặc đã thay đổi hoặc được định cấu hìnhThích hợp cho các tập dữ liệu nhỏ với cập nhật không thường xuyênCác tập dữ liệu lớn có cập nhật thường xuyênThời gian làm mới lâu hơnThời gian làm mới nhanh hơnSử dụng tài nguyênSử dụng tài nguyên cao hơnSử dụng tài nguyên thấp hơnDữ liệu lịch sửYêu cầu tải lại tất cả dữ liệu lịch sửGiữ lại dữ liệu lịch sử trong các phân vùng hoặc kho lưu trữ được xác địnhThực -hỗ trợ dữ liệu thời gianHỗ trợ hạn chế cho dữ liệu thời gian thựcHỗ trợ cập nhật dữ liệu theo thời gian thực hoặc gần thời gian thực
Điều kiện tiên quyết của việc làm mới gia tăng
Mặc dù tính năng này rất phổ biến đối với các tập dữ liệu lớn nhưng chưa sẵn có cho đến khi gói Power BI và các tham số tập dữ liệu khác đáp ứng các điều kiện tiên quyết nhất định. Tìm những yêu cầu dưới đây:
#1. Các gói Power BI được hỗ trợ
Tính năng làm mới tăng dần có sẵn cho các bộ dữ liệu Power BI Premium, Premium cho mỗi người dùng, Power BI Pro và Power BI Embedded.
Để cập nhật dữ liệu theo thời gian thực thông qua DirectQuery, hỗ trợ được giới hạn ở các bộ dữ liệu Power BI Premium, Premium cho mỗi người dùng và Power BI Embedded.
#2. Nguồn tập dữ liệu được hỗ trợ
Cập nhật dữ liệu theo thời gian thực lên tập dữ liệu lớn trên báo cáo Power BI thông qua làm mới tăng dần là phù hợp nhất cho cơ sở dữ liệu quan hệ và có cấu trúc như Azure Synapse và Cơ sở dữ liệu SQL. Bạn cũng có thể làm cho nó hoạt động trên các cơ sở dữ liệu khác thông qua cấu hình tùy chỉnh.
Tuy nhiên, tập dữ liệu phải chứa hoặc hỗ trợ những nội dung sau:
Cột ngày/giờ
Cần có cột ngày hoặc ngày/giờ trong tập dữ liệu bạn đang phân tích với quá trình làm mới tăng dần. Các cột này giúp Power BI tạo điểm bắt đầu và điểm kết thúc để dữ liệu được cập nhật từ máy chủ nguồn.
Lọc ngày/giờ
Power BI phải có khả năng lọc tập dữ liệu theo dữ liệu theo ngày, thường thông qua cột ngày trong bảng mục tiêu, có thể là kiểu dữ liệu ngày/giờ hoặc số nguyên trong các nguồn quan hệ. Các tham số RangeStart và RangeEnd, cả ở kiểu dữ liệu ngày/giờ, lọc dữ liệu bảng bằng cột ngày.
Thông số phạm vi
Trước khi có thể bắt đầu thêm các sự kiện làm mới gia tăng trong báo cáo Power BI, bạn phải đưa tập dữ liệu vào Power Query để thêm các tham số theo phạm vi. Sử dụng lệnh Quản lý tham số, bạn phải thêm hai tham số mới có tên RangeStart và RangeEnd cho tập dữ liệu đích.
Bộ dữ liệu hỗ trợ gấp truy vấn
Gấp truy vấn là một kỹ thuật tối ưu hóa cơ sở dữ liệu giúp cải thiện hiệu suất truy vấn bằng cách đẩy càng nhiều công việc xử lý dữ liệu trở lại máy chủ cơ sở dữ liệu càng tốt.
Thay vì truy xuất một lượng lớn dữ liệu từ máy chủ cơ sở dữ liệu, sau đó lọc và xử lý dữ liệu đó trong ứng dụng khách, việc gấp truy vấn cho phép máy chủ cơ sở dữ liệu thực hiện các hoạt động lọc, sắp xếp và tổng hợp trực tiếp trên nguồn dữ liệu.
Nguồn dữ liệu duy nhất
Giả sử bạn đang định cấu hình làm mới tăng dần để nhận dữ liệu thời gian thực cho cơ sở dữ liệu lớn. Hoặc, bạn đang tạo một hệ thống truy vấn cơ sở dữ liệu nâng cao bằng cách sử dụng Mô hình đối tượng dạng bảng (TOM) và Ngôn ngữ tập lệnh mô hình dạng bảng (TMSL) thông qua điểm cuối XMLA. Trong những tình huống như vậy, tất cả các phân vùng dữ liệu, dù là DirectQuery hay Import, đều phải được truy vấn từ một nguồn dữ liệu duy nhất.
#3. Ngày và giờ hệ thống
Cần có quyền truy cập vào ngày và giờ hệ thống để Power BI hiểu thời điểm cần cập nhật dữ liệu tăng dần dựa trên chính sách đã xác định của bạn. Vì vậy, bạn phải luôn đặt ngày giờ hệ thống ở chế độ tự động thay vì thủ công.
Cách thiết lập làm mới tăng dần trong Power BI
Hãy tìm bên dưới bốn bước đơn giản để thiết lập làm mới dần dần ngay bây giờ:
#1. Nhập tập dữ liệu của bạn vào ứng dụng Power BI Desktop
Bạn chỉ có thể định cấu hình báo cáo Power BI của mình để làm mới dần dần từ ứng dụng Power BI dành cho máy tính để bàn. Sau khi xuất bản báo cáo, bạn có thể sử dụng tính năng này để lấy dữ liệu theo thời gian thực hoặc dữ liệu từ một phạm vi đã chọn trong công cụ Power BI Service (phiên bản web của Power BI).
Để nhập tập dữ liệu, hãy làm như sau:
- Khởi chạy ứng dụng Power BI Desktop.
- Nhấp vào nút Nhận dữ liệu trên màn hình giật gân Power BI.
- Trên hộp thoại Lấy dữ liệu, chọn nguồn cơ sở dữ liệu, như Cơ sở dữ liệu SQL Server.
- Nhập chi tiết máy chủ SQL và nhấp vào OK.
- Bây giờ bạn sẽ thấy tập dữ liệu Navigator của cơ sở dữ liệu.
- Chọn một bảng từ Bộ điều hướng và nhấp vào Tải để lấy dữ liệu trong Power BI.
#2. Xử lý tập dữ liệu trên Power Query
Bây giờ, bạn phải chuyển đổi tập dữ liệu trong Power Query để thêm tham số theo phạm vi và lọc ngày/giờ. Đây là cách thực hiện:
- Trên Power BI, đi tới tab Trang chủ trên ribbon và nhấp vào lệnh Chuyển đổi dữ liệu.
- Tập dữ liệu bây giờ sẽ mở trong Power Query.
- Bấm vào cột Ngày.
- Bây giờ hãy nhấp vào Quản lý tham số.
- Trên hộp thoại Quản lý tham số, bấm vào Mới.
- Trong trường Tên, nhập RangeStart.
- Trong trường Giá trị hiện tại, nhập ngày bắt đầu hoặc ngày/giờ của quá trình làm mới tăng dần. Trong hướng dẫn này, đó là ngày 1/1/2023.
- Nhấn OK để áp dụng.
- Thực hiện theo các bước tương tự để thêm tham số RangeEnd cùng với ngày hoặc ngày/giờ mà Power BI sẽ thực hiện làm mới tăng dần.
Bây giờ bạn sẽ có ba mục trong Power Query như trong hình bên dưới.
Bây giờ, chọn cột Ngày và nhấp vào menu thả xuống. Nhấp vào tùy chọn Bộ lọc ngày và sau đó chọn Bộ lọc tùy chỉnh từ menu tràn.
Đối với menu thả xuống đầu tiên, hãy chọn “là sau hoặc bằng”. Nhấp vào hộp bên cạnh và chọn tham số RangeStart.
Sau đó, nhấp vào menu thả xuống thứ hai và chọn “là trước hoặc bằng” rồi thêm tham số RangeEnd.
Bây giờ chỉ cần bấm vào nút Đóng & Áp dụng ở góc trên cùng bên trái của Power Query.
#3. Định cấu hình Làm mới tăng dần trên ứng dụng Power BI Desktop
Trên Power BI, chuyển sang chế độ xem Bảng. Ở bên phải của bảng tập dữ liệu, nhấp chuột phải vào tên bảng hoặc tập dữ liệu mà bạn muốn áp dụng chức năng làm mới tăng dần. Nhấp vào Làm mới tăng dần trên menu ngữ cảnh.
Bây giờ, hãy làm như sau:
- Bật công cụ Đặt phạm vi nhập và làm mới bằng cách trượt nút.
- Nhập giá trị cho các trường sau:
- Bắt đầu lưu trữ dữ liệu
- Bắt đầu làm mới dữ liệu dần dần
- Nhấp vào Áp dụng.
#4. Xuất bản báo cáo
Bây giờ hãy vào lệnh Trang chủ > Xuất bản bên trong khối Chia sẻ. Nhấp vào Xuất bản.
Power BI sẽ yêu cầu bạn lưu tệp trên PC. Làm theo hướng dẫn.
Bấm lại vào Xuất bản và chọn đích đến, chẳng hạn như Không gian làm việc của tôi, rồi bấm Chọn.
Phần kết luận
Vì vậy, bây giờ bạn đã biết cách tận dụng tính năng làm mới gia tăng của Power BI để luôn nhận được dữ liệu theo thời gian thực từ máy chủ nguồn dữ liệu mà không cần cập nhật toàn bộ dữ liệu và phải trả khoản phí rất lớn cho việc sử dụng tài nguyên điện toán đám mây. Bạn cũng tiết kiệm thời gian quý báu trong quá trình này.
Hãy làm theo các bước được đề cập ở trên và thử làm mới dần dần vào lần tiếp theo khi bạn tạo và xuất bản báo cáo cũng như bảng thông tin từ Power BI.
Tiếp theo, Power BI: sự khác biệt giữa báo cáo và bảng thông tin.