全程強(qiáng)大的數(shù)據(jù)流和聚合
時間:2022-04-16 14:39:01 | 來源:行業(yè)動態(tài)
時間:2022-04-16 14:39:01 來源:行業(yè)動態(tài)
讓我們從微軟的Power BI公告開始。公告包含了處理從數(shù)據(jù)來源(Azure IoT Hub和Azure Event Hubs)獲得數(shù)據(jù)流的Power BI數(shù)據(jù)流功能(云端的功能就是Power Query)。微軟的團(tuán)隊(duì)承諾稱,它將讓流數(shù)據(jù)和實(shí)時分析像批處理數(shù)據(jù)和常規(guī)分析一樣易于使用不僅僅是針對BI專家和數(shù)據(jù)工程師,還可以適用于商業(yè)用戶。而且由于事件中心(Event Hubs)可以在Apache Kafka兼容模式下工作,因此引發(fā)了一個問題,即該功能是否有一天可以與該開源流事件平臺一起工作。
另一個有趣的功能被稱為自動聚合。要了解此功能,你必須了解作為其基礎(chǔ)的基本聚合功能?;揪酆瞎δ苁鼓憧梢栽诙攘康幕A(chǔ)上預(yù)先計(jì)算聚合,從而獲得出色的性能,特別是針對那些Power BI已經(jīng)通過DirectQuery連接了的數(shù)據(jù)源時,更是如此。DirectQuery可以從后端數(shù)據(jù)源獲取數(shù)據(jù)。
通過聚合,Power BI可以避免一直到后端獲取通用匯總數(shù)據(jù),而將這種方式保留給相對較少的詳細(xì)數(shù)據(jù)集。聚合的問題在于,用戶必須在建模Power BI要查詢數(shù)據(jù)的時候設(shè)計(jì)聚合。這里有一個好消息,自動聚合功能將根據(jù)實(shí)際觀察到的查詢模式自動構(gòu)建這些算法,隨著收集到的此類觀察結(jié)果數(shù)量的增加,它的表現(xiàn)還會變得越來越好。
數(shù)據(jù)流和自動聚合的預(yù)覽版本都將在7月發(fā)布,這兩個功能都是Power BI Premium專有的。由于Premium現(xiàn)在是按用戶提供服務(wù),用戶需要在Power BI Pro的基礎(chǔ)上每個月多支付10美元以使用Premium功能。因此這些功能和更多的用戶都相關(guān)。同時,另一項(xiàng)Premium功能Power BI部署管道(Power BI deployment pipelines)可以獲取面向開發(fā)人員的自動化API(Automation APIs)以支持Azure DevOps、GitHub和Azure Pipelines等工具,讓它們可以自動化地部署Power BI資產(chǎn)。自動化API(Automation APIs)現(xiàn)在已經(jīng)可以使用了。
這里有很多只針對Premium用戶的功能,而高級用戶的定價意味著我們將會看到更多這樣的功能。同時,微軟還發(fā)布了一個很酷的新功能,該功能允許將Power BI報告被內(nèi)嵌到Jupyter筆記本中作為開源Python包。而且它與Power BI Pro兼容,包括可免費(fèi)試用的版本。下圖是一個裝有Power BI的Jupyter筆記本的圖片。
關(guān)鍵詞:聚合,數(shù)據(jù),強(qiáng)大