◆ 數(shù)據(jù)挖掘是打開數(shù)據(jù)寶藏的鑰匙
時間:2022-02-24 17:40:02 | 來源:網(wǎng)絡(luò)推廣
時間:2022-02-24 17:40:02 來源:網(wǎng)絡(luò)推廣
人工智能有一個重要的應(yīng)用:數(shù)據(jù)挖掘。作為近年來新興的一門計(jì)算機(jī)邊緣學(xué)科,其在國內(nèi)外引起了越來越多的關(guān)注。
并且隨著數(shù)據(jù)挖掘技術(shù)的不斷改進(jìn)和數(shù)據(jù)挖掘工具的不斷完善,數(shù)據(jù)挖掘必將在各行各業(yè)中得到廣泛的應(yīng)用。
數(shù)據(jù)挖掘是從大量的數(shù)據(jù)中通過算法發(fā)現(xiàn)有價(jià)值信息的過程,這項(xiàng)以數(shù)據(jù)庫技術(shù)、統(tǒng)計(jì)分析、人工智能等為依托的技術(shù)出現(xiàn)有其必然性和可行性。
首先,數(shù)字經(jīng)濟(jì)的到來對數(shù)據(jù)的處理和利用提出了更高的要求,而傳統(tǒng)的數(shù)據(jù)處理方法對大量數(shù)據(jù)無從下手,必然要求有更為先進(jìn)的數(shù)據(jù)處理技術(shù)。
其次,大數(shù)據(jù)和云計(jì)算技術(shù)的不斷發(fā)展,使得借助計(jì)算機(jī)來完成大量數(shù)據(jù)的處理和分析成為可能。
在智慧城市領(lǐng)域,數(shù)字技術(shù)把基礎(chǔ)地理數(shù)據(jù)、正射影像、街景影像數(shù)據(jù)、全景影像數(shù)據(jù)、三維模型數(shù)據(jù)結(jié)合在一起,這產(chǎn)生了大量的地圖數(shù)據(jù),而在智慧城市的建設(shè)和應(yīng)用中,將產(chǎn)生從TB到PB級越來越多的數(shù)據(jù),從而進(jìn)入大數(shù)據(jù)時代。
而對于這些大數(shù)據(jù)來說,傳統(tǒng)的數(shù)據(jù)分析工作已經(jīng)不適合對其進(jìn)行合理的分析,導(dǎo)致了一種數(shù)據(jù)爆炸但知識貧乏的現(xiàn)象。
目前在智慧城市的智慧交通,智慧國土等應(yīng)用中的數(shù)據(jù)庫系統(tǒng)主要局限于實(shí)現(xiàn)數(shù)據(jù)的錄入、查詢、統(tǒng)計(jì)等功能,但無法有效地發(fā)現(xiàn)數(shù)據(jù)中存在的關(guān)系和規(guī)則,很難把握數(shù)據(jù)背后隱藏的知識,無法根據(jù)現(xiàn)有的數(shù)據(jù)預(yù)測未來的趨勢。
這在一定程度上阻礙了智慧城市的應(yīng)用與普及。而數(shù)據(jù)挖掘技術(shù)恰恰是解決這一難題的最佳方法。
應(yīng)用數(shù)據(jù)挖掘技術(shù),可以從GIS數(shù)據(jù)庫中發(fā)現(xiàn)更多的地理知識和地理規(guī)律、對專題數(shù)據(jù)進(jìn)行有效、合理的分析,從而達(dá)到城市的智能運(yùn)行、政府的科學(xué)決策、公眾的便捷生活及企業(yè)的高效運(yùn)營。
在銀行業(yè),數(shù)據(jù)挖掘同樣有很多的應(yīng)用場景,其中一個就是風(fēng)險(xiǎn)管理,如信用風(fēng)險(xiǎn)評估??赏ㄟ^構(gòu)建信用評級模型,評估貸款申請人或信用卡申請人的風(fēng)險(xiǎn)。
一個進(jìn)行信用風(fēng)險(xiǎn)評估的解決方案,能對銀行數(shù)據(jù)庫中所有的賬戶指定信用評級標(biāo)準(zhǔn),用若干數(shù)據(jù)庫查詢就可以得出信用風(fēng)險(xiǎn)的列表。
這種對于高/低風(fēng)險(xiǎn)的評級或分類,是基于每個客戶的賬戶特征,如尚未償還的貸款、信用調(diào)降報(bào)告歷史記錄、賬戶類型、收入水平及其他信息等。
對于銀行賬戶的信用評估,可采用直觀量化的評分技術(shù)。將顧客的海量信息數(shù)據(jù)以某種權(quán)重加以衡量,針對各種目標(biāo)給出量化的評分。
以信用評分為例,通過由數(shù)據(jù)挖掘模型確定的權(quán)重,來給每項(xiàng)申請的各指標(biāo)打分,加總得到該申請人的信用評分情況。銀行根據(jù)信用評分來決定是否接受申請,確定信用額度。
過去,信用評分的工作由銀行信貸員完成,只考慮幾個經(jīng)過測試的變量,如就業(yè)情況、收入、年齡、資產(chǎn)、負(fù)債等?,F(xiàn)在應(yīng)用數(shù)據(jù)挖掘的方法,可以增加更多的變量,提高模型的精度,滿足信用評價(jià)的需求。
毫無疑問,數(shù)據(jù)挖掘是打開數(shù)據(jù)寶藏的一把鑰匙,但是其普及推廣還是難度很大。
主要原因是數(shù)據(jù)挖掘的技術(shù)門檻過高,涉及到機(jī)器學(xué)習(xí)、模型算法、python等很多專業(yè)的技術(shù),一般的IT人員很難掌握。雖然市場上也有一些專業(yè)的平臺軟件,但它們的易用性還是不夠,學(xué)習(xí)起來有一定的難度。所以,一款簡單易用的可視化數(shù)據(jù)挖掘平臺就顯得非常重要。
由思邁特軟件出品的Smartbi Mining操作起來非常簡單,建模、訓(xùn)練、部署等都是在一個界面完成。業(yè)務(wù)人員可以參與,整個過程很直觀。
里面有很多內(nèi)置的模型算法,模型參數(shù)也是默認(rèn)調(diào)整到最優(yōu)狀態(tài),大大降低了使用門檻。而且,系統(tǒng)隨時可以擴(kuò)展,處理海量數(shù)據(jù)也不會出現(xiàn)問題。
關(guān)鍵詞:數(shù)據(jù),鑰匙,寶藏