|
提及數(shù)據(jù)分析工具相信小伙伴們都不陌生,但是很多人都會有個疑惑? 數(shù)據(jù)分析工具這么多,它們有什么區(qū)別?哪個更好?哪個更強?我應(yīng)該學(xué)習(xí)哪個? 雖然這個問題有點俗套,但是很重要,我也一直努力在追求這個終極問題的答案。如果大家在網(wǎng)上去搜索這方面相關(guān)的信息,你又很難看到一個公平的觀點。因為評價某一個工具的好壞評論者都可能站在不同的角度,帶上一些個人的感情色彩。 今天我們拋開這些個人色彩的東西,力求客觀地與大家淺談一下我個人對市面上幾款數(shù)據(jù)分析工具的看法,供大家參考。 我共選了三類工具:
下面我一一來介紹: Excel如果說BI工具是戰(zhàn)斗機,R語言、Python是轟炸機,那么Excel就是數(shù)據(jù)分析里的航空母艦,表格制作、數(shù)據(jù)透視表、VBA等等功能強大,Excel的體系龐大到?jīng)]有任何一個分析工具能夠超過它,保證人們能夠按照需求進(jìn)行分析。 當(dāng)然也有人認(rèn)為自己非常精通計算機編程語言,不屑于使用Excel這種工具,因為Excel不能處理大數(shù)據(jù)。但換個思維想想,我們在日常中用到的數(shù)據(jù)是否超過了大數(shù)據(jù)這個極限呢?在我看來,Excel屬于萬能型的選手,解決小數(shù)據(jù)當(dāng)然最適合,加上插件也可以處理百萬級的數(shù)據(jù)。 總結(jié)一下,基于Excel的強大的功能和它的用戶規(guī)模,我的看法是,它是必備工具,你要是想學(xué)數(shù)據(jù)分析Excel絕對是首選,而且是必選! BI工具BI也就是商業(yè)智能,這是為了數(shù)據(jù)分析而生的,它誕生的起點就非常高,目標(biāo)是把從業(yè)務(wù)數(shù)據(jù)到經(jīng)營決策的時間縮短,如何利用數(shù)據(jù)來影響決策。 而我們看Excel的產(chǎn)品目標(biāo)不是這樣的,Excel可以做很多事情,你用Excel可以畫一張課程表,做一份調(diào)查問卷,當(dāng)作計算器來算數(shù),甚至還可以用來畫畫,用VBA寫個小游戲,這些其實都不是數(shù)據(jù)分析功能。 但是術(shù)業(yè)有專攻,BI是專攻數(shù)據(jù)分析的。 就拿現(xiàn)在市面上比較常見的powerBI、FineBI、tableau這些BI工具來說,你會發(fā)現(xiàn)它是完全按照數(shù)據(jù)分析的流程來設(shè)計的,先是數(shù)據(jù)處理、整理清洗,再到數(shù)據(jù)建模,最后數(shù)據(jù)可視化,展現(xiàn)圖表,用圖來講故事,發(fā)掘問題影響決策。 這些是數(shù)據(jù)分析的必經(jīng)之路,同時這個流程里面也存在著從業(yè)者的一些痛點:
這些痛點都是BI工具能夠給我們帶來改變和增值的地方。 那么再來談?wù)凱owerBI、FineBI、Tableau等BI工具之間的對比: 1、Tableau: Tableau的核心本質(zhì)其實就是excel的數(shù)據(jù)透視表和數(shù)據(jù)透視圖,可以說它敏銳地發(fā)覺了Excel的這個數(shù)據(jù)透視特性,較早地切入了BI市場,把這個核心價值發(fā)揚光大了。 從發(fā)展歷史和當(dāng)前的市場的反饋情況看,Tablueau在可視化方面更勝一籌。這個優(yōu)勢我認(rèn)為并不是圖表有多炫酷,而是它的設(shè)計、色彩、操作界面給人一種簡單,清新的感覺。這一點的確是像Tableau自己所宣傳的,投入了很多學(xué)術(shù)性精力研究人們喜歡什么樣的圖表,怎樣在操作和視覺上給使用者帶來極致的體驗。 此外,Tableau也在日趨完善,比如加入數(shù)據(jù)清洗功能和更多智能分析功能。這也都是Tableau可預(yù)計的產(chǎn)品發(fā)展優(yōu)勢。 2、Power BI power bi勝在微軟的商業(yè)模式和產(chǎn)品的數(shù)據(jù)分析功能: PowerBI之前是以Excel插件作為產(chǎn)品,受限于Excel本身這個航母,發(fā)展情況并不理想,于是從Excel的插件中剝離出來,獨立成一門派,脫胎換骨。但作為后來者,每個月都有迭代跟新,追趕速度非???。 powerBI的商業(yè)模式是軟件免費,這樣你不用擔(dān)心盜版、破解版的問題,因為正版都是免費的,這一點相比Tableau的動輒幾千元的售價實在是很有誘惑力;另一方面是數(shù)據(jù)分析功能,就是PowerPivot,DAX語言,它可以讓我用類似Excel寫公式的方式,實現(xiàn)很多非常復(fù)雜的高級分析。 3、Fine BI 再說Fine BI,它的獨到之處就在于自助式BI更適合企業(yè)級用戶。 比如取數(shù),業(yè)務(wù)人員一會一個需求,這里數(shù)據(jù)不對、那里報表格式不對,效率很低。像有些企業(yè)是沒有數(shù)據(jù)分析師這樣的崗位,F(xiàn)ineBI的自助化就能夠?qū)崿F(xiàn)在權(quán)限內(nèi)自己取數(shù)分析,不再讓業(yè)務(wù)和IT互相扯皮。 傳統(tǒng)的BI方式可能會需要ETL架構(gòu)師或者是數(shù)據(jù)建模師等,但是自助式BI所需要的就很少了,基本上是可以完成人工的解放,盡可能地去減少成本。 還有一個比較重要的點是,F(xiàn)ineBI是通過拖拽字段的方式,實現(xiàn)數(shù)據(jù)透視分析的,可以一鍵生成圖表,入門門檻比較低,對于數(shù)據(jù)分析新手來說,比powerBI和tableau要好學(xué)一點。 R語言和python第三類工具,這是最難的回答的。雖然像Excel,Bi工具這些軟件的設(shè)計已經(jīng)盡最大努力考慮到大部分?jǐn)?shù)據(jù)分析的應(yīng)用場景,但本質(zhì)上他們都是定制化的,如果沒有設(shè)計某一項功能,或者開發(fā)某項功能的按鈕,很有可能你就不能完成你的工作。 對于這一點,編程語言就不一樣了,語言是非常強大非常靈活的,你可以隨心所欲地寫代碼執(zhí)行你想要的東西。比如R和Python語言,作為數(shù)據(jù)科學(xué)家的必備工具,從職業(yè)高度上講,這絕對是高于Excel、BI工具的。 那么有哪些應(yīng)用場景,R、Python 可以做,而Excel和BI工具比較難實現(xiàn)呢? 1、專業(yè)的統(tǒng)計分析 以R語言來講,它最擅長的是統(tǒng)計型分析,比如求正態(tài)分布,利用算法歸類聚群,回歸分析等。這種分析就好比把數(shù)據(jù)當(dāng)做一種實驗品,它能夠幫助我們回答的問題: 比如數(shù)據(jù)的分布情況,是正態(tài)分布、三角分布還是其他類型的分布?離散情況如何?是否在我們想要達(dá)到的統(tǒng)計可控范圍內(nèi)呢?不同參數(shù)對結(jié)果的影響的量級是多少?以及假設(shè)性模擬分析,如果某一參數(shù)變化,會帶來多大的影響? 2、個體預(yù)測分析 比如我們想要預(yù)測一位消費者的行為,他會在我們的店里停留多長時間,消費多少,或者通過一個人的淘寶消費記錄判斷他的個人信用情況,制定貸款額度;再或者根據(jù)你在網(wǎng)頁上的瀏覽記錄,推送不同的商品。這也是涉及到目前比較火的機器學(xué)習(xí)、人工智能概念。 總結(jié)以上的對比說明了幾個軟件的差別,我想總結(jié)的是,存在即合理。Excel\BI\編程語言,這些工具在應(yīng)用上有交叉重疊的地方,也有互補的地方。對于重疊的地方,無論是哪種工具,只要你能利用它解決你遇到的問題,它就是最棒的。 選擇哪個工具,首先要了解你自己的工作,是否會用到我剛才提到的那些應(yīng)用場景?;蛘呦胂肽愕膹臉I(yè)方向,是朝著偏重數(shù)據(jù)的數(shù)據(jù)科學(xué)方向發(fā)展,還是偏業(yè)務(wù)的商業(yè)分析方向。 |
|
|