作為一名數(shù)據(jù)工作者,我每天會接觸到很多的數(shù)據(jù)可視化成果,美好的可視化作品簡潔明快炫酷非常,讓人心情舒暢。 但是不佳的數(shù)據(jù)可視化也越來越多。比如這張信息圖,通過大大小小的飛機圖標展示某島空軍部署情況,但讀者能從中迅速獲取所表達的信息嗎?如果用“數(shù)字+圖標”重新設計這張圖能否更加清晰?最后,這張圖也是密集恐懼者的一場災難。 我認為目前可視化正在快速進入泡沫期。每天在誕生各類優(yōu)秀作品的同時,會出現(xiàn)數(shù)倍的劣質作品。原因在哪里? 我的答案是—— 技術的發(fā)展激發(fā)了人類過度表達的欲望。 2000年前,那時我們的祖先在竹簡上刻字,鐫刻每一個字都非常辛苦,技術落后使我們的表達簡潔,比如說《老子》五千言,文辭深邃,流轉久遠,陳鼓應先生用厚厚一本書注譯。而現(xiàn)在我們有了電腦輸入法,打字飛快。但是結果呢(如下圖)? 技術的發(fā)展在解放生產力的同時,也解放了過度表達的欲望,而這個勢頭正在數(shù)據(jù)可視化領域重演。 在現(xiàn)代工具的幫助下,我們點兩下鼠標就可以做出精美的圖表,而類似的圖表在三五年前還要需要專業(yè)繪圖者花兩三天才能做出來。傳播就更容易了,輕輕點擊按紐就可以立刻傳到朋友圈讓大家看到。 極簡主義面前,數(shù)據(jù)可視化需要回答的三個問題 這個時代可視化更需要簡潔表達。極簡主義目前很流行,但做到并不容易,一方面是由于技術局限,另一方面是必須努力控制自身表達欲望。一年前我們也經歷了一場理智與欲望的斗爭。 2013年,中國政府啟動了中國第三次全國經濟普查。這是人類歷史上空前的一次壯舉!國家動用了300多萬基層調查員,對960萬平方公里上的1200多萬個經濟單位,進行上千個指標的詳細地毯式普查。 我們的團隊為國家統(tǒng)計系統(tǒng)建設了十多年的統(tǒng)計地理信息系統(tǒng),所以2014年接受了一個光榮而艱巨的任務把全國33個?。ú话ㄅ_灣)328個地市、2000多個縣的數(shù)據(jù)展示在一張地圖上,一共3次經濟普查每個地區(qū)包含90多個指標,總數(shù)據(jù)量達到86萬個。 這個可視化工作很困難。迫使我們去思考三個關鍵的問題:
我想到了多年前看過無印良品的創(chuàng)始人原研哉撰寫的《設計中的設計》,其中提到“Visualogue”的概念,也就是視覺對話??梢栽O想兩個語言、文字不通的陌生人,給他們一張紙,一桿筆,他們一定是最簡潔的方式把自己的想法畫下來交流,這就是用視覺對話。這其實就是數(shù)據(jù)可視化的本質,通過可視化圖表將對領域陌生的讀者用比文字快十倍百倍的速度帶進門。 這給了我一個啟示,了解了人類的對話也許是理解可視化的鑰匙。所以我破解了一次對話。所有對話都從信息源開始,信息經歷通道傳輸給接收者,并形成反饋,此外還需要考慮來自環(huán)境的噪音以及人為噪音——語言中的無效信息。所有對話都是由這樣的基本單元組成。 提升可視化效率的三個方法 參照對話模型就可以發(fā)現(xiàn)數(shù)據(jù)可視化的優(yōu)化密碼。提升對話效率通常有三個方法:
在數(shù)據(jù)可視化領域相對應的三項技術就是數(shù)據(jù)降維、關聯(lián)關系和扁平交互。 1.數(shù)據(jù)降維 數(shù)據(jù)降維被認為是大數(shù)據(jù)處理的首要任務。而迄今為止最有效的降維方法依舊是人類已經使用上千年的分類。在沒有計算機的時代,圖書館使用分類技術讓我們在短時間內可以在成千上萬本書中找到需要的信息。 在地理可視化中也充分利用分類技術,分析發(fā)現(xiàn)86萬數(shù)據(jù)是可以分為時間和地區(qū)兩個分組,而90多個指標可以分為綜合信息,第三產業(yè),第二產業(yè)、能源四大類。這三大維度時間、地區(qū)和指標構成數(shù)據(jù)空間,三個維度值確定就可以獲得唯一的數(shù)據(jù),比如北京市(地區(qū))2013年(時間)的就業(yè)人口總數(shù)(指標); 如果確定兩個維度就可以獲得一個相關的數(shù)據(jù)集,例如2013年(時間)單位總數(shù)(指標),其全國分布圖。
我們在是否嘗試去了解分析自己面對的數(shù)據(jù),良好的數(shù)據(jù)分類整理是實現(xiàn)優(yōu)質的可視化的最好起點。 2.關聯(lián)關系 數(shù)據(jù)本身并無意義,只有相關才能產生含義與價值,所以關聯(lián)關系時則從數(shù)據(jù)到知識躍遷的過程.此過程需要將零散數(shù)據(jù)集聚,叫做信息加工。
可視化不同于文字,知識不是直白的說出來,而是用隱喻方式表達,綜合利用顏色、大小、聯(lián)動等視覺習慣讓讀者在不知不覺中自然感受到數(shù)據(jù)的差異和關聯(lián)。 地圖上不同顏色深淺代表數(shù)據(jù)值的大小,圖標的大小和內容可以代表數(shù)據(jù)總量大小,和不同成分差異。 數(shù)據(jù)聯(lián)動主要體現(xiàn)在人機交互中,隨著鼠標移動數(shù)據(jù)同步變化,此外關聯(lián)的欄目頁隨時更新當前熱點區(qū)域的指標排名和三次經濟普查的變化趨勢,整個過程基本不依賴文字語言,讀者可以直觀感受到數(shù)據(jù)的變化。
良好的數(shù)據(jù)關聯(lián)性分析與處理有助于厘清一份數(shù)據(jù)對于可視化是否有價值,也可以幫助我們選擇合適的可視化方法。 3.扁平交互 計算機與手機屏幕是有限的,每增加一個顏色和要素都會增加進入眼睛的信息量,從而干擾對信息的傳輸,所以要嚴格控制進入用戶眼睛每一個比特,避免沖淡可視化主題。 地理可視化中采取了兩種方式實現(xiàn)數(shù)據(jù)隱藏,一種是逐級鉆取,可以充分利用地域的天然的分級包含關系,使得信息不用不一下子全部展開,而是隨著“省-市-縣”層次逐級展示;另一種是擴展圖示。 將復雜的信息濃縮為簡單的圖標,只有讀者感興趣的時候才點擊展開。
數(shù)據(jù)可視化是一個“謊言” 從某種意義上說可視化是一個“謊言”,現(xiàn)在不缺乏數(shù)據(jù)展示,缺乏的是數(shù)據(jù)隱藏,只有充分的數(shù)據(jù)隱藏才能有效的數(shù)據(jù)展示。這是可視化的關鍵。 什么叫隱藏?不是不讓讀者看到這個數(shù)據(jù),而是分不同的場合、不同的時間段展示不同的數(shù)據(jù),只有當讀者需要了才展示,而不是一下子將所有數(shù)據(jù)鋪開來,否則其實是對數(shù)據(jù)的濫用,也阻礙了讀者獲取信息。 感謝我們不屈不撓,創(chuàng)意無限的優(yōu)秀團隊,感謝你們?yōu)榇税具^的多少個不眠之夜,作為你們的一員,我非常驕傲。
我們也于8月份把作品放在國家數(shù)據(jù)網站上,讓全國乃至全球的讀者都可以分享中國第三次全國經濟普查這項人類壯舉的喜悅。
這就是我們將86萬數(shù)據(jù)放入一張地圖的故事,總結一句話“可視化的本質是簡潔”,也就是俗話說“千言萬語不如一張圖”。
但是為什么還會出現(xiàn)過度表達現(xiàn)象呢?我想這和更愛自己還是更愛世界有關,如果一個人更希望去炫耀自己的技術和數(shù)據(jù),那么很有可能選擇復雜的可視化,如果一個人更關注傳遞給讀者有效信息,那么他肯定會選擇簡潔的可視化。 所以請行動吧,審視自己的每一幅作品,每一段文字,每一張圖片,大膽的剃掉不必要的部分,你會發(fā)現(xiàn)舍棄的越多,你將獲得的會更多。 數(shù)盟網站:www.dataunion.org 數(shù)盟微博:@數(shù)盟社區(qū) 數(shù)盟微信:DataScientistUnion 數(shù)盟【大數(shù)據(jù)群】272089418 數(shù)盟【數(shù)據(jù)可視化群】 179287077 數(shù)盟【數(shù)據(jù)分析群】 174306879 (長按可關注)
點擊[閱讀原文] 國內唯一數(shù)據(jù)可視化在線課程 |
|
|
來自: 昵稱27299644 > 《待分類》