|
入門數(shù)據(jù)可視化的小伙伴往往都會問這樣一個問題:我應(yīng)該從哪里開始學(xué)起,有什么書推薦嗎? 這個問題之所以普遍,是因?yàn)?/span>數(shù)據(jù)可視化是一個相當(dāng)交叉的學(xué)科,既涉及數(shù)據(jù)分析,也涉及設(shè)計(jì)和編程。而這三大方向之中,每一個又可以延伸出許多子領(lǐng)域(例如設(shè)計(jì)里面又可以分出靜態(tài)圖表設(shè)計(jì)、交互圖表設(shè)計(jì)、圖表動畫設(shè)計(jì))。這樣一來,可能的學(xué)習(xí)路徑就非常多樣。然而,目前市面上的可視化書籍各有側(cè)重、缺乏歸類,導(dǎo)致讀者很難高效挑選到最吻合自己學(xué)習(xí)目標(biāo)的讀物。再者,在中文世界里,高質(zhì)量的數(shù)據(jù)可視化讀物還不多,因此,如果想要深入了解這門學(xué)科,就繞不開要閱讀一些英文著作。 基于以上這些原因,倭瓜在回答“我該讀什么書”的時(shí)候,總覺得十分棘手。不過幸運(yùn)的是,最近讀到了一篇文獻(xiàn)綜述,對可視化領(lǐng)域的圖書做了一次系統(tǒng)性梳理。這篇綜述由英國Swansea University的兩位研究人員撰寫,在選書這個問題上給出了很好的指導(dǎo)。我們會首先介紹原版的英文圖書,之后給出相應(yīng)的中文譯本。 可視化領(lǐng)域有多少書? 兩位研究者總共搜集到了86本與數(shù)據(jù)可視化強(qiáng)相關(guān)的書籍。這86本書,涵蓋了可視化基礎(chǔ)理論、信息設(shè)計(jì)原理、可視分析、工具教程等多個方面。 其中,最早的可視化書籍發(fā)布于1967年,是來自Jacques Bertin的《圖形符號學(xué)》(Semiology of Graphics)。此后十幾年,都未有新的可視化書籍發(fā)表。 1983年,Edward Tufte發(fā)表了他的代表作The visual display of quantitative information,這也是可視化領(lǐng)域一本劃時(shí)代的奠基之作。 此后,90年代,又陸續(xù)有幾本新書出現(xiàn)。直到2000年,尤其是2010年以后,可視化相關(guān)書籍才迎來井噴。 這86本書的詳細(xì)列表可在項(xiàng)目網(wǎng)站查看:http://visbooks./ 如何給這些書歸類? ![]() ![]() 從寫作定位來看,這些書可以被歸為6大類: 1.經(jīng)典理論 2.通俗讀物 3.學(xué)術(shù)教材 4.業(yè)界經(jīng)驗(yàn) 5.專項(xiàng)知識 6.工具教程 ![]() 下面我們來自己看看每一類具體都包含哪些書! 經(jīng)典理論 經(jīng)典理論一般是20年以上的奠基性作品,共6本: 1.Jacques Bertin的《圖形符號學(xué)》(Semiology of Graphics)。 Bertin是一名來自法國的制圖師,也是第一個系統(tǒng)地總結(jié)如何設(shè)計(jì)可視化的人。
比如,在這張圖里,Bertin總結(jié)了各種各樣的視覺符號,包括:尺寸、飽和度、紋理、顏色、方向、形狀。同時(shí),他指出了數(shù)據(jù)本身有不同類型,包括關(guān)系類數(shù)據(jù)、順序類數(shù)據(jù)等等。通過將視覺符號與數(shù)據(jù)類型匹配,Bertin總結(jié)出了一系列可能的設(shè)計(jì)方案。
例如,下圖展示了16種地圖的畫法,是不是比現(xiàn)在的很多地圖都好看呢:
2.Edward Tufte的3本書:The Visual Display of Quantitative Information,Envisioning Information,Visual Explanation。 Tufte在可視化領(lǐng)域的影響力毋庸置疑。他最為人稱道的著作就是第一本:The Visual Display of Quantitative Information。 這本書提出的一系列理念,可以說奠定了可視化領(lǐng)域的設(shè)計(jì)準(zhǔn)則。從“派系”而言,Tufte的觀點(diǎn)偏實(shí)用主義和極簡主義,他強(qiáng)調(diào)用理性、客觀的方法,判斷一張圖表是否能夠最高效地傳達(dá)數(shù)據(jù)信息。比如,他提出了數(shù)據(jù)墨水(Data-Ink Ratio)和圖表垃圾(Chartjunk)的概念,強(qiáng)調(diào)應(yīng)該減少與數(shù)據(jù)無關(guān)的墨水。
同一幅折線圖,左邊裝飾主義,右邊極簡主義 3.William Cleveland的2本書:Visualizing Data,The Elements of Graphing Data。
第一本書比較偏向用可視化進(jìn)行數(shù)據(jù)分析,即如何用圖表繪制復(fù)雜的數(shù)據(jù)類型,包括單變量,雙變量,三變量等等。作者提出的這些圖表畫法,在今天的很多統(tǒng)計(jì)軟件里已經(jīng)能常常見到:
用矩陣查看正態(tài)分布 Cleveland的第二本書則主要關(guān)注圖表元素的正確使用,比如圖例、數(shù)據(jù)標(biāo)簽、坐標(biāo)軸等是否清晰。 遺憾的是,這六本書目前都還沒有中文譯本。這里推薦一些中文文章供閱讀:Jacques Bertin與圖形符號系統(tǒng),數(shù)據(jù)可視化有統(tǒng)一規(guī)范嗎。 通俗讀物 通俗讀物一般是向大眾引介可視化概念、用法,并提供一些圖表案例供翻閱。由于是寫給大眾看的入門類書籍,因此不要求讀者有任何專業(yè)背景。
一些例子 影響比較大的有資深圖表設(shè)計(jì)師、數(shù)據(jù)新聞記者Alberto Cairo的三本書:
其中兩本已經(jīng)被翻譯為中文。通過閱讀這些書籍,你可以了解到可視化是如何在真實(shí)數(shù)據(jù)上應(yīng)用的,以及在設(shè)計(jì)可視化時(shí),應(yīng)該避免哪些誤區(qū)或?yàn)E用。
還有一個更加“古早”的項(xiàng)目,Visual Complexity。這個項(xiàng)目從2005年起就開始搜集各種各樣的可視化設(shè)計(jì),十幾年中已經(jīng)搜集了上千個作品,并出版了一部書籍,中文叫“視覺繁美”。
不過,倭瓜最近一次登陸這個網(wǎng)站的時(shí)候,項(xiàng)目似乎已經(jīng)缺乏維護(hù)??粗畮啄昵暗脑O(shè)計(jì),不禁感嘆技術(shù)在進(jìn)步,而美還是一如往常。 與此同時(shí),市面上還有許多“圖冊”類的書籍,主要以印刷可視化作品為主。這類書的好處在于文字很少,因此看英文原版也不會有太大負(fù)擔(dān)。同時(shí),豐富的精選案例,也可以幫助你打開設(shè)計(jì)思路、激發(fā)可視化的想象力。
兩本可愛的可視化畫冊 學(xué)術(shù)教材 第三類書是學(xué)術(shù)教材。這類書一般會系統(tǒng)性、分章節(jié)的講解領(lǐng)域知識,受眾為學(xué)習(xí)該專業(yè)的學(xué)生。
一些例子 比如,下面這本書從 What, Why, How三個層面講解了什么是可視化、為什么需要可視化、以及如何可視化。
書中總結(jié)的視覺通道,比早期Bertin的總結(jié)要更全面一些,還包括斜度、彎曲度、體積、動畫等等。這些通道都可以用來映射數(shù)據(jù):
書中也對可視化設(shè)計(jì)的合理性進(jìn)行了討論。例如,人眼對哪些視覺通道的感知更加準(zhǔn)確:
研究顯示,位置類(Position)的視覺通道在感知上是最準(zhǔn)確的,面積類(Area)則最不準(zhǔn)確 如果你還想更加深入地了解可視化背后的心理學(xué)原理,那么下面這本教材是一個不錯的選擇。這本書基本上逐一介紹了人類對各種視覺元素的感知機(jī)制,包括亮度、色彩、空間感等等。
中文教材方面,目前有浙大陳為老師等編寫的《數(shù)據(jù)可視化》。這本書梳理了可視化領(lǐng)域的學(xué)科分類和研究內(nèi)容,對于想要學(xué)習(xí)可視化專業(yè)的同學(xué)來說是一本必讀入門教材。
還有一些書筆者稱之為“應(yīng)用型教材”,主要關(guān)注如何實(shí)現(xiàn)可視化。例如Nathan Yau的兩本書,中文分別譯為“鮮活的數(shù)據(jù)”和“數(shù)據(jù)之美”。這兩本書偏系統(tǒng)性的實(shí)操教材,包括如何處理數(shù)據(jù)、分析數(shù)據(jù)、如何使用工具畫圖等。
業(yè)界經(jīng)驗(yàn) 這一類的書籍一般是業(yè)界人士的現(xiàn)身說法,結(jié)合業(yè)務(wù)和實(shí)操經(jīng)驗(yàn)進(jìn)行分享。它的目標(biāo)讀者一般是特定行業(yè)的從業(yè)者或?qū)I(yè)人士。
一些例子 例如,《用數(shù)據(jù)講故事》。這本書由谷歌的前人力分析團(tuán)隊(duì)經(jīng)理撰寫,主要講解在了公司業(yè)務(wù)場景里應(yīng)該怎樣繪制數(shù)據(jù)圖表,下圖右邊是它的中文版。
左:英文版;右:中文版 整本書不涉及任何復(fù)雜理論和技術(shù),但是許多小知識、小技巧能切實(shí)提高畫圖的水準(zhǔn)。比如,作者總結(jié)了一些商務(wù)匯報(bào)中常用的可視化類型:
抑或是提出一些改進(jìn)辦法,使得原本簡陋的excel圖表更加美觀得體。下面這張圖其實(shí)無形之中實(shí)踐了Tufte的數(shù)據(jù)墨水理論,減少了許多不必要的元素,使圖表整體更清晰、美觀。
左:改良前;右:改良后 總體而言,倭瓜認(rèn)為這本書很適合有日常作圖需求的辦公室人群,幾乎不需要專業(yè)知識背景,會比學(xué)術(shù)教材更加通俗易懂。當(dāng)然,有的時(shí)候,所謂的“業(yè)界”、“學(xué)界”并不是那么涇渭分明的。學(xué)術(shù)研究,往往也需要吸納很多業(yè)界的需求,而學(xué)術(shù)產(chǎn)生的成果也常常會應(yīng)用于實(shí)踐中。 以下面這本書為例,這本書的主題也是“用數(shù)據(jù)講故事”,但作者們都是資深的可視化研究人員。不過,盡管仍保留著學(xué)術(shù)的嚴(yán)謹(jǐn)性,書籍的整體風(fēng)格并不晦澀,里面的文章也都不是嚴(yán)格意義上的論文,而是夾雜了許多觀點(diǎn)、評論和案例。筆者認(rèn)為這是一個跨越固有邊界、促進(jìn)思維碰撞的有益嘗試。
這本書暫時(shí)只有英文版 還有不少書專門講解商業(yè)儀表盤的制作經(jīng)驗(yàn):
或者是定位于設(shè)計(jì)師的經(jīng)驗(yàn)分享:
因此,在選書時(shí),最好認(rèn)準(zhǔn)自己本行業(yè)專家撰寫的圖書。 專項(xiàng)知識 專項(xiàng)知識類圖書一般解決一個具體的領(lǐng)域問題,一般是偏技術(shù)類的問題,例如如何針對安全類數(shù)據(jù)進(jìn)行可視化、如何對多維度數(shù)據(jù)進(jìn)行降維展示、如何對城市規(guī)劃數(shù)據(jù)進(jìn)行可視分析等等。 這些書往往是眾多學(xué)術(shù)研究成果的集成品,因而相對專業(yè)艱深,適合領(lǐng)域?qū)<已凶x。目前這一類的圖書的中文譯本還很少,因此不做過多介紹了。
一些例子 工具教程 這一類圖書主要講解某個工具的具體用法和操作步驟。而工具的種類也非常繁多,且以編程語言和軟件為主(如Python, D3.js, Processing)。這類圖書中文譯本不少,且中國本土也有很多人撰寫此類書籍。
然而,這類書也存在一些潛在問題,比如,教學(xué)的質(zhì)量不高、光是看書難以學(xué)會實(shí)操,以及工具本身更新?lián)Q代速度快等等。尤其是中文的技術(shù)類圖書,灌水的比例更大。因此筆者認(rèn)為,在學(xué)技術(shù)時(shí),讀書可能會幫助理解技術(shù)的構(gòu)建方式和底層邏輯。但要熟練掌握這門技術(shù),還是要依靠不斷的上手練習(xí)和項(xiàng)目實(shí)戰(zhàn)。
否則就會這樣 最后打個總結(jié)。如下圖所示,總體而言,早期的書籍以經(jīng)典理論(藍(lán)色)為主,而近年來則出現(xiàn)了越來越多工具教程(紫色)以及面向大眾用戶的通俗讀物(綠色)。同時(shí),也出現(xiàn)了一些內(nèi)容更綜合的書籍,例如在分享案例的同時(shí),提供工具教程(藍(lán)黑色)。當(dāng)然,當(dāng)我們書架上的選擇越來越豐富的時(shí)候,辨別好書也就越來也重要。
可視化書籍?dāng)?shù)量,按時(shí)間排序 ![]() 哪些書最值得讀? ![]() ![]() ![]() 下面這張圖顯示了所有可視化書籍的學(xué)術(shù)引用量(展現(xiàn)其學(xué)術(shù)影響力,y軸表示)和亞馬遜銷量(展現(xiàn)其普遍的熱門程度,x軸表示)分布。
可視化書籍的引用量(y軸-越上越高)和亞馬遜銷量(x軸-越左越高) 首先來看高引的書籍,也就是圖上的這幾本:
引用量最高的是Tufte的The Visual Display of Quantitative Information,截止倭瓜發(fā)文時(shí)已經(jīng)被引超過13000次,引用量相比其他書可以說是一騎絕塵。Tufte的另外兩本書,Envisioning Information和Visual Explanation,分別位于被引的第2名、第7名。上文介紹的心理學(xué)教材Information Visualization: Perception for Design位列第3名。Bertin和Cleveland的經(jīng)典理論著作位列第4、第5。位列第6的是Illuminating the Path,這本書由美國國土安全部資助,致力于將數(shù)據(jù)的可視分析應(yīng)用于國家安全維護(hù)和反恐。位列第8的是另一本可視化教材Information Visualization: An Introduction。 再來看銷量。下圖紅框中是銷量最高的幾本書:
所有書中銷量最好的是業(yè)界實(shí)戰(zhàn)書《用數(shù)據(jù)講故事》。Edward Tufte和Bertin的經(jīng)典著作分別位于銷量的第2、第3、第4、第7位。同樣高銷量還有通俗讀物如The Functional Art(《不只是美》),以及業(yè)界經(jīng)驗(yàn)書如Information Dashboard Design。 可以發(fā)現(xiàn),在國外,經(jīng)典理論著作無論是在引用量上,還是銷量上,都處于優(yōu)勢地位。而在銷量上同樣表現(xiàn)突出的,則主要是業(yè)界經(jīng)驗(yàn)和通俗讀物。 出于好奇,筆者也去查了查京東上賣得最火的可視化圖書。結(jié)果顯示,在中國最為暢銷的基本上都是技術(shù)類教程,著重于工程實(shí)操。相反,基礎(chǔ)理論和行業(yè)經(jīng)驗(yàn)類的書籍則數(shù)量較少,且大多譯自英文,鮮有來自本土的作者。可見,國內(nèi)的可視化理念普及還需時(shí)日,同時(shí),我們也希望看到更多優(yōu)質(zhì)的本土作品出現(xiàn)。
以“數(shù)據(jù)可視化“為關(guān)鍵詞搜到的圖書,按銷量排名 當(dāng)然,引用量和銷量并不是評價(jià)一本書的唯一標(biāo)準(zhǔn)。一方面,一本書是否被大多數(shù)人熟知存在一定的偶然性,并不是所有的好書都是熱門的;另一方面,讀書是人和書交互的過程,能夠解答你疑惑、啟發(fā)你思路的書往往才是最“對胃口”的書。 書山有路勤為徑。挑一本書,開啟你的可視化之旅吧! ———————————————— 參考文獻(xiàn): Rees, D., & Laramee, R. S. (2019, February). A survey of information visualization books. In Computer Graphics Forum (Vol. 38, No. 1, pp. 610-646). https://www./watch?v=8EMW7io4rSI https:///starlinking/%E7%94%A8%E6%95%B8%E6%93%9A%E8%AC%9B%E6%95%85%E4%BA%8B-d21cb7fc1540. https:///vis-it-%E6%9C%89%E8%A6%96%E6%B2%92%E4%BA%8B/%E5%8F%AF%E8%A6%96%E5%8C%96%E5%9F%BA%E7%A4%8E-jacques-bertin-%E8%88%87%E5%9C%96%E5%BD%A2%E7%AC%A6%E8%99%9F%E7%B3%BB%E7%B5%B1-63c99484da5f. https:///@mslima/visualcomplexity-com-ad9a12fa2c1a https://www./reading/munzner-14-visualization-analysis-and-design https:///visualization-analysis-design-tamara-munzner-department-of-computer/ ![]() - the end - |
|
|