|
很榮幸,能來北京參加2018年第十一屆中國R會(huì)議,并在中國人民大學(xué)-R語言數(shù)據(jù)可視化會(huì)場作報(bào)告。 本次演講題目:《R語言ggplot2之地理信息可視化》,本次演講重點(diǎn)講解R語言基于ggplot2包的地理信息可視化,先介紹不同的地圖投影模式,講解世界地圖、美國和英國等世界各國、中國(包括省級(jí)、市級(jí)到縣級(jí)不同的行政單位)、局部地圖等,地圖數(shù)據(jù)的獲取與繪制,特別會(huì)講解標(biāo)準(zhǔn)中國和美國地圖的繪制;再接著講解不同的地圖類型,包括等值區(qū)間地圖、帶散點(diǎn)、氣泡、柱形、餅圖和連接線的地圖、等位地圖、地鐵線路圖等。
本次演講只講解地理空間數(shù)據(jù)可視化部分,此部分也被收錄在我的新書《R語言數(shù)據(jù)可視化之美》中,敬請(qǐng)期待。 本次內(nèi)容相對(duì)來說,有點(diǎn)多,我拆成兩部分推送給大家:地圖等級(jí)和地圖類型。關(guān)于地圖等級(jí)部分的內(nèi)容請(qǐng)見: 這次就介紹地圖類型的部分。 點(diǎn)描法地圖 點(diǎn)描法地圖(DotMap, 點(diǎn)分布地圖DotDistribution Map, 點(diǎn)密度地圖Dot Density Map)是一種通過在地理背景上繪制相同大小的點(diǎn)來表示數(shù)據(jù)在地理空間上分布的方法。點(diǎn)數(shù)據(jù)描述的對(duì)象是地理空間中離散的點(diǎn),具有經(jīng)度和緯度的坐標(biāo),但是不具備大小的信息,比如某區(qū)域內(nèi)的餐館、公司分布等。 在R語言中先使用geom_polygon()函數(shù)繪制地圖,再使用geom_point()函數(shù)在地圖圖層上就可以繪制散點(diǎn)數(shù)據(jù)。 沃羅諾伊地圖 沃羅諾伊圖(VoronoiDiagram,也稱作又叫狄利克雷鑲嵌(Dirichlettessellation)或者泰森多邊形(Thiessen polygon)是由俄國數(shù)學(xué)家格奧爾吉·沃羅諾伊建立的空間分割算法。 沃羅諾伊圖解決的問題實(shí)際上就是基于一組特定點(diǎn)將平面分割成不同區(qū)域,而每一區(qū)域又僅包含唯一的特定點(diǎn),并且該區(qū)域內(nèi)任意位置到該特定點(diǎn)的距離比到其它的特定點(diǎn)都要更近。特別適用于如分析星巴克咖啡、7-11便利店等的最大覆蓋區(qū)域。 帶氣泡的地圖 帶氣泡的地圖(BubbleMap),其實(shí)就是氣泡圖和地圖的結(jié)合,根據(jù)數(shù)據(jù)(lat,long,value)在地圖上繪制氣泡。位置信息(lat,long)對(duì)應(yīng)到地圖的具體地理位置,數(shù)據(jù)的大小value映射到氣泡面積大小,有時(shí)候還存在第四維類別變量catergory,可以使用顏色區(qū)分?jǐn)?shù)據(jù)系列。 帶氣泡的地圖比分級(jí)統(tǒng)計(jì)圖更適用于比較帶地理信息的數(shù)據(jù)的大小,但是當(dāng)?shù)貓D上的氣泡過多過大時(shí),氣泡間會(huì)相互遮蓋而影響數(shù)據(jù)展示。所以在繪制時(shí)需要考慮設(shè)定氣泡的透明度。 帶柱形的地圖 帶柱形的地圖(BarMap)是柱形圖和地圖的組合,可以用柱形系列表示地理位置的一系列數(shù)據(jù)指標(biāo),柱形的高度對(duì)應(yīng)指標(biāo)的數(shù)據(jù),不同的指標(biāo)使用不同的顏色區(qū)分。 在R語言中,可以使用geom_polygon()函數(shù)繪制地圖,geom_rect()函數(shù)繪制柱形數(shù)據(jù),geom_text()函數(shù)添加數(shù)據(jù)標(biāo)簽。 帶餅圖的地圖 帶餅圖的地圖(PieMap)是餅圖和地圖的組合,可以用餅圖系列表示地理位置的一系列類別的數(shù)值占比情況,餅圖的占比對(duì)應(yīng)類別的數(shù)據(jù),不同的類別也可以使用不同的顏色區(qū)分。 R語言scatterpie包的geom_scatterpie()函數(shù)可以繪制散點(diǎn)復(fù)合餅圖和氣泡復(fù)合餅圖。先使用geom_polygon()函數(shù)繪制地圖,再使用geom_scatterpie()函數(shù)在地圖圖層上就可以繪制散點(diǎn)復(fù)合餅圖或者氣泡復(fù)合餅圖。 帶連接線的地圖 在地理空間數(shù)據(jù)中,線數(shù)據(jù)通常指連接兩個(gè)或更多點(diǎn)的線段或者路徑。線數(shù)據(jù)具有長度屬性,即所經(jīng)過的地理距離。常見的線數(shù)據(jù)可視化方法包括連接地圖和流向地圖。 連接地圖 (Connection Map) 是用直線或曲線連接地圖上不同地點(diǎn)的一種圖表。雖然連接地圖非常適合用來顯示地理連接和關(guān)系,但我們也可使用單一連接鏈路來顯示地圖路線。此外,通過研究連接地圖上的連接分布或集中程度,我們也可以用它來顯示空間格局。 在R中g(shù)eosphere包的geosphere()函數(shù)可以計(jì)算兩地的中間路線的插值,再使用geom_path()可以繪制線條。 流向地圖(FlowMap) 在地圖上顯示信息或物體從一個(gè)位置到另一個(gè)位置的移動(dòng)及其數(shù)量,通常用來顯示人物、動(dòng)物和產(chǎn)品的遷移數(shù)據(jù)。單一流向線所代表的移動(dòng)規(guī)模或數(shù)量由其粗細(xì)程度表示,有助顯示遷移活動(dòng)的地理分布。 在R中g(shù)eosphere包的geosphere()函數(shù)可以計(jì)算兩地的中間路線的插值,再使用geom_path()可以繪制線條,單一流向線所代表的移動(dòng)規(guī)?;驍?shù)量映射到線條的粗細(xì)size。
|
|
|