合并结果存在重复‘NA’及R语言地图代码适配数据集变更问询

阿华AIGC实验室

2026-5-21

解决合并后重复NA值的问题

看起来你已经成功适配了机场数据集的读取路径，现在遇到合并结果里有重复NA值的问题，我来帮你梳理下常见的解决思路：

1. 先清理原始机场数据中的无效NA

首先要确认原始数据里本身是否存在大量NA，尤其是用于合并的关键字段（比如country、经纬度），这些NA会在合并时被保留甚至重复：

# 先查看各字段的NA数量
colSums(is.na(airports))

# 过滤掉关键字段为NA的行（根据你的合并需求调整字段）
airports_clean <- airports[!is.na(airports$country) & !is.na(airports$lat) & !is.na(airports$lon), ]

2. 解决合并时的匹配不一致问题（针对rworldmap）

如果是用rworldmap的joinCountryData2Map函数合并，大概率是国家名称不匹配导致的批量NA（比如"United States" vs "USA"），可以这么处理：

先运行合并并查看不匹配的名称：

library(rworldmap)
# 开启verbose模式，输出不匹配的国家列表
map_merge <- joinCountryData2Map(airports_clean, 
                                 joinCode = "NAME", 
                                 nameJoinColumn = "country",
                                 verbose = TRUE)

根据输出的不匹配列表，手动修正机场数据里的国家名称：

# 示例：修正常见的名称差异，你需要根据实际输出调整
airports_clean$country[airports_clean$country == "United States"] <- "USA"
airports_clean$country[airports_clean$country == "United Kingdom"] <- "UK"
airports_clean$country[airports_clean$country == "South Korea"] <- "Korea, Republic of"

重新运行合并，这时候匹配失败的NA会大幅减少。

3. 去除合并后的重复NA行

如果合并后仍有重复的NA记录，可以用以下方式清理：

# 去除完全重复的行
map_merge_unique <- dplyr::distinct(map_merge)

# 过滤掉关键字段全为NA的无效行（比如国家名称和经纬度都为空）
map_merge_clean <- map_merge[!is.na(map_merge$NAME) | !is.na(map_merge$lat), ]

4. 调整合并类型减少NA

如果不需要保留未匹配的行，可以将合并类型设为inner，只保留双方匹配成功的数据：

map_merge_inner <- joinCountryData2Map(airports_clean, 
                                       joinCode = "NAME", 
                                       nameJoinColumn = "country",
                                       type = "inner",
                                       verbose = TRUE)

按照这个流程走下来，应该就能解决你遇到的重复NA问题了。

内容的提问来源于stack exchange，提问作者ASH