最近有一批点和多变型的数据,需要将点按照多边形的区域进行分割。
经过若干尝试,终于通过geopandas的sjoin函数得以实现。
这里首先感谢博主“张da统帅”的分享,使得本人获得该实现方法的灵感,原帖见:https://beiyuan.me/geospatial-analysis-with-python-4/
以下是实现步骤及代码:
1. 如果点文件为带有坐标的文本文件,则先将其写入GeoDataFrame类对象,若为shpfile文件,则直接用geopandas进行读取。
# 载入geopandas库 import geopandas as gpd # 用geopandas读取点shpfile文件 point = gpd.read_file(point_path)
2. 用geopandas读取多边形shp文件
# 读取多边形shpfile文件 polygon = gpd.read_file(polygon_path)
3. 通过sjoin()函数获取点与多边形相交的系列,组成新的GeoDataFrame类对象
new_gdf = gpd.sjoin(point, polygon, op='intersects')
这里new_gdf包含了所有point和polygon相交元素的信息。
new_gpd的geometry列值为点的坐标,两个对象的其他列都合并在了new_gdf中(可以通过how关键字参数选择只包含point/polygon的列值,具体见:http://geopandas.org/reference/geopandas.sjoin.html)
op关键字参数有 {‘intersects’, ‘contains’, ‘within’}三种可选,由于geopandas给出的文本链接不可用(可能是因为某种神秘力量吧),所以三种参数对应方法暂不明了。
4. 按照polygon的范围对point进行分割
# new——gdf中的每一行代表一个点,每个点中都包含了其所在多边形的所有列(geometry列除外) # 由于index属性是每个DataFrame对象都有的,因此利用index值判断点属于哪个多边形 # polygon的index值在new_gdf中默认为index_rigth, 具体见:http://geopandas.org/reference/geopandas.sjoin.html # 获取每个点对应的polygon的index值 indexs = new_gdf.index_right.values # 去掉s中重复的index值(由于有多个点在一个多边形中的情况) s = list(set(indexs)) # 从new_gdf中拣出在index值对应多边形中的点,存入point_split列表(也可用point_split.to_file()方法直接写入shpfile文件) point_split = [] for index in indexs: point_split.append(new_gdf.loc[gdf['index_right'] == index, ['想要保存的列名0', ‘想要保存的列名1’, ...]]
5. 完成~