使用shapely处理地图数据:

  1. 计算区域面积
  2. 计算区域时候相交
  3. 计算相交面积
  4. 地图坐标系转换
  5. 区域多边形修正

坐标系转换

百度转高德

from coordTransform_utils import gcj02_to_bd09
def amap_to_bmap(data):
    """
    高德转为百度
    """    
    baidu_lng,baidu_lat = gcj02_to_bd09(data['longitude'], data['latitude'])

    return baidu_lng, baidu_lat

高德转百度

from coordTransform_utils import gcj02_to_bd09,bd09_to_gcj02
def bmap_to_amap(data):
    """
    百度转为高德
    """    
    amap_lng,amap_lat = bd09_to_gcj02(data['longitude'], data['latitude'])

    return amap_lng, amap_lat

创建多边形:

以上海市虹口区数据为例。

df = pd.read_csv("/Users/li/Workspace/github.com/py3-labs/lab057/data/blocks.csv")
df = df.loc[df['district_name'] == '虹口'].reset_index(drop=True).iloc[0]
boards = df['district_board']
print(boards[:100])

from shapely.geometry import Point, Polygon
points = [Point(float(x.split(',')[0]), float(x.split(',')[1])) for x in boards.split(';')]
polygon = Polygon(points)

image.png|700

计算多边形面积

# 创建Polygon
from shapely.geometry import Point, Polygon
from pyproj import Geod
import pyproj
import shapely.ops as ops
from functools import partial

points = [Point(float(x.split(',')[0]), float(x.split(',')[1])) for x in boards.split(';')]
polygon = Polygon(points)

# 第一种计算
print("面积01(单位m^2):",polygon.area)

# 第二种计算
geom_area = ops.transform(
    partial(
        pyproj.transform,
        pyproj.Proj(init='EPSG:4326'),
        pyproj.Proj(
            proj='aea',
            lat_1=polygon.bounds[1],
            lat_2=polygon.bounds[3]
        )
    ),
    polygon)

print("面积02(单位m^2):",geom_area.area)

# 第三种计算
geod = Geod(ellps="WGS84")
polygon = Polygon(points)
area = abs(geod.geometry_area_perimeter(polygon)[0])
print("面积03(单位m^2):",area)

image.png|450

image.png|500

第一种计算方式和后面两种计算方式有这么大差别的原因是:

  1. 我们输入的坐标是高德坐标,高德坐标(GCJ-02)是在WGS-84的基础上漂移,因此GCJ-02仍然属于地理坐标系。
  2. shapely默认按照投影坐标系进行计算。
  3. 第一种计算方式有问题就是因为,shapely是把经纬度当作投影坐标系来计算(简单地可以认为就是直接坐标系)。
  4. shapely的默认单位是米,那么第一种方式计算出来确实是这样。
  5. 第二种计算方式。把坐标从EPSG:4326(可以认为这个就是WGS-84,是一种别称)坐标系转为了aea坐标系。
  6. aea坐标系是一个投影坐标系。也就是通过这个转换,地理坐标系转为了投影坐标系。
  7. 在投影坐标系中,经纬度坐标的距离会变成现实中的距离,所以计算面积也就是正确的。
  8. 第三种计算方式。是可以处理WGS84坐标系的点,所以也是正确的。
  9. 这里需要说明的是,计算距离和面积,需要是投影坐标系。因为这时候投影坐标系可以认为是一个平面,地理坐标系的点不认为是一个平面上。

创建一个半径1公里的圆

既然半径1公里,那么肯定是用在地图中的,那么也就需要转换坐标系。

from functools import partial

import pyproj
from shapely import geometry
from shapely.geometry import Point,Polygon
from shapely.ops import transform

def get_circle(center_lng,center_lat,radius) -> Polygon:
    """
    得到一个圆心多边形,radius单位为米
    """
    local_azimuthal_projection = "+proj=aeqd +R=6371000 +units=m +lat_0={} +lon_0={}".format(
        center_lat, center_lng
    )
    wgs84_to_aeqd = partial(
        pyproj.transform,
        pyproj.Proj("+proj=longlat +datum=WGS84 +no_defs"),
        pyproj.Proj(local_azimuthal_projection),
    )
    aeqd_to_wgs84 = partial(
        pyproj.transform,
        pyproj.Proj(local_azimuthal_projection),
        pyproj.Proj("+proj=longlat +datum=WGS84 +no_defs"),
    )

    center = Point(float(center_lng), float(center_lat))
    point_transformed = transform(wgs84_to_aeqd, center)
    buffer = point_transformed.buffer(radius)
    # Get the polygon with lat lon coordinates
    circle_poly = transform(aeqd_to_wgs84, buffer)
    return circle_poly

这里是在WGS84aeqdaeqdaea一样都是局部的投影坐标系。 aeqd需要给定一个中心点经纬度坐标。 所以创建的步骤变为:

  1. 创建一个经纬度坐标的Point。这时候还是shapely默认坐标系的,经纬度还没有含意。
  2. 把这个坐标通过aeqd->wgs84变换,转为WGS84下的地理坐标系,这时候经纬度有实际意义了。
  3. 然后在地理坐标系下,把这个点向外扩大1公里,得到一圈点。
  4. 向外扩大这一步可以使用buffer方法,参数就是距离。
  5. 然后把这一圈点再通过wgs84->aeqd变化,转为投影坐标系。方便之后的计算(在投影坐标系中计算面积和距离)。

多边形相交

poly_block = block_polygon_dict[_block_id]
if poly_block.intersects(poly_circle):    
	# 计算两个Polygon对象的相交面积
	try:
		poly_intersect = poly_block.intersection(poly_circle)

		geod = Geod(ellps="WGS84")
		area = abs(geod.geometry_area_perimeter(poly_intersect)[0])

		is_intersect.append(area)
	except Exception as e:
		print("计算错误",_block_id)
		raise ValueError(e)
  1. 在投影坐标系下计算时候相交。
  2. 相交区域的面积参考多边形面积计算。

buffer(0)的处理

有的时候,我们会遇到区域边界错乱的情况,这个时候可以用buffer(0)来解决,如下图: image.png|500

polygon = Polygon([Point(float(x.split(",")[0]),float(x.split(",")[1])) for x in _row["block_board_valid"].split(";")])
if not polygon.is_valid:
	print("not valid",_row['block_id'],_row['block_name'])

	# buffer
	multi_polygon = polygon.buffer(0)
	if isinstance(multi_polygon, Polygon):
		block_polygon_dict[_row['block_id']] = multi_polygon
	elif isinstance(multi_polygon, MultiPolygon):
		# 获得multiPolygon中面积最大的polygon
		max_polygon = max(multi_polygon.geoms, key=lambda polygon: polygon.area)
		block_polygon_dict[_row['block_id']] = max_polygon    
else:
	block_polygon_dict[_row['block_id']] = polygon
  1. is_valid先判断多边形时候有效
  2. 没有是上图这种情况is_valid就是False,这个时候就可以用buffer(0),把多边形改为有效的。
  3. 但是会出现两种情况,一种是转为了一个有效的多边形。
  4. 第二种是分割成多个多边形,遇到这种情况我们就用最大的一块代替原本的多边形。

参考资料