历史地理第十八辑
走进数字化:中国历史地理信息
系统的一些概念和方法
地理信息系统(Geographical Information System,简称为GIS),它是20世纪60年代开
始迅速发展起来的地理学研究技术和手段。
这是一个多学科交叉发展的产物,首先它以地
理信息及其数理分析方法为基础,同时它借助
计算机技术实现复杂的运算和数据及图形处理。近年来,计算机工具飞速的发展为GIS普
及和广泛运用起了很大的推动作用,目前这个
技术正开始与传统的中国历史地理学结合。2000年在云南昆明召开的“中国历史地理国
际学术讨论会”上,数字化问题已经被认为是
新世纪历史地理发展的一个重要方向。在国
际上,美国洛杉矶大学伯克利分校兰卡斯特教
授牵头的ECAI计划(Electronic Cultural Atlas Initiative数字化文化地图集行动计划),已经
吸引几十个国家、数百位人文学者加入到数字
化的行列,其中GIS技术的运用是一个很主要
的方面。2001年初,复旦大学与美国哈佛大学、澳大利亚格林菲斯大学合作,在美国亨
利-罗斯基金和复旦大学三年行动计划“重中
之重”项目的支持下,开展了“中国历史地理信
息系统”(CHGIS)项目的研究,目的是把中国
历史基础地理信息内容用数字化的数据提供-给学术界和其他用户。经过半年来多位学者
的共同努力,项目组初步完成了基础概念和方
法的摸索,并完成了演示数据的编写和数字化。这里介绍一些主要概念和方法的心得,不当之处,请多指教。
、历史地理信息的数据化
基础历史地理信息与载体
历史地理信息包罗万象,有自然的,如气
候、地貌、灾害、动植物等;也有人文的,如政区
疆域.聚落、经济、人口、文化、社会等。但其中有一些是最基础的信息。从有关地理内容的表达来看,无非有两个基础的因素,即空间位
置和要素内容(当然要素中又可以延伸出许多
L
相关的类型)。不过,表达地理信息在地球表面位置的科学方一经纬度系统是近代科学的产物,在中国历史上的大部分时间中还没有这个系统和完善的概念,实际上历史文献记载中的地理信息是通过另一个系统来表达空
*
间位置的,即众所周知的地名点和区域(行政的或自然的),如某地发生水灾、某地有多少人
■-
口、某地有什么梓的社会文化习俗,或某现象■
在某山某河艺阳等等。这个大部分以人文要素标记的地点和地区实际上起着与经纬度相似的作用,用以标记地理要素所属的空间位置。因此这种用以标记其他地理信息的空间位置,可以称为基础历史地理信息。
12
当然这个基础信息的局限和缺陷是显而易见的,如相对性、名称随时间变化等等。但这是一个客观事实,历史地理研究依赖的历史文献信息就是这样表述的,我们必须面对这个问题。谭其釀先生主编的《中国历史地图集》出版,其历史地理意义重大,如果从信息角度来看,是把历史上传统的空间信息描述方法和内容,转移到以现代地理坐标为基础的现代地图上,大大方便了阅读和利用历史地理信息,提高了历史地理信息空间位置的准确性。以计算机技术为基础的中国历史地理信息系统从基本目的上来看,是传承了《中国历史地图集》的主要目的,也是把基础历史地理信息标定到现代空间位置基础上。但CHGIS也提供了纸面历史地图所不具有的功能。
从基础历史地理信息的时间变化属性来看,它是一种随时间一直在变化的信息,如地名的变更、治所的迁移、政区辖境的盈缩等等,系。当然,我们可以增加时间截面的数量,来表达更多的不同时期的历史地理信息,但这样将大幅度地提高载体的数量。例如,《中国历史地图集》每个主要朝代只有一个标准年代(指分幅图),如果每个主要朝代标准年代增加到两个,图集卷数将增加一倍,如果再增多,恐怕一个图集是无法容纳的。而CHGIS数据库描述的基础历史地理信息方法与传统纸质媒介时间截面方法不同,它是按每个地名、区域或其他地理对象的“生存期”来描述(关于这个概念,我们在下面再详细解释),并作为整体来描述这些地理信息在时间上的变化,而具体显示在屏幕或打印出的具体地图仅仅是这个数据库中的一个索引对象,这个索引对象相当于一个时间截面,只不过索引对象可以随时生成或取
消,并不需要占据空间。很明显,CHGIS 描述基础历史地理信息的能力要大大超过传统的纸质地图。例如,我们可以方便地定义索
即一个空间信息的集合在时间轴上连续变化。引对象的时间间隔为“年”,也就是说,只要数任何特定时期的地图上,只能描述这个变化在据库完成后,可以逐年展现基础历史地理信息某一时间断面上的特征,图1表示了这个关的分布,以满足各方面的需要。
时间
变化
图1具有时间变化的CHGIS数据和査询结果的关系
13
“图文并茂”是CHGIS数据的一个特。我们知道,人类生活在一个空间世界中,
许多知识除了对象的性质描述外,还与对象
的空间位置有关,但我们的文字语言对对象
生活中数据库系统的实际例子
的空间描述并不是合适的工具,千言万语常
常并不如一幅地图来得简捷和详细。但也要
看到,地图也仅仅是表现了对象的空间性质,
图面简单的符号或图形并不淋漓尽致地表达对象的复杂性质。显然,最好有一种兼及
两者的手段或工具,能满足我们这两方面的
要求,即对象的空间属性和性质属性的有机结合。其实这个需求并不是信息时代的“专 利”,至少在中国古代已经有了这种要求,如历史上“图说”之类的著作就是这种需求的初步实践。但在计算机技术充分发展之前,我 们大部分只能用类似“图说”的手段满足初步要求。CHGIS数据利用现代地理信息系统工具,
把基础历史地理信息的空间属性(空间位置和形态)和性质属性(有关这些空间对象的性质描述)有机和动态地结合在一起。在我们查询地名或政区时,既可以看到它们的空间形态和位置关系,也可以看到描述它们的相关文字,甚至考释和其他参考资料,显然大大提高了我们参考基础历史地理信息的能力和手段。
容易更新则是CHGIS的另一个重要特征。纸质地图一旦印刷以后,除了再版,很难更改。但基于计算机技术的CHGIS基础历史地理信息很容易修改和补充,可以保证初.
I
■■■
步资料完成后,不断修改和更新,从而使这个基础资料系统得到进一步的完善。这是一个重要的特征,我们知道,限于研究水平和时间,历史地理中任何研究成果不可能是十全十美的,帯常我们在一个成果出版后,或多或少都会发现可以进一步补充和修改的地方,这需要在以后的研究中改进。如果一个系统的内容可以由作者或他人随时修改,显然这个系统可以不断地得到完善,从而使用户或读者得到更多的益处。
2.历史地理信息的属性分析
在讨论历史地理信息的属性分析前,我
们需要进一步明确CHGIS数据的定义,因为任何信息属性分析都需要有明确的对象,不同的对象需要强调不同的属性,只有明确对象,才能有目标明确的属性提取。如前面所述,CHGIS系统的基本功能是用地理信息系统技术编制基础历史地理信息,同时我们认为CHGIS也应当承担普通历史地图的功能。也就是说,它在为历史地理或其他方面研究提供基础数据的同时,其本身的内容需要有相当的可读性,无论是图面内容的表达还是相关数据的阅读。
考虑到上述的要求,CHGIS数据从空间
属性来看,至少需要包括以下内容:
(1)聚落地名有许多类型,但其中无疑最重要的是聚落。历史上的许多信息都与聚落有关,同时它也是其他历史地理信息的基本空间信息点。
(2)行政区域和疆域不同等级的行政区域也是基础地理信息,并且表达了不同行政区域在空间上的位置关系,以及统辖关系o (3)自然地理要素包括海岸线、河流、湖泊、山脉、山峰、地形等。
聚落是最基本的信息(其他内容与此相似)。从空间上来看,它是一个点(一定比例尺的条件下),说明这个点的属性数据有许多,但按照上述整个数据库的需要达到的效果和要求来分析,可以包括:名称、行政隶属关系、空间属性、时间属性、数据库属性、注释等六大类。
名称任何聚落都有名称,但考虑到整
14
个CHG1S数据库需要向全世界开放,在表达上应该包括三种类型,即简体、繁体和拼音。此外,不少地名有不同的俗称或异名,而 不仅仅是一个官方或较正式的名称,因此俗称或异名也构成了这个聚落在名称上的一种属性。同时,异名有时是用其他语言系统表达的,这个语言系统是什么,也需要注明O 行政隶属关系在国家社会中,聚落,无论是村镇、县治或其他,都受一定的行政管理体系的管辖和节制。以水口镇为例,属清朝、浙江省、湖州府、长兴县,以上的朝代、省级单位、府级单位和县级单位构成了水口镇在行政隶属关系上的几个属性。从上述水口镇的例子来看,我们只要有5个属性就可以描述这个聚落行政关系,但由于数据库不光是描述清代的地名,它的结构还必须容纳其他朝代与上述结构关系不同的行政体系。因此行政关系属性需要扩展。我们目前在CHGIS 数据库中规定的行政关系属性一共有9个,朝代、政权、省级、二级、三级、四级、五级、县级、县以下,以保证任何一个聚落的行政关系属性有相应的属性描述位置。表1是几个地名的行政关系属性和描述。需要指出的是, CHGIS数据的目的并
不是编制完善的行政区划和隶属关系,有些行政关系在数据库中需要加以简化或省略,如县以下的聚落仅归并为一类,而边地的一些特殊内容也作了简化。完善的行政区划和隶属关系应该有专题数据来描述。此外,从聚落所处的行政地位可以对聚落的性质进行分类,但分类体系需要考虑分类的使用范围和用处。如县以下的地名有许多种,镇、市、集、好等都有一定内涵的差异,可以作为分类的依据。但从数据查询的要求来看,分类不能太复杂,专门的分类应该是专题内容的工作,CHGIS数据基础目的是提供基础历史地理信息,分类主要考虑
数据检索的需要。
名称水口镇朝代政权省级
表1行政隶属关系属性的几个例子
2级
「湖州府
3级4级5级
武进县Si常州府县级
长兴县
武进县
县以下
水口镇村镇
江宁府江苏江宁府
空间属性空间属性包括点的经纬度(如水口镇,经度119.865753,纬度31.093875)、今地(水口镇,今浙江长兴县北水口镇)、位置来源、定点依据。尽管在地理信息系统中,基本的空间属性已经由点的位置所决定,但这还不够。考虑到CHGIS数据不光是在我们工作中所用的GIS系统表现,我们还希望用户可以利用这些数据在其他GIS中运用,直接用数字方式描述聚落的位置,可以方便地在其他GIS系统中生成相应的空间点的位置。今地这个属性对聚落的
描述并不是必要的,但在编制数据库时,可以
方便地帮助到该聚落在底图上的相应位置。位置来源用于描述任何一个聚落在技术上是如何确定在目前位置上的,这个信息是一个技术基础,一方面表明了位置的数据是从何来的,同时也描述了如何来的,可以为以后修改数据的人员掌握数据的技术基础提供•帮助,并发现可能存在的问题。以下是一个描述的例子:
FROM_FD用于表识聚落点(Point)的来源是依据研究人员绘制的
分府草图。
各县聚落点是研究人员用手工的方
15
法绘制在1s50万地形图底图上,没有
1:50万地形图的地区,利用ARCCHI-
NA的打印地图作为工作底图。县界画
法的资料依据,参见各县聚落点数据的
Note中的说明。每个研究人员分别承
担分府的聚落点与县界的草图绘制。
ARCCHINA是ARCINPO格式,在ARCVIEW3.0a中分别读入各分幅
RESPT层的数据,并输出为SHAPE格
式保存。在MAPINFO的Universal
Translator中把各分幅的SHAPE文件
转换为TAB格式文件。转换的投影参
数为:
Longitude/Latitude(Pulkovo 1942)\p4284,\1,1001
在MAPINFO中把各分幅的TAB 文件合并为一个RESPT文件。
各府草图扫描后,在MAPINFO中注册。
1550万地形图的投影参数如下:
“一auss-Kruger(Pulkovo1942)
“GK Zone21(Pulkovo1942)\ p28421”,8,1001,7,123,0,1< 21500000,0
ARCCHINA来源的底图注册投影
参数见上。•
.■
注册的扫描底图与RESPT图层叠加比较,如果研究人员绘制的聚落点位
r■
置和地名与RESPT图层没有相应的
点,则用MAjpiNFO的点工具,依据草
图的位置直接在聚落点图层上绘制,该
■.、
图层的投影设置与RESPT图层相同。
并在记录中表识为FROM_FD o
定点依据实际上是地名释文的一部分内容。数据库中的任一聚落,必须有相应的文献依据和相应的判断意见,其中重要的是如何定位。只有描述了这些信息,才能正确地把聚落确定到经纬度系统中,形成电子地图。
以下也是一个例子。
龙窟镇
乾隆《武进县志》卷二《驿站》,北塘
九里铺,南接府总铺,北接龙窟铺,计程
俱十里。又北塘龙窟铺,在龙窟镇,北接
江阴火庄铺,计程十里,可见龙窟镇在县
北二七里。光绪《武进阳湖合志》卷三
《水道》,龙窟荡,俗名龙虎塘,今有龙虎
塘,在武进县北近二十里,接江阴县界,
符合上述记载,当即清之龙窟镇。
时间属性时间属性是涉及到历史地理信息的一个重要的属性,因为GIS数据中引入了“时间坐标”的概念,也使得GIS数据可以用来描述地理信息的历史变化过程,相关概念已经有了较多的讨论①。但如何在属性数据上对一个历史地理对象的描述,可以有多种方法,我们将在下面专门讨论有关思路和概念,这里
仅给出我们在CHGIS数据运用的方法和规定。时间属性类用4个单列的
属性描述,即一个独立对象记录出现时间和结束时间,以及每个时间标量的精度。出现时间和结束时间在数据库中用公历表示,仅表示到年。之所以用年来表示,是基于这样的考虑:
由于历史资料现实以及研究水平和程度■
问题,实际上是不可能所有的地名记录都有
■-
确切的起迄时间(Beginning and Ending)0
.--
根据我们的认识,历史上记载的地名,有关起迄时间的有以下几种可能:
16①Ian Johnson,**Mapping the fourth dimension:the
*TimeMap project”,www#archaeology.
usydL edu au* *

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。