一、EDI标准分类
EDI标准在实际应用当中分为语言标准和通信标准两大类。
1、语言标准
EDI语言,用于将信息结构化地表达出来,以使得计算机相互理解。这种语言主要用于描述传统上结构化的信息,例如贸易单证。而非结构化的信息,例如备忘录、信函等不包括在内。
国际上存在两大标准体系,一个是流行于欧洲、亚洲的,由联合国欧洲经济委员会制定的UN/EDIFACT 标准。另一个是流行于北美的,由美国国家标准化委员会制定的ANSI X.12 标准。今天,在EDIFACT和ANSI的积极努力与配合下,终于达成一致而统一采用EDIFACT标准,为国际间更广泛的合作提供了有利的保证。
2、通信标准
通信标准的作用是负责将数据从一台计算机传输到另一台计算机中。简单地说,它是载运信息手段的标准。
只有有了通信标准,电子单证的传输才有可能。而只有有了EDI语言,数据的相互理解才有可能。EDI语言对其载体所使用的通信标准并无限制,但是,目前一般采用国际标准的MHS系统(电子邮件系统)。
二、UN/EDIFACT标准的基本原则
1、提供一种发送数据及接收数据的各方都可以使用的语言,这种语言所使用的语句是无二义性的。
2、这种标准不受计算机机型的影响,既适用于计算机间的数据交流,又独立于计算机之外。
三、UN/EDIFACT标准的组成
UN/EDIFACT由一系列涉及电子数据交换的标准、指南和规则、目录和标准报文组成。主要可分成以下几类:
1、指南和规则
其中包括:
(1)EDIFACT应用级语法规则(ISO9735)
(2)EDIFACT语法规则实施指南
(3)EDIFACT报文设计规则和指南
2、目录
(1)UN/EDED(the EDIFACT Data Element Directory),即UN/EDIFACT的基本数据元目录,是ISO 7372即UN/TDED联合国贸易数据元字典的子集。
(2)UN/EDCD(the EDIFACT Composite Data Element Directory)即UN/EDIFACT的复合数据元目录。
(3)UN/EDSD(the EDIFACT Standard Segments Directory)即UN/EDIFACT的数据段目录。
(4)UN/EDCL(the EDIFACT Code List),即UN/EDIFACT的代码目录,ISO 7372的组成部分。
(5)UN/EDMD(the EDIFACT United Nations Standard Messages Directory),即标准报文目录。
3、UN/EDIFACT 的三要素
EDIFACT报文标准的基本组成要素是数据元目录,段目录和EDI标准报文格式。后面我们就这三个基本要素加以讨论。
四、数据元
数据元是电子单证最基本的单位。制定电子单证首先就要对涉及贸易数据元所对应的名称、使用范围、数据类型和长度作出规定。
数据元是指在确定的上下文中被认为不可再细分的数据单元。在EDIFACT中特指规定用做标识,描述和数值表示的数据单元。
每一个数据元由一个4位的数字唯一地标识它。如:
n 1001 单证(据)/报文名称
n 3239 原产地国
数据元值一般是一个字母数字串。如:
n 380 在1001表示商业发票
n CN 在3239表示中国
1、数据元的一般分类
EDIFACT中的数据元一般分为简单数据元、复合数据元、成分数据元三类。
(1)简单数据元:含有单一值的数据元,即用来表示一个无须其他说明就能表明其含义的数据元。
(2)复合数据元:含有两个或多个成分数据元的数据元。有些数据本身不能确定其含义,必须对其加以某些限定才能明确。在EDIFACT中,复合数据元具有单一功能,各成分数据元与其功能有直接的联系。例如:
(3)
C507 日期/时间/期限
2005 日期/时间/期限限定符
2380 日期/时间/期限
2379 日期/时间/期限格式限定符
3:20021225:102 表示发票日期为2002年12月25日
其中 2005中 3=发票日期/时间
2379中 102=CCYYMMDD
成分数据元:复合数据元的组成部分,以其在复合数据元中的位置来标识的简单数据元。每个成分数据元依据其位置根据定义有明确的含义。每个成分数据元用数据元分隔符,如“:”来分开。
成分数据元有两种类型,一是必备型,用M表示。二是条件型,用C表示。
作为条件型数据元,当其在复合数据元中不出现时,应遵循下面两条规则:
①当被省略的数据元位于复合数据元中间时,分隔符应保留。例如:
123: :456
②当被省略的数据元位于复合数据元尾,分隔符不出现。例如:
123:456——省略(当含有三个以上成分数据元时)
2、数据元目录
UN/TDED(ISO7372)中定义了目前国际上通用的基本贸易数据元。EDIFACT采用了此标准。在TDED中,每一标准数据元用—个四位数来标识。该标识码在EDIFACT电子单证中并不出现,但可以作为引用参考号或系统内部使用。在TDED中,标准数据元可分为10类:
n 0000—0499: 用于EDI通信控制,例如:协议版本号。
n l000—1499: 单证引用与参考号,例如:订单号。
n 2000—2499: 有关的时间信息,例如:单证日期。
n 3000—3499: 参与方、地点信息,例如:进口商、目的地。
n 4000—4499: 条款、条件,例如:付款条件。
n 5000—5499: 金额与费用。
n 6000—6499: 计量的值与量。
n 7000—7499: 货物与物品。
n 8000—8499: 运输工具、方式等。
n 9000—9499: 海关业务与其他。
对于上述l0类数据,前500个编号,即X000—X499,是国际统一分配的。随后的300个编号,即X500—X 799,是供国家内部统一分配的,不同国家相同编号的数据的含义不同。最后的200个编号,即X800—X999是供行业或公司内使用,不同行业或公司相同编号的数据元含义不同。在使用数据元时,应尽量采用国际标准数据元。除非特别必要,不要使用自定义数据元,以免影响通用性。
3、EDED是TDED的一个子集,它定义了UNSM中使用的简单数据元。
在EDED中,每一数据元的定义包括三项内容:
一是数据元代码作为每个数据元的标识,给它一个有含义的名字作为数据元意义的简要解释,并指出数据元的版本。
二是数据元说明。
三是表示方法,用来规定数据元的类型及长度,n,a 或an。例如:
a3:用三个字母表示
n2:用二个数字表示
an5:用五个字母与数字表示
an..14:用1到14个字母数字表示
例:
2005 日期/时间限定词 E91.2
说明:赋予日期,时间或期限特定含义的代码
表示:an..3
4、EDCD定义了在UNSM中使用的复合数据元
每一个复合数据元都有一个四位编号。以“S”打头的编号表示用于传输控制的复合数据元。以“C”打头的编号为用户数据元,用于传输使用者需要传输的信息。例如:
S002表示交换的发送方。它由三个成分数据元组成:
0004 发送人标识 M an..35
0007 参与方标识代码限定词 C an..4
0008 返回路径 C an..14
C53l表示包装详情,由三项组成:
7075 包装级 C an..3
7233 包装有关信息 C an..3
7073 包装条件和条款 C an..3
5、EDCL定义用代码表示的数据元的具体代码
例如2013是频率代码,其代码在EDCL中定义如下:A为每年,D为不连续的,F表示可变时限,M表示每月,Q每季度,S每半年,T为四星期工作月,W每星期,Z为相互约定。3207是国家代码,代码在ISO 3166中定义,如CN表示中国,UN表示英国等等。
五、数据段
数据段是电子单证的中级信息单元。数据段由一组功能上相关的数据元组成,用以完成特定的功能。
1、数据段结构
(1)段标识:说明段的含义以及段重复、段嵌套指示。数据段的名字都是由3个大写字母组成,一般是一个字头的缩写。
(2)数据元:数据段所表达的内容由一组数据元表达。段中的数据元依照其在段中的位置并根据段的定义确定其含义,因此数据元在数据段中的位置是固定的。
(3)段终止符:段结束标志(′)。
2、数据段分类
用于UNSM的段均收集在EDSD中,在新单证的设计过程中,也可能有新的段加入其中,贸易双方也可根据需要订立双边协定,使用一些双方约定的段。但这样做会导致标准的不统一,因而不值得提倡。
关联密切的数据元经常组合在一起形成复合数据元,再进一步组成数据段。段按其用途可分作两类,一类为用户数据段,另一类是服务段。
(1) 用户数据段:这是用来运载用户信息的段,它是一个中间信息单元,反映具体的商务信息,如单证中具有一定功能的项,它对应着纸面单证上的一个栏目,如发货方,收货方等。
例:
LOC 地点/位置识别
DTM 日期/时间/周期
TDT 运输细节
(2) 服务数据段:它在单证的传播控制中起作用,规定格式或通信、交换要求的数据段,有时也称为控制数据段,它是为电子传送提供信息服务的。如报文开始、报文结束等,这样的段在单证语法标准中定义。
例:
UNH 报文头
UNT 报文尾
3、数据段目录
数据段目录罗列了所有的数据段。段目录中的每个数据段都有一些属性解释这个数据段,例如,一个属性说明它的版本号,另一个属性说明它的主要功能等。段目录还指出每一个数据段是由哪些数据元所组成的以及这个数据元的出现状况。
在EDSD中,段是按照下述原则设计的:
一个段具有独立的功能,例如表示地址、金额总计、详细日期等等。不同概念的数据不能混在一个段中表示。例如表示地址、金额、日期等的数据是具有不同概念的数据,故不能混在一个段中表示。
一个段中的各个数据元都在段定义中标明了其状态,该状态表明此数据项是必备项(用M表示)还是可选项(用C表示)。必备项是段中必须出现的数据元,而可选项则是根据需要选用或根据某种应用的需要指定使用。各数据项还标明其可重复次数。例如:
M1——此项必须出现而且只能出现一次。
M10——此项必须至少出现一次,最多可出现10次。
C10——此项可以不出现,或最多出现10次。
在一个段中,必备型数据应出现在前,而可选型数据出现在后。这样,当可选型数据不出现时,可从中略去。段组中的段也遵从相同原则。例如:
NAD表示姓名/地址与其相关功能。它由下述数据元组成:
3035——参与方限定符 必备型
C082——参与方标识细目 可选型
C058——名称与地址 可选型
C080——参与方名称 可选型
C059——街道 可选型
3164——城市名称 可选型
3229——国家下一级机构标识 可选型
3251——邮政编码标识 可选型
3207——国家,代码型 可选型
此段只有第一项为必备型,因而首先出现,说明参与方的身份。其他均为可选项,参与方的姓名地址可用代码来表示,也可用文字来表示。例如下面的三个例子:
NAD+BY+1234567:ABC:DEF′
NAD+BY++ZHAO WEI:1954 HUA SHAN RD:SHANGHAI
NAD+BY+++SJTU:EE:ZHAO WEI+516 FA HUA ZHEN RD+SHANGHAI++200052 +CHINA′
由于一个段中各项的意义是依据其位置确定的,因此若某项不出现时应有方式表示。当某一项在中间省略时,相应的分隔符“+”仍应保留。若被省略项出现在段尾,则用段终止符终止整个段,分隔符也不再保留,如上述第一例。
段可以重复,段重复时可以用显式表示或隐式表示。
如:假设段AAA重复出现三次
则:用显式表示为
AAA:1+…′AAA:2+…′AAA:3+…′
用隐式表示为
AAA+…′AAA+…′AAA+…′
在UMSM一般采用隐式表示,除非特别需要。显式与隐式表示方法不能在同一单证中混用。对于复杂的功能,用相关段组形成段来表示。段组作为整体出现。可规定段组的状态及重复次数。例如在发票中,联系人用两个段表示,一个是CTA段,表示联系人的作用与代码或姓名。另一个是COM段,表示通信方式和通信号码。这个段组的状态为C,而其中CTA的状态为M,COM为C。段组中段的状态表示此段相对于段组的状态。在上例中,段组可以整体不出现,即CTA与COM均不出现。若出现,则CTA必须出现而COM则不一定出现。因此上述段组可能的出现序列为:
CTA CTA C0M CTA COM CTA
1 2 3 4
段组重复用显式表示为 :
CTA:1+…′CTA:2+…′COM:2:1+…′CTA:3+…′COM:3:1+…′CTA:4+…′
同样地一般采用隐式表示。
CTA+…′CTA+…′COM+…′CTA+…′COM+…′CTA+…′
对整个段指定特定意义的限定词作为必备型数据元在段中第一位置出现。如上例中NAD段中第二项为限定词,指定地址为买方或卖方等。
段的标识以三个字母表示,如以UN打头的标识说明为服务段,作为传输控制用。