ISIN, SEDOLE和CUSIP都是用于标识金融中的有价证券。说的简单点,他们就是一串字符和数字组成字符串,用来定义像股票,基金等等。他们的区别在于应用的国家和字符本身定义的不同。
ISIN的定义可见wikipedia,用于全球唯一标志有价证券。它是一个12位的由字母和数字组成字符串,应用于交易和结算。它一共由三部分组成,两位的国家标识,九位字母数字组成
的标志和一位验证码。最后的一位验证码是通过前面的11位计算得到的。那么验证ISIN就是验证最后一位是否和通过规定确定的算法计算的结果一致。下面描述这种验证的算法:
首先对于字符到数值之间的转换,有 A = 10, B = 11, C = 12……X = 33, Y = 34, Z = 35,在sql中,可以这样得到对应数值:
SELECT ASCII('A') – 55
比如对于ISIN:US0378331005 最后的一位5是如下计算得到的:
第一步:把字符转换成数字:U->30, S->28
US0378331005 ->3028037833100
第二步:把得到的数字字符串分成两组,奇数位组和偶数位组
3028037833100 = (3, 2, 0, 7, 3, 1, 0), (0, 8, 3, 8, 3, 0)
第三步:把最后一位所在的组每个数字字符乘2(以上最后一位为0,在奇数位组)
(6, 4, 0, 14, 6, 2, 0)
第四步:把所有的数字加起来,对于第三步计算得到的值如果大于10,用个位和十位的值相加。
(6 + 4 + 0 + (1 + 4) + 6 + 2 + 0) + (0 + 8 + 3 + 8 + 3 + 0) = 45
第五步:对10求余
45 mod 10 = 5
第六步:从十相减
10 - 5 = 5
第七步:在对10求余
5 mod 10 = 5
所以最后一位验证码是5,US0378331005 是一个能通过验证的ISIN。
在以上的计算当中,对于单一的数字进行乘2的操作,如果值大于10 用个位去加十位。那么对0,1,2,3,4来说,只要它们乘2就 可以了,但是对5, 6, 7, 8, 9来说,
5->5*2=10->1+0=1
6->6*2=12->1+2=3
7->7*2=14->1+4=5
8->8*2=16->1+6=7
9->9*2=18->1+8=9
它们之间有n->2*n-9的对应关系。首先建立如下函数来做这种简单的计算:
CREATE FUNCTION [dbo].[getSum] ( @inputValue INT ) RETURNS INT AS BEGIN DECLARE @retV AS INT SET @retV = @inputValue * 2 IF @inputValue > 4 SET @retV = @retV - 9 RETURN @retV END
接下来就是写函数来验证ISIN了,从上面的计算过程中,首先要得到由数字的字符串,然后在对这个数字字符串进行奇数位,偶数位的计算。代码如下:
CREATE FUNCTION [dbo].[Is_IsinValid] ( @isin VARCHAR(MAX) ) RETURNS BIT AS BEGIN DECLARE @retValue AS BIT SET @retValue = 0 SET @isin =LTRIM(RTRIM(@isin)) DECLARE @numS AS VARCHAR(MAX) SELECT @numS = COALESCE(@numS, '') + c FROM ( SELECT CASE WHEN ISNUMERIC(SUBSTRING(@isin, N, 1)) = 1 THEN SUBSTRING(@isin, N, 1) ELSE CAST(ASCII(SUBSTRING(@isin, N ,1)) - 55 AS VARCHAR(MAX)) END AS c FROM dbo.Number WHERE N < LEN(@isin) ) AS dr1 DECLARE @vv AS INT SET @vv = 0 SELECT @vv = @vv + CASE WHEN N %2 = LEN(@numS) % 2 THEN dbo.getSum(CAST(SUBSTRING(@numS, N, 1) AS INT)) ELSE CAST(SUBSTRING(@numS, N, 1) AS INT) END FROM dbo.Number WHERE N <= LEN(@numS) IF (10 - @vv % 10) % 10 = SUBSTRING(@isin, LEN(@isin), 1) SET @retValue = 1 RETURN @retValue END
CUSIP的定义见wiki。它是9位有字母和数字组成的字符串。主要在北美使用。具体的计算方式不再描述,wiki中有很详尽的描述,此处只贴上sql代码。
CREATE FUNCTION [dbo].[Is_CusipValid] ( -- Add the parameters for the function here @cusip VARCHAR(MAX) ) RETURNS BIT AS BEGIN SET @cusip = LTRIM(RTRIM(@cusip)) DECLARE @retBit AS BIT SET @retBit = 0 DECLARE @sumValue AS INT SET @sumValue = 0 SELECT @sumValue = @sumValue + CASE WHEN N % 2 = 0 THEN CASE WHEN ISNUMERIC(SUBSTRING(@cusip, N, 1)) = 1 THEN dbo.getSum(CAST(SUBSTRING(@cusip, N, 1) AS INT)) ELSE dbo.getSum((ASCII(SUBSTRING(@cusip, N, 1)) - 55) / 10) + dbo.getSum((ASCII(SUBSTRING(@cusip, N, 1)) - 55 ) % 10) END ELSE CASE WHEN ISNUMERIC(SUBSTRING(@cusip, N, 1)) = 1 THEN CAST(SUBSTRING(@cusip, N, 1) AS INT) ELSE (ASCII(SUBSTRING(@cusip, N, 1)) - 55) / 10 + (ASCII(SUBSTRING(@cusip, N, 1)) - 55 ) % 10 END END FROM dbo.Number WHERE N < LEN(@cusip) IF (10 - @sumValue % 10) % 10 = SUBSTRING(@cusip, LEN(@cusip), 1) SET @retBit = 1 RETURN @retBit END
SEDOL是7位字母数字组成的标识,主要应用于英国和爱尔兰。定义见wiki。计算过程也不再重复,只共享代码。
CREATE FUNCTION [dbo].[Is_SedolValid] ( -- Add the parameters for the function here @sedolChars AS CHAR(20) ) RETURNS BIT AS BEGIN DECLARE @retValue AS BIT DECLARE @lastItem AS ChAR SET @retValue = 0 IF LEN(@sedolChars) = 7 BEGIN SELECT @lastItem = (10 - SUM(ItemValue) % 10) % 10 FROM( SELECT Item, Weight, ItemValue = ( CASE ISNUMERIC(Item) WHEN 1 THEN CAST(Item AS INT) ELSE ASCII(Item) - 55 END) * Weight FROM ( SELECT SUBSTRING(@sedolChars, N, 1) Item, Weight=( CASE N WHEN 1 THEN 1 WHEN 2 THEN 3 WHEN 3 THEN 1 WHEN 4 THEN 7 WHEN 5 THEN 3 WHEN 6 THEN 9 WHEN 7 THEN 1 ELSE 0 END) FROM dbo.Number WHERE N< LEN(@sedolChars) ) AS dr1 ) AS dr2 IF CAST(SUBSTRING(@sedolChars, 7, 1) AS INT) = @lastItem SET @retValue =1 END RETURN @retValue END