Base58
Base58是用于比特币(Bitcoin)中使用的一种独特的编码方式,主要用于产生Bitcoin
的钱包地址。相比Base64
,Base58
不使用数字"0
",字母大写"O
",字母大写"I
",和字母小写"l
",以及"+
"和"/
"符号。
设计Base58主要的目的是:
- 避免混淆。在某些字体下,数字0和字母大写
O
,以及字母大写I
和字母小写l
会非常相似。 - 不使用"
+
"和"/
"的原因是非字母或数字的字符串作为帐号较难被接受。 - 没有标点符号,通常不会被从中间分行。
- 大部分的软件支持双击选择整个字符串。
以下引用自其作者中本聪(Satoshi Nakamoto
)在base58.h
中的注释:
//
// Why base-58 instead of standard base-64 encoding?
// - Don't want 0OIl characters that look the same in some fonts and
// could be used to create visually identical looking account numbers.
// - A string with non-alphanumeric characters is not as easily accepted as an account number.
// - E-mail usually won't line-break if there's no punctuation to break at.
// - Doubleclicking selects the whole number as one word if it's all alphanumeric.
//
编码
一个Base58
"字元"可以表示的位元数为Log258
≈ 5.858
bits。经过Base58
编码的数据为原始的数据长度的 8/5.858 ≈ 1.37
倍,稍微多于Base64
的1.33
倍。
编码符号表:
编码 | 字符 | 编码 | 字符 | 编码 | 字符 | 编码 | 字符 |
---|---|---|---|---|---|---|---|
0 | 1 | 16 | H | 32 | Z | 48 | q |
1 | 2 | 17 | J | 33 | a | 49 | r |
2 | 3 | 18 | K | 34 | b | 50 | s |
3 | 4 | 19 | L | 35 | c | 51 | t |
4 | 5 | 20 | M | 36 | d | 52 | u |
5 | 6 | 21 | N | 37 | e | 53 | v |
6 | 7 | 22 | P | 38 | f | 54 | w |
7 | 8 | 23 | Q | 39 | g | 55 | x |
8 | 9 | 24 | R | 40 | h | 56 | y |
9 | A | 25 | S | 41 | i | 57 | z |
10 | B | 26 | T | 42 | j | ||
11 | C | 27 | U | 43 | k | ||
12 | D | 28 | V | 44 | m | ||
13 | E | 29 | W | 45 | n | ||
14 | F | 30 | X | 46 | o | ||
15 | G | 31 | Y | 47 | p |
由于256不能被58所整除,Base58无法像Base64那样子转换为8位元的二进制后依次取出6位元,就可以快速完成转换;因此,Base58编码算法需要除法运算实现。如果被编码的数据较长,则要用特殊的class来处理大数,在Bitcoin使用了OpenSSL中的BIGNUM:
code_string = "123456789ABCDEFGHJKLMNPQRSTUVWXYZabcdefghijkmnopqrstuvwxyz";
x = convert_bytes_to_big_integer(hash_result);
output_string = "";
while(x > 0)
{
(x, remainder) = divide(x, 58);
output_string.append(code_string[remainder]);
}
repeat(number_of_leading_zero_bytes_in_hash)
{
output_string.append(code_string[0]);
}
output_string.reverse();