下一页 上一页 目录

2. 希伯来语字符表示标准

2.1 ASCII

为了澄清一件事,一劳永逸地:不存在 8 位 ASCII 这样的东西。ASCII 只有 7 位。任何 8 位代码都不是 ASCII,但这并不意味着它不是标准。ISO-8859-8 是标准,但不是 ASCII。谢谢!

2.2 DOS 希伯来语

希伯来语编码从 128d (Aleph) 开始。因此,编码需要 8 位。这就是你在显卡 EPROM 硬件字体上拥有的,所有基于 DOS 的希伯来语编辑器都使用此表(Qtext、HED 等)。

2.3 ISO 希伯来语

希伯来语编码从 224 (Aleph) 开始。这是互联网标准、国际标准,并且基本上是 Ms-Windows 和 Macintosh 的标准(Dagesh 等...)。

2.4 旧 PC 希伯来语

这是 7 位的,并且已过时,因为它基本上占据了与英语小写字母相同的 ASCII 范围。因此,最好避免使用它。但是,当 ISO 希伯来语的第八位被一些无知的 Unix 邮件程序剥离时(因此你的邮件的希伯来语部分会得到一堆英文字母,并且常规英语,无论是否反转,都混在其中),你将会得到这个,并且需要将其转换为 PC 或 ISO。如果英语与希伯来语混合在一起,这将是一个令人难过的局面,因为你将得到希伯来语加乱码,或者英语加乱码...

2.5 转换

这里有一些简单的脚本,用于从每个标准转换为其他标准

DOS - ISO:      tr '\200-\232' '\340-\372' < {dos_file} > {iso_file}
ISO - DOS:      tr '\340-\372' '\200-\232' < {iso_file} > {dos_file}
OLD - DOS:      tr -z '\200-\232' < {old_Hebrew_file} > {dos_file}

注意:tr 使用的数字是八进制的!


下一页 上一页 目录