3. 字体

情况可能看起来很混乱。有数量不明的字体,每种字体都用自己的表格编码,并由任意的键盘布局和输出驱动。在我看来,泰米尔语在字体表格的最大数量上可以与任何其他语言认真竞争。更让情况混乱的是网页的动态字体,这使得任何人都可以使用非标准字体,只要他们的页面可以被查看。

所有这些之外,还有印度信息交换标准代码(ISCII),这是印度政府赞助的“统一”方案,旨在将所有印度字体置于梵文字母的框架下。任何熟悉泰米尔语和梵文字母的字符书写方式的人都会理解这种方法缺乏任何合理性。

毋庸置疑,这只会增加混乱。Sivaraj 再次撰写了一篇关于此以及泰米尔语 Unicode 的优秀分析文章,可以在 找到。对于那些不熟悉泰米尔语文字的人,Sivaraj 撰写的一篇优秀的入门介绍文章可以在 找到。

让我们暂时忽略这种混乱,了解一下常用的字体编码的情况。主要有两个竞争者,幸运的是它们很快将趋于一致。第一个也是最流行的是泰米尔语信息交换标准代码(TSCII),由世界各地的志愿者开发,另一个是泰米尔语单语(TAM)和泰米尔语双语(TAB)编码,由泰米尔纳德邦政府提出。再次强调,TAM 在操作系统环境中的用途有限,我们可以安全地忽略它。几乎所有 Linux 方面的工作都在 TSCII 中(控制台、KDE、GNOME 本地化)。

3.1. TSCII

TSCII 是一种基于字形的 8 位双语编码。它使用一组独特的字形;通常是较低的 ASCII 集。罗马字母和标准标点符号占据前 128 个位置,泰米尔语字形占据高位 ASCII 区段(位置 128-256)。关于早期字体编码方案以及 TSCII 方法背后的原理的良好概述,可以在 http://www.geocities.com/Athens/5180/tscii.html 找到。

TSCII 志愿者的主页 URL 是 http://www.tamil.net/tscii。该站点讨论了 TSCII 编码,并提供了包括字体、键盘驱动程序、编辑器和各种平台的相互转换工具在内的工具。根据 TSCII-1.6 的字体编码表可以在 http://www.tamil.net/tscii/charset16.gif 找到。

当前版本的 TSCII 是 1.6,预计很快会发布修订版,该修订版将修复在使用各种位置进行编码时的一些异常情况。版本 1.7 将完全向后兼容 1.6,并有望获得普及。TSCII 讨论组目前正在集思广益,讨论对 TSCII-1.6 的修改。您可以通过成为会员来参与讨论。您也可以从那里下载各种测试版工具。根据 TSCII-1.7(草案)的字体编码表可以在 找到。

3.2. TAB

TAB 是泰米尔纳德邦政府提出的一种基于字符的双语标准。TAB 双语编码表可以在 http://www.tamilnet99.org/annex4.htm 找到。TAB 编码工具(主要限于 Windows 平台)也可以在此页面附近下载。

3.3. 其他字体和编码

类型太多了,不幸的是,它们没有得到很好的记录。讨论它们超出了本文档的范围。