计算机使用 1 字节 = 8 位来表示语言符号,即我们有 2^8 = 256 个不同的字母。ASCII 码(美国信息交换标准代码)严格地仅定义了前 128 个符号(7 位)。另一半符号用于描绘其他语言的特殊符号以及图形符号。相反,与其他欧洲语言相比,希腊语完全是 8 位的。显而易见的原因是希腊语与其它语言相比有许多不同的符号。
关于互联网上希腊语的更多信息,您可以在 RFC 1947,“电子邮件消息的希腊字符编码”中找到。请参阅相关链接 http://andrew2.andrew.cmu.edu/rfc/rfc1947.html
希腊语存在许多不同的标准化。其中最常见的标准是 737 和 928。两者都适用于单音希腊语。 737 标准用于 DOS,而 928 标准用于所有 UNIX 和 Windows(略有变化)。 Linux 将 928 作为其主要代码页。当然,我们有两套或更多希腊语标准是一个大问题,这可以通过特殊的转换器来克服,以便从一个集合更改为另一个集合。
从 Oracle 关于 Linux 的文档 和 服务器手册 中,可以找到数据库(以及最重要的计算机系统)中使用的常见希腊语标准及其标准化的(但仍然是?)代码
737 也被称为 437G (=437Greek),因为它来自美国 437 的修改。 737 最初出现在早期 PC 的 MDA 和 Hercules 显卡的希腊语 EPROM 中,即它们位于硬件中。 它们主要在 DOS 中使用,因此来自那里的所有文件都应为 737。 由于 737 现在被认为是 DOS 的遗留物,因此最好将 737 文件转换为 928,请参阅 convertgreek。 在 Linux 中,代码页 737 仅在控制台(文本模式)中完全支持,但也有一些用于 X-Windows 的字体。
已经报道过某些内核中无法键入“d”(DELTA 微)的情况,这是因为它与 128+ESC (128+27=155=asc("d")) 重叠。 转到 /usr/src/linux/drivers/char/console.c,它在某处说
&& (c != 127 || disp_ctrl) && (c != 128+27); alla3te se && (c != 127 || disp_ctrl) /* && (c != 128+27)*/;并编译一个新的内核。
737 在 Grafis 包中的一些固定字体中受支持:graphis。
[ah@computer.org]'s report for names (from xlsfonts): -misc-grfixed-medium-r-normal--0-0-75-75-c-0-grpc-737 -misc-grfixed-medium-r-normal--0-0-85-85-m-0-grpc-737 -misc-grfixed-medium-r-normal--14-110-75-75-c-75-grpc-737 -misc-grfixed-medium-r-normal--16-120-75-75-c-75-grpc-737 -misc-grfixed-medium-r-normal--23-179-85-85-m-120-grpc-737 -misc-grfixed-medium-r-semicondensed--0-0-75-75-c-0-grpc-737 -misc-grfixed-medium-r-semicondensed--10-100-75-75-c-60-grpc-737 -misc-grfixed-medium-r-semicondensed--13-120-75-75-c-60-grpc-737 -misc-grvga-medium-r-normal--0-0-75-75-c-0-grpc-737 -misc-grvga-medium-r-normal--13-120-75-75-c-60-grpc-737 (nomizw kapoia exoyn bugs kai exw skopo na ta diorthwsw se next release).
希腊语 928 是最新和最广泛使用的标准化,最初由 ELOT 建立。 后来,它被 ISO 接受为 ISO-Latin-8859-7,或简称为 Latin7,甚至 UNICODE 的希腊语支持也基于它。 928 用于所有 UNIX 应用程序、互联网,并且是当今 Linux 的标准。 标准 928 在控制台(文本模式)和图形环境 (X-Windows) 中均受支持。
Windows 希腊语 (Windows-1253) 与 ELOT 928 标准的主要偏差是 928 的字符“A”(带重音的 A),它在 Windows 中对应于段落标记。 Windows-1253 中也缺少上逗号和希腊语引号 << 和 >>。 由于我们不可避免地必须接受 MS-Windows 施加给我们的这个限制,并且由于许多用户使用 wintel 工作平台,因此最好在发送电子邮件、帖子等时避免使用 <带重音的 A>。 或者,您可以使用 'A (' = SHIFT+")。 'E 和 'O 也存在类似的问题。 为了您的方便,以下是 928 标准下的所有带重音的字母:AEHIOYO。
UNICODE (ISO 10646) 是 16 位的(即 65536 种组合),包括多种语言,包括偏移量为 #370 的现代希腊语和偏移量为 #1F00 的古代希腊语。 从现代到古代(多音)希腊语和线性文字 B 都受支持! Linux 在内部支持 UNICODE,但其使用尚未普及,因为它还取决于应用程序的采用。 更多信息请参阅:http://linuxdoc.org/HOWTO/Unicode-HOWTO.html
==================================================================== Vasilis Vasaitis <vas@hal.csd.auth.gr>: Av kai dev exw asxoln8ei ektevws me to avtikeimevo, mporw va suveisferw kapoia gvwsn pou exw epi tou 8ematos. Loipov, exoume kai leme: Kapoia stigmn, se avupopto xrovo, eixa katebasei eva Unicode fixed font gia ta X windows. Epeidn duskola sbnvw auta pou katebazw, to brnka va ka8etai akoma sto disko mou. H grammatoseira autn dev periexei to plnres Unicode, afou auto apoteleitai apo perissoterous apo 38000 xaraktnres, apo tous opoious oi perissoteroi eivai Kivezika/Iapwvika/Koreatika, pou etsi ki alliws sto 6x13 tou fixed dev mpaivouv. Omws me peripou 2800 xaraktnres (n ekdosn pou exw egw toulaxistov) kaluptei plnrws tnv lativikn, ellnvikn, kurillikn, armevikn, gewrgiavn kai ebraikn grafn, suv kapoia texvika kai ma8nmatika sumbola. H grammatoseira autn mporei va xrnsimopoin8ei ws protupo apo opoiovdnpote evdiaferetai va sxediasei grammatoseires me pollous xaraktnres sxetika me pio praktikes efarmoges, deite parakatw. H selida tou tupou pou tnv eftia3e, av eivai akoma n idia, eivai: http://www.cl.cam.ac.uk/~mgk25/ Upostnri3n stnv kovsola: H kovsola upostnrizei Unicode edw kai kati aiwves, mesw bebaia tou UTF8 (gia osous dev 3erouv, to UTF8 eivai mia avaparastasn tou UniCode me metablnto mege8os, to opoio gia gia tous 128 prwtous xaraktnres exei tnv idia morfn me to ASCII). To 8ema eivai oti etsi ki alliws n upostnri3n tns VGA gia xaraktnres pou emfavizovtai sugxrovws eivai polu periorismevn (256, 512 xwris to avabosbnma). Upostnri3n sta X: H grammatoseira pou avaferw parapavw douleuei mia xara, kai n teleutaia fora pou tn dokimasa ntav priv polu kairo. Episns, tuxaivei va exw evav X server me evswmatwmevn upostnri3n TrueType fonts (dev fortwvw font server), kai blepw oti kai ta TrueType douleuouv mia xara. Gia osous dev 3erouv, ta XFree86 4.0 8a erxovtai me evswmatwmevn upostnri3n TrueType. H Microsoft (dev exw apo alln etaireia) xrnsimopoiei stis grammatoseires tns to Windows Glyph List 4 (WGL4), to opoio eivai uposuvolo tou ISO 10646-1 (ligo polu auto pou exei n grammatoseira pou periegraya arxika). Efarmoges: Edw katarreouv ola. Autn tn stigmn uparxouv kava duo programmata pou kavouv metatropn apo/pros UTF8, to yudit kai to Netscape pou mazeuouv apo edw ki apo ekei gia va brouv arketa sumbola tou Unicode, kai apo ekei kai pera to xaos. Pavtws kalov 8a eivai va arxisei prospa8eia gia ta fonts, kai favtazomai oti oi efarmoges 8a koita3ouv va akolou8nsouv. --------------- Report apo Panagioti Vrioni: Gnwrizw oti o Giannis Gyftomitros <yang@hellug.gr> exei hdh arxisei na asxoleitai me thn dunatothta dhmiourgias Unicode grammatoseirwn pou na periexoun kai ta ellhhnika (Project Grafis, bl. GRArial k.l.), isws na exei proxwrhsei kai parapera... Apo thn ekdosh 6.0, o XFS pou periexetai sto Red Hat exei patch wste na mporei na emfanisei Trye Type Fonts. Bl. sxetiko "White Paper" stho "support" ths https://#/ . An balete Unicode TTFonts (px. ths M$) auta paizoun, me thn ennoia oti fainontai dia8esima ta fonts me xilia-duo diaforetika encodings. Den kserw omws an paizoun kai san unicode grammatoseira, px. gia na dei kapoios ena keimeno me ellhnika, agglika kai kinezika tautoxrona sto Netscape. =====================================================================
Xwindows 有一个固定的字体,请参阅相关链接:http://www.cl.cam.ac.uk/~mgk25/ucs-fonts.html
还有一个用于 Unicode 的文本编辑器,名为 Yudit,ftp://metalab.unc.edu/pub/Linux/apps/editors/X/yudit-1.1.tar.gz
UTF-8 标准现在是互联网上的标准,请参阅相关 RFC:http://andrew2.andrew.cmu.edu/rfc/rfc2279.html
关于 Unicode 中现代希腊语的更多信息,请访问:http://charts.unicode.org/Unicode.charts/normal/U0370.html
Aggelos Xaritsns < ah@computer.org> 编写了这个转换器:ftp://ftp.hri.org/pub/greek/programs/gr2gr.prl 它使用 perl (5 或 4) 运行。 因此,它可以在安装了 perl 的任何操作系统(unix、dos、win32、os2、mac、vms ...)上工作。
它支持多种不同的希腊语,例如
在计算机技术研究所,有 grfilter:ftp://ftp.cti.gr/pub/src/grfilter.tar
在目录 ftp://corfu.forthnet.gr/pub/greek2lat 中,有一个从 928 到 greeklish 的转换器,也适用于 WEB 站点。
Kwstas Kwstns, < kosta@kostis.net > 也编写了这个转换器,它支持多种希腊语以及其他语言:http://www.kostis.net/freeware/trans120.tar.gz
还有一个 Giwrgos Spniliwtns 的程序,它转换 437、Win95、X win。 它的地址未知。
这是一个来自 GNU 项目的通用小程序,它支持多种不同语言(包括希腊语)的转换器。 或许所有其他程序都应该在某个时候集成到其中。 请参阅地址 http://www.delorie.com/gnu/docs/recode/recode_toc.html
根据具体情况,请参阅 convertgreek
通常为 737,转换时需要小心,留给专家 guru 处理。
通常为 737,请参阅 convertgreek
应为 928,并且显示正常。
如果它有希腊语字幕,那就没问题 :-)
扔掉它们
有用的链接