jython 2.5.2 还是不支持cjk(中国,日本,韩国亚洲字符编码)

Life is short , play more!
本文来自lihao's Blog,转载请注明。

虽然我们在jython的官网上http://www.jython.org/faq3.html 可以看到明确地有说, We do plan to support bz2, ctypes, sqlite3, flesh out unicodedata, and support cjk codecs in 2.5.1. 很不幸的是, 只是plan, 实际上并没有真正实现.
cjk代表就是chinease, japanease, korean , python 在2.4 版本中,早以集成了cjk模块.而jpython却迟迟没有动静, 忽略了亚洲人民的感情.

Jython 2.5.3b1 (2.5:5fa0a5810b25, Feb 22 2012, 12:39:02)
[Java HotSpot(TM) Client VM (Sun Microsystems Inc.)] on java1.6.0_23
>>>
>>> print u'123'.encode('utf-8')
123
>>> print u'123'.encode('gbk')
Traceback (most recent call last):
  File "", line 1, in 
LookupError: unknown encoding 'gbk'

感觉是bug, 源于发现encodings文件夹下,有这些gbk的py库文件. 但是却不能工作. 所以网上搜索,发现是bug的可能性最大.

关于缺少cjk支持的jpython bug 描述见 http://bugs.jython.org/issue1066 , 状态仍然是open,并没有resolved. 最后一跳comments说, “maybe we can get this in for 2.6” 也许,我们就要等到2.6 了. 目前来看还得一直等.

所以解决该问题的根本办法,就是自己写patch代码了. 这有一个日本朋友的帖子, 大家可以参考一下.
http://web.archiveorange.com/archive/v/8tc1Zc2rV3qiUcy9zPlA


发表评论

电子邮件地址不会被公开。 必填项已用*标注