Cool IRI插件的作者回答有关IRI的问题

| | Comments (9) | TrackBacks (0)
This post is about IRI and Lee Joon's MT plugin "Cool IRI". It includes my Chinese translation of Lee's email and with the original one attached with it. Posting here for letting more people can share Lee's knowledge and the attitude to the audience. Greatly appreciate.
在此对Lee Joon 表示谢意和敬礼。

一个星期前我装了韩国人Lee 开发的MT插件Cool_IRI

当时在我的中文版的 Internet Explorer上显示正常,而在英文版的 Firefox上显示不正常,都是 "%" 什么的。于是我到Lee 的博客上留言,告诉她我这个问题。她告诉我到FF里把 "network.standard-url.escape-utf8 " 设置为 "false" 就可以正确显示中文了。我完全不明白这个设置在哪里。除了问她在哪里设置,我还写了好几个问题在她的留言处。(说句实话,有些问题如果没弄明白我确实不敢随便来用它,以免以后带来后果。)

这是我的几个问题:

1 - 这个设置在哪里? 你说的FF是指我电脑上安装的FF吗?
2 - 如果是指我本地的FF,那不就意味着只有我的非中文版的FF能正常显示中文IRI,而其他人的非中文版FF就不能正确读出来吗?
3 - 我希望这个设置是在插件里面,但我没有找到。如果能通过插件本身来设置的话,那么就意味着所有的非中文版FF都能正确读出中文的 IRI 了,那才叫酷呢 (就像用UTF编码写的中文一样,任何浏览器都能读出来。只是我能读有什么用啊,东西又不是写给我一个人看的)。
4 - 我的IE是中文版的,那些非中文版的IE显示中文IRI是怎么样的呢?希望你的IE能告诉我结果。
5 - 我认为这点是最重要的了,也是我最关心的。如果非中文版的各种浏览器不能正确显示本来的IRI,取而代之的是一长串的 "%",好了,这个时候如果有人链接我的某篇文章时,他/她在地址栏中复制的我的链接可是那些 "%"啊 ! 那不是我原本的链接啊 ! 这样的链接指向我的页面,搜索引擎会怎么看?PR传递会如何?

我知道我的问题太多了。知道她会答复我( 之前我的每个问题她都有答复的),但不知道会怎么答复。我在等。很快,几个小时后我收到了Lee的 email。很长。我用中文把信的全文都写出来让大家一起看看,原文附在本文的最后(我已经通知Lee我会就此写一篇东西)。

你问了很多问题,但我想每个问题都很有道理。我就我所知道和想到的来谈谈。

1 - 在FF的地址栏,输入 "about:config",FF的所有的配置就被列出来了。很长一串。然后在 "filter" 区域输入 "utf",过滤出来的结果就只剩下三四个了,在这里去设置 "true/false" (把 true 改为 false)。

2 - 是,也可能不是。我用的是韩语版的FF,我就能正确读出你的中文 IRI 来。这和FF的语言版本没有关系,而和电脑安装的字体有关系。

当然,有的中国用户电脑上虽然装有中文字体,但还是会在地址栏上看到 %HH 的编码。因为我不确定中文版中FF默认的 "network.standard-url.escape-utf8" 设置是 "true" 还是 "false"。如果设置的是 "true",那在他们的FF下就只能看到 %HH 编码了。

你知道的,目前差不多所有的网民都不太了解 IRI,他们习惯于那些不允许非 ASCII 编码的老URL(?)。有人说,非 ASCII 编码的地址是没有价值的,这样说来我们就不应该在URL中使用它了 (以避免出现 %HH)。 这样的局限性对非英语用户来说是太过分了一点。

目前,IRI 还处在过渡阶段。IE6 对 IRI 的支持不是很好 (IE7就能很好的支持),最新的浏览器象 FF / Mozilla / Opera 虽支持 IRI 但就目前来说还不是很完美或不够流畅。

我举个例子:

你知道国际化域名 (Internationalized Domain Name)(IDN) 吗?它赋予了 IRI 更广泛的含义。象 職業.com 这个域名就是个例子(我希望它在你那里能够显示出来)。

当有些人在浏览器中输入 職業.com 时,他们肯定能到这个网站,但当我也这么做时,我的FF浏览器却显示为 http://xn--q6v940c.com/,为什么呢?

原因在于FF提供的 network.IDN_show_punycode true/false 配置选项,它可以让用户选择在浏览器的地址栏中是显示 IDN(職業.com) 还是选择 Punycode 编码的 ( xn--q6v940c.com/)。

这个 IDN 的问题(?) 看起来有点和 IRI 显示方面的问题有点类似。

还是接着上面的 2 - 是的,当用户关闭 IRI 或 IDN 选项的时候,就只能看到 %HH url 或 xn-***** 这样的 punycode 了。

那是浏览器用户所拥有的权利,我觉得这还是有道理的。终端用户应该拥有掌控他们的浏览器的权力。

现在真正的问题(?)是很多人还不了解 IRI / IDN,以至于他们根本就不知道他们还可以打开或关闭这些选项这样一个事实 !

随着时间的推移,更多的人(主要是东方人用户)会来使用 IRI / IDN,更多的人会知道他们拥有在浏览器中选择显示自己语言文字的权力。

3 - 上面说过的,IRI 只是暂时性的用来显示地址。即使有问题也不是本质性的,无非是出于显示的目的罢了。

服务器端,我们没有办法来控制终端用户的行为。比方说,我可以固定某种字体的大小为绝对大小,以前我们可能会想,对啊 ~,所有的人在我的页面上看到的是固定大小的字体。IE6 还是那样。但所有其他的现代浏览器已经不再是那样做了。他们让终端用户可以调控页面的字体大小, 即使你在页面上使用了固定大小的字体。

我想这种浏览器地址栏的现象和上面那种情况应该是差不多的。

4 - 你谈到非中文用户不能看到正确的中文地址,那他们能否用链接指向你的页面?他们能否打开并进到你的页面?

肯定能。当然,非中文用户不能看到正确的中文地址,但并不意味着他们不能到达你的页面。

举个例子说,有的 IRI,象 alogblog.com/中國/index.html ,你可能会想,IRI 的地址你可以到浏览器的地址栏输入 "中國",当然你可以这么做。

但是,那不是正常的使用计算机的方式,很少有人会用手工去输入地址的。比如美国用户的电脑里没有中文字体,他们不能直接输入也不能看到中文的 "中國"。

然而,如果他从其他页面的链接来寻找这个页面 (中國/index.html ),他也能到达。

最终,我要问,为什么我们要使用 IRI 呢?
作为我来讲,为什么我要用韩语的 URL 呢?
作为你来讲,为什么你要用汉语的 URL 呢?
職業.com ,又为什么要用这个域名而不用 occupation.com 呢?

我认为,用户之所以采用 IRI / IDN,是因为他们把能 理解 / 使用 / 看懂 / 他们自己语言的人看得更重要。

所以,如果你的一些页面内容是针对全球用户的,那么标题就用英语来写。如果某些页面都是中文而且这些页面是针对懂得中文的用户的,那么标题就用中文来写。

我也是遵循这条原则的。

5 - 如果链接你中文 IRI 的人是能 理解 / 使用 / 看懂 中文的人 (一般来说应该是中国人),那他就没有必要使用 %HH 地址,如果他知道这只是用来 过渡URL 显示的。

再比方说,如果一个不懂得汉语的美国人要链接你的页面时,那么无论如何他就只能在他那 ISO-8859-1编码的页面上使用 %HH 了。

但是象我在第四条里说的,绝大多数情况下,你的永久地址都会被中文格式所链接。如果你担心别人用 %HH 格式来链接 (因为在他们的浏览器上显示的你的 IRI 是 %HH ),那么我建议你把你的 IRI 地址镶进你的独立页面(Individual Page)中,如果有人要链接它,可以从你的页面中复制那个中文地址而不用到浏览器的地址栏中去复制了。

为了更方便点,你可以提供一些按钮形式的链接给那些要链接该页面的人:
http://alogblog.com/blog/archives/2004/06/Mozillar에서도_가능한_클립보드_복사_자바스크립트.php

如果你想要 IE 或 FF 来复制 Javascript,看看上面这个链接吧。

在韩国,不是很多人知道 IRI。所以我经常故意的把我的 韩语 IRI 地址贴到别人的网页或论坛上,然后,他们会发现 Ooo~,原来韩语地址也可以这样啊... ...

对于 SE / PR / linking ... ... 等等 我可以告诉你,别担心啊 :) 为什么呢?

因为当我们使用 IRI 的时候,我们具有比那些使用非 IRI 或 URL 的人有更多的优势。

例如,当我用韩语在博客上发表文章时,那我的 URL 是什么呢?如果我不使用 IRI,那它的 URL 就只能是下面两种形式:一种是 alogblog.com/my_good_posting.html,而另一种是 alogblog.com/2006/234.html

对啊,只能是这样的了,既不是文章的内容,也不是文章的标题。

如果我们使用 IRI 地址而如果 Yahoo 或 Google 并不能明白我们的 IRI 的含义的话,我们并没有失去什么,只是我们没有额外获得什么而已。

庆幸的是,Google 能很好的理解 IRI,而不明白 %HH 。韩国Yahoo好像能明白 %HH 。即使这样,我们没有失去什么。

随着时间推移,当我们越来越多的把我们自己的语言用作地址,Yahoo 也会要开始采用 IRI 的原始含义,在技术上来说, 这并没有什么困难。

=======================
总而言之,IRI 现在还不算成熟。 所以,眼下来看,我们可以对一些未知的问题获得一些经验,有一点可以确定的是,互联网环境将从 URL (由于只是允许单纯的 ASCII,我讨厌这种哲学,尽管在互联网刚开始时没有问题)转向 IRI 。很多的浏览器将会更好更多的支持 IRI,越来越多的人们将会知道并且理解它。

这只是时间问题。

=============
嘿,写得太长了。
我的英语不是很好,我担心我的想法能不能正确地表达给你。
但愿如此。

好了。我实在是几天没有睡好了,在稀里糊涂中把Lee Joon 的这封邮件写成了中文。可不是吗,现在已经天亮了,这个不眠之夜啊。

关于搜索引擎辨认 IRI 的问题,我也补充一句:美国的 Google 能很好的读懂它,但专门针对我们中国用户立足于本地化的 百度 却不认识正宗的中文。有意思吧? 不信?到这里看看 百度,再看看 Google,你就明白了。

baidu-iri
google-iri


估计上面写的还有不少的错误或语句不通的地方,或者我完全就说错了。现不管它了。以后再改过来吧。

前面已经很长了,不知道你是不是早就没有耐心了?那不怪你,只怪我太无聊。

不管怎样,我还是把 Lee Joon 的原始邮件贴上来,放到下页吧。

You asked many things, and I think every questins is resonable. I'll tell you as I know/think.

1. In FF's address bar, enter "about:config" then all of FF's congif. will be listed. Too many lists. So enter "utf" in "filter" area, then three or four config fields are shown. In there, you can set it to "true/false".

2. Yes, or no. I'm using Korean FF, but I can see your Chinese IRI. That doesn't matter with FF language version. That concerns with PC's installed font.

Of course, some Chinese users who have Chinese fonts in their PC, may see %HH encoded address. I'm not sure that in FF, default of network.standard-url.escape-utf8 is true or false. If "true", that FF user only see %HH address.

As you know, currently nealy all of netizen are not familliar with IRI. They are accustomed to old(?) URL which doesnt allow non ASCII. Some people say non ASCII address is INVALID, so say that we should not use it in URL(escaping to %HH is from this reason). But this limitation is too strict in non US users.

For now, IRI is in a transitional state. IE 6 doesnt support IRI well, (IE 7 will do). Moderen browsers like FF/Mozilla/Opera support IRI, but not perfectly or smoothly in current.

Let me introduce one example.

Do you know Internationalized domain name(IDN), which is inclued in wider meaning of IRI) ? 職業.com is one example. (I wish that doman name is to be shown in your environment)

When someone enter 職業.com in his browser, of course he will go to that site. When I did it, my FF brower display it as http://xn--q6v940c.com/. Why?

FF provides network.IDN_show_punycode true/false config option in order for users to be able to choose IDN(職業.com) or Puny code( xn--q6v940c.com/) in browsers address bar.

This IDN problem(?) seems to be alike with our IRI display problem.

Again 2.
Yes. Users who turned off that IRI or IDN option only see %HH url or xn-***** puny code domain name.
That is the right of browser's user, I think it is not unresonable. End users had better have all power to control his browser.

The real problem(?) is that currently many people doesn't familliar with IRI/IDN, as a result they don't recognize the FACT that they have such options to turn it off/on.

But as time pass, more peple(mainly estern users) use IRI/IDN, more people know their right to disply theit own language character in browsers.

3.
As explained above, the appearence of IRI is a matter of only temporaily displaying address. Yes, that problem is not essential, but only on displaying purpose.

In server side, we have no method to control end user's action. For example, we can fix some font's size to absolute size. Previously we might think, yes~ all users will see my page with my fixed font size. IE 6 keep that. But all modern browser doesnt keep that size. They provide end users to control relative font size although page author fixed font size.

I think this appearence in browser's address bar is like above.

4.
You concern that if non Chinese users doesnt see right Chinese address, then can they point to my page? can they access my page?

I say YES. Of course non Chinses users may not see right Chinese address, but this doesn't mean they can't access that page.

For example, some IRI, alogblog.com/中國/index.html is one. You may think, IRI address can be used by typing 中國 in browser's address bar. Of course you can do that.

BUT, it not normal computing situation. Little users type URL by hands. For example, American users who have no Chinese fonts CAN'T type/see 中國 directly.

However if he followed that page(中國/index.html ) from other page's link, they still can access to that page.

As a conclusion, I would say that why do we use IRI? In my case, why do I use Korean URL? In your case, why do you Chinese URL? Why does 職業.com use that domain instead of occupation.com?

I think users introducing IRI/IDN treat their own people(can understand/use/see their language) more importantly than potential world users.

If some page whose url is example.com/best_page.html have only Korean language, then only its ASCII url doen't guarantee non Korean users visiting.

So if your some pages are for global contents, then write the title with English. If some pages have only Chinese characters and for users who understand Chinese, then write the title in Chinese.

I also follow that rule.

5.
If the linker of your Chinese IRI is the one who understand/use/see (in general, he may be Chinese), then he dont need to use %HH address, if he know that is only URI-transitional displaying purpose.
And for example, if the linker is American who can not use/see Chinses, they anyway have to use %HH in his ISO-8859-1 encoded page.

But as I said 4, most of time, your permalink will be linked in Chinese form. If you worry about other's linking in %HH form because their browser show your IRI with %HH, I recommend that you embed your IRI permalink in Indiv. page. If someone want to link it, they will copy that Chnise address, not from browsers address.

More conventiently, you can provide some adress copy button for linkers. http://alogblog.com/blog/archives/2004/06/Mozillar에서도_가능한_클립보드_복사_자바스크립트.php

If you want IE and Firefox copying Javascript, see above link.

In Korea, not so many people know IRI. So I often include my Korean IRI to some other's page or forum, board intentionally. Then people who saw my IRI recognize that Ooo~ Korean URL also can be possible...

SE/PR/linking...and so on. I would tell you that Dont' worry :) Why?

If we use IRI, we have additional power than non-IRI or URI. For example, I write Korean posting. What is its URL? if I dont use IRI, its URL may be one of two form. One is alogblog.com/my_good_posting.html, The other is alogblog.com/2006/234.html.

Yes it's ONLY address, not contents or title.

if we use IRI address and if Google or Yahoo don't understan our IRI meaning, we have no additinal loss. We just dont additional gaining.

Good news is that Google understands IRI properly, not %HH forms. (Korean) Yahoo seems to get %HH form. Even if so, we have no loss.

But as time pass, as we use more and more our own language in address, Yahoo also will get IRI with its original meaning. This is not difficult technically.

=======
As a conclusion, IRI is not maturing feature for now. So for the time being, we might experience some unknown problems, but one certain fact is that Internet environment will move from URL(ASCII only, I hate that philosophy, although in the begining of Internet, it is not problem) to IRI. Many browers will support more and properly, and more people will knwo and understand it.

It's a matter of time.

----------
Hew, it's too long,
I'm not good at English, so I'm afraid my thought will transit to you rightly.
I wish it will do.

Bye

0 TrackBacks

Listed below are links to blogs that reference this entry: Cool IRI插件的作者回答有关IRI的问题.

TrackBack URL for this entry: http://www.yangkang.org/cgi-bin/mt/mt-tb.cgi/41

9 Comments

Yang,
看来你是一夜未睡哦,哈,最近我也是一样睡眠不足,明天周末补回来,韩国的LEE很热心哦,看他那么长篇的给你分析问题,真的很不错,这几天我也要加油弄我的MT了,对了你有知道的MT模板站点吗?

Levi ,
关于模板,我在前段时间已经写了5-6篇文章。你可以看看,应该会有点用。

什么地方有模板下载,我昨天在下面这个答复里已经写得很清楚了,你没有看到吧?
http://www.yangkang.org/archives/2006/07/movable_type5.html#comment-288

对了,你别只看首页的文章啊,我在首页只设置了显示最新的4篇,这样就不至于首页打开的速度太慢。以前的都存档了。到相关的类别或时间分段里去找啊。

Yang,
确实我现在还不太习惯使用MT,在操作上有点晕呼呼,不过我会好好看的,哪个模板下载的地址是没看到咯,准备周末好好完善下自己的MT,嘿嘿,上班忙也只能闲的时候上来晃悠下...^^

发完这篇稿后我马上就写了email 给Lee, 叫他把给我的这封email 登到他的博客上。刚才在那里我看到了。好。

朋友一直说我文章写得很长,没想到还有比我更厉害的。

我是没办法啊,被人家逼成这样的。

她如果说:你用就用,不用就算了,免费给你呢! 那我就懒得写了。

我发完上面这篇后又向她提了关于 IRI 的最后一个问题。刚才那个韩国人又来信了,也是很长的。我不敢再在这里发了,怕你们骂人啊。

发出来呀,大家也看看,最好翻译一下!

我们大家也学习点新东西!!

最近我也刚开始学习 mt,好多东西都要学习!

Leave a comment

About this Entry

This page contains a single entry by Yang published on July 14, 2006 5:33 AM.

MT3.3今天正式发布 was the previous entry in this blog.

现在是MT3.31了 is the next entry in this blog.

Find recent content on the main index or look in the archives to find all content.