«前の日記(2004-05-29) 最新 次の日記(2004-05-31)» 編集

Matzにっき

迷惑メール対策なら Dr.WEB
『Dr.WEB メールデーモン』、MTA 用迷惑メール対策製品です!


2004-05-30 [長年日記]

暫定的な状態だが、やっと復旧した。これを書いているのは6/5である。

_ [教会]松江

松江出席。家族と一緒にいられるのは祝福である。

心から福音を求めた経験談を聞く。私なんざ、あんまり求めなくても与えられているので、 ハングリー精神に欠ける。

求めよ、そうすれば、与えられるであろう。捜せ、そうすれば、見いだすであろう。門をたたけ、そうすれば、あけてもらえるであろう。

[マタイ 7:7より引用]

_ [Ruby]Ruby and Unicode

There Ain't No Such Thing As Plain Text」に関連して、 Paul Prescodからメールをもらう。要するに「Prothonはバイナリも格納できる文字列を採用しようとしているようだが、これは間違いだ。それに関してマイクロソフトが日本でどのように(Unicodeを使って)日本語を扱うソフトウェアを作っているのかいくつか質問がある」ということだそうな。

が、この質問に私はこたえられなかった。私も知りたいので、どなたか知恵を貸していただけないだろうか。

Microsoft is a huge promoter of Unicode, and not even full Unicode, but mostly the BMP subset. So I would like to understand how they make Japanese software that is popular.
  • Do they use Unicode?

    マイクロソフトは(日本で)Unicodeを使っているか。

  • Do they layer on encoding tags or something on top?

    エンコーディングを示すタグのようなものを使っているのか。

  • Does Japanese Word support a) just the BMP, b) all of Unicode or c) much more?

    日本語版マイクロソフトワードは a) BMPだけを使っているか b) Unicode全部か c)それ以上か?

  • Can Japanese Word show un-unified Chinese and Japanese characters side by side?

    日本語版マイクロソフトワードは中国の文字と日本の文字を(ユニファイせずにそれぞれの字体で)並べて表示できるか。

  • Can Word import from Ichitaro? If so, how do they manage the extra characters?

    ワードは一太郎から文書をインポートできるか。できるなら、外字をどう扱っているか?

ご存じの方はいらっしゃるだろうか。最初のふたつの質問の答えが「Yes」、「No」であることは容易に想像ができるのだが。

リンク

本日のツッコミ(全6件) [ツッコミを入れる]
_ calc (2004-06-05 10:25)

順番に「Yes」「???(Yes?)」「b)」「Yes」「???(Yes?)」です。<br>・Windows2000/Office2000の時点で、Microsoft製のWindowsアプリケーションは全てUnicode化していることを確認しています。(Officeに関しては97あたりでも対応していたかも)<br>・WindowsにはCodePage(CP)というのがありますがこれが「エンコーディングを示すタグ」に相当するのであれば二番目はYesです。(thread単位で設定でき、ShiftJIS/Big5等のような変則的な2byte文字の1byte/2byte判定用情報はここに格納されている)<br>・最後の質問ですが、Wordには昔から一太郎の文書を変換する機能がついています(逆に一太郎もWord文書を変換する機能あり)。ただし、私は一太郎を使ったことがなく、これらの変換機能に問題があるかどうか知らないので???にしました。なお外字ですがShiftJISの外字領域とUnicodeの外字領域のマッピングはOSの提供するAPIレベルでうまくやってくれていて、(私のところでは外字を2000文字ほど作成してShiftJISなアプリケーションとWord/Excelで併用していますが)特に問題も起きていないので、個々のアプリケーションが気にする問題ではないのでしょう。

_ MMX (2004-06-05 11:07)

MS-Wordは Unicode文字列以外のワープロ独自情報で動く部分が多く<br>テキスト処理一般の基準になりえるか?です。組文字とか統一性なし。<br><br>● 日本語版マイクロソフトワードは中国の文字と日本の文字を(ユニファイせずにそれぞれの字体で)並べて表示できるか。<br><br>はい、できます。<br>フォントが入っていて、Wordのフォント選択に見えれば。<br><br><text font=明朝>骨</text> <text font=SimHei>骨</text><br>のようなイメージで、骨の文字コードは同一で中の Г と 反対<br>になります。ワープロのフォント情報でやっていて、コピペでも<br>「RTFを処理できるソフト」ならフォント情報は保存されます。<br>UNICODE文字列にはフォント切り替えの情報は入っていない。<br><br><br>● ワードは一太郎から文書をインポートできるか。できるなら、外字をどう扱っているか?<br>MS-DOSのころからRTF経由で最低限の両方向インポートできてます。<br>一太郎はWord形式保存ができ、Wordは一太郎インポートのフィルタがあります。<br>一太郎のシンボルはWordでは豆腐になりますが、Wordで一太郎シンボルの<br>フォントを当て直すと復活します。フォント情報の引継ぎは不完全。<br><br>外字?とは、具体的な文字コードがないと実験できません。

_ MMX (2004-06-05 11:36)

XMLと文字メーリングリスト<br>http://www2.xml.gr.jp/1ml_main.html?MLID=xmlmoji<br>実装の話もあります。

_ MMX (2004-06-05 17:16)

だめだめ日記<br>http://damedame.monyo.com/<br>では<br>■ [コンピュータ]Windows NT系OSでUTF-16を使う<br>うーん、実はできたんですね……。知らなかった。くしく <br>Surrogates <br>Setting up Microsoft Windows NT, 2000 or Windows XP<br>http://www.i18nguy.com/surrogates.html<br>http://msdn.microsoft.com/library/default.asp?url=/library/en-us/intl/unicode_192r.asp<br>でBMP以上とか

_ MMX (2004-06-05 17:44)

Mac OS XのOpenTypeを使うための基礎知識<br>http://www.incunabula.co.jp/dtp-s/macosx_doukawaru/4.html<br>Mac のほうが実際に出力できる字形は多い。<br>コードというより、グリフ・セットですが

_ MMX (2004-06-05 21:26)

UNICODE の外の文字コードも健在です。<br><br>携帯本体は 独自Shift_JIS<br>BREWにはもう一つ、C言語の文字列とは異なる文字列<br>http://www.itmedia.co.jp/mobile/0311/14/n_bapp_2.html<br>(MIFESエディタのよう)<br><br>住基ネットの文字コードは?

お名前:
E-mail:
コメント:
[]

«前の日記(2004-05-29) 最新 次の日記(2004-05-31)» 編集

RSS feed meter for http://www.rubyist.net/~matz/ track feed Matzにっき Creative Commons License This work is licensed under a Creative Commons License.