暫定的な状態だが、やっと復旧した。これを書いているのは6/5である。
松江出席。家族と一緒にいられるのは祝福である。
心から福音を求めた経験談を聞く。私なんざ、あんまり求めなくても与えられているので、 ハングリー精神に欠ける。
求めよ、そうすれば、与えられるであろう。捜せ、そうすれば、見いだすであろう。門をたたけ、そうすれば、あけてもらえるであろう。
[マタイ 7:7より引用]
「There Ain't No Such Thing As Plain Text」に関連して、 Paul Prescodからメールをもらう。要するに「Prothonはバイナリも格納できる文字列を採用しようとしているようだが、これは間違いだ。それに関してマイクロソフトが日本でどのように(Unicodeを使って)日本語を扱うソフトウェアを作っているのかいくつか質問がある」ということだそうな。
が、この質問に私はこたえられなかった。私も知りたいので、どなたか知恵を貸していただけないだろうか。
Microsoft is a huge promoter of Unicode, and not even full Unicode, but mostly the BMP subset. So I would like to understand how they make Japanese software that is popular.
Do they use Unicode?
マイクロソフトは(日本で)Unicodeを使っているか。
Do they layer on encoding tags or something on top?
エンコーディングを示すタグのようなものを使っているのか。
Does Japanese Word support a) just the BMP, b) all of Unicode or c) much more?
日本語版マイクロソフトワードは a) BMPだけを使っているか b) Unicode全部か c)それ以上か?
Can Japanese Word show un-unified Chinese and Japanese characters side by side?
日本語版マイクロソフトワードは中国の文字と日本の文字を(ユニファイせずにそれぞれの字体で)並べて表示できるか。
Can Word import from Ichitaro? If so, how do they manage the extra characters?
ワードは一太郎から文書をインポートできるか。できるなら、外字をどう扱っているか?
ご存じの方はいらっしゃるだろうか。最初のふたつの質問の答えが「Yes」、「No」であることは容易に想像ができるのだが。
リンク
This work is licensed under a Creative Commons License.
順番に「Yes」「???(Yes?)」「b)」「Yes」「???(Yes?)」です。<br>・Windows2000/Office2000の時点で、Microsoft製のWindowsアプリケーションは全てUnicode化していることを確認しています。(Officeに関しては97あたりでも対応していたかも)<br>・WindowsにはCodePage(CP)というのがありますがこれが「エンコーディングを示すタグ」に相当するのであれば二番目はYesです。(thread単位で設定でき、ShiftJIS/Big5等のような変則的な2byte文字の1byte/2byte判定用情報はここに格納されている)<br>・最後の質問ですが、Wordには昔から一太郎の文書を変換する機能がついています(逆に一太郎もWord文書を変換する機能あり)。ただし、私は一太郎を使ったことがなく、これらの変換機能に問題があるかどうか知らないので???にしました。なお外字ですがShiftJISの外字領域とUnicodeの外字領域のマッピングはOSの提供するAPIレベルでうまくやってくれていて、(私のところでは外字を2000文字ほど作成してShiftJISなアプリケーションとWord/Excelで併用していますが)特に問題も起きていないので、個々のアプリケーションが気にする問題ではないのでしょう。
MS-Wordは Unicode文字列以外のワープロ独自情報で動く部分が多く<br>テキスト処理一般の基準になりえるか?です。組文字とか統一性なし。<br><br>● 日本語版マイクロソフトワードは中国の文字と日本の文字を(ユニファイせずにそれぞれの字体で)並べて表示できるか。<br><br>はい、できます。<br>フォントが入っていて、Wordのフォント選択に見えれば。<br><br><text font=明朝>骨</text> <text font=SimHei>骨</text><br>のようなイメージで、骨の文字コードは同一で中の Г と 反対<br>になります。ワープロのフォント情報でやっていて、コピペでも<br>「RTFを処理できるソフト」ならフォント情報は保存されます。<br>UNICODE文字列にはフォント切り替えの情報は入っていない。<br><br><br>● ワードは一太郎から文書をインポートできるか。できるなら、外字をどう扱っているか?<br>MS-DOSのころからRTF経由で最低限の両方向インポートできてます。<br>一太郎はWord形式保存ができ、Wordは一太郎インポートのフィルタがあります。<br>一太郎のシンボルはWordでは豆腐になりますが、Wordで一太郎シンボルの<br>フォントを当て直すと復活します。フォント情報の引継ぎは不完全。<br><br>外字?とは、具体的な文字コードがないと実験できません。
XMLと文字メーリングリスト<br>http://www2.xml.gr.jp/1ml_main.html?MLID=xmlmoji<br>実装の話もあります。
だめだめ日記<br>http://damedame.monyo.com/<br>では<br>■ [コンピュータ]Windows NT系OSでUTF-16を使う<br>うーん、実はできたんですね……。知らなかった。くしく <br>Surrogates <br>Setting up Microsoft Windows NT, 2000 or Windows XP<br>http://www.i18nguy.com/surrogates.html<br>http://msdn.microsoft.com/library/default.asp?url=/library/en-us/intl/unicode_192r.asp<br>でBMP以上とか
Mac OS XのOpenTypeを使うための基礎知識<br>http://www.incunabula.co.jp/dtp-s/macosx_doukawaru/4.html<br>Mac のほうが実際に出力できる字形は多い。<br>コードというより、グリフ・セットですが
UNICODE の外の文字コードも健在です。<br><br>携帯本体は 独自Shift_JIS<br>BREWにはもう一つ、C言語の文字列とは異なる文字列<br>http://www.itmedia.co.jp/mobile/0311/14/n_bapp_2.html<br>(MIFESエディタのよう)<br><br>住基ネットの文字コードは?