«前の日記(2007-03-05) 最新 次の日記(2007-03-07)» 編集

Matzにっき


2007-03-06 [長年日記]

_ [Ruby] 「Ruby開発環境を準備している」,米CodeGearのVice President,Michael Swindell氏語る:ITpro

知らない人はいないかもしれないけど、 CodeGearは、Borlandから切り離された開発環境を提供する子会社。 最近はDelphi for PHPを発表している。

動的なプログラミング言語では,Rubyに注目している。すでに弊社社長のBen Smithを含む上級役員の間で,CodeGearがRubyによる開発のための製品に取り組むことにコミットしている。ただし,どのような内容の製品になるかは現時点では明らかにできない。現在調査を進めているところだ。2007年中にCodeGearのRuby製品を提供できるものと期待している。

すばらしい。特筆すべきは、私がこのニュースを(どなたかのブログ経由で) 日経ITproで初めて知る点である。まあ、そんなもんか。

_ [言語] Programming Erlang

Pragmatic Bookshelfの新作。今度はErlangだ。 現時点ではβ版をPDFで入手できる。

もうちょっとRuby以外の言語の勉強に力を入れたいところではあるのだが、 どうしよう、買おうかなあ。

_ シフトJISを捨てられるか?:ITpro

なんか、途中までは普通のことが書いてあるんだけど、 最後の結論がおかしい。

では,今までのデファクトだったシフトJISはどうだろうか。シフトJISを使うと,(英文混じりの)日本語を表現する場合,そのデータ長はUTF-8/16/32 に比べて短くなる。コンピュータを取り巻く通信環境は高速になり,ストレージは大容量化してきたとはいえ,データ長は短いに越したことはない。シフト JISでもデータ長は文字数に比例しないが,必ず英数字は1バイト,日本語文字は2バイトになる。Unicodeエンコーディングよりも良さそうだが,シフトJISの問題は表現できない文字が存在することだ。裏を返せば,「シフトJISで表現できない文字を使わない」ようにすれば良いのだが,それでは進歩がない。日本語文字列を扱うのに,何か良いエンコーディングはないだろうか。

「短いに越したことはない」というごく弱い理由で、さらに別のエンコーディングの必要性をほのめかさないでいただきたい。ただでさえ日本語を扱えるエンコーディングの乱立に迷惑しているのに(日本語だけで4種類なんて異常だ)。もう、新しいデータはUTF-8でいいよ。

_ Tx: Succinct Trie Data Structure

記憶容量効率の良いトライ実装。BSDライセンス。 しかし、岡野原さんは毎度毎度すごいなあ。

爪の垢を煎じて飲まないとな。

_ How to Play the Homophone Game - eHow.com

以前、「英語ではしりとりできないなあ」と思ったことがあるが、 Homophone Gameはおそらく英語でしりとりに相当するゲーム。

具体的には、同じ(似た)音の単語二つを含む文を交代に思いつく限り並べるというもの。

  • He ate eight apples.
  • I can see the sea.

とか。うーん、やっぱりしりとりの方が面白そうだなあ。

_ [OSS] やまぐちOSS協議会 発足セミナー

やまぐちでも山口情報産業協会を中心にOSS協議会が設立されるということで、 その発足セミナー講師として井上社長とともに山口入り。 時間の関係で、松江→米子→岡山→新山口。

セミナーの内容は、最初にアシスト社長、ビル・トッテン氏の 特別講演以外は先日の福岡のものとほぼ同じ。 演者も、IPA OSSセンター長、田代さん、 NaCl社長(しまねOSS協議会会長)井上さん、 私。ただし、時間はちょっとずつ短かった。

ビル・トッテンさんの講演内容はそのまんま「不都合な真実」であった。 彼は飛行機に乗らないそうだ。 でも、環境の視点からこれから田舎の重要性が増すという意見は興味深かった。 現在都市に人口が集中しているのは高エネルギー消費を前提にしているからで、 数年後、(自発的または強制的に)エネルギーを消費できなくなったら 田舎に中心が移動するので、今から田舎(たとえば山口)に投資するのだそうだ。

ふーむ。

その後、懇親会など。

楽しかったが、 山口の企業が今後OSSとどう付き合っていくか、 せっかく発足したOSS協議会がどう活かされるか、 今後の課題も大きいように思えた。

_ [原稿] 日経Linux 2007年5月号

テーマは「電子メール」。〆切は昨日なのだが、 どうにも終わらなかった。毎月、見積もりが甘すぎ。

で、今月は、プロトコル(SMTP, POP, IMAPなど)の解説と Rubyで記述されたメール関連ソフトウェアの紹介に終始してしまい、 コードが全然無かった。来月はもうちょっと実践的な記事にしたいなあ。

本日のツッコミ(全5件) [ツッコミを入れる]
_ 成瀬 (2007-03-10 00:43)

>日本語文字列を扱うのに,何か良いエンコーディングはないだろうか<br>っgzip<br>辞書を日本語用に時間かけて作っておけばいいだけですな。

_ じょりちょこ (2007-03-11 15:52)

非Lisperに前置記法が本当に嫌われているように、欧米主導な標準策定に本能的嫌悪を抱いている人たちは日本語の文字のエンコーディングのByte数が増えることに頑固な抵抗を示しますね(LightCone氏とかね)。

_ MMX (2007-03-12 10:02)

>日本語文字列を扱う<br>全角半角のCOBOL固定長の伝統(既得権)も大切ですから UTF-8 にすんなり移行しません。

_ まつもと (2007-03-12 10:14)

まあ、「新しいデータは」と言ってるんでCOBOLはいちおうスコープ外ではないかと。<br>もっとも最近のCOBOL系のデータがUTF-8ってのは十分にあり得ると思いますけどね。表示はプロポーショナルになってるし。

_ ttk (2007-03-17 08:56)

>(日本語だけで4種類なんて異常だ)<br>これはどうなんでしょうかね。<br>Unicode だって、テキスト系用途のUTF-8はともかく、<br>UCS-2, UTF-16BE, UTF-16LE, UTF-32BE, UTF-32LE, ...<br>いったいいくつあるんだか。

お名前:
E-mail:
コメント:
[]

«前の日記(2007-03-05) 最新 次の日記(2007-03-07)» 編集

track feed Matzにっき Creative Commons License This work is licensed under a Creative Commons License.