Hatena::Groupasakura

浅倉卓司@blog風味? このページをアンテナに追加 RSSフィード

Error : RSSが取得できませんでした。

2004-03-11(Thu)

POPFileのパッチ

|  POPFileのパッチ - 浅倉卓司@blog風味? を含むブックマーク  POPFileのパッチ - 浅倉卓司@blog風味? のブックマークコメント

 kakasiを使うのがイヤだったので適当に分かち書きにするパッチと、APOPで使えるようにするパッチ


 APOPのほうはほっといても使えそうな感じに見えるんだけど、何故か使えなかったりするので、必要に応じてどうぞ。

トラックバック - http://asakura.g.hatena.ne.jp/asakura-t/20040311

2004-03-06(Sat)

SledgeでUTF-8を扱う場合のまとめ

|  SledgeでUTF-8を扱う場合のまとめ - 浅倉卓司@blog風味? を含むブックマーク  SledgeでUTF-8を扱う場合のまとめ - 浅倉卓司@blog風味? のブックマークコメント

Sledge::Charset::UTF8のconvert_paramは機能していないようなので(utf8フラグが落ちてしまうため)、パラメータの値は必要に応じてdecodeする。

・セッションのほうはちゃんとutf8フラグを保持してくれるので問題なし。

・ファイルの入出力をするときはbinmode($fh, "utf8")を忘れずに。

・DBIのUTF-8対応はDBDまかせらしい。DBD::Pgは対応しているっぽい。DBD::mysqlは対応してないように見える。DBD::SQLiteはそもそもutf8らしい。

(DBDまわりはいろいろ未確認)

・内部encodingがUTF-8かどうかのフラグを*::Configに持っておくと、将来的に役立つかもしれない。

 ――だいたいこんなところでしょうか。

トラックバック - http://asakura.g.hatena.ne.jp/asakura-t/20040306

2004-03-02(Tue)

分かち書き

|  分かち書き - 浅倉卓司@blog風味? を含むブックマーク  分かち書き - 浅倉卓司@blog風味? のブックマークコメント

 KAKASIとかChaSenとかMeCabを入れるのが面倒だったので作った日本語を分かち書きするコード。

my @CharUtf8 = (
  '[\x{ff10}-\x{ff19}]+',  # [0-9]+
  '[\x{ff21}-\x{ff3a}\x{ff41}-\x{ff5a}]+',  # [a-zA-Z]+
  '\x{3092}',  # を
  '[\p{InHiragana}\x{30fc}]+',  # [ぁ-ん゛゜ゝゞー]+
  '\p{InKatakana}+',  # [ァ-ヶ・ーヽヾ]+
  '(?:\p{Han}\p{InHiragana})',  # 漢字1文字+ひらがな1文字
  '\p{Han}+',  # <漢字>+
);
my $CharUtf8 = "(". join( "|", @CharUtf8) .")";
----
s/$CharUtf8/ $1 /og;

 これでもそれなりになんとかなる、気がする。個人的にPOPFileにパッチをあてて使っているんだけど、KAKASIを使っているときと遜色ないです。

 ひらがなに音引きを入れるべきかとか、カタカナの中黒は外したほうがいいんじゃないかとか、考慮する点はありますけど。

 というか、こういう感じのをCでライブラリになってると使えるんじゃないの? とか思った。自分で書こうとは思わないけど。

トラックバック - http://asakura.g.hatena.ne.jp/asakura-t/20040302

2004-03-01(Mon)

Wikiの書式

|  Wikiの書式 - 浅倉卓司@blog風味? を含むブックマーク  Wikiの書式 - 浅倉卓司@blog風味? のブックマークコメント

 Wikiなんて使いにくいものが、どうしてもてはやされているんだろうと思ってたけど、単純に日本語で(というよりは欧米の言語以外で)使いにくいのですね。

 日本語として使いやすいモノを作ればいいのに、日本のWikiの作者は基本的には日本語を考えていないみたいなのが困りモノ。知っている中ではVikkyのみが日本語として使いやすかったのだけど、ソースが公開されていないし、現在は開発中止してるみたいだ。

 というわけで、僕が日本語Wikiに求めるのは以下の2点:

日本語的な書式で記述できること

 例えば見出しや箇条書きを表現するのに「*」「-」などを使うよりは、「■」「・」を使ったほうが良いでしょう。互換性を考えると、どちらでも記述できるようにするのがよろしいかと。

 また、改行を改行として扱うか、改行ごとに段落として処理してくれたほうがありがたい。その方が日本語としては都合がよい。あるいは行頭に" "(全角空白)や括弧(パーレン)があった場合に段落とみなしても良いだろう。


 これを実装していたのが(僕の知る限り)Vikkyしかなかったのはなぜなんだろうか。だいぶ前にPukiWikiで提案したら却下された。仕方がないので一時期は自分でパッチをあてて使っていたけど。

 はてなダイアリーは、見出しはともかく改行・段落の扱いは日本語フレンドリーで好ましい実装になってます。


キーワードの自動リンク

 オリジナルのWikiで優れていたのはWikiWord化すれば特別な書式なしでリンクが作られた点にあるのだと思う。ところが残念ながら日本語その他で使われているブラケットを使った書式は、新しいリンクを作るときはともかく、「自動的にリンクが作られる」という点においてオリジナルのWikiに劣っている。

 なので、キーワード(既に作られているページ)を自動的にリンクを作られるのが理想であろう。PukiWikiのように階層化可能なら、階層内のキーワードを優先的にリンクしてくれるとなおよろしい。

 この点で、はてなダイアリーの実装は日本語フレンドリーな点でたいへん好ましく思う。

 ――というわけで、このような実装があるWikiを探してますので、ご存じの方はお教えいただけるとうれしいです。

 ないなら自分で作るしかないわけですが……。

トラックバック - http://asakura.g.hatena.ne.jp/asakura-t/20040301
2004 | 01 | 02 | 03 | 05 | 06 | 07 | 08 | 09 | 10 | 11 | 12 |
2005 | 01 | 02 | 03 | 04 | 05 | 06 | 07 | 08 | 09 | 10 | 11 | 12 |
2006 | 01 | 02 | 03 | 04 | 05 | 06 | 08 | 09 | 10 | 11 | 12 |
2007 | 02 | 03 | 04 | 05 | 06 | 07 | 10 | 11 | 12 |
2008 | 02 | 03 | 04 | 06 | 09 | 10 | 11 | 12 |
2009 | 01 | 02 | 03 | 04 | 05 | 06 | 07 | 09 | 10 | 11 | 12 |
2010 | 01 | 02 | 03 | 04 | 05 | 06 | 07 | 08 | 09 | 10 | 11 | 12 |
2011 | 01 | 02 | 03 | 06 | 07 | 08 | 09 | 10 | 11 | 12 |
2012 | 02 | 03 | 04 | 05 | 07 | 08 | 10 | 11 | 12 |
2013 | 01 | 05 | 07 |
2014 | 01 | 02 |
2016 | 01 |
2017 | 01 | 05 |