Linux で自宅サーバ [ Home Server Techncial ]

>>トップページに戻る

BBS 過去ログ No.0013に戻る

タイトル: namazuでの検索結果(日本語)でURIの所だけ文字化け
記事No: 4237
投稿日: 2006/06/28(Wed) 22:23
投稿者: 望月   <a_mochizuki@hithit.co.jp>
いろいろと調べましたが、結局分からなかったため、投稿いたします。
何が出来ないかと申しますと、namazuでの検索結果(日本語)でURIの所だけ文字化けします。
検索結果のタイトルがUTF-8で要約のところがEUCです。
  (ブラウザのエンコードを日本語EUCとUTF-8で試しました)

どこを変えればよいのかサッパリ解りませんので皆さんのお知恵をお借りしたく思います。

■使用ソフト
os RedHat EnterpriseLinux ES ver3
namazu2.0.16
nkf2.0.4
kakasi2.3.4
を使用しております。

■mknmz -Cの結果(一部)

システム: linux
Namazu: 2.0.16
Perl: 5.008000
File-MMagic: 1.25
NKF: /usr/bin/nkf
KAKASI: /usr/local/bin/kakasi -ieuc -oeuc -w
茶筌: no
和布蕪: no
わかち書き: /usr/local/bin/kakasi -ieuc -oeuc -w
メッセージの言語: ja_JP.eucJP
言語: ja_JP.eucJP
文字コード: euc

■namazuの設定ファイル(文字に関係しそうな部分)
.namazurc Lang ja(他にja_JP.SJISとja_JP.eucJP,ja_JP.UTF8試しました)

 .mknmrc $NKF = "/usr/bin/nkf";
$KAKASI = "/usr/local/bin/kakasi -isjis -oeuc -w";
(isjisの部分をieucに変更しても特に変化なし)

■シェルでLANG=ja ;export LANGとしました。
(他にja_JP.SJISとja_JP.eucJP,ja_JP.UTF8試しました)

検索を掛けたいファイルはWindowsで作りSAMBAの3.0.7でサーバーに送った物です。

■インデックス作成のコマンドには-Uのオプションを付加しています。
mknmz -kU --replace='s#/home/XXXX/YYYY##;' --config='/var/www/cgi-bin/.mknmzrc' -O /usr/local/var/namazu/index /home/XXXX/YYYY

■mod_encoding
SetServerEncoding EUC-JP
DefaultClientEncoding JA-AUTO-SJIS-MS SJIS
AddClientEncoding "cadaver/" EUC-JP

■作成されたインデックスのファイル
NMZ.field.subject
NMZ.field.uri
をPCにダウンロードし、サクラエディタを用いて
EUCで保存しなおし、アップロードしたところ、
文字化けが解消されたため、このファイルが文字化けの原因ようです。

不足な情報があるかも知れませんが以上よろしくお願いします。

タイトル: Re: namazuでの検索結果(日本語)でURIの所だけ文字化け
記事No: 4239
投稿日: 2006/06/29(Thu) 19:49
投稿者: 望月   <a_mochizuki@hithit.co.jp>
自己レスです。
解決しましたのでご報告します。
smb.conf を次のように
編集し、Samba を再起動します。

unix charset = EUCJP-MS

再度、Windows から UNIX にファイル名、フォルダ名がEUC−JPになるようにファイルを移動し、インデックスを作り直しました。

▲ページの最上部に戻る

Copyright©2003 Home Server Technical. All Right Reserved.
webmaster@miloweb.net