WEBALIZER 日本語化 for Windows
このページは、個人的な覚え書きです。
その為、webalizer の基本的な使い方などは記載していません。
知り合いの要望により、極力日本語化した Windows 版の Webalizer をカスタマイズしました。
要望 :
Windowsで処理したい。
直感的にわかるようになるべく日本語で表示したい。
レスポンスコードも日本語に変換してほしい。等
ただし、グラフィックで処理する部分の日本語化には対応していません。( ?? わからない ?? )
未熟者が作っているものですから、無茶な日本語も含まれます。
開発環境
Windows XP Professional ServicePack 2
Cygwin Ver.2.340.2.5-1-jp
webalizer Ver.2.01-10 Win32
ど素人の知識
動作環境 ( 必須 )
Windows
EUC文字コードに対応した日本語エディタ
webalizer-2.01-10-win32-bin.zip
webalizer-2.01-10-win32-bin.zip を日本語化してビルドしたファイル
検証環境
Windows XP Professional ServicePack 2 and Windows XP Professional ServicePack 1
秀丸エディタ
webalizer-2.01-10-win32-bin.zip
Apache 1.3.33 のログファイル( combined )
Windows Server 2003 の Windows Media サービスの Windows Media サービス形式のログ ( かなり特殊ですが )
完成見本
このサイトの4月のログ解析結果です。
(意図的にホスト名の一部を消してあります。)
参考にしたサイト
http://moriya.xrea.jp/tools/webalizer.html
やったこと
グラフィックとHTMLで使用する語句を全部別にして、テキストで表示する部分を全て日本語化。
使用方法
webalizer
のダウンロードページから、Windows版[ Win32 - Intel
] をダウンロードしてきて解凍します。
インストールディレクトリは、解りやすく C:\webalizer\bin
とでもしておきましょう。
参考 : ftp://ftp.mrunix.net/pub/webalizer/webalizer-2.01-10-win32-bin.zip
ビルドしたファイルを、差し替え&追加します。
参考にさせて頂いたサイトにあったように、webalizer.exe だけを差し替えたかったんだけどグラフィックも日本語化対応させたくて色々弄くり回していたら、
余分なファイルがたくさん必要になってしまいった。。。
おまけに、なにも解決してないし。。。
webalizer.conf の編集 (基本編)
confファイルは、EUCで書かれているのでEUCの文字コードが使える日本語エディタで編集。
Windows 付属の Notepad は使えません。 秀丸エディタ や MKEditor 等を使ってください。
出来上がるログレポートのHTMLもEUCになります。
タイトルとサイト名を最初に指定しましょう。
サイト名はグラフィックでも使用されるので、半角英数字しか使えませんので、URLにしておきます。
URL表記で良いでしょう!ということで、あえて日本語にすることも無いと思ったので手を抜きました。
ReportTitle 月次集計レポート
HostName www.url.co.jp
ついでに、リンク元から自サイトを除きます。
HideReferrer www.url.co.jp
ついで表示させたい情報を適宜指定して、最後にログファイルと出力先を設定すればおしまい。
OutputDir
..\Output
LogFile
..\log\access_log.LOG
詳細は、sample-J.conf を参照。
ログファイルの処理
ログファイルは、毎回変更するのと、一度にたくさんのファイルを処理したい為にバッチファイルで指定することも可能。
まず、ディレクトリ構造を以下のように配置
C:
|--- webalizer
|--- bin (プログラム本体)
|--- log (ログファイル)
|--- output (出力先)
webalizer のフォルダに webalizer.bat
ファイルを用意。
決して webalizer.bat を bin フォルダに入れてはいけません!
入れると、一部のタグが2重化してしまい、最悪読めないファイルが出来てしまいます。
どうしても入れたいときは、-c /PATH/webalizer.conf を指定しないか、webalizer.conf ファイル名を変更しましょう。
バッチファイルなんて面倒という方は、webalizer.exe と
webalizer.conf のショートカットでも可。
webalizer.conf の編集 (詳細編)
・検索エンジン対応
GroupReferrer / SearchEngine
で検索サイトのURLや検索語句切り出し位置の指定をします。
GroupReferre は見やすくする為、SearchEngine
は指定しないと認識してくれないから必ず指定した方が良いでしょう。ただし、生ログをそのまま処理しても文字化けだらけで意味不明なので、適宜コード変換処理をしたログファイルを使用するのが前提です。ほんと日本語って面倒。
ちなみに、今回依頼を請けた内容では、検索語句の表示は不要でしたので、これ以上つっこんだ話は有りません。
(後に文字化け対策を相談された顛末を追加しました)
HideReferrer 等と併せて使うと効果的ですね。
SearchEngine yahoo.com p=
GroupReferrer yahoo.co.jp/ Yahoo!
HideReferrer yahoo.co.jp
・ページタイプの指定
PageType
は、リクエストページの統計でカウントしたいファイルタイプの指定です。
画像ファイルや css 、js
など、表示したくないもの全てを除き指定しましょう。
PageType htm*
PageType xls
PageType doc
PageType txt
PageType pdf
などなど、設置しているファイルタイプに応じて指定。
・グループURLの指定
リクエストページの統計はこのままでは見にくいので、GroupURL
でディレクトリ毎の統計も日本語で表示させましょう。
GroupURL /products/*
製品情報
GroupURL /corporation/* 会社案内
GroupURL /webcatalog/* Webカタログ
などなど、設置しているディレクトリに応じて指定。
HideURL
と併せて使えば、ディレクトリだけのレポートも可能。
HideURL *.html
・ユーザ情報の整理
ユーザ情報もグループURLと同様にユーザIDをユーザ名で表示させた方が見やすいですから、GroupUser
と HideUser を使用してみましょう。
この機能を使用したときとしないときで、微妙にカウント数がずれるのはなぜ?
HideUser 0001
HideUser 0002
HideUser 0003
GroupUser 0001
会員1号
GroupUser 0002
会員2号
GroupUser 0003
会員3号
以上 (2004/10)
|